丙型肝炎病毒疫苗
本申请是以下申请的分案申请:申请日:2002年10月10日;申请号:02824665.9(PCT/US02/32512);发明名称:同上。
相关申请
本申请要求申请日为2002年3月13日的美国临时申请流水号60/363,774和申请日为2001年10月11日的美国临时申请流水号60/328,655的优先权,以上两份申请分别被收作本文参考。
发明背景
在本申请中所引用的参考文献并非承认是本发明的现有技术。
世界人口的大约3%受到了丙肝病毒(HCV)的感染(Wasley等,Semin.Liver Dis.20,1-16,2000)。接触HCV导致明显的急性疾病的只占很小的百分比,而在大多数情况下所述病毒会形成慢性感染,导致肝脏炎症并且缓慢发展成肝脏衰竭和硬化(Iwarson,FEMSMicrobiol.Rev.14,201-204,1994)。另外,流行病学调查表明,HCV在肝细胞癌的发病方面起着重要作用(Kew,FEMS Microbiol.Rev.14,211-220,1994,Alter,Blood 85,1681-1695,1995)。
在1992年对HCV进行常规血液筛查之前,大部分感染是通过意外接触受感染的血液、血液制品或移植器官而感染的。在进行HCV液筛查的地方,HCV主要是通过直接透过皮肤接触受感染的血液,即静脉内用药而感染的。较少见的传播方法包括围产期接触,血液透析,以及与HCV感染患者的性接触(Alter等,N.Engl.J.Med.341(8),556-562,1999,Alter,J.Hepatol.31Suppl.88-91,1999.Semin.Liver.Dis.201,1-16,2000)。
HCV基因组由大约9.5kb的单链RNA组成,它编码具有大约3000个氨基酸的前体多蛋白(Choo等,Science 244,362-364,1989,Choo等,Science 244,359-362,1989,Takamizawa等,J.Virol.65,1105-1113,1991)。所述HCV多蛋白包括以下顺序的病毒蛋白: C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B。
各个病毒蛋白是通过HCV多蛋白的蛋白水解而产生的。宿主细胞蛋白酶能释放推测的结构蛋白C,E1,E2,和p7,并且在810号氨基酸上产生NS2的N-末端(Mizushima等,J.Virol.68,2731-2734,1994,Hijikata等,P.N.A.S.USA 90,10773-10777,1993)。
推测非结构蛋白NS3,NS4A,NS4B,NS5A和NS5B形成了病毒复制机制,并且是从所述多蛋白中释放出来的。与NS2和NS3的N-末端相关的锌-依赖型蛋白酶负责NS2和NS3之间的裂解(Grakoui等,J.Virol.67,1385-1395,1993,Hijikata等,P.N.A.S.USA90,10773-10777,1993)。位于NS3的N-末端结构域中的一种特殊的丝氨酸蛋白酶,负责在NS3/NS4A,NS4A/NS4B,NS4B/NS5A和NS5A/NS5B接合处的蛋白水解裂解(Bartenschlager等,J.Virol.67,3835-3844,1993,Grakoui等,Proc.Natl.Acad.Sci.USA 90,10583-10587,1993,Tomei等,J.Virol.67,4017-4026,1993)。NS4A提供了NS3活性的辅因子(Failla等,J.Virol.68,3753-3760,1994,De Francesco等,美国专利号5,739,002)。
NS5A是能产生干扰素抗性的高度磷酸化的蛋白(De Francesco等,Semin.Liver Dis.,20(1),69-83,2000,Pawlotsky,ViralHepat.Suppl.1,47-48,1999)。
NS5B提供了一种RNA-依赖型RNA聚合酶(De Francesco等,国际公开号WO 96/37619,Behrens等,EMBO 15,12-22,1996,Lohmann等,Virology 249,108-118,1998)。
发明概述
本发明涉及Ad6载体和编码含有失活的NS5B RNA-依赖型RNA聚合酶区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。所述核酸特别适合用作提供多种抗原的腺病毒载体或DNA质粒疫苗的成分,用于产生针对HCV的HCV特异性细胞介导的免疫(CMI)反应。
HCV特异性CMI反应表示能识别HCV抗原的细胞毒性T淋巴细胞和T辅助细胞的产生。CMI反应还可以包括非HCV特异性免疫作用。
优选的核酸编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,它基本上与SEQ.ID.NO.1相似,并且具有足够的蛋白酶活性,以便对它自 身进行加工,产生基本上相似于存在于SEQ.ID.NO.1中的NS5B区的至少一种多肽。所产生的相当于NS5B区的多肽是无酶促活性的。更优选的是,所述HCV多肽具有足够的蛋白酶活性,以便产生基本上相似于存在于SEQ.ID.NO.1中的NS3,NS4A,NS4B,NS5A,和NS5B区的多肽。
所提到的“基本上相似的序列”表示与参考序列的同一性至少为大约65%。因此,举例来说,具有基本上相似于SEQ.ID.NO.1的氨基酸序列的多肽,与SEQ.ID.NO.1具有至少大约65%的总体氨基酸同一性。
相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽,与SEQ.ID.NO.1上的相应的区具有至少大约65%的氨基酸序列同一性。所述相应的多肽在本文中又被称为NS3,NS4A,NS4B,NS5A和NS5B多肽。
因此,本发明的第一方面披露了包括编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列的核酸。所编码的多肽具有足够的蛋白酶活性,以便对它自身进行加工,产生无酶促活性的NS5B多肽。
在一种优选实施方案中,所述核酸是能够在需要的人细胞中表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的表达载体。在人细胞内的表达具有治疗作用,可以有效治疗HCV感染,并且预防性治疗HCV感染。
表达载体包括编码一种多肽的核苷酸序列以及进行正确转录和加工的调节元件。可以存在的调节元件包括与编码所述多肽的核苷酸天然相关的调节元件,以及不是与所述核苷酸序列天然相关的外源调节元件。诸如外源激发子的外源调节元件可用于在特定宿主中表达,如在人细胞中表达。可用于功能性表达的调节元件的例子包括激发子,终止子,核糖体结合位点和聚腺苷酸化信号。
本发明的另一方面,披露了包括能够在人细胞中表达基本相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒的核酸。所述多肽能够对它自身进行加工,以便产生无酶促活性的NS5B蛋白。所述基因表达盒至少包括以下部分:
a)与编码多肽的核苷酸序列转录性偶联的激发子;
b)与所述核苷酸序列功能性偶联的5′核糖体结合位点;
c)与所述核苷酸序列的3′末端连接的终止子;和
d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。
所提到的“转录性偶联”表示所述激发子的定位使得可以通过结合在所述激发子上的RNA聚合酶使核苷酸序列转录。转录性偶联并不要求被转录的序列靠近所述激发子。
所提到的“功能性偶联”表示介导一种对所述核苷酸序列的作用的能力。功能性偶联并不需要所偶联的序列彼此接近。与所述核苷酸序列功能性偶联的聚腺苷酸化信号有利于转录的RNA的裂解和聚腺苷酸化。与所述核苷酸序列功能性偶联的5’核糖体结合位点有利于核糖体结合。
在优选实施方案中,所述核酸是适合用于治疗HCV的治疗性用途或用作生产治疗载体的中间物的DNA质粒载体或腺病毒载体。治疗HCV,包括主动治疗HCV感染和预防性治疗HCV感染。
本发明的另一方面披露了包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体,所述腺病毒载体是通过以下方法生产的,该方法包括(a)同源重组和(b)腺病毒载体回收(rescue)。所述同源重组步骤中产生了一种腺病毒基因组质粒。所述腺病毒载体回收步骤产生了来自所述腺病毒基因组质粒的腺病毒载体。
本文所披露的腺病毒基因组质粒包括一种重组腺病毒基因组,它具有一个在E1区上的缺失,和任选在E3区上的缺失,以及插入所述缺失区之一中的基因表达盒。所述重组腺病毒基因组是由基本上相似于一种或多种腺病毒血清型的区域组成的。
本发明的另一方面披露了包括SEQ.ID.NO.4的核酸序列的腺病毒载体或它的衍生物,其中,所述衍生物的存在于SEQ.ID.NO.4上的HCV多蛋白编码序列被SEQ.ID.NO.3,SEQ.ID.NO.10或SEQ.ID.NO.11中任一个的HCV多蛋白编码序列所取代。
本发明的另一方面披露了一种包括含有编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的序列的核酸的培养的重组细胞。所述重组细胞具有多种用途,如用于通过载体构建方法复制编码所述多肽的核酸。
本发明的另一方面披露了一种制备包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的 腺病毒载体的方法。该方法包括以下步骤:(a)生产包括重组腺病毒基因组的腺病毒基因组质粒,它在E1和E3区具有缺失,并且具有插入所述缺失区之一中的基因表达盒,和(b)从所述腺病毒基因组质粒中回收腺病毒载体。
本发明的另一方面披露了包括用于表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体和可以药用载体的药物组合物。所述载体适合给患者施用,并且在患者体内表达多肽。
“患者”表示能够感染HCV的哺乳动物。患者可能感染了或没有感染HCV。患者的例子有人和黑猩猩。
本发明的另一方面披露了一种治疗患者的方法,包括给所述患者施用有效量的表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体的步骤。所述载体适合给患者施用,并且在患者体内表达多肽。
进行治疗的患者可能有或没有感染HCV。对于感染了HCV的患者来说,有效量足以获得以下作用中的一种或多种:减弱HCV复制的能力,减少HCV负荷,提高对病毒的清除,并且增强一种或多种HCV特异性CMI反应。对于没有感染HCV的患者来说,有效量是足以获得下列一种或多种效果的用量:增强产生针对HCV感染的HCV特异性CMI反应的一种或多种成分的能力,降低了对HCV感染的易感性,和减弱了传染性病毒建立导致慢性疾病的持久感染的能力。
本发明的另一方面涉及包括Ad6区和一个不存在于Ad6中的区的重组核酸。所提到的“重组”核酸表示存在两个或两个以上不是天然彼此相关的核酸区。所述Ad6重组核酸优选包括Ad6区和编码与Ad6异源的多肽的基因表达盒。
通过本文所提供的包括不同实施例的其他说明,可以理解本发明的其他特征和优点。所提供的实施例说明了用于实施本发明的不同成分和方法。这些实施例不构成对本发明的限定。根据本发明的说明,技术人员能够确定和采用可用于实施本发明的其他成分和方法。
附图的简要说明
图1A和1B表示SEQ.ID.NO.1。
图2A,2B,2C和2D表示SEQ.ID.NO.2。SEQ.ID.NO.2 提供了编码SEQ.ID.NO.1的核苷酸序列,同时提供了优化的内部核糖体进入位点和TAAA终止序列。1-6号核苷酸提供了优化的内部核糖体进入位点。7-5961号核苷酸编码HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,5137-5145号位置上的核苷酸提供了1711-1713号氨基酸位置上的AlaAlaGly序列,它使得NS5B失活。5962-5965号核苷酸提供了TAAA终止序列。
图3A,3B,3C和3D表示SEQ.ID.NO.3。SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。7-5961号核苷酸编码HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽。
图4A-4M表示MRKAd6-NSmut(SEQ.ID.NO.4)。SEQ.ID.NO.4是包括一个表达盒的腺病毒载体,其中,SEQ.ID.NO.1的多肽是由SEQ.ID.NO.2编码的。碱基对1-450相当于Ad5的碱基对1-450;碱基对462-1252相当于人CMV激发子;碱基对1258-1267相当于Kozak序列;碱基对1264-7222相当于NS基因;碱基对7231-7451相当于BGH聚腺苷酸化信号;碱基对7469-9506相当于Ad5碱基对3511-5548;碱基对9507-32121相当于Ad6碱基对5542-28156;碱基对32122-35117相当于Ad6碱基对30789-33784;碱基对35118-37089相当于Ad5碱基对33967-35935。
图5A-50表示SEQ.ID.NOs.5和6。SEQ.ID.NO.5编码具有有活性的RNA依赖型RNA聚合酶的HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽。SEQ.ID.NO.6提供了所述多肽的氨基酸序列。
图6A-6C提供了pV1JnsA的核酸序列(SEQ.ID.NO.7)。
图7A-7O提供了Ad6基因组的核酸序列(SEQ.ID.NO.8)。
图8A-8K提供了Ad5基因组的核酸序列(SEQ.ID.NO.9)。
图9表示Ad6基因组的不同的区。线性(35759bp)ds DNA基因组用双平行线表示,并且被划分成100个作图单位。转录单位是以相对它们在基因组上的位置和方向形式示出的。早期基因(E1A,E1B,E2A/B,E3和E4)是通过灰色箭头表示的,通过黑色箭头表示的晚期基因(LI-L5),是通过对由主要晚期激发子(MLP)产生的转录物的可变剪接而产生的,并且它们都包括位于5′末端的三联前导序列(1,2,3)。E1区位于大约1.0-11.5的作图单位,E2区位于75.0-11.5的作 图单位,E2位于76.1-86.7的作图单位,E4区位于99.5-91.2的作图单位。所述主要晚期转录单位位于16.0和91.2作图单位之间。
图10表示回收含有Ad6和Ad5区的pAdE1-E3+的同源重组。
图11表示回收包括Ad6区的pAdE1-E3+的同源重组。
图12表示来自用表达不同的HCV NS盒的质粒DNA转染的293细胞的全细胞提取物的Western印迹。用特异性抗体检测成熟的NS3和NS5A产物。″pV1Jns-NS″表示pV1JnsA质粒,其中,Met-NS3-NS4A-NS4B-NS5A-NS5B多肽是由SEQ.ID.NO.5编码的,并且SEQ.ID.NO.5被插入SEQ.ID.NO.7的1881-1912号碱基之间。″pV1Jns-NSmut″表示pV1JnsA质粒,其中,SEQ.ID.NO.2被插入SEQ.ID.NO.7的1882-1925号碱基之间。″pV1Jns-NSOPTmut″表示pV1JnsA质粒,其中SEQ.ID.NO.3被插入SEQ.ID.NO.7的1881-1905号碱基之间。
图13A和13B表示通过IFNγELIspot显示的在C57black6小鼠(A)和BalbC小鼠(B)体内诱导的T细胞反应,包括用基因电转移装置(GET)分别注射25微克和50微克的编码不同HCV NS盒的质粒DNA。
图14表示在感染HeLa细胞之后,来自不同腺病毒载体的蛋白表达。MRKAdS-NSmut是基于Ad5序列的腺病毒载体(SEQ.ID.NO.9),其中,Ad5基因组具有碱基对451-3510的E1缺失,碱基对28134-30817的E3缺失,并且具有插入450-3511号位置之间的SEQ.ID.NO.4的碱基对451-7468所提供的NS3-NS4A-NS4B-NS5A-NS5B表达盒。Ad5-NS是基于Ad5主链的腺病毒载体,具有碱基对342-3523的E1缺失,和碱基对28134-30817的E3缺失,并且包括编码来自SEQ.ID.NO.5的NS3-NS4A-NS4B-NS5A-NS5B的表达盒。″MRKAd6-NSOPTmut″表示具有修饰过的SEQ.ID.NO.4序列的腺病毒载体,其中,SEQ.ID.NO.4的碱基对1258-7222被SEQ.ID.NO.3所取代。
图15表示由IFNγELIspot显示的通过两次注射109vp含有不同HCV非结构基因盒的腺病毒载体,在C57black6小鼠体内诱导的T细胞反应。
图16A-16D表示由I FN γEL I s po t显示的通过一次或两次注射 1010vp(A)或1011vp(B)含有不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的T细胞反应。
图17A和17B表示由IFNγELIspot显示的通过两次注射1010vp(A)或1011vp(B)编码不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的CD8+T细胞反应。
图18A-18F表示由大量CTL分析显示的通过两次注射1011vp的Ad5-NS(A),MRKAdS-NSmut(B),或MRKAd6-NSmut(C)在猕猴体内诱导的T细胞反应。
图19表示质粒pE2。
图20A-D表示部分密码子优化序列NSsuboptmut(SEQ.ID.NO.10)。Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的编码序列是从7-5961号碱基。
本发明的详细说明
本发明涉及Ad6载体和编码含有失活的NS5B区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。提供失活的NS5B区,提供了NS5B抗原,同时降低了由活性病毒RNA聚合酶导致的不利副作用的可能性。所述核酸的用途包括用作疫苗成分,以便将HCV多肽导入细胞,它能提供用于产生针对HCV的CMI反应的多种抗原,并且用作用于生产所述疫苗成分的中间产物。
适应性细胞免疫反应,由于主要组织相容性复合物(MHC)I型和II型表达的普遍分布,起着能够在整体身体内的HCV感染的细胞中识别病毒抗原的作用,以便诱导免疫学记忆,并且保持免疫学记忆。上述功能是由抗原特异性CD4+T辅助细胞(Th)和CD8+细胞毒性T细胞(CTL)提供的。
在通过它们的特异性T细胞受体激活之后,HCV特异性Th细胞实现了多种免疫调控功能,其中大部分功能是通过Th1和Th2细胞因子介导的。HCV特异性Th细胞有助于B细胞的激活和分化,并且有助于病毒特异性细胞毒性T细胞的诱导和刺激。Th细胞与CTL一起还能分泌能抑制若干病毒的复制和基因表达的IFN-γ和TNF-α。另外,Th细胞和CTL即主要效应细胞,可以诱导病毒感染过的细胞的程序凋亡和裂解。
HCV特异性CTL是由专门的抗原呈递细胞(pAPCs)加工的抗原产生的。抗原可以是在pAPCs内合成的或者是导入的。PAPC中的抗原合成,可以通过将编码序列所述抗原的表达盒导入所述细胞而完成。
施用核酸疫苗的一种优选途径是肌内途径。肌内施用似乎会导致将核酸导入体细胞和pAPCs,并且在那里表达。在所述体细胞中产生的HCV抗原可以转移到pAPCs,以便在I类MHC分子中呈递(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。
PAPCs在蛋白酶体复合物中将较长的抗原加工成较小的肽抗原。所述抗原被转运到内质网/高尔基复合体分泌途径中,以便与I类MHC蛋白结合。CD8+T淋巴细胞通过T细胞受体(TCR)和CD8细胞表面蛋白识别与I类MHC结合的抗原。
用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸作为疫苗成分,可以从一种单一载体生产多种能够产生CMI反应的抗原。所述多肽应当能够对它自身进行充分加工,以便产生至少一个相当于NS5B的区。优选的核酸编码基本上相似于SEQ.ID.NO.1的氨基酸序列,它具有足够的蛋白酶活性,以便对它自身进行加工,产生基本上相似于存在于SEQ.ID.NO.1上的NS3,NS4A,NS4B,NS5A和NS5B的各个HCV多肽。
基本上相似于SEQ.ID.NO.1的多肽,具有足够的蛋白酶活性,在细胞中对它自身进行加工,给所述细胞提供存在于若干不同HCV菌株中的T细胞表位。蛋白酶活性是由NS3和NS3/NS4A蛋白提供的,在合适的裂解位点上消化Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,以便释放相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽。Met-NS3-NS4A-NS4B-NS5A-NS5B的自我加工,产生了接近天然存在的HCV多肽的多肽。
根据本文所提供的指导,可以产生足够强的免疫反应,以便在患者体内获得有益作用。所提供的指导包括与HCV序列选择,载体选择,载体生产,组合治疗和施用相关的信息。
I.HCV序列
可以将多种不同的核酸序列用作疫苗成分,以便给细胞提供HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,或作为生产疫苗成分的中间 物。用于获得合适核酸序列的起点,优选是被修饰而产生失活的NS5B的天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽。
在以下文献中披露了利用HCV核酸序列提供HCV非结构抗原,以便产生CMI反应:Cho等,Vaccine17:1136-1144,1999,Paliard等,国际公开号WO01/30812(并不被认为是本发明的现有技术),和Coit等,国际公开号WO01/38360(并不被认为是本发明的现有技术)。例如,所述文献没有披露对它自身进行加工以便产生失活的NS5B的多肽,特别是没有披露HCV序列与本文所采用的递送载体的组合。
对HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽序列的修饰,可以通过改变其编码核酸而产生。可以进行改变,以便产生缺失,插入和取代。
可以在NS5B上进行小的修饰,以便通过导向于复制所必需的基序产生失活的聚合酶。NS5B活性所必需的基序的例子,以及为了生产失活的NS5B而可以进行的修饰披露于以下文献中:Lohmann等,Journal of Virology 71:8416-8426,1997,和Kolykhalov等,Journal of Virology 74:2046-2051,2000。
在产生对HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽的修饰时需要考虑的其他因素,包括保持自身加工的能力和保持T细胞抗原。HCV多肽进行自身加工的能力,在很大程度上是通过功能性NS3蛋白酶确定的。能保持NS3活性蛋白酶活性的修饰,可以通过NS3蛋白,用作NS3的辅因子的NS4A,和存在于NS3-NS4A-NS4B-NS5A-NS5B多肽中的NS3蛋白酶识别位点而获得。
可以对天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽序列进行不同的修饰,以便产生能够诱导多种T细胞反应的多肽。影响一种多肽诱导多种T细胞反应的能力的因素,包括HCV特异性T细胞抗原区的保存或导入,以及不同T细胞抗原区在不同HCV分离物中的优势。
天然存在的HCV分离物的多种例子为本领域所熟知。HCV分离物可以划分成以下六种包括一种或多种亚型的主要基因型:HCV-1/(1a,1b,1c),HCV-2/(2a,2b,2c),HCV-3/(3a,3b,10a),HCV-4/(4a),HCV-5/(5a)和HCV-6/(6a,6b,7b,8b,9a,11a)(Simmonds,J.Gen.Virol.,693-712,2001)。诸如HCV-BK,HCV-J,HCV-N,HCV-H的特定HCV序列的例子,业已在GenBank保藏,并且在多个文献中披露(例 如,参见Chamberlain等,J.Gen.Virol.,1341-1347,1997)。
例如,HCV T细胞抗原可以通过经验性实验鉴定。鉴定T细胞抗原的一种方法包括用较大长度的多肽产生一系列重叠的短肽,然后从受感染的患者中筛选T细胞群体的阳性克隆。阳性克隆是通过特定肽激活/激发的。可以将诸如IFNγ-ELISPOT,IFNγ-细胞内染色和大量(bulk)CTL分析的技术用于测定肽活性。由此鉴定的肽可以视为代表了各病原体的T细胞表位。
例如,通过生产包括来自两种或两种以上天然存在的序列的区域的杂合NS3-NS4A-NS4B-NS5A-NS5B多肽,可以将来自不同HCV分离物的HCV T细胞抗原区导入一种单一序列。所述杂合体可以包括其他修饰,所述修饰优选不会减弱所述多肽产生HCV CMI反应的能力。
可以用本文所披露的或为本领域所熟知的技术,确定修饰过的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽对它自身进行加工,并且产生CMI反应的能力。所述技术包括使用IFNγ-ELISPOT,IFNγ-细胞内染色和大量CTL分析,测定HCV特异性CMI反应。
A.Met-NS3-NS4A-NS4B-NS5A-NS5B序列
SEQ.ID.NO.1提供了优选的Met-NS3-NS4A-NS4B-NS5A-NS5B序列。SEQ.ID.NO.1包括大量的HCV特异性T细胞抗原,这些抗原存在于若干不同的HCV分离物中。SEQ.ID.NO.1与HCV BK菌株核苷酸序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B部分相似。
在SEQ.ID.NO.1中,对于I类MHC分子识别来说,重要的锚定位点是保守的或代表HCV多蛋白的NS3-NS4A-NS4B-NS5A-NS5B部分上的20种已知T细胞表位中的18种的保守性取代。就其余两种已知的T细胞表位而言,一种在SEQ.ID.NO.1上具有一个非保守性锚定取代,该取代仍然能被不同的HLA超类型识别,而一种表位具有一个不是保守的锚定残基。HCV T-细胞表位披露于以下文献中:Chisari等,Curr.Top.Microbiol Immunol.,242:299-325,2000,和Lechner等J.Exp.Med.9:1499-1512,2000。
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列和SEQ.ID.NO.1之间的差别包括在5’末端引入一个甲硫氨酸,以及修饰过的NS5B活性位点残基在SEQ.ID.NO.1上的存在。所述修饰将GlyAspAsp换成 了AlaAlaGly(1711-1713号残基),以便使NS5B失活。
所编码的HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,优选具有基本上相似于SEQ.ID.NO.1的氨基酸序列。在不同的实施方案中,所编码的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,与SEQ.ID.NO.1的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或与SEQ.ID.NO.1具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的差别。
Met-NS3-NS4A-NS4B-NS5A-NS5B多肽和SEQ.ID.NO.1之间的氨基酸差别,是通过确定两种序列不同的氨基酸修饰的最低数量计算的。氨基酸修饰可以是缺失,添加,取代或它们的任意组合。
氨基酸序列同一性,是通过本领域众所周知的方法确定的,所述方法将一种多肽的氨基酸序列与第二种多肽的氨基酸序列进行比较,并且产生一种序列比对。氨基酸同一性是通过所述比对计算的,包括统计具有相同氨基酸的比对的残基对的数量。
用于确定序列同一性的方法包括披露于以下文献中的方法:Schuler,G.D.in Bioinformatics:A Practical Guide to theAnalysis of Genes and Proteins,Baxevanis,A.D.和Ouelette,B.F.F.,eds.,John Wiley&Sons,Inc,2001;Yona,等,in Bioinformatics:Sequence,structure and databanks,Higgins,D.and Taylor,W.eds,Oxford University Press,2000;andBioinformatics:Sequence and Genome Analysis,Mount,D.W.,ed.,Cold Spring Harbor Laboratory Press,2001。确定氨基酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics Computer Group(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,Methods in Enzymology 183:63-98,1990,R.F.Doolittle,ed)。
在本发明的一种实施方案中,两种多肽之间的序列同一性是通过使用GAP程序确定的(Wisconsin Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman,等,J.Mol.Biol.48:443-453, 1970)。GAP考虑了两种序列之间的所有可能的比对和空位位置,并且产生一种将匹配的残基数量最大化以及将空位的数量和大小最小化的总体比对。利用一种评分距阵确定符号匹配值。另外,为了限制向所述比对中插入空位,需要空位产生罚分和空位延伸罚分。利用GAP进行多肽比较的默认程序参数是BLOSUM62(Henikoff等,Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)氨基酸评分距阵(MATrix=blosum62.cmp),空位产生参数(GAP权重=8),而空位延伸参数(LENgth权重=2)。
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,除了在它们的整个长度上基本上相似于SEQ.ID.NO.1之外,还能产生基本上相似于存在于SEQ.ID.NO.1上的相应的区域的各个NS3,NS4A,NS4B,NS5A和NS5B区,SEQ.ID.NO.1上的相应的区是以如下形式提供的:Met-NS3的1-632号氨基酸;NS4A的633-686号氨基酸;NS4B的687-947号氨基酸;NS5A的948-1394号氨基酸和NS5B的1395-1985号氨基酸。
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B区与SEQ.ID.NO.1上的相应区域的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的氨基酸差别。
SEQ.ID.NO.1的氨基酸修饰,优选保持了所有的或大部分的T细胞抗原区。天然存在的氨基酸差别,是由于不同的氨基酸侧链(R基团)产生的。R基团能影响氨基酸的不同的性质,如物理尺寸,电荷,和疏水性。可以将氨基酸划分成以下不同类型:中性和疏水性(丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,色氨酸,苯丙氨酸,和甲硫氨酸);中性和极性(甘氨酸,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,天冬酰胺,和谷氨酰胺);碱性(赖氨酸,精氨酸,和组氨酸);和酸性(天冬氨酸和谷氨酸)。
一般,在取代不同的氨基酸时,优选用具有相似性质的氨基酸取代。在特定类型内部取代不同的氨基酸,如用缬氨酸取代亮氨酸,用精氨酸取代赖氨酸,和用天冬酰胺取代谷氨酰胺是不会导致多肽三级结构改变的很好的候选取代。
基于特定的氨基酸序列和已知的遗传密码的间并性,可以获得大量不同的编码核酸序列。遗传密码的间并性是由于几乎所有氨基酸都是由核苷酸三联体或″密码子″的不同组合编码的。特定密码子翻译成特定氨基酸为本领域所熟知(例如,参见Lewin GENESIV,p.119,Oxford University Press,1990)。氨基酸是由以下密码子编码的:
A=Ala=丙氨酸:密码子GCA,GCC,GCG,GCU
C=Cys=半胱氨酸:密码子UGC,UGU
D=Asp=天冬氨酸:密码子GAC,GAU
E=Glu=谷氨酸:密码子GAA,GAG
F=Phe=苯丙氨酸:密码子UUC,UUU
G=Gly=甘氨酸:密码子GGA,GGC,GGG,GGU
H=His=组氨酸:密码子CAC,CAU
I=Ile=异亮氨酸:密码子AUA,AUC,AUU
K=Lys=赖氨酸:密码子AAA,AAG
L=Leu=亮氨酸:密码子UUA,UUG,CUA,CUC,CUG,CUU
M=Met=甲硫氨酸:密码子AUG
N=Asn=天冬酰胺:密码子AAC,AAU
P=Pro=脯氨酸:密码子CCA,CCC,CCG,CCU
Q=Gln=谷氨酰胺:密码子CAA,CAG
R=Arg=精氨酸:密码子AGA,AGG,CGA,CGC,CG G,CGU
S=Ser=丝氨酸:密码子AGC,AGU,UCA,UCC,UCG,UCU
T=Thr=苏氨酸:密码子ACA,ACC,ACG,ACU
V=Val=缬氨酸:密码子GUA,GUC,GUG,GUU
W=Trp=色氨酸:密码子UGG
Y=Tyr=酪氨酸:密码子UAC,UAU。
可以优化核酸序列,以便增强在宿主中的表达。要考虑的因素包括C:G含量,优选的密码子,以及避免抑制性二级结构。所述因素能够以不同的方式组合,以便获得在特定宿主中具有增强了的表达的核酸序列(例如,参见Donnelly等,国际公开号WO 97/47358)。
特定序列在特定宿主中具有增强了的表达的能力涉及某些经验实验。所述实验包括测定保护性核酸序列的表达,以及,如果必要的话,改变所述序列。
B.编码核苷酸序列
SEQ.ID.NOs.2和3提供了编码Met-NS3-NS4A-NS4B-NS5A-NS5B序列的核苷酸序列的两种例子。SEQ.ID.NO.2的编码序列,与天然存在的HCV-BK序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B区相似(核苷酸序列同一性为99.4%),SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。SEQ.ID.NOs.2和3具有78.3%的核苷酸序列同一性。
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸(GenBank保藏号M58335)和SEQ.ID.NO.2之间的差别,包括SEQ.ID.NO.2具有一个核糖体结合位点,一个ATG甲硫氨酸密码子,一个编码修饰过的NS5B催化结构域的区,一种TAAA终止信号和另外30个核苷酸的差别。编码AlaAlaGly(1711-1713号残基)的修饰过的催化结构域取代了GlyAspAsp,以便使NS5B失活。
编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,优选基本上相似于SEQ.ID.NO.2的编码区。在不同实施方案中,编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,与SEQ.ID.NO.2编码区的核苷酸序列的同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。
编码Met-NS3-NS4A-NS4B-NS5A-NS5B的序列和SEQ.ID.NO.2编码区之间的核苷酸差别,是通过确定两种序列差别的核苷酸修饰的最低数量计算的。核苷酸修饰可以是缺失,添加,取代或它们的任意组合。
核苷酸序列同一性,是通过本领域熟知的方法确定的,该方法比较了一种序列的核苷酸序列和另一种序列的核苷酸序列,以便产生一种序列比对。序列同一性是根据所述比对,通过统计具有相同核苷酸的比对位置的数量确定的。
用于确定两种多核苷酸之间的核苷酸序列同一性的方法,包括披露于以下文献中的方法:Schuler,in Bioinformatics:A PracticalGuide to the Analysis of Genes and Proteins,Baxevanis,A.D. 和Ouelette,B.F.F.,eds.,John Wiley&Sons,Inc,2001;Yona等,.in Bioinformatics:Sequence,structure anddatabanks,Higgins,D.和Taylor,W.eds,Oxford UniversityPress,2000;and Bioinformatics:Sequence and Genome Analysis,Mount,D.W.,ed.,Cold Spring Harbor Laboratory Press,2001。确定核苷酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics ComputerGroup(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,W.R.,Methods inEnzymology 183:63-98,1990,R.F.Doolittle,ed)。
在本发明的一种实施方案中,两种多核苷酸之间的序列同一性,是通过采用GAP确定的(Wisconsin Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman等,J.Mol.Biol.48:443-453,1970)。GAP考虑了两种序列之间所有可能的比对和空位位置,并且产生了使匹配的残基数量最大化,并且使空位的数量和大小最小化的总体比对。用一种评分距阵确定符号匹配值。另外,需要用空位产生罚分和空位延伸罚分来限制将空位插入所述比对中。采用GAP的多核苷酸比较的默认程序参数是nwsgapdna.cmp评分距阵(MATrix=nwsgapdna.cmp),空位产生参数(GAP权重=50)和空位延伸参数(LENgth权重=3)。
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列,除了在其整个长度上基本上相似之外,产生了基本上相似于存在于SEQ.ID.NO.2中的相应区域的各个NS3,NS4A,NS4B,NS5A和NS5B区。SEQ.ID.NO.2上的相应的编码区是以如下形式提供的:Met-NS3的7-1902号核苷酸;NS4A的1903-2064号核苷酸;NS4B 2065-2847号核苷酸;NS5A的2848-4188号核苷酸;NS5B的4189-5661号核苷酸。
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B编码区与SEQ.ID.NO.2上的相应的区域上的核苷酸序列同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11, 1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。
C.基因表达盒
基因表达盒包括多肽表达所需要的元件。所提到的“多肽”没有提供大小限制,并且包括蛋白。存在于基因表达盒中的调节元件通常包括:(a)与编码所述多肽的核苷酸序列转录性偶联的激发子,(b)与所述核苷酸序列功能性偶联的5′核糖体结合位点,(c)与所述核苷酸序列的3′末端连接的终止子,和(d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。还可以存在用于增强或调控基因表达或多肽加工的其他调节元件。
激发子是由RNA聚合酶识别,并且介导下游区域转录的遗传元件。优选的激发子是强激发子,它能提供较高水平的转录。强激发子的例子包括立即早期人巨细胞病毒激发子(CMV),和具有内含子A的CMV(Chapman等,Nucl.Acids Res.19:3979-3986,1991)。激发子的其他例子包括天然存在的激发子,如EF1α激发子,鼠CMV激发子,Rous肉瘤病毒激发子,和SV40早期/晚期激发子和β-肌动蛋白激发子;以及人工激发子,如合成的肌肉特异性激发子和嵌合型肌肉-特异性/CMV激发子(Li等,Nat.Biotechnol.17:241-245,1999,Hagstrom等,Blood 95:2536-2542,2000)。
所述核糖体结合位点位于起始密码子上或靠近起始密码子。优选的核糖体结合位点的例子包括CCACCAUGG,CCGCCAUGG,和ACCAUGG,其中AUG是起始密码子(Kozak,Cell44:283-292,1986)。核糖体结合位点的另一种例子是GCCACCAUGG(SEQ.ID.NO.12)。
聚腺苷酸化信号负责裂解转录的RNA,并且在所述RNA上添加poly(A)尾。高等真核生物中的聚腺苷酸化信号包括AAUAAA序列,距离聚腺苷酸化添加位点大约11-30个核苷酸。AAUAAA序列参与RNA裂解的信号传递(Lewin,Genes IV,Oxford University Press,NY,1990)。poly(A)尾对于mRNA加工来说是重要的。
可以用作基因表达盒的一部分的聚腺苷酸化信号,包括最小兔β-珠蛋白聚腺苷酸化信号和牛生长激素聚腺苷酸化(BGH)(Xu等,Gene272:149-156,2001,Post等,美国专利U.S.5,122,458)。其他例子包括合成的聚腺苷酸化信号(SPA)和SV40聚腺苷酸化信号。所 述SPA序列如下:AAUAAAAGAUCUUUAUUUUCAUUAGAUCUGUGUGUUGGUUUUUUGUGUG(SEQ.ID.NO.13)。
可以存在的用于增强或调控基因表达或多肽加工的其他调节元件的例子,包括增强子,前导序列和操纵子。增强子区能增强转录。增强子区的例子包括CMV增强子和SV40增强子(Hitt等,Methods inMolecular Genetics 7:13-30,1995,Xu,等,Gene 272:149-156,2001)。增强子区可以与激发子结合。
前导序列是多肽上的氨基酸区,它能引导所述多肽进入蛋白酶体。编码序列所述前导序列的核酸是结构基因的5′末端,并且是随所述结构基因一起转录的。前导序列的例子是tPA。
可以用操纵子序列调控基因表达。例如,可以利用Tet操纵子序列抑制基因表达。
II.治疗性载体
可以用适合治疗性施用的载体将编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸导入患者体内。合适的载体能够将核酸递送到靶细胞中,而又不会导致不可接受的副作用。
细胞表达是利用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒实现的。所述基因表达盒包括用于在靶细胞内产生并且加工足够数量的核酸,以便获得有利效果的调节元件。
可用于治疗性用途的载体的例子包括第一和第二代腺病毒载体,辅助依赖型腺病毒载体,腺伴随病毒载体,逆转录病毒载体,α病毒载体,Venezuelan马脑炎病毒载体,和质粒载体(Hitt等,Advancesin Pharmacology 40:137-206,1997,Johnston等,美国专利号6,156,588,和Johnston等,国际公开号WO 95/32733)。用于将Met-NS3-NS4A-NS4B-NS5A-NS5B多肽导入对象体内的优选载体,是第一代腺病毒载体和质粒DNA载体。
A.第一代腺病毒载体
用于表达基因表达盒的第一代腺病毒载体,包括E1和任选的E3缺失重组腺病毒基因组内的表达盒。E1区上的缺失足够大,以便去除腺病毒复制所必需的元件。
用于表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的第一代腺病毒 载体,包括E1和E3缺失的重组腺病毒基因组。E1区的缺失足够大,以便去除腺病毒复制所必需的元件。E1和E3区缺失的组合足够大,以便能容纳编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒。
所述腺病毒具有双链线性基因组,在两端具有反向末端重复。在病毒复制期间,将所述基因组包装在病毒衣壳内,以便形成毒粒。所述病毒通过病毒附着以及随后的内化,进入它的靶细胞(Hitt等,Advances in Pharmacology 40:137-206,1997)。
腺病毒载体可以基于不同的腺病毒血清型,如出现在人或动物体内的血清型。动物腺病毒的例子包括牛,猪,黑猩猩,鼠,犬和禽(CELO)腺病毒。优选的腺病毒载体是基于人血清型的,更优选基于B,C或D型血清型。人腺病毒B,C,D或E血清型的例子包括2型(″Ad2″),4型(″Ad4″),5型(″Ad5″),6型(″Ad6″),24型(″Ad24″),26型(″Ad26″),34型(″Ad34″)和35型(″Ad35″)。腺病毒载体可以包括来自单一腺病毒或来自两种或两种以上腺病毒的区域。
在不同的实施方案中,腺病毒是基于Ad5,Ad6,或它们的组合的。Ad5披露于以下文献中:Chroboczek等,J.Virology 186:280-285,1992。Ad6披露于图7A-7N中。包括Ad5区的基于Ad6的载体披露于下面所提供的实施例部分。
腺病毒载体不一定完全去掉了它们的E1和E3区。相反,去掉了足够数量的E1区,使得在缺乏E1蛋白的条件下,不能复制的载体是以反式形式提供的;并且E1缺失和E1或E3缺失的组合大到足够容纳一个基因表达盒。
E1缺失可以从Ad5的大约碱基对342开始一直进行到大约碱基对3523,或相当于来自其他腺病毒的区域。所缺失的区域包括去掉从Ad5的大约碱基对450到大约碱基对3511的区域,或来自其他腺病毒的相应区域。始于大约碱基对341的较大的E1区缺失,去掉了有利于病毒包装的元件。
E3缺失能够从Ad5的大约27865号碱基对到大约30995号碱基对,从或者其他腺病毒载体的相应的区域获得。所述缺失区优选包括去掉了从Ad5的大约28134号碱基对到大约30817号碱基对的区域,或其他腺病毒载体的相应的区域。
E1区以及任选的E3区的缺失的组合应当足够大,以便包括所述 基因表达盒的重组基因组的总体大小,不超过野生型腺病毒基因组的大约105%。例如,当重组腺病毒Ad5基因组的大小增加超过大约105%时,所述基因组会变得不稳定(Bett等,Journal of Virology 67:5911-5921,1993)。
包括所述基因表达盒的重组腺病毒基因组的大小优选为野生型腺病毒基因组的大约85%-大约105%。在不同实施方案中,包括所述表达盒的重组腺病毒基因组的大小为野生型基因组大小的大约100%-大约105.2%,或大约100%。
可以将大约7,500kb插入具有E1和E3缺失的腺病毒基因组中。在没有任何缺失的情况下,Ad5基因组为35,935个碱基对,而Ad6基因组为35,759个碱基对。
第一代腺病毒载体的复制可以通过提供反式E1基因产物而实现。E1基因产物能够以反式形式提供,例如,通过使用业已用腺病毒E1区转化过的细胞系。用腺病毒E1区转化过的细胞和细胞系的例子有HEK 293细胞,911细胞,PERC.6TM细胞和转染过的原代人aminocytes细胞(Graham等,Journal of Virology 36:59-72,1977,Schiedner等,Human Gene Therapy 11:2105-2116,2000,Fallaux等,Human Gene Therapy 9:1909-1917,1998,Bout等,美国专利号6,033,908)。
应当将Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒插入重组腺病毒基因组的相当于缺失的E1区或缺失的E3区的区域。所述表达盒可以具有平行的或反向平行的取向。在平行取向中,所述插入基因的转录方向与缺失的E1或E3基因的方向相同。在反向平行取向的转录中,将相反的链用作模板,而转录方向是沿相反方向进行的。
在本发明的一种实施方案中,所述腺病毒载体具有插入到E1缺失区的基因表达盒。该载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548的第二腺病毒区或从相当于Ad6的大约碱基对3508到大 约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在本发明的另一种实施方案中,所述腺病毒载体具有插入到E3缺失区的表达盒。该载体包括:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在涉及腺病毒区的优选的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四,和第五区;(2)相当于Ad6的第一,第二,第三,第四,和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于 Ad5的第五区。
B.DNA质粒载体
DNA疫苗质粒载体包括一个基因表达盒和有利于复制并且优选有利于载体选择的元件。优选的元件提供了用于在非哺乳动物细胞中复制的元件和选择标记。所述载体应当不包括提供在人细胞中复制的元件或用于整合到人核酸中的元件。
有利于核酸选择的选择标记包括所述标记。优选的选择标记是能产生抗生素抗性的标记。抗生素选择基因的例子,包括编码氨苄青霉素,新霉素,和卡那霉素抗性的核酸。
可以用含有细菌复制起点和选择标记的质粒起始生产合适的DNA疫苗载体。能提供较高产量的细菌复制起点的例子,包括ColE1质粒-衍生的细菌复制起点(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。
细菌复制起点和选择标记的存在,使得能够在诸如大肠杆菌的细菌菌株中生产DNA载体。利用选择标记排除不包括DNA载体的细菌。
III.AD6重组核酸
Ad6重组核酸包括基本上相似于存在于SEQ.ID.NO.8中的Ad6区的Ad6区,和不存在于Ad6核酸中的区域。包括Ad6区的重组核酸具有不同的用途,如用于生产不同的Ad6区,作为生产基于Ad6的载体的中间物,以及用作递送重组基因的载体。
如图9所示,Ad6的基因组组构与Ad5的基因组组构非常相似。Ad5和Ad6之间的同源性大约为98%。
在不同实施方案中,Ad6重组核酸包括基本上相似于E1A,E1B,E2B,E2A,E3,E4,L1,L2,L3,或L4的核苷酸区,或它们的任意组合。与Ad6区基本上相似的核酸区具有至少65%,至少75%,至少85%,至少95%,至少99%或100%的核苷酸序列同一性;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的核苷酸差别。在上文的I.B.节中披露了用于确定基本上相似的核酸序列的技术和实施方案。
重组Ad6核酸优选包括编码不存在于Ad6中的多肽的表达盒。表 达盒的例子包括编码HCV区的表达盒,和编码其他类型多肽的表达盒。
可以采用不同量的Ad6生产不同类型的腺病毒载体,如第一代和第二代腺病毒载体。正如在上文的II.A.节中所指出的,第一代腺病毒载体是E1缺陷型的,并且在提供反式E1时能够复制。
第二代腺病毒载体包括比第一代载体少的腺病毒基因组,并且可用于与互补的细胞系和/或补充腺病毒蛋白的辅助载体连接。在不同的参考文献中,披露了第二代腺病毒载体,如Russell,Journal ofGeneral Virology 81:2573-2604,2000;Hitt等,1997,HumanAd vectors for Gene Transfer,Advances in Pharmacology,Vol40Academic Press。
在本发明的实施方案中,Ad6重组核酸是E1缺陷型腺病毒载体,它能够在补充反式E1时复制。可以将表达盒插入缺失的E1区和/或缺失的E3区。
具有在缺失的E1区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对28134到大约碱基对30817或从相当于Ad6的大约碱基对28157到大约碱基对30788的任选存在的第四个区;
f)从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第五腺病毒区,其中,如果存在第四区,所述第五区与所述第四区连接,或如果不存 在所述第四区,所述第五区与第三区连接;和
g)与所述第五区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第六腺病毒区;
其中,存在至少一个Ad6区。
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。
具有在缺失的E3区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的相当于从Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;
其中,存在至少一个Ad6区。
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。
IV.载体生产
可以用重组核酸技术生产载体,如包括使用限制酶,核酸连接,和同源重组的技术。重组核酸技术为本领域所熟知(Ausubel,CurrentProtocols in Molecular Biology,John Wiley,1987-1998,和Sambrook等,Molecular Cloning,A Laboratory Manual,2′dEdition,Cold Spring Harbor Laboratory Press,1989)。
利用中间载体驱动治疗性载体,或将表达盒或它的一部分从一种载体转移到另一种载体。中间载体的例子包括腺病毒基因组质粒和穿梭载体。
中间载体上的有用元件包括复制起点,选择标记,同源重组区,和常见的限制位点。可以利用常见的限制位点促进核酸序列的克隆或释放。
同源重组区提供了与另一种核酸分子上的目标区同源的核酸序列区。该同源区位于要插入所述目标区的核酸序列侧翼。在不同实施方案中,同源区的长度优选为大约150-600个核苷酸,或长度为大约100-500个核苷酸。
本发明的一种实施方案披露了包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒,选择标记,细菌复制起点,导向于要插入或取代E1区的表达盒的第一腺病毒同源区和第二腺病毒同源区的穿梭载体。所述第一和第二同源区位于所述表达盒侧翼。第一同源区包括至少大约100个碱基对,它们基本上与野生型腺病毒区的大约碱基对4-450的至少右侧末端(3′末端)同源。第二同源区包括至少大约100个碱基对,它们基本上与Ad5的大约碱基到3511-5792的至少左侧末端(5’末端)或来自另一种腺病毒的相应区同源。
所提到的“基本上同源”表示与目标区特异性重组的足够的同源性程度。在不同实施方案中,基本上同源表示至少85%,至少95%或100%的序列同一性。序列同一性可以按照上文I.B.节中所披露的方法进行。
生产腺病毒载体的一种方法是通过产生包括一个表达盒的腺病毒基因组质粒。前腺病毒质粒包括在需要的互补细胞系中复制所需要的所有腺病毒序列。然后用限制酶消化所述前腺病毒质粒,以便释放病毒ITR′s,并且转染到所述互补细胞系中,进行病毒回收。ITR′s 必须从质粒序列上释放,以便能够进行复制。腺病毒载体回收导致了含有所述表达盒的腺病毒载体的产生。
A.腺病毒基因组质粒
腺病毒基因组质粒包括存在于较大长度质粒(它可以是粘粒)上的腺病毒载体序列。所述较大长度的质粒可以包括其他元件,如根据生产和保持所述质粒所采用的方法,有助于真核细胞或细菌细胞生长和选择的元件。用于生产腺病毒基因组质粒的技术,包括与使用穿梭载体和同源重组相关的技术,和与将基因表达盒插入腺病毒粘粒相关的技术(Hitt等,Methods in Molecular Genetics 7:13-30,1995,Danthinne等,Gene Therapy 7:1707-1714,2000)。
腺病毒基因组质粒优选具有插入E1或E3缺失区的基因表达盒。在本发明的一种实施方案中,所述腺病毒基因组质粒包括插入E1缺失区的基因表达盒,复制起点,选择标记,和重组腺病毒区,该腺病毒区由以下成分组成:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;和
g)相当于存在于Ad5或Ad6中的E3区的全部或一部分的任选存在的E3区,根据需要的腺病毒载体的总体大小,可以提供较小的插 入片段。
在本发明的另一实施方案中,所述重组腺病毒基因组质粒具有插入到E3缺失区的基因表达盒。所述载体包括复制起点,选择标记,和以下部分:
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区;
b)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒结合的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。
在不同实施方案中,存在相关的腺病毒区:
(1)相当于Ad5的第一,第二,第三,第四和第五区;
(2)相当于Ad6的第一,第二,第三,第四和第五区;和
(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区和相当于Ad5的第五区。
本发明的一种实施方案披露了一种制备腺病毒载体的方法,包括生产腺病毒基因组质粒的同源重组步骤和腺病毒回收步骤。所述同源重组步骤包括使用其侧翼为腺病毒同源区的包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的穿梭载体。所述腺病毒同源区将表达盒导向于E1或E3缺失区。
在本发明的一种实施方案中,涉及生产腺病毒基因组质粒,将基因表达盒插入载体,包括:从相当于Ad5或Ad6的大约碱基对1到大 约碱基对450的第一腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。所述腺病毒基因组质粒应当包括复制起点和选择标记,并且可以包括Ad5或Ad6的E3区的全部或一部分。
在涉及腺病毒区的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四和第五区;(2)相当于Ad6的第一,第二,第三,第四和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于Ad5的第五区。
B.腺病毒载体回收
可以用本领域已知的或本文所披露的技术,从重组腺病毒基因组质粒中回收腺病毒载体。用于回收腺病毒的技术的例子为本领域所熟知,并且披露于以下文献中:Hitt等,Methods in Molecular Genetics7:13-30,1995,和Danthinne等,Gene Therapy 7:1707-1714,2000。
回收本文所披露的腺病毒载体的优选方法,包括加强腺病毒复制。例如,加强腺病毒复制可以通过在独立的载体上补充腺病毒功能,如E2蛋白(聚合酶,前末端蛋白和DNA结合蛋白)以及E4或f6进行。下面的实施例10披露了加强腺病毒复制,以便回收包括密码子优化的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体。
V.部分优化的HCV编码序列
HCV多蛋白编码核酸的部分优化提供了优化用于在人体内表达的较少量的密码子而不是全面优化。总体目标是提供由于密码子优化而产生的增强表达的优点,同时有利于生产包括具有优化密码子的HCV 多蛋白编码核酸的腺病毒载体。
HCV多蛋白编码序列的完全优化,提供了每一种氨基酸的最常见的人密码子。完全优化可以用本领域所熟知的密码子频率表进行,并且使用诸如BACKTRANSLATE的程序(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc.)。
部分优化可以对所存在的完整HCV多蛋白编码序列(例如,NS3-NS5B)进行,或对存在的一个或多个局部区域进行。在不同实施方案中,所存在的完整HCV编码多肽的GC含量不超过至少大约65%;并且一个或多个局部区域的GC含量不超过大约70%。
局部区域是存在于HCV编码核酸中的区域,并且其大小可以改变。例如,局部区域的长度可以为大约60,大约70,大约80,大约90或大约100个核苷酸。
部分优化可以通过首先构建要根据天然存在的序列部分优化的HCV编码多蛋白序列而实现。另外,可以将优化的HCV编码序列用作比较的基础,以便产生部分优化的序列。
VI.HCV组合治疗
可以使用HCV Met-NS3-NS4A-NS4B-NS5A-NS5B疫苗本身来治疗患者,可以与其他HCV治疗剂组合使用,并且可以与针对其他类型疾病的试剂一起使用。其他治疗剂包括治疗HCV和具有高的HCV感染倾向人体内的疾病的其他治疗剂。针对其他类型疾病的试剂包括针对HIV和HBV的疫苗。
用于治疗HCV的其他治疗剂,包括疫苗和非疫苗制剂(Zein,Expert Opin.Investig.Drugs 10:1457-1469,2001)。其他HCV疫苗的例子包括为了诱导针对HCV核心抗原和HCV E1,E2或p7区的免疫反应而设计的疫苗。疫苗成分可以是天然存在的HCV多肽,HCV模拟表位(mimotope)多肽或编码序列所述多肽的核酸。
HCV模拟表位多肽包括HCV表位,但是具有与天然存在的HCV抗原不同的序列。HCV模拟表位可以与天然存在的HCV抗原融合。在以下文献中,提供了披露用于生产模拟表位的一般性技术的参考文献,并且披露了不同的HCV模拟表位:Felici等,美国专利号5,994,083和Nicosia等,国际申请号WO 99/60132。
VII.药物施用
可以采用本文所提供的说明以及本领域所熟知的技术,制备并且给患者施用HCV疫苗。例如,一般性药物施用的指南披露于以下文献中:Modern Vaccinology,Ed.Kurstak,Plenum Med.Co.1994;Remington′s Pharmaceutical Sciences 18thEdition,Ed.Gennaro,Mack Publishing,1990;和Modern Pharmaceutics 2″d Edition,Eds.Banker和Rhodes,Marcel Dekker,Inc.,1990,其中的每一份文献都被收作本文参考。
HCV疫苗可以通过不同途径施用,如静脉内,腹膜内,皮下,肌内,真皮内,通过皮肤的按压或鼻内途径。优选的途径是肌内途径。
肌内施用可以使用不同的技术进行,例如通过使用或不用一个或多个电脉冲注射。电介导的转移,可能有利于通过刺激体液和细胞免疫反应进行遗传学免疫。
疫苗注射可以用不同的技术进行,如通过采用针头注射系统或无针头注射系统。无针头注射系统的例子是喷射注射装置(Donnelly等,国际公开号WO 99/52463)。
A.电介导的转移
电介导的转移或基因电-转移(GET),可以通过在核酸注射之后输送合适的电脉冲进行(参见Mathiesen,国际公开号WO 98/43702)。质粒注射和电穿孔可以用不锈钢针头进行。针头是成对的,三联的或更复杂的形式的。在一种设计中,将所述针头焊接在印刷电路板上,所述电路板是机械支持物,并且通过合适的电缆将针头与电场发生器连接在一起。
以电脉冲形式提供电刺激。脉冲可以具有不同的形式(矩形,正弦,三角形,指数衰减)和不同的极性(具有阳性或阴性极性的单极,双极)。脉冲可以以稳定的电压或稳定的电流形式输送。
可以利用不同形式的电治疗,将包括HCV的核酸疫苗和其他核酸疫苗导入患者体内。可行的电治疗方式包括以下方案:
治疗1:每隔1秒钟输送10串1000个矩形双极脉冲,脉冲长度为0.2毫秒/相,频率为1000Hz,稳定电压模式,45伏/相,浮动电流。
治疗2:每隔1秒钟输送2串100个矩形双极脉冲,脉冲长度为2毫秒/相,频率为100Hz,稳定电流模式,100毫安/相,浮动电压。
治疗3:2串双极脉冲,脉冲长度为大约2毫秒/相,总长度为大约3秒钟,其中,穿过组织的实际电流固定在大约50毫安。
电脉冲是通过电场发生器输送的。合适的发生器可以包括3个独立的硬件部件,它们组装于一个共同的底盘,并且通过便携式PC运行驱动程序驱动。所述软件同时管理基础功能和辅助功能。该装置的部件包括:(1)通过微处理器驱动的信号发生器,(2)电放大器和(3)数字示波器。
所述信号发生器,在特定范围内在软件控制下输送具有任意频率和形状的信号。所述相同的软件具有用于要输送的波形的相互作用编辑器,所述发生器涉及一种数字控制的电流限制装置(控制最大电流输出的安全装置)。所述电力放大器可以将所产生的信号放大到+/-150V。所述示波器是数字化的,并且能够对由所述放大器输送的电压和电流进行取样。
B.药用载体
可以药用的载体有利于疫苗的保存和给对象施用。在本文中披露了可以药用的载体的例子。其他可以药用的载体为本领域所熟知。
可以药用的载体可以包括不同的成分,如缓冲液,普通盐水或磷酸缓冲的盐水,蔗糖,盐和聚山梨酸酯。可以药用的载体的例子如下:2.5-10mM TRIS缓冲液,优选大约5mM TRIS缓冲液;25-100mM NaCl,优选大约75mM NaCl;2.5-10%蔗糖,优选大约5%蔗糖;0.01-2mMMgCl2;和0.001%-0.01%聚山梨醇酯80(来自植物的)。PH优选为大约7.0-9.0,更优选大约8.0。载体的一种具体例子包括5mM TRIS,75mM NaCl,5%蔗糖,1mM MgCl2,0.005%聚山梨醇酯80,pH 8.0。
C.用药方案
可以根据特定疫苗效力和诸如患者年龄,体重,性别和医学状况等因素;施用途径;需要的效果;以及用药次数,确定合适的用药方案。特定疫苗的效力取决于不同因素,如特定疫苗产生多肽的能力,所述多肽是在细胞中表达和加工的,并且以I类和II类MHC复合物的形式出现。
给患者施用的HCV编码核酸可以是包括病毒载体在内的不同类 型载体的一部分,如腺病毒载体,和DNA质粒疫苗。在涉及施用DNA质粒的不同实施方案中,给患者施用大约0.1-10mg质粒,以及给患者施用大约1-5mg质粒。在涉及施用病毒载体,优选腺病毒载体的不同实施方案中,给患者施用大约105-1011病毒颗粒,以及给患者施用大约107-1010病毒颗粒。
病毒载体疫苗和DNA质粒疫苗可以单独施用,或者可以作为激发和加强施用方案的一部分。激发和加强接种的一种混合形式,包括用DNA激发和用病毒载体疫苗加强,或用病毒载体疫苗激发和用DNA疫苗加强。
可以使用多次激发,例如大约2-4次或更多次。激发和加强之间的时间长度,通常从大约4个月到1年,不过,可以采用其他时间方案。采用DNA疫苗的激发方案,可优选用于患有以前存在的腺病毒免疫反应的患者的场合。
在本发明的一种实施方案中,将1×107-1×1012腺病毒载体颗粒,优选大约1×1010-1×1011腺病毒载体颗粒直接施用于肌肉组织中。在初次接种之后,用腺病毒载体或DNA疫苗进行加强。
在本发明的另一种实施方案中,初次的接是通过直接进入肌肉组织中的DNA疫苗进行的。在初次免疫之后,用腺病毒载体或DNA疫苗进行加强。
可以同时施用诸如白介素-12,GM-CSF,B7-1,B7-2,IP10,Mig-1的试剂,以便加强免疫反应。所述试剂可以作为蛋白施用,或者通过使用核酸载体施用。
D.异源激发-加强
异源激发-加强是一种混合形式,它包括使用一种类型的病毒载体进行激发,而用另一种类型的病毒载体进行加强。所述异源激发-加强可包括相关的载体,如基于不同腺病毒血清型的载体,以及关系更远的病毒,如腺病毒和痘病毒。在以下文献中披露了利用痘病毒和腺病毒载体防止小鼠出现疟疾:Gilbert等,Vaccine 20:1039-1045,2002。
涉及激发和加强的不同实施方案,包括表达所需抗原的以下类型的载体,如Met-NS3-NS4A-NS4B-NS5A-NS5B:Ad5载体,随后是Ad6载体;Ad6载体,随后是Ad5载体;Ad5载体,随后是痘病毒载体; 痘病毒载体,随后是Ad5载体;Ad6载体,随后是痘病毒载体;和痘病毒载体,随后是Ad6载体。
激发和加强之间的时间长度,通常为大约4个月到1年,不过,可以使用其他时间方案。最低时间方案应当足够允许免疫学休息。在一种实施方案中,这种休息是为期至少6个月的时间。激发可能包括用一种类型的载体多次激发,如激发2-4次。
存在于水痘病毒载体中的表达盒,应当包括一个激发子,该激发子是天然的,或源于感兴趣的痘病毒或其他痘病毒成员。构建和使用不同类型的痘病毒型载体的不同方法,包括基于痘苗病毒,修饰过的痘苗病毒,禽痘病毒,浣熊痘病毒,修饰过的痘苗病毒Ankara,金丝雀痘病毒(如ALVAC),禽痘病毒,牛痘病毒,和NYVAC的载体是本领域所熟知的(Moss,Current Topics in Microbiology andImmunology 158:25-38,1982;Earl等,In Current Protocolsin Molecular Biology,Ausubel等eds.,New York:GreenePublishing Associates&Wiley Interscience;1991:16.16.1-16.16.7,Child等,Virology 174(2):625-9,1990;Tartaglia等,Virology 188:217-232,1992;美国专利号4,603,112,4,722,848,4,769,330,5,110,587,5,174,993,5,185,146,5,266,313,5,505,941,5,863,542,和5,942,235)。
E.佐剂
HCV疫苗可以与佐剂一起配制。对于DNA质粒疫苗来说,佐剂是特别有用的。佐剂的例子包括明矾,AlPO4,alhydrogel,脂质-A及其衍生物或变体,弗氏不完全佐剂,中性脂质体,含有疫苗和细胞因子的脂质体,非离子型嵌段共聚物和趋化因子。
含有聚环氧乙烷(POE)和聚环氧丙烷(POP)的非离子型嵌段聚合物,如POE-POP-POE嵌段共聚物可以用作佐剂(Newman等,CriticalReviews in Therapeutic Drug Carrier Systems 15:89-142,1998)。可以用与阴离子型表面活性剂组合的非离子型嵌段共聚物增强核酸的免疫反应。
佐剂制剂的一种具体例子是含有CRL-1005(CytRx ResearchLaboratories),DNA,和benzylalkonium chloride(BAK)的制剂。该制剂可以通过使用正位移移液管将纯的聚合物添加到溶解在PBS 中的质粒DNA的冷却(<5℃)溶液中而制备。然后对该溶液进行涡旋搅拌,以便使所述聚合物溶解。在所述聚合物完全溶解之后,在低于所述聚合物的絮凝点(大约6-7℃)的温度下获得了透明溶液。然后通过缓慢添加溶解在PBS中的BAK的稀释溶液,将大约4mM BAK添加到溶解在PBS中的DNA/CRL-1005溶液中。在添加聚合物和BAK之前,最初DNA浓度为大约6mg/mL,而最终DNA浓度为大约5mg/mL。在添加BAK之后,对该制剂进行充分涡旋搅拌,然后使它的温度提高到高于絮凝点大约2℃。冷却和混合同时使它的温度提高到高于絮凝点大约2℃,重复进行若干次,直到该制剂的粒度为大约200-500nm,该粒度是通过动态光学散射测定的。然后将该溶液保存在冰上一直到该溶液透明,然后放在-70℃下保存。在使用之前,让该溶液在室温下解冻。
F.疫苗保存
可以利用不同类型的缓冲液保存腺病毒载体和DNA疫苗。例如,可以用下面的实施例9中所披露的缓冲液A105保存载体。
通过清除或螯合微量金属离子,可以改善对DNA的保存。可以将琥珀酸或苹果酸的试剂和螯合剂用于改善DNA疫苗的稳定性。螯合剂的例子包括多种磷酸配体和EDTA。添加诸如乙醇或甘油的非还原性自由基清除剂还可以防止因为自由基的产生对DNA质粒的破坏。另外,在所述制剂中可以控制缓冲液的类型,pH,盐浓度,光照,以及消毒方法的类型,以便优化所述DNA疫苗的稳定性。
实施例
提供下面的实施例是为了进一步说明本发明的不同特征。这些实施例还说明了可用于实施本发明的方法。这些实施例没有限定要求保护的本发明。
实施例1:Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒
根据1b亚型HCV BK菌株构建了编码HCVNS3-NS4A-NS4B-NS5A-NS5B的不同的基因表达盒。所编码的序列具有下列任一种序列:(1)活性NS5B序列(″NS″),(2)失活的NS5B序列(″NSmut″),(3)具有失活的NS5B序列的密码子优化序列(″NSOPTmut″)。所述表达盒还包括CMV激发子/增强子和BGH聚腺苷 酸化信号。
NS核苷酸序列(SEQ.ID.NO.5)与HCV BK菌株GenBank保藏号M58335相比,在5952个核苷酸中有30个核苷酸不同。NS氨基酸序列(SEQ.ID.NO.6)与相应的1b基因型HCV BK菌株在1984个氨基酸中有7个氨基酸不同。为了能够起始翻译,在NS序列的5′末端存在一个ATG密码子。在NS序列的3′末端存在一个TGA终止序列。
NSmut核苷酸序列(SEQ.ID.NO.2,图2)与NS序列相似。NSmut和NS之间的差别包括NSmut具有改变了的NS5B催化位点;在5′末端具有一个最佳核糖体结合位点;以及在3′末端具有一个TAAA终止序列。NS5B上的改变包括5138-5146号碱基,这些碱基编码1711-1713号氨基酸。所述改变导致了氨基酸GlyAspAsp改变成AlaAlaGly,并且产生了失活形式的NS5B RNA-依赖型RNA-聚合酶NS5B。
NSOPTmut序列(SEQ.ID.NO.3,图3)是根据由NSmut编码的氨基酸序列设计的。使用GCG(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc)BACKTRANSLATE程序将NSmut氨基酸序列反向翻译成核苷酸序列。为了制备NSOPTmut核苷酸序列,其中的每一种氨基酸是由相应的最常见的人密码子编码的,该程序是这样进行的:选择最可能的氨基酸序列的产生作参数,并且规定在GCG软件包内可获得的高度表达的人基因(human-high.cod)的密码子频率表作为翻译方案。
实施例2:制备具有NS,NSmut或NSOPTmut序列的pV1Jns质粒
含有NS,NSmut或NSOPTmut序列的pV1Jns质粒是通过以下方法制备和表征的:
具有NS序列的pV1Jns质粒
将来自HCV BK型菌株的编码区Met-NS3-NS4A-NS4B-NS5A和编码区Met-NS3-NS4A-NS4B-NS5A-NS5B(Tomei等,J.Virol.67:4017-4026,1993)克隆到pcDNA3质粒(Invitrogen)上,分别制备pcD3-5a和pcD3-5b载体。用HindIII消化PcD3-5A,用Klenow填充片段补平末端,随后用XbaI消化,以便产生相当于Met-NS3-NS4A-NS4B-NS5A的编码区的片段。将该片段克隆到pV1Jns-poly上,用BglII消化,用Klenow填充片段补平末端,随后用Xba I消化,制备pV1JnsNS3-5A。
pV1Jns-poly是pV1JnsA质粒的衍生物(Montgomery等,DNA andCell Biol.12:777-783,1993),通过将含有XbaI,PmeI,PacI的识别位点的多接头插入独特的BglII和NotI限制位点进行修饰。具有NS序列的pV1Jns质粒(pV1JnsNS3-5B)是通过以下方法获得的:同源重组到细菌菌株BJ5183中,用通过XbaI和NotI消化线性化的pV1JNS3-5A和含有大约200bp的NS5A,NS5B编码序列和大约60bp的BGH聚腺苷酸化信号共转化。所得到的质粒被称为pV1Jns-NS。
pV1Jns-NS可以归纳如下:
碱基 pV1JnsA的1-1881号碱基
一个额外的 AGCTT
随后是 Met-NS3-NS5B序列(SEQ.ID.NO.5)
然后是 wt TGA终止子
一个额外的 TCTAGAGCGTTTAAACCCTTAATTAAGG(SEQ.ID.NO.14)
碱基 pV1JnsA的1912-4909号碱基
具有NSmut序列的pV1Jns质粒
通过添加完整Kozak序列修饰V1JnsNS3-5A质粒的5′末端的NS3编码序列。该质粒(V1JNS3-5Akozak)是通过重组到细菌菌株BJ5183中,用通过A/HI消化线性化的V1JNS3-5A和包括内含子A的近端部分,限制位点BglII,完整的Kozak翻译起始序列和NS3编码序列的一部分的PCR片段共转化获得的。
通过用Xba I消化使所得到的质粒(V1JNS3-5Akozak)线性化,并且与包括大约200bp的NS5A,NS5B突变序列,强翻译终止序列TAAA和大约60bp的BGH聚腺苷酸化信号的PCR片段一起共转化到细菌菌株BJ5183中。所述PCR片段是通过组装两个22bp的重叠片段获得,其中,通过用于扩增它们的寡核苷酸引入了突变。所得到的质粒被称pV1Jns-NSmut。
pV1Jns-NSmut可以归纳如下:
碱基 pV1JnsA的1-1882号碱基
随后是 kozak Met-NS3-NS5B(mut)TAAA序列(SEQ.ID.NO.2)
一个额外的 TCTAGA
碱基 pV1JnsA的1925-4909号碱基
具有NSOPTmut序列的pVIJns质粒
通过位于该基因5’和3’末端的BamHI和SalI限制位点消化人密码子优化的合成基因(NSOPTmut),它具有突变的NS5B,以便破坏酶促活性,完整的Kozak翻译起始序列和强翻译终止序列。然后将该基因克隆到存在于V1JnsA质粒的多接头上的BglII和SalI限制位点上,以便产生V1Jns-NSOPTmut。
pV1Jns-NSOPTmut可以归纳如下:
碱基 pV1JnsA的1-1881号碱基
一个额外的 C
然后是 kozak Met-NS3-NS5B(optmut)TAAA序列(SEQ.ID.NO.3)
一个额外的 TTTAAATGTTTAAAC(SEQ.ID.NO.15)
碱基 pV1JnsA的1905-4909号碱基
质粒表征
通过转染在补充了L-谷氨酰胺(最终浓度4mM)的10%FCS/DMEM中生长的SEK293细胞,测试HCV NS蛋白的表达。在转染之前24小时,将细胞铺平板到直径35毫米的6个孔中,以便在转染的当天到达90%-95%的铺满度。使用LIPOFECTAMINE 2000试剂,用40纳克质粒DNA(事先确定为非饱和DNA用量)和100纳克含有Rous肉瘤病毒激发子控制的荧光素酶报导基因的pRSV-Luc质粒共转染。在37℃下,将细胞保持在CO2培养箱中48小时。
用1%Triton/TEN缓冲液制备细胞提取物。将所述提取物的荧光素酶活性标准化,并且在10%SDS聚丙烯酰胺凝胶上对系列稀释液进行电泳。将蛋白转移到硝酸纤维素上,并且用针对NS3,NS5A和NS5B的抗体分析,以便评估表达强度和正确的蛋白水解裂解。用模拟转染的细胞作为阴性对照。在图12中示出了来自测试pV1JnsNS,pV1JnsNSmut和pV1JnsNSOPTmut的典型实验的结果。
实施例3:用质粒DNA载体对小鼠进行免疫
将DNA质粒pV1Jns-NS,pV1Jns-NSmut和pV1JnsNSOPTmut注射到不同的小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。两个不同的株(Balb/C和C57Black6,N=9-10)用25或50μg的DNA进行 肌内注射,随后进行电脉冲。每一只动物每隔3周接受2个剂量。
在两次用药之后,通过对细菌表达的NS3蛋白酶结构域进行ELISA,测定在C57BIack6小鼠体内诱导的针对NS3蛋白的体液免疫反应。在用所有三种载体免疫的动物体内检测到对测试抗原特异的抗体,几何平均效价(GMT)在94000-133000范围内(表1-3)。
表1:pV1jns-NS
表2:pV1jns-NSmut
表3:pV1jns-NSOPTmut
在以3周的间隔2次肌内注射25μg质粒DNA免疫的C57BIack6小鼠体内检测到T细胞反应。进行定量ELIspot分析,以便测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过用包括针对C57BIack6小鼠的CD8+表位的二十聚体肽(pep1480)进行相同的测定,分析特异性CD8+反应。
用标准ELIspot分析,检测以抗原特异性形式分泌IFNγ的细胞。通过相同的ELIspot测定分析,以三周的间隔用50μg质粒DNA进行2次肌内注射免疫的C57BIack6小鼠体内的T细胞反应,测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽具有10个残基的重叠,包括NS3-NS5B序列。
用免疫过的小鼠制备脾细胞,并且重悬浮在R10培养基中(RPMI 1640,补充了10%FCS,2mM L-谷氨酰胺,50U/ml-50μg/ml青霉素/链霉素,10mM Hepes,50μM 2-巯基乙醇)。用纯化的大鼠抗小鼠INFγ抗体(PharMingen,Cat.No.18181D,PharmiMingen,10975Torreyana Road,San Diego,California 92121-1111USA)对Multiscreen 96-孔过滤平板(Millipore,Cat.No.MAIPS4510,Millipore Corporation,80Ashby Road Bedford,MA)进行包被。在培养过夜之后,用PBS 1X/0.005%Tween洗涤平板,并且用250μl/孔的R10培养基封闭。
用免疫过的小鼠制备脾细胞,并且在存在或不存在10μM肽的条件下,以2.5×105/孔或5×105/孔的密度将它培养24小时。在充分洗涤(PBS1X/0.005%Tween)之后,添加生物素化的大鼠抗小鼠IFNγ抗体(PharMingen,Cat.No.18112D,PharMingen,10975TorreyanaRoad,San Diego,California 92121-1111USA),并且在4℃下培养过夜。为了显影,添加链亲和素-AKP(PharMingen,Cat.No.13043E,PharMingen,10975Torreyana Road,San Diego,California92121-1111USA)和1-StepTMNBT-BCIP显影溶液(Pierce,Cat.No.34042,Pierce,P.O.Box 117,Rockford,IL 61105USA)。
利用包括HCV BK菌株NS3-NS5B的完整序列的二十聚体重叠肽的合并物显示HCV-特异性IFNγ-分泌T细胞。同样,将包括针对C57Black6小鼠的CD8+表位的单一的二十聚体肽用于检测CD8反应。在图13A和13B中示出了来自通过两次注射25或50μg质粒载体pV1Jns-NS,pV1Jns-NSmut和pV1Jns-NSOPTmut免疫的C57Black6和Balb/C小鼠(N=9-10)组的代表性数据。
实施例4:猕猴的免疫
通过肌内注射溶解在7.5mg/ml CRL1005,洁尔灭0.6mM中的5mg质粒pV1Jns-NSOPTmut对猕猴(N=3)进行免疫。在0和4周在每只动物的三角肌注射两剂。
通过IFN-γELISPOT在不同的时间点测定CMI。该分析测定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。
特定肽或肽合并物的使用可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析和干扰素-γ细胞内染色分析中的抗原呈递。制备基 于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5A,NS5B),以便用于在所述分析中测定在HCV DNA和腺病毒载体免疫的猕猴和HCV-感染的人体内的免疫反应。各个的肽是重叠的20-聚体,错开10个氨基酸。可以将肽的大的合并物用于检测对HCV蛋白的总体反应,而将较小的合并物和各个肽用于确定一种反应的表位特异性。
IFNγELISPOT
IFNγ-ELISPOT分析能提供HCV特异性T淋巴细胞反应的定量测定。对PBMC进行系列稀释,并且放入用抗猕猴IFN-γ抗体(MD-1U-Cytech)包被的微量滴定板的孔中。用HCV肽合并物将它们培养20小时,导致了前体细胞和IFN-γ分泌的再刺激。洗掉所述细胞,留下与细胞附着的浓集区上的抗体包被的孔结合的分泌的IFN。用生物素化的抗猕猴IFN抗体(detector Ab U-Cytech),随后用碱性磷酸酶偶联的链亲和素(Pharmingen 13043E)检测捕获的IFN。添加不溶性碱性磷酸酶底物,导致了在所述孔中细胞所在的位置出现暗斑,为分泌IFN-γ的每一个T细胞留下一个斑点。
每个孔的斑点的数量与抗原特异性T细胞的前体频率直接相关。在该分析中选择干扰素γ作为观察的细胞因子(使用物种特异性抗γ干扰素单克隆抗体),因为它是最常见的,并且是由激活的T淋巴细胞合成和分泌的最丰富的细胞因子之一。对于该分析来说,在存在和不存在(培养基对照)肽抗原的情况下,测定样品的每一百万PBMCs中成斑细胞(SFC)的数量。在表4中示出了在施用两种物质之后来自猕猴的PBMC的数据。
表4
来自通过两次注射5mg DNA/剂免疫的猕猴的PBMC的INFγELISPOT,存在于质粒pV1Jns-NSOPTmut的OPTIVAX/BAK中。数据是以SFC7106PBMC形式表达的。
实施例5:Ad6前-腺病毒质粒的构建
Ad6前-腺病毒质粒是通过以下方法获得的:
构建pAd6E1-E3+前-腺病毒质粒
利用Ad5和Ad6之间的广泛序列同一性(大约98%)或仅包括Ad6区,构建可用于制备第一代Ad6载体的基于Ad6的前-腺病毒质粒。利用同源重组将wtAd6序列克隆到细菌质粒中。
在图10中示出了用于以含有Ad5和Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad5 ITR盒的第二种DNA片段共转化BJ 5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad5基因组的右侧末端(碱基对33798-35935)和左侧末端(碱基对1-341和碱基对3525-5767)序列。ITR盒包括来自Ad5342-3524的E1序列的缺失。ITR盒中的Ad5序列提供了与纯化的Ad5病毒DNA同源的区,其中,在该区可以发生重组。
通过限制分析,筛选潜在克隆,并且选择一个克隆作为pAd6E1-E3+。然后对该克隆进行全面测序。pAd6E1-E3+包括从碱基对1-341和碱基对3525-5548的Ad 5序列,Ad6碱基对5542-33784,Ad5碱基对33967-35935(对于Ad5和Ad6来说,碱基编号是相对wt 序列而言的)。pAd6E1-E3+包括所有Ad6毒粒结构蛋白的编码序列,构成了它的野生型特异性。
在图11中示出了用于以含有Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad6ITR盒的第二种DNA片段共转化BJ5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad6基因组的右侧末端(碱基对35460-35759)和左侧末端(碱基对1-450和碱基对3508-3807)序列。这三种片段是通过PCR产生的,并且随后克隆到NEB193中,产生了pNEBAd6-3(ITR盒)。ITR盒包括Ad5的451-3507的E1序列的缺失。ITR盒中的Ad6序列提供了与纯化的Ad6病毒DNA同源的区,其中,可以发生重组。
pAd6E1-E3-前-腺病毒质粒的构建
用含有Ad5区的pAd6E1-E3+作起点,构建了含有Ad5区,并且在E3区有缺失的Ad6型载体。将含有E3区(Ad6碱基对25871-31192)的pAd6E1-E3+的5322bp的亚片段亚克隆到pABS.3上,产生pABSAd6E3。然后在该质粒上产生3个E3缺失,产生了三种新的质粒pABSAd6E3(1.8Kb)(缺失了Ad6的碱基对28602-30440),pABSAd6E3(2.3Kb)(缺失了Ad6的碱基对28157-30437)和pABSAd6E3(2.6Kb)(缺失了Ad6的碱基对28157-30788)。然后利用细菌重组将3个E3缺失取代返回到pAd6E1-E3+中,产生Ad6基因组质粒pAd6E1-E3-1.8Kb,pAd6E1-E3-2.3Kb和pAd6E1-E3-2.6Kb。
实施例6:制备具有NS序列的Ad5基因组质粒
通过XmnI和NruI限制位点消化含有编码区NS3-NS4A-NS4B-NS5A的pcDNA3质粒(Invitrogen),并且将含有CMV激发子,NS3-NS4ANS4B-NS5A编码序列和牛生长激素(BGH)聚腺苷酸化信号的DNA片段克隆到穿梭载体pDe1E1Spa的独将的EcorV限制位点上,产生了Sva3-5A载体。
用XmnI和EcorI消化(部分消化)含有编码区NS3-NS4A-NS4B-NS5A-NS5B的pcDNA3质粒,并且将含有部分NS5A,NS5B基因和BGH聚腺苷酸化信号的DNA片段克隆到Sva3-5A载体上,用EcorI和BglII消化,用Klenow补平末端,产生了Sva3-5B载体。
最后通过SspI和Bst1107I限制位点消化Sva3-5B载体,并且将含有其侧翼为腺病毒序列的表达盒(CMV激发子,NS3-NS4A-NS4B-NS5A-NS5B编码序列和BGH聚腺苷酸化信号)的DNA片段与Ad5HVO(E1-,E3-)ClaI线性化的基因组质粒一起共转化到细菌菌株BJ5183中,产生pAd5HVONS。pAd5HVO包括Ad5碱基对1-341,碱基对3525-28133和碱基对30818-35935。
实施例7:制备具有Nsmut序列的腺病毒基因组质粒
在Ad5或Ad6背景中,制备含有NS-mut序列的腺病毒基因组质粒。Ad6背景包括Ad5区的1-450,3511-5548和33967-35935号碱基。
用BglII和XbaI限制酶消化pV1JNS3-5Akozak,并且将含有Kozak序列和编码NS3-NS4A-NS4B-NS5A的序列的DNA片段克隆到BglII和XbaI消化过的polypMRKpde1E1穿梭载体中。所得到的载体被命名为shNS3-5Akozak。
PolypMRKpde1E1是Rkpde1E1(Pac/pIX/pack450)+CMVmin+BGHpA(str)的衍生物。通过在CMV激发子下游的独特BglII限制位点上插入包括BglII,PmeI,SwaI,XbaI,SalI识别位点的多接头进行过修饰。MRKpdelE1(Pac/pIX/pack450)+CMVmin+BGHpA(str)包括Ad5序列的碱基对1-5792,具有E1序列的碱基对451-3510的缺失。将人CMV激发子和BGH聚腺苷酸化信号以E1平行取向插入E1缺失区,通过一个独特的BglII位点分隔它们。
通过组装PCR并且通过同源重组插入shNS3-Sakozak载体,获得了NS5B片段,该片段发生了突变以便破坏了酶促活性,并且在3’末端具有强的翻译终止序列,产生了polypMRKpde1E1NSmut。在polypMRKpde1E1NSmut中,NS-mut编码序列受CMV激发子的控制,并且BGH聚腺苷酸化信号存在于下游。
通过用PadI和Bst1107I限制酶切除所述基因表达盒和包括可以进行同源重组的腺病毒序列的侧翼区,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6Kb ClaI线性化的基因组质粒共同转化细菌菌株BJ5183,以便分别产生pAd5HVONSmut和pAd6E1-,E3-Nsmut。
pAd6E1-E3-2.6Kb包括Ad5碱基对1-341和碱基对3525-5548,Ad6碱基对5542-28157和碱基对30788-33784,和Ad5碱基对 33967-35935(对于Ad5和Ad6来说,碱基对编号是相对wt序列而言)。在这两种质粒上,病毒ITR′s是通过包括细菌复制起点和氨苄青霉素抗性基因的质粒序列连接的。
实施例8:具有NSOPTmut的腺病毒基因组质粒的制备
用BamHl和SalI限制酶消化由克隆到pCRBlunt载体(Invitrogen)上的SEQ.ID.NO.3提供的人密码子优化的合成基因(NSOPTmut),并且克隆到存在于穿梭载体pMRKpde1E1上的BglII和SalI限制位点上。所得到的克隆(polypMRKpde1E1NSOPTmut)用PacI和Bst1107I限制酶消化,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6KbClaI线性化的基因组质粒一起共同转化到细菌菌株BJ5183中,分别产生pAd5HVONSOPTmut和pAd6E1-,E3-NSOPTmut。
实施例9:腺病毒载体的回收和扩增
在Per.6细胞中回收腺病毒载体。Per.C6是在补充了L-谷氨酰胺(最终浓度为4mM),青霉素/链霉素(最终浓度为100IU/ml)和10mMMgCl2的10%FCS/DMEM中生长的。在感染之后,将细胞保持在补充了5%马血清(HS)的相同培养基中。为了进行病毒回收,将2.5×106Per.C6铺平板到直径为6cm的Petri培养皿中。
在铺平板24小时之后,通过磷酸钙方法,用10μg的PacI线性化的腺病毒DNA转染细胞。将所述DNA沉淀留在细胞上4小时时间。去掉所述培养基,并且添加5%HS/DMEM。
将细胞保持在CO2培养箱中,直到出现细胞致病作用(1周)。回收细胞和上清液,并且进行3次冷冻/解冻循环(液氮/37℃的水浴)。在-4℃下,以3000rpm的速度对裂解物进行离心20分钟,并且以每个培养皿1毫升的用量,使用所回收的上清液(相当于包括仅在细胞上传代1次的病毒的细胞裂解液;P1),以便感染在直径10厘米的Petri培养皿中达到80%-90%铺满度的Per.C6。培养感染的细胞,直到出现细胞致病作用,回收细胞和上清液,并且按上述方法制备裂解液(P2)。
将P2裂解液(4ml)用于感染2×15cm的Petri培养皿。将从该感染中回收的裂解液(P3),以等份样品形式在-80℃下保存,作为病毒的原种,以便用作大规模病毒制备的原材料。在这种情况下,1ml的原种就足以感染直径为2×15cm的Petri培养皿,并且将所得到 的裂解液(P4)用于感染要进行大规模感染的Petri培养皿。
进一步的扩增是用P4裂解液进行的,该裂解液用不含FCS的培养基稀释,并且用于以每个培养10ml的用量感染30×15cm的Petri培养皿(Per.C6达到80%-90%的铺满度)。在CO2培养箱中培养细胞1小时,每隔20分钟进行轻微混合。在每个培养皿中添加12ml5%HS/DMEM,并且培养细胞直到出现细胞病理效应(大约48小时)。
收集细胞和上清液,并且在4℃下以2Krpm的速度离心20分钟。将沉淀重新悬浮在15ml 0.1M Tris,pH=8.0中。通过3次冷冻/解冻循环裂解细胞(液氮/37℃的水浴)。添加150μl的2MMgCl2和75μl的DNAse(溶解在10ml的20mM Tris-HCl pH=7.4中的10mg牛胰腺脱氧核糖核酸酶I,50mM NaCl,1mM二硫苏糖醇,0.1mg/ml牛血清白蛋白,50%甘油),在37℃的水浴中培养1小时之后(每隔15分钟涡旋搅拌1次),在4℃下以4K rpm的速度对裂解液进行15分钟的离心。所回收的上清液可以加样到CsCl梯度上。CsCl梯度是按以下方法在SW40超透明试管中制备的:
0.5ml的1.5d CsCl
3ml的1.35d CsCl
3ml的1.25d CsCl,在每个试管中加样5ml的病毒上清液。
如果必要的话,在所述试管上面放置0.1Mtris-Cl,pH=8.0。用转子SW40,在10℃下以35K rpm将试管离心1小时。用注射器收集病毒带(位于1.25/1.35的界面上)。
将所述病毒转移到新的SW40超透明试管中,并且将1.35dCsCl添加在试管的顶部。用转子SW40,在10℃下以35K rpm将试管离心24小时,然后以尽可能小的体积收集病毒,并且用缓冲液A105(5mMTris,5%蔗糖,75mM NaCl,1mM MgCl2,0.005%聚山梨醇酯80,pH=8.0)充分透析。在透析之后,以10%的最终浓度添加甘油,并且在-80℃下,以等分样品的形式保存病毒。
实施例10:改善了的腺病毒载体回收
发现具有HCV NSOPTmut转基因的第一代Ad5和Ad6载体难以回收。回收过程的一个可能的障碍可能是因为质粒DNA不能有效复制,它是腺病毒复制机制的一种亚最佳模板。与DNA的5’末端连接的末端蛋白的缺乏(通常存在于病毒DNA中),与插入所述载体的E1区中 的转基因的极高G-C含量相关,可能导致质粒衍生的腺病毒复制速度的显著降低。
为了建立回收Ad载体的更有效的和可再现的方法,采用了包括受tet-诱导型激发子控制的所有E 2蛋白(聚合酶,前末端蛋白和DNA结合蛋白),以及E4orf6的表达载体(pE2;图19)。PE2的转染与PerC6和293中的正常前腺病毒质粒的组合,导致了Ad DNA复制的显著增强,并且导致了完整感染性腺病毒颗粒的更有效的产生。
质粒构建
pE2是基于克隆载体pBII(CLONTECH)的,具有两个附加元件,以便能够进行附加型复制,并且在细胞培养物中选择:(1)EBV-OriP(EBV[nt]7421-8042)区,当EBNA-1表达时,使得质粒能够与细胞周期同步复制,和(2)潮霉素-B磷酸转移酶(HPH)-抗性基因,使得能够阳性选择转化过的细胞。按以下方法构建了腺病毒基因E2a和b以及E4-Orf6的两个转录单位,并且在pE2中进行组装。
Ad5-聚合酶ClaI/Sphl片段和Ad5-pTPAcc65/EcoRV片段是从pVac-Pol和pVac-pTP获得的(Stunnemberg等,NAR 16:2431-2444,1988)。用Klenow补平这两个片段,并且克隆到pBI的SalI(补平的)和EcoRV位点上,分别获得了pBI-Pol/pTP。
通过将它克隆到pJC13-1的BamHI位点上,首先将来自pCEP4(Invitrogen)的EBV-OriP元件插入β-珠蛋白绝缘体二聚体中(Chung等,Cell 74(3):505-14,1993)。然后将来自pJC13-OriP的HS4-OriP片段克隆到pSAlmv(一种含有tk-Hygro-B抗性基因表达盒和Ad5复制起点的质粒)内部,通过PCR由pFG140获得了首尾连接排列的ITR′s(Graham,EMBO J.3:2917-2922,1984),用以下引物:5′-TCGAATCGATACGCGAACCTACGC-3′(SEQ.ID.NO.16)和5′-TCGACGTGTCGACTTCGAAGCGCACACCAAAAACGTC-3′(SEQ.ID.NO.17),因此产生了pMVHS40rip。然后将来自pMVHS40rip的包括绝缘的OriP,Ad5ITR连接和tk-HygroB盒的DNA片段插入pBI-Pol/pTP载体限制的AseI/AatII,产生了pBI-Pol/pTPHS4。
为了构建能表达Ad5-Orf6和Ad5-DBP的第二种转录单位,首先将通过PCR获得的E4orf6(Ad5[nt]33193-34077)插入pBI载体,产生了pBI-Orf6。然后,将DBP编码DNA序列(Ad5[nt]22443-24032) 插入pBI-Orf6,获得了第二种双向Tet-调节的表达载体(pBI-DBPB4orf6)。用BGH和SV40polyA取代存在于pBI中的原始polyA信号。
然后通过插入包括Adeno5-ITRs的DNA片段,修饰pBI-DBP/E4orf6,它们是以首尾连接形式排列的,还包括从质粒pSA-lmv中获得的潮霉素B抗性基因。然后将新的质粒pBIDBP/E4orf6shuttle用作供体质粒,以便用大肠杆菌菌株BJ5183进行同源重组,将第二种tet-调节的转录单位插入pBI-Pol/pTPHS4中,获得pE2。
细胞系,转染和病毒扩增
在补充了10%胎牛血清(FBS),10mM MgCl2,青霉素(100U/ml),链霉素(100ug/ml)和2mM谷氨酰胺的Dulbecco′s改良的Eagle′s培养基(DMEM)中培养PerC6细胞。
所有瞬时转染都是按照生产商披露的方法用Lipofectamine2000(Invitrogen)进行的。用PacI消化过的3.5μg的Ad5/6NSOPTmut前-腺病毒质粒自身或与5μg pE2加1μg pUHD52.1组合转染生长在6cm平板上的铺满度为90%的PERC.6TM。pUHD52.1是反向tet反式激活蛋白2(rtTA2)的表达载体(Urlinger等,Proc.Natl.Acad.Sci.U.S.A.97(14):7963-7968,2000)。在转染时,细胞是在存在1μg/ml多西环素的条件下培养的,以便激活pE2表达。在转染之后7天收获细胞,并且通过3次冷冻/解冻循环获得细胞裂解液。将2ml细胞裂解液用于感染第二个6cm培养皿的PerC6。培养感染的细胞,直到出现完整的CPE,然后收获。按上述方法让病毒顺序传代5次,然后在氯化铯梯度上纯化。纯化病毒的DNA结构是通过内切核酸酶消化和琼脂糖凝胶电泳分析控制的,并且与原始前腺病毒质粒限制图谱进行比较。
实施例11:HCV多蛋白编码核酸的部分优化
进行HCV多蛋白编码核酸的部分优化,以便促进包括用于在人宿主中表达的优化密码子的腺病毒载体的产生。总体目标是提供由于密码子优化而产生的增强的表达,同时促进编码HCV多蛋白的腺病毒载体的产生。
在生产编码HCV多蛋白的具有在人宿主中表达的优化密码子的 腺病毒载体时,遇到了若干种难题。发现包括优化序列(SEQ.ID.NO.3)的腺病毒载体,比包括非优化序列(SEQ.ID.NO.2)的腺病毒载体更难以合成和回收。
生产包括SEQ.ID.NO.3腺病毒载体的难题是由于高的GC含量。特别有问题的区域是在NSOPTmut(SEQ.ID.NO.3)的大约3900号位置。
设计了另一种版本的优化HCV编码核酸序列,以便有利于它在腺病毒载体上的应用。与NSOPTmut相比,将所述另一种版本设计成具有较低的总体GC含量,以便减轻/避免连续的G或C的潜在的有问题的基序的出现,同时保持高水平的密码子优化,以便能够改善所编码的多蛋白和各个裂解产物的表达。
用于制备亚最佳密码子优化序列的起点是NSOPTmut核苷酸序列的编码区(SEQ.ID.NO.3的7-5961号碱基)。密码子使用频率的值(将每一种氨基酸标准化为总共1.0)是从在Wisconsin PackageVersion 10.3中提供件human_high.Cod中获得的(Accelrys Inc.,a wholly owned subsidiary of Pharmacopeia,Inc)。
为了降低局部和总体GC含量,人工制备了确定每一种氨基酸的优选密码子取代的表格。对于每一种氨基酸来说,所述密码子1)与最常见的密码子相比,具有更低的GC含量,和2)选择出现较高的密码子使用频率(如在human_high.Cod中所定义的)作为取代密码子。例如,对于Arg来说,最高频率的密码子是CGC。在编码Arg的其他五种替代密码子(CGG,AGG,AGA,CGT,CGA)中,有三个(AGG,CGT,CGA)将GC含量降低了1个碱基,有1个(AGA)降低了2个碱基,并且有一个(CGG)降低了0个碱基。由于在human high.Cod中所列举的AGA密码子具有较低的使用频率(0.1),因此,取代CGC的密码子选择为具有0.18的相对频率的AGG。采用相似的标准,以便建立其他氨基酸的密码子取代,得到表5所示的清单。在以下优化方法中采用的参数是评经验确定的,以便所得到的序列保持显著改善了的密码子使用(对于每一种氨基酸而言),并且降低GC含量(总体上和连续G和/或C的局部片段形式)。
部分优化的HCV编码序列的两种例子是由SEQ.ID.NO.10和SEQ.ID.NO.11提供的。SEQ.ID.NO.10提供了整体上部分优化的 HCV编码序列。SEQ.ID.NO.11提供了密码子使用完全优化的HCV编码序列,只有部分优化的区域例外。
密码子优化是通过以下方法进行的:
步骤1)使用3个密码子的滑动窗口(9个碱基),每一次循环后使所述窗口移动一个密码子,分析输入的完全优化的NSOPTmut序列的编码区。无论何时在所述窗口中检测到含有5个或5个以上连续C和/或G的片段,都采用以下取代规则:用N表示以前进行的密码子取代的数量。如果N是奇数的话,使用在表5中规定的密码子取代所述窗口中的中间密码子,如果N是偶数的话,使用在诸如human_high.cod.密码子优化表中规定的密码子取代窗口中的第三个末端密码子。如果在第二或第三个密码子存在Leu或Val,不进行任何取代,以便不导入具有很低相对密码子使用频率的Leu或Val密码子(例如,参见human_high.Cod)。在随后的循环中,对包括以前循环的取代的序列进行移动窗口分析。
根据经验发现所述3个密码子窗口中的中间和末端密码子的其他取代,提供了更令人满意的优化密码子使用的总体保持,同时还降低了GC含量(在该方法之后根据最终序列判断)。不过,一般来说,正确的取代方法取决于由接受分析的核苷酸序列所编码的氨基酸序列,并且必须凭经验确定。
步骤2)然后使用长度为21个密码子(63个碱基)的滑动窗口,对包括在步骤1)中进行的所有密码子取代的序列进行其他分析:根据可判断的参数,确定该窗口中总体GC含量。如果所述窗口中GC含量高于70%的话,就进行以下密码子取代方法:在所述窗口中,用表5中所提供的密码子取代氨基酸Asn,Asp,Cys,Glu,His,Ile,Lys,Phe,Tyr的密码子。对这一组氨基酸的取代的限制受到了以下事实的驱动:a)所述取代密码子仍然具有可接受的在human_high.Cod中的高的使用频率,和b)取代密码子的CUTG中的平均总体人密码子使用几乎与最常见的密码子一样高。在以下循环中,对包括前面循环的取代的序列进行移动窗口的分析。
通过GC含量总体上的降低和各个氨基酸的高密码子优化的保持之间的折中,凭经验确定70%的阈值。与步骤1)一样,确切的取代方法(氨基酸和GC含量阈值的选择),同样取决于由接受分析的核 苷酸序列所编码的氨基酸序列,并且必须凭经验确定。
步骤3)然后人工编辑通过步骤1)和2)产生的序列,并且按照以下标准改变其他密码子:人工检查在具有21个密码子的窗口上GC含量仍然高于70%的区域,并且按照表5中提供的方案再次取代少数密码子。
进行随后的步骤,以便提供有用的限制位点,去掉互补链上的可能的开放读框,添加同源重组区,添加Kozac信号,并且添加一个终止子。这些步骤的编号为4-7。
步骤4)检查步骤3)中所产生的序列的某些限制位点(BglII,PmeI和XbaI)的缺乏和仅有一个StuI位点的存在,以便可以进行随后的使用一小类显著酶的克隆策略。通过取代作为相应识别位点的一部分的密码子,从所述序列中去掉两个位点(一个BglII位点,以及一个StuI位点)。
步骤5)然后相应修饰通过步骤1)-4)制备的序列,以便随后产生修饰过的NSOPTmut序列(通过同源重组)。在通过步骤1)-4)获得的序列中,包括3556-3755号碱基的片段和包括4456-4656号碱基的片段被来自NSOPTmut的相应的片段所取代。包括SEQ.ID.NO.10的3556-4656号碱基的片段可用于通过同源重组取代NSOPTmut上的有问题的区域(3900号位置附近),由此产生了具有SEQ.ID.NO.11的序列的NSOPTmut的变体。
步骤6)分析在步骤1)-5)产生的序列,发现了一个潜在的、几乎跨越互补链上的完整片段的开放读框。从所述有义链上去掉所有密码子CTA和TTA(Leu)和TCA(Ser),能够有效除去所述互补链上的一个读框中的所有终止密码子。尽管转录该互补链开放读框,以及随后翻译成蛋白的可能性非常小,为了排除对有义链上的编码的序列的转录和随后翻译的潜在的干扰,大约每隔500个碱基,将编码Ser的TCA密码子导入所述有义链。在步骤5)中导入的片段中没有引入变化,以便可以进行同源重组。编码Ser的TCA密码子优于编码Leu的CTA和TTA密码子,因为与human_high.Cod中的CTA(0.02)和TTA(0.03)相比,TCA具有更高的相对频率(0.05)。另外,来自CUTG的平均人密码子使用,倾向于TCA(对于CTA和TTA来说为0.14和0.07)。
步骤7)在最后一个步骤中,将GCCACC添加到该序列的5’末端,以便产生一个优化的内部核糖体进入位点(Kozak信号),并且在3’末端添加一个TAAA终止信号。为了保持NSsuboptmut的翻译特性的激发,所述编码区的前8个密码子保持与NSOPTmut序列相同。再次检查所得到的序列上BglII,PmeI和XbaI识别位点的缺乏,和仅有一个StuI位点的存在。
与NSOPTmut(70.3%)相比,NSsuboptmut序列(SEQ.ID.NO.10)具有总体上较低的GC含量(63.5%),并且保持密码子使用优化的良好优化水平。NSsuboptmut与NSmut的核苷酸序列同一性为77.2%。
表5:在步骤1)和步骤2)期间进行的密码子取代的定义
实施例12:病毒表征
通过以下方法表征腺病毒载体:(a)测定物理学颗粒/ml;(b)进行TaqMan PCR分析;和(c)在感染HeLa细胞之后检查蛋白表达。
a)物理颗粒测定
以1/10和1/100的比例用0.1%SDS PBS稀释氯化铯纯化的病毒。作为对照,使用缓冲液A105。在55℃下将所述稀释液培养10分钟,在对所述试管进行短时间离心之后,测定260nm下的O.D.。按以下方法计算病毒颗粒的数量:1OD 260nm=1.1×1012物理颗粒/ml。以上结果通常在5×1011和1×1012物理颗粒/ml范围内。
b)TaqMan PCR分析
将TaqMan PCR分析用于进行腺病毒载体基因组定量(Q-PCR颗粒/ml)。用ABI Prism 7700-序列检测仪进行TaqMan PCR分析。该反应是在50μl的最终体积中,在存在寡核苷酸(最终浓度200nM)和对腺病毒主链特异的探针(最终浓度200μM)的条件下进行的。用0.1%SDS PBS以1/10的比例稀释所述病毒,并且在55℃下培养10分钟。在对所述试管进行简单离心之后,制备系列的1/10稀释液(用水稀释)。将10μl的10-3,10-5和10-7稀释液用作PCR测定的模板。
根据在相同实验中产生的标准曲线,计算存在于每一种样品中的颗粒的数量。典型的结果为1×1012至3×1012Q-PCR颗粒/ml。
c)HCV非结构蛋白的表达
通过感染HeLa细胞检测HCV NS蛋白的表达。在感染前一天,以1.5×106细胞/皿(直径10cm的Petri培养皿)的密度将细胞铺平板。将相当于m.o.i.50,250和1250pp/细胞的不同数量的氯化铯纯化的病毒稀释在培养基(无FCS)中,达到5ml的最终体积。将稀释过的病毒添加到所述细胞上,并且在37℃下,在CO2培养箱中培 养1小时(每隔20分钟进行轻柔混合)。添加5ml 5%HS-DMEM,并且在37℃下将所述细胞培养48小时。
用1%Triton/TEN缓冲液制备细胞提取物。在10%SDS-丙烯酰胺凝胶上对提取物进行电泳,吸印到硝酸纤维素膜上,并且用针对NS3,NS5a和NS5b的抗体分析,以便检查正确的多蛋白裂解。将模拟感染的细胞用作阴性对照。在图14中示出了来自测试Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut的典型实验的结果。
实施例13:用编码不同NS盒的腺病毒载体对小鼠进行免疫
将腺病毒载体Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut注射到C57Black6小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。用109pp的CsCl纯化的病毒肌内注射各组动物(n=9-10)。每只动物以三周的间隔接受两剂。
通过在用药之后对细菌表达的NS3蛋白酶结构域进行ELISA分析,测定在用药之后来自C57Black6免疫小鼠的两种血清中针对NS3蛋白的体液免疫反应。检测的对测试抗原特异的抗体的几何平均效价(GMT)为100-46000(表6,7,8和9)。
表6:Ad5-NS
表7:Ad5-Nsmut
表8:MRKAd5-Nsmut
表9:MRKAd6-NSmut
通过定量ELISPOT测定分析TC57Black6小鼠体内的T细胞反应,其中测定对20聚体的五种合并物(从F到L+M命名)的反应的IFN-γ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过相同的测定,使用包括C57Black6小鼠的CD8+表位(pep1480)的20聚体肽,分析在C57Black6小鼠体内诱导的特异性CD8+反应。通过标准ELIspot测定,检测以抗原特异性方式分泌IFNγ的细胞。
按上面实施例3所示方法生产并且处理脾细胞和肽。在图15中示出了来自通过两次注射109载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut的病毒颗粒免疫的C57Black6小鼠组(N=9-10)的代表性数据。
例14:用腺病毒载体对猕猴进行免疫
通过肌内注射氯化铯纯化的Ad5-NS,MRKAd5-NSmut,MRKAd6-Nsmut或MRKAd6-NSOPTmut病毒,对猕猴(N=3-4)进行免疫。在第0和第4周,每只动物在三角肌处接受两剂1011或1010vp。
在不同的时间点通过以下方法测定CMI:a)IFN-γELISPOT(参见上文的实施例3),b)IFN-γICS,和c)大量CTL分析。以上分析方法确定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。
特定肽或肽合并物的使用,可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析,和干扰素-γ细胞内染色分析中的抗原呈递。制备基于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5a,NS5b),以便在所述分析中用于测定HCV DNA和腺病毒载体免疫的猕猴,以及HCV感染的人体内的免疫反应。所述各个肽是重叠的20聚体,错开10个氨基酸。可以将大的肽合并物用于检测对HCV蛋白的总体反应,同时,可以将较小的合并物和各个肽用于确定一种反应的表位特异性。
IFN-γ1CS
对于IFN-γICS来说,用肽合并抗原刺激存在于1ml R10(补充了10%FCS的RPMI培养基)中的2×106PBMC。每一种肽的最终浓度为2μg/ml。在37℃下,在CO2培养箱中将细胞培养1小时,然后以10μg/ml的最终浓度添加Brefeldin A,以便抑制可溶性细胞因子的分泌。在37℃下将细胞再培养14-16小时。
在存在以下共刺激抗体的条件下进行刺激:CD28和CD49d(抗人CD28BD340975和抗人CD49d BD340976)。在培养之后,用表面抗原的荧光染料偶联的抗体对细胞进行染色:抗-CD3,抗-CD4,抗-CD8(CD3-APC Biosource APS0301,CD4-PE BD345769,CD8-PerCPBD345774)。
为了检测细胞内细胞因子,用FACS透化缓冲液2(BD340973),2x最终浓度处理细胞。一旦固定和透化,用抗人IFN-γ,IFN-γFITC(Biosource AHC4338)的抗体培养细胞。
将细胞重新悬浮在用PBS制备的1%甲醛中,并且在24小时之内,在FACS上分析。在装有两种激光的FACSCalibur仪器(BectonDickinson)上进行四色FACS分析。通过门控与CD3,CD8阳性细胞群偶联的正向与侧向散射中的淋巴细胞群获得数据。获得了所述门的至少30,000个事件。阳性细胞是以106淋巴细胞中IFN-γ表达细胞的数量形式表达的。
在图16A-16D,17A和17B中,报导了在一次或两次注射1010或1011vp不同腺病毒载体之后从免疫过的猴获得的IFN-γELISPOT和IFN-γICS数据。
大量CTL分析
T淋巴细胞的区分效应物功能,是这种细胞群体的亚型直接裂解具有合适的MHC-相关抗原肽的细胞的能力。这种细胞毒性活性最常见的是与CD8+T淋巴细胞相关。
在体外用能表达HCV抗原的重组疫苗病毒感染PBMC样品大约14天,以便提供记忆T细胞的抗原再刺激和扩增。测试了针对用肽抗原合并物处理过的自体B细胞系的细胞毒性。
所述培养物的裂解功能,是以在用CTL效应细胞培养4小时期间,由靶细胞释放的铬导致的特异性裂解的百分比形式测定的。测定特异性细胞毒性,并且与不相关的抗原或赋形剂处理过的B细胞系进行比 较。这种分析是半定量的,并且是确定CTL反应是否是由疫苗引起的优选方式。在图18A-18F中示出了在两次注射1011vp/剂和腺病毒载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut之后,来自免疫过的猴的数据。
其他实施方案在以下权利要求范围内。尽管业已示出了和说明了若干种实施方案,在不超出本发明构思和范围的前提下,可以进行各种改进。
序列表
<110>Merck&Co.Inc.,和Istituto Di Ricerche Di Biologia Molecolare P.
Angeletti S.P.A.
<120>丙型肝炎病毒疫苗
<130>ITR0015Y PCT
<150>60/363,774
<151>2002-03-13
<150>60/328,655
<151>2001-10-11
<160>17
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1985
<212>PRT
<213>人工序列
<220>
<223>Met-NS3-NS4A-NS4B-NS5A-NS5B多肽
<400>1
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly
1 5 10 15
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
20 25 30
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys
35 40 45
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr
50 55 60
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp
65 70 75 80
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr
85 90 95
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
115 120 125
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
130 135 140
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145 150 155 110
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met
165 170 175
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
180 185 190
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
195 200 205
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
210 215 220
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225 230 235 240
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
245 250 255
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly
260 265 270
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
275 280 285
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile
290 295 300
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305 310 315 320
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
325 330 335
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly
340 345 350
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe
355 360 365
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly
370 375 380
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385 390 395 400
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
405 410 415
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
420 425 430
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
435 440 445
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
450 455 460
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly
465 470 475 480
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
485 490 495
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val
500 505 510
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
515 520 525
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
530 535 540
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr
545 550 555 560
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
565 570 575
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
580 585 590
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
595 600 605
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met
610 615 620
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625 630 635 640
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val
645 650 655
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp
660 665 670
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser
675 680 685
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys
690 695 700
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala
705 710 715 720
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp
725 730 735
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
740 745 750
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe
755 760 765
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe
770 775 780
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala
785 790 795 800
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser
805 810 815
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
820 825 830
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met
835 840 845
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro
850 855 860
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His
865 870 875 880
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
885 890 895
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu
900 905 910
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile
915 920 925
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser
930 935 940
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys
945 950 955 960
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro
965 970 975
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly
980 985 990
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala
995 1000 1005
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro
1010 1015 1020
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr
1025 1030 1035 1040
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala
1045 1050 1055
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly
1060 1065 1070
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro
1075 1080 1085
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg
1090 1095 1100
Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val
1105 1110 1115 1120
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro
1125 1130 1135
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp
1140 1145 1150
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly
1155 1160 1165
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro
1170 1175 1180
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp
1185 1190 1195 1200
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile
1205 1210 1215
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp
1220 1225 1230
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu
1235 1240 1245
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala
1250 1255 1260
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp
1265 1270 1275 1280
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala
1285 1290 1295
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu
1300 1305 1310
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly
1315 1320 1325
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro
1330 1335 1340
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr
1345 1350 1355 1360
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser
1365 1370 1375
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val
1380 1385 1390
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys
1395 1400 1405
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu
1410 1415 1420
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly
1425 1430 1435 1440
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp
1445 1450 1455
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val
1460 1465 1470
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro
1475 1480 1485
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn
1490 1495 1500
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu
1505 1510 1515 1520
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn
1525 1530 1535
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg
1540 1545 1550
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala
1555 1560 1565
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser
1570 1575 1580
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn
1585 1590 1595 1600
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg
1605 1610 1615
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser
1620 1625 1630
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys
1635 1640 1645
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys
1650 1655 1660
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr
1665 1670 1675 1680
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala
1685 1690 1695
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Ala Ala
1700 1705 1710
Gly Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala
1715 1720 1725
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro
1730 1735 1740
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys
1745 1750 1755 1760
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr
1765 1770 1775
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu
1780 1785 1790
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met
1795 1800 1805
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe
1810 1815 1820
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln
1825 1830 1835 1840
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile
1845 1850 1855
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser
1860 1865 1870
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val
1875 1880 1885
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg
1890 1895 1900
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe
1905 1910 1915 1920
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala
1925 1930 1935
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly
1940 1945 1950
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu
1955 1960 1965
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn
1970 1975 1980
Arg
1985
<210>2
<211>5965
<212>DNA
<213>人工序列
<220>
<223>编码SEQ.ID.NO.1的未优化的cDNA序列
<400>2
gccaccatgg cgcccatcac ggcctactcc caacagacgc ggggcctact tggttgcatc 60
atcactagcc ttacaggccg ggacaagaac caggtcgagg gagaggttca ggtggtttcc 120
accgcaacac aatccttcct ggcgacctgc gtcaacggcg tgtgttggac cgtttaccat 180
ggtgctggct caaagacctt agccggccca aaggggccaa tcacccagat gtacactaat 240
gtggaccagg acctcgtcgg ctggcaggcg ccccccgggg cgcgttcctt gacaccatgc 300
acctgtggca gctcagacct ttacttggtc acgagacatg ctgacgtcat tccggtgcgc 360
cggcggggcg acagtagggg gagcctgctc tcccccaggc ctgtctccta cttgaagggc 420
tcttcgggtg gtccactgct ctgcccttcg gggcacgctg tgggcatctt ccgggctgcc 480
gtatgcaccc ggggggttgc gaaggcggtg gactttgtgc ccgtagagtc catggaaact 540
actatgcggt ctccggtctt cacggacaac tcatcccccc cggccgtacc gcagtcattt 600
caagtggccc acctacacgc tcccactggc agcggcaaga gtactaaagt gccggctgca 660
tatgcagccc aagggtacaa ggtgctcgtc ctcaatccgt ccgttgccgc taccttaggg 720
tttggggcgt atatgtctaa ggcacacggt attgacccca acatcagaac tggggtaagg 780
accattacca caggcgcccc cgtcacatac tctacctatg gcaagtttct tgccgatggt 840
ggttgctctg ggggcgctta tgacatcata atatgtgatg agtgccattc aactgactcg 900
actacaatct tgggcatcgg cacagtcctg gaccaagcgg agacggctgg agcgcggctt 960
gtcgtgctcg ccaccgctac gcctccggga tcggtcaccg tgccacaccc aaacatcgag 1020
gaggtggccc tgtctaatac tggagagatc cccttctatg gcaaagccat ccccattgaa 1080
gccatcaggg ggggaaggca tctcattttc tgtcattcca agaagaagtg cgacgagctc 1140
gccgcaaagc tgtcaggcct cggaatcaac gctgtggcgt attaccgggg gctcgatgtg 1200
tccgtcatac caactatcgg agacgtcgtt gtcgtggcaa cagacgctct gatgacgggc 1260
tatacgggcg actttgactc agtgatcgac tgtaacacat gtgtcaccca gacagtcgac 1320
ttcagcttgg atcccacctt caccattgag acgacgaccg tgcctcaaga cgcagtgtcg 1380
cgctcgcagc ggcggggtag gactggcagg ggtaggagag gcatctacag gtttgtgact 1440
ccgggagaac ggccctcggg catgttcgat tcctcggtcc tgtgtgagtg ctatgacgcg 1500
ggctgtgctt ggtacgagct cacccccgcc gagacctcgg ttaggttgcg ggcctacctg 1560
aacacaccag ggttgcccgt ttgccaggac cacctggagt tctgggagag tgtcttcaca 1620
ggcctcaccc acatagatgc acacttcttg tcccagacca agcaggcagg agacaacttc 1680
ccctacctgg tagcatacca agccacggtg tgcgccaggg ctcaggcccc acctccatca 1740
tgggatcaaa tgtggaagtg tctcatacgg ctgaaaccta cgctgcacgg gccaacaccc 1800
ttgctgtaca ggctgggagc cgtccaaaat gaggtcaccc tcacccaccc cataaccaaa 1860
tacatcatgg catgcatgtc ggctgacctg gaggtcgtca ctagcacctg ggtgctggtg 1920
ggcggagtcc ttgcagctct ggccgcgtat tgcctgacaa caggcagtgt ggtcattgtg 1980
ggtaggatta tcttgtccgg gaggccggct attgttcccg acagggagtt tctctaccag 2040
gagttcgatg aaatggaaga gtgcgcctcg cacctccctt acatcgagca gggaatgcag 2100
ctcgccgagc aattcaagca gaaagcgctc gggttactgc aaacagccac caaacaagcg 2160
gaggctgctg ctcccgtggt ggagtccaag tggcgagccc ttgagacatt ctgggcgaag 2220
cacatgtgga atttcatcag cgggatacag tacttagcag gcttatccac tctgcctggg 2280
aaccccgcaa tagcatcatt gatggcattc acagcctcta tcaccagccc gctcaccacc 2340
caaagtaccc tcctgtttaa catcttgggg gggtgggtgg ctgcccaact cgcccccccc 2400
agcgccgctt cggctttcgt gggcgccggc atcgccggtg cggctgttgg cagcataggc 2460
cttgggaagg tgcttgtgga cattctggcg ggttatggag caggagtggc cggcgcgctc 2520
gtggccttca aggtcatgag cggcgagatg ccctccaccg aggacctggt caatctactt 2580
cctgccatcc tctctcctgg cgccctggtc gtcggggtcg tgtgtgcagc aatactgcgt 2640
cgacacgtgg gtccgggaga gggggctgtg cagtggatga accggctgat agcgttcgcc 2700
tcgcggggta atcatgtttc ccccacgcac tatgtgcctg agagcgacgc cgcagcgcgt 2760
gttactcaga tcctctccag ccttaccatc actcagctgc tgaaaaggct ccaccagtgg 2820
attaatgaag actgctccac accgtgttcc ggctcgtggc taagggatgt ttgggactgg 2880
atatgcacgg tgttgactga cttcaagacc tggctccagt ccaagctcct gccgcagcta 2940
ccgggagtcc cttttttctc gtgccaacgc gggtacaagg gagtctggcg gggagacggc 3000
atcatgcaaa ccacctgccc atgtggagca cagatcaccg gacatgtcaa aaacggttcc 3060
atgaggatcg tcgggcctaa gacctgcagc aacacgtggc atggaacatt ccccatcaac 3120
gcatacacca cgggcccctg cacaccctct ccagcgccaa actattctag ggcgctgtgg 3180
cgggtggccg ctgaggagta cgtggaggtc acgcgggtgg gggatttcca ctacgtgacg 3240
ggcatgacca ctgacaacgt aaagtgccca tgccaggttc cggctcctga attcttcacg 3300
gaggtggacg gagtgcggtt gcacaggtac gctccggcgt gcaggcctct cctacgggag 3360
gaggttacat tccaggtcgg gctcaaccaa tacctggttg ggtcacagct accatgcgag 3420
cccgaaccgg atgtagcagt gctcacttcc atgctcaccg acccctccca catcacagca 3480
gaaacggcta agcgtaggtt ggccaggggg tctcccccct ccttggccag ctcttcagct 3540
agccagttgt ctgcgccttc cttgaaggcg acatgcacta cccaccatgt ctctccggac 3600
gctgacctca tcgaggccaa cctcctgtgg cggcaggaga tgggcgggaa catcacccgc 3660
gtggagtcgg agaacaaggt ggtagtcctg gactctttcg acccgcttcg agcggaggag 3720
gatgagaggg aagtatccgt tccggcggag atcctgcgga aatccaagaa gttccccgca 3780
gcgatgccca tctgggcgcg cccggattac aaccctccac tgttagagtc ctggaaggac 3840
ccggactacg tccctccggt ggtgcacggg tgcccgttgc cacctatcaa ggcccctcca 3900
ataccacctc cacggagaaa gaggacggtt gtcctaacag agtcctccgt gtcttctgcc 3960
ttagcggagc tcgctactaa gaccttcggc agctccgaat catcggccgt cgacagcggc 4020
acggcgaccg cccttcctga ccaggcctcc gacgacggtg acaaaggatc cgacgttgag 4080
tcgtactcct ccatgccccc ccttgagggg gaaccggggg accccgatct cagtgacggg 4140
tcttggtcta ccgtgagcga ggaagctagt gaggatgtcg tctgctgctc aatgtcctac 4200
acatggacag gcgccttgat cacgccatgc gctgcggagg aaagcaagct gcccatcaac 4260
gcgttgagca actctttgct gcgccaccat aacatggttt atgccacaac atctcgcagc 4320
gcaggcctgc ggcagaagaa ggtcaccttt gacagactgc aagtcctgga cgaccactac 4380
cgggacgtgc tcaaggagat gaaggcgaag gcgtccacag ttaaggctaa actcctatcc 4440
gtagaggaag cctgcaagct gacgccccca cattcggcca aatccaagtt tggctatggg 4500
gcaaaggacg tccggaacct atccagcaag gccgttaacc acatccactc cgtgtggaag 4560
gacttgctgg aagacactgt gacaccaatt gacaccacca tcatggcaaa aaatgaggtt 4620
ttctgtgtcc aaccagagaa aggaggccgt aagccagccc gccttatcgt attcccagat 4680
ctgggagtcc gtgtatgcga gaagatggcc ctctatgatg tggtctccac ccttcctcag 4740
gtcgtgatgg gctcctcata cggattccag tactctcctg ggcagcgagt cgagttcctg 4800
gtgaatacct ggaaatcaaa gaaaaacccc atgggctttt catatgacac tcgctgtttc 4860
gactcaacgg tcaccgagaa cgacatccgt gttgaggagt caatttacca atgttgtgac 4920
ttggcccccg aagccagaca ggccataaaa tcgctcacag agcggcttta tatcgggggt 4980
cctctgacta attcaaaagg gcagaactgc ggttatcgcc ggtgccgcgc gagcggcgtg 5040
ctgacgacta gctgcggtaa caccctcaca tgttacttga aggcctctgc agcctgtcga 5100
gctgcgaagc tccaggactg cacgatgctc gtgaacgccg ccggccttgt cgttatctgt 5160
gaaagcgcgg gaacccaaga ggacgcggcg agcctacgag tcttcacgga ggctatgact 5220
aggtactctg ccccccccgg ggacccgccc caaccagaat acgacttgga gctgataaca 5280
tcatgttcct ccaatgtgtc ggtcgcccac gatgcatcag gcaaaagggt gtactacctc 5340
acccgtgatc ccaccacccc cctcgcacgg gctgcgtggg aaacagctag acacactcca 5400
gttaactcct ggctaggcaa cattatcatg tatgcgccca ctttgtgggc aaggatgatt 5460
ctgatgactc acttcttctc catccttcta gcacaggagc aacttgaaaa agccctggac 5520
tgccagatct acggggcctg ttactccatt gagccacttg acctacctca gatcattgaa 5580
cgactccatg gccttagcgc attttcactc catagttact ctccaggtga gatcaatagg 5640
gtggcttcat gcctcaggaa acttggggta ccacccttgc gagtctggag acatcgggcc 5700
aggagcgtcc gcgctaggct actgtcccag ggggggaggg ccgccacttg tggcaagtac 5760
ctcttcaact gggcagtgaa gaccaaactc aaactcactc caatcccggc tgcgtcccag 5820
ctggacttgt ccggctggtt cgttgctggt tacagcgggg gagacatata tcacagcctg 5880
tctcgtgccc gaccccgctg gttcatgctg tgcctactcc tactttctgt aggggtaggc 5940
atctacctgc tccccaaccg ataaa 5965
<210>3
<211>5965
<212>DNA
<213>人工序列
<220>
<223>编码SEQ ID NO:1的优化的cDNA
<400>3
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc 60
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc 120
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac 180
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac 240
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc 300
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc 360
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc 420
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc 480
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc 540
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc 600
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc 660
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc 720
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc 780
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc 840
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc 900
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg 960
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag 1020
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag 1080
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg 1140
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg 1200
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc 1260
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac 1320
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc 1380
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc 1440
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc 1500
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg 1560
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc 1620
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc 1680
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc 1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc 1800
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag 1860
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg 1920
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg 1980
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag 2040
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag 2100
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc 2160
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag 2220
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc 2280
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc 2340
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc 2400
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc 2460
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg 2520
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg 2580
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc 2640
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc 2700
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc 2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg 2820
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg 2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg 2940
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc 3000
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc 3060
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac 3120
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg 3180
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc 3240
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc 3300
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag 3360
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag 3420
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc 3480
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc 3540
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac 3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc 3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag 3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgcc 3780
gccatgccca tctgggcccg ccccgactac aacccccccc tgctggagag ctggaaggac 3840
cccgactacg tgccccccgt ggtgcacggc tgccccctgc cccccatcaa ggcccccccc 3900
atcccccccc cccgccgcaa gcgcaccgtg gtgctgaccg agagcagcgt gagcagcgcc 3960
ctggccgagc tggccaccaa gaccttcggc agcagcgaga gcagcgccgt ggacagcggc 4020
accgccaccg ccctgcccga ccaggccagc gacgacggcg acaagggcag cgacgtggag 4080
agctacagca gcatgccccc cctggagggc gagcccggcg accccgacct gagcgacggc 4140
agctggagca ccgtgagcga ggaggccagc gaggacgtgg tgtgctgcag catgagctac 4200
acctggaccg gcgccctgat caccccctgc gccgccgagg agagcaagct gcccatcaac 4260
gccctgagca acagcctgct gcgccaccac aacatggtgt acgccaccac cagccgcagc 4320
gccggcctgc gccagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac 4380
cgcgacgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc 4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc 4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag 4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg 4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac 4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag 4740
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg 4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc 4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac 4920
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc 4980
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg 5040
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc 5100
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc 5160
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc 5220
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc 5280
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg 5340
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc 5400
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc 5460
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac 5520
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag 5580
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc 5640
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc 5700
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac 5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag 5820
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg 5880
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc 5940
atctacctgc tgcccaaccg ctaaa 5965
<210>4
<211>37090
<212>DNA
<213>人工序列
<220>
<223>MRKAd6-NSmut核酸
<400>4
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag gcggccgcga tccattgcat acgttgtatc 480
catatcataa tatgtacatt tatattggct catgtccaac attaccgcca tgttgacatt 540
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 600
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 660
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 720
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 780
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 840
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 900
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 960
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1020
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 1080
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1140
cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc 1200
tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt gagatctgcc 1260
accatggcgc ccatcacggc ctactcccaa cagacgcggg gcctacttgg ttgcatcatc 1320
actagcctta caggccggga caagaaccag gtcgagggag aggttcaggt ggtttccacc 1380
gcaacacaat ccttcctggc gacctgcgtc aacggcgtgt gttggaccgt ttaccatggt 1440
gctggctcaa agaccttagc cggcccaaag gggccaatca cccagatgta cactaatgtg 1500
gaccaggacc tcgtcggctg gcaggcgccc cccggggcgc gttccttgac accatgcacc 1560
tgtggcagct cagaccttta cttggtcacg agacatgctg acgtcattcc ggtgcgccgg 1620
cggggcgaca gtagggggag cctgctctcc cccaggcctg tctcctactt gaagggctct 1680
tcgggtggtc cactgctctg cccttcgggg cacgctgtgg gcatcttccg ggctgccgta 1740
tgcacccggg gggttgcgaa ggcggtggac tttgtgcccg tagagtccat ggaaactact 1800
atgcggtctc cggtcttcac ggacaactca tcccccccgg ccgtaccgca gtcatttcaa 1860
gtggcccacc tacacgctcc cactggcagc ggcaagagta ctaaagtgcc ggctgcatat 1920
gcagcccaag ggtacaaggt gctcgtcctc aatccgtccg ttgccgctac cttagggttt 1980
ggggcgtata tgtctaaggc acacggtatt gaccccaaca tcagaactgg ggtaaggacc 2040
attaccacag gcgcccccgt cacatactct acctatggca agtttcttgc cgatggtggt 2100
tgctctgggg gcgcttatga catcataata tgtgatgagt gccattcaac tgactcgact 2160
acaatcttgg gcatcggcac agtcctggac caagcggaga cggctggagc gcggcttgtc 2220
gtgctcgcca ccgctacgcc tccgggatcg gtcaccgtgc cacacccaaa catcgaggag 2280
gtggccctgt ctaatactgg agagatcccc ttctatggca aagccatccc cattgaagcc 2340
atcagggggg gaaggcatct cattttctgt cattccaaga agaagtgcga cgagctcgcc 2400
gcaaagctgt caggcctcgg aatcaacgct gtggcgtatt accgggggct cgatgtgtcc 2460
gtcataccaa ctatcggaga cgtcgttgtc gtggcaacag acgctctgat gacgggctat 2520
acgggcgact ttgactcagt gatcgactgt aacacatgtg tcacccagac agtcgacttc 2580
agcttggatc ccaccttcac cattgagacg acgaccgtgc ctcaagacgc agtgtcgcgc 2640
tcgcagcggc ggggtaggac tggcaggggt aggagaggca tctacaggtt tgtgactccg 2700
ggagaacggc cctcgggcat gttcgattcc tcggtcctgt gtgagtgcta tgacgcgggc 2760
tgtgcttggt acgagctcac ccccgccgag acctcggtta ggttgcgggc ctacctgaac 2820
acaccagggt tgcccgtttg ccaggaccac ctggagttct gggagagtgt cttcacaggc 2880
ctcacccaca tagatgcaca cttcttgtcc cagaccaagc aggcaggaga caacttcccc 2940
tacctggtag cataccaagc cacggtgtgc gccagggctc aggccccacc tccatcatgg 3000
gatcaaatgt ggaagtgtct catacggctg aaacctacgc tgcacgggcc aacacccttg 3060
ctgtacaggc tgggagccgt ccaaaatgag gtcaccctca cccaccccat aaccaaatac 3120
atcatggcat gcatgtcggc tgacctggag gtcgtcacta gcacctgggt gctggtgggc 3180
ggagtccttg cagctctggc cgcgtattgc ctgacaacag gcagtgtggt cattgtgggt 3240
aggattatct tgtccgggag gccggctatt gttcccgaca gggagtttct ctaccaggag 3300
ttcgatgaaa tggaagagtg cgcctcgcac ctcccttaca tcgagcaggg aatgcagctc 3360
gccgagcaat tcaagcagaa agcgctcggg ttactgcaaa cagccaccaa acaagcggag 3420
gctgctgctc ccgtggtgga gtccaagtgg cgagcccttg agacattctg ggcgaagcac 3480
atgtggaatt tcatcagcgg gatacagtac ttagcaggct tatccactct gcctgggaac 3540
cccgcaatag catcattgat ggcattcaca gcctctatca ccagcccgct caccacccaa 3600
agtaccctcc tgtttaacat cttggggggg tgggtggctg cccaactcgc cccccccagc 3660
gccgcttcgg ctttcgtggg cgccggcatc gccggtgcgg ctgttggcag cataggcctt 3720
gggaaggtgc ttgtggacat tctggcgggt tatggagcag gagtggccgg cgcgctcgtg 3780
gccttcaagg tcatgagcgg cgagatgccc tccaccgagg acctggtcaa tctacttcct 3840
gccatcctct ctcctggcgc cctggtcgtc ggggtcgtgt gtgcagcaat actgcgtcga 3900
cacgtgggtc cgggagaggg ggctgtgcag tggatgaacc ggctgatagc gttcgcctcg 3960
cggggtaatc atgtttcccc cacgcactat gtgcctgaga gcgacgccgc agcgcgtgtt 4020
actcagatcc tctccagcct taccatcact cagctgctga aaaggctcca ccagtggatt 4080
aatgaagact gctccacacc gtgttccggc tcgtggctaa gggatgtttg ggactggata 4140
tgcacggtgt tgactgactt caagacctgg ctccagtcca agctcctgcc gcagctaccg 4200
ggagtccctt ttttctcgtg ccaacgcggg tacaagggag tctggcgggg agacggcatc 4260
atgcaaacca cctgcccatg tggagcacag atcaccggac atgtcaaaaa cggttccatg 4320
aggatcgtcg ggcctaagac ctgcagcaac acgtggcatg gaacattccc catcaacgca 4380
tacaccacgg gcccctgcac accctctcca gcgccaaact attctagggc gctgtggcgg 4440
gtggccgctg aggagtacgt ggaggtcacg cgggtggggg atttccacta cgtgacgggc 4500
atgaccactg acaacgtaaa gtgcccatgc caggttccgg ctcctgaatt cttcacggag 4560
gtggacggag tgcggttgca caggtacgct ccggcgtgca ggcctctcct acgggaggag 4620
gttacattcc aggtcgggct caaccaatac ctggttgggt cacagctacc atgcgagccc 4680
gaaccggatg tagcagtgct cacttccatg ctcaccgacc cctcccacat cacagcagaa 4740
acggctaagc gtaggttggc cagggggtct cccccctcct tggccagctc ttcagctagc 4800
cagttgtctg cgccttcctt gaaggcgaca tgcactaccc accatgtctc tccggacgct 4860
gacctcatcg aggccaacct cctgtggcgg caggagatgg gcgggaacat cacccgcgtg 4920
gagtcggaga acaaggtggt agtcctggac tctttcgacc cgcttcgagc ggaggaggat 4980
gagagggaag tatccgttcc ggcggagatc ctgcggaaat ccaagaagtt ccccgcagcg 5040
atgcccatct gggcgcgccc ggattacaac cctccactgt tagagtcctg gaaggacccg 5100
gactacgtcc ctccggtggt gcacgggtgc ccgttgccac ctatcaaggc ccctccaata 5160
ccacctccac ggagaaagag gacggttgtc ctaacagagt cctccgtgtc ttctgcctta 5220
gcggagctcg ctactaagac cttcggcagc tccgaatcat cggccgtcga cagcggcacg 5280
gcgaccgccc ttcctgacca ggcctccgac gacggtgaca aaggatccga cgttgagtcg 5340
tactcctcca tgccccccct tgagggggaa ccgggggacc ccgatctcag tgacgggtct 5400
tggtctaccg tgagcgagga agctagtgag gatgtcgtct gctgctcaat gtcctacaca 5460
tggacaggcg ccttgatcac gccatgcgct gcggaggaaa gcaagctgcc catcaacgcg 5520
ttgagcaact ctttgctgcg ccaccataac atggtttatg ccacaacatc tcgcagcgca 5580
ggcctgcggc agaagaaggt cacctttgac agactgcaag tcctggacga ccactaccgg 5640
gacgtgctca aggagatgaa ggcgaaggcg tccacagtta aggctaaact cctatccgta 5700
gaggaagcct gcaagctgac gcccccacat tcggccaaat ccaagtttgg ctatggggca 5760
aaggacgtcc ggaacctatc cagcaaggcc gttaaccaca tccactccgt gtggaaggac 5820
ttgctggaag acactgtgac accaattgac accaccatca tggcaaaaaa tgaggttttc 5880
tgtgtccaac cagagaaagg aggccgtaag ccagcccgcc ttatcgtatt cccagatctg 5940
ggagtccgtg tatgcgagaa gatggccctc tatgatgtgg tctccaccct tcctcaggtc 6000
gtgatgggct cctcatacgg attccagtac tctcctgggc agcgagtcga gttcctggtg 6060
aatacctgga aatcaaagaa aaaccccatg ggcttttcat atgacactcg ctgtttcgac 6120
tcaacggtca ccgagaacga catccgtgtt gaggagtcaa tttaccaatg ttgtgacttg 6180
gcccccgaag ccagacaggc cataaaatcg ctcacagagc ggctttatat cgggggtcct 6240
ctgactaatt caaaagggca gaactgcggt tatcgccggt gccgcgcgag cggcgtgctg 6300
acgactagct gcggtaacac cctcacatgt tacttgaagg cctctgcagc ctgtcgagct 6360
gcgaagctcc aggactgcac gatgctcgtg aacgccgccg gccttgtcgt tatctgtgaa 6420
agcgcgggaa cccaagagga cgcggcgagc ctacgagtct tcacggaggc tatgactagg 6480
tactctgccc cccccgggga cccgccccaa ccagaatacg acttggagct gataacatca 6540
tgttcctcca atgtgtcggt cgcccacgat gcatcaggca aaagggtgta ctacctcacc 6600
cgtgatccca ccacccccct cgcacgggct gcgtgggaaa cagctagaca cactccagtt 6660
aactcctggc taggcaacat tatcatgtat gcgcccactt tgtgggcaag gatgattctg 6720
atgactcact tcttctccat ccttctagca caggagcaac ttgaaaaagc cctggactgc 6780
cagatctacg gggcctgtta ctccattgag ccacttgacc tacctcagat cattgaacga 6840
ctccatggcc ttagcgcatt ttcactccat agttactctc caggtgagat caatagggtg 6900
gcttcatgcc tcaggaaact tggggtacca cccttgcgag tctggagaca tcgggccagg 6960
agcgtccgcg ctaggctact gtcccagggg gggagggccg ccacttgtgg caagtacctc 7020
ttcaactggg cagtgaagac caaactcaaa ctcactccaa tcccggctgc gtcccagctg 7080
gacttgtccg gctggttcgt tgctggttac agcgggggag acatatatca cagcctgtct 7140
cgtgcccgac cccgctggtt catgctgtgc ctactcctac tttctgtagg ggtaggcatc 7200
tacctgctcc ccaaccggta aatctagagc tgtgccttct agttgccagc catctgttgt 7260
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 7320
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 7380
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 7440
ggtgggctct atggccgatc ggcgcgccgt actgaaatgt gtgggcgtgg cttaagggtg 7500
ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc agcagccgcc 7560
gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt gacaacgcgc 7620
atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga tggtcgcccc 7680
gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac gccgttggag 7740
actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat tgtgactgac 7800
tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc ccgcgatgac 7860
aagttgacgg ctcttttggc acaattggat tctttgaccc gggaacttaa tgtcgtttct 7920
cagcagctgt tggatctgcg ccagcaggtt tctgccctga aggcttcctc ccctcccaat 7980
gcggtttaaa acataaataa aaaaccagac tctgtttgga tttggatcaa gcaagtgtct 8040
tgctgtcttt atttaggggt tttgcgcgcg cggtaggccc gggaccagcg gtctcggtcg 8100
ttgagggtcc tgtgtatttt ttccaggacg tggtaaaggt gactctggat gttcagatac 8160
atgggcataa gcccgtctct ggggtggagg tagcaccact gcagagcttc atgctgcggg 8220
gtggtgttgt agatgatcca gtcgtagcag gagcgctggg cgtggtgcct aaaaatgtct 8280
ttcagtagca agctgattgc caggggcagg cccttggtgt aagtgtttac aaagcggtta 8340
agctgggatg ggtgcatacg tggggatatg agatgcatct tggactgtat ttttaggttg 8400
gctatgttcc cagccatatc cctccgggga ttcatgttgt gcagaaccac cagcacagtg 8460
tatccggtgc acttgggaaa tttgtcatgt agcttagaag gaaatgcgtg gaagaacttg 8520
gagacgccct tgtgacctcc aagattttcc atgcattcgt ccataatgat ggcaatgggc 8580
ccacgggcgg cggcctgggc gaagatattt ctgggatcac taacgtcata gttgtgttcc 8640
aggatgagat cgtcataggc catttttaca aagcgcgggc ggagggtgcc agactgcggt 8700
ataatggttc catccggccc aggggcgtag ttaccctcac agatttgcat ttcccacgct 8760
ttgagttcag atggggggat catgtctacc tgcggggcga tgaagaaaac ggtttccggg 8820
gtaggggaga tcagctggga agaaagcagg ttcctgagca gctgcgactt accgcagccg 8880
gtgggcccgt aaatcacacc tattaccggc tgcaactggt agttaagaga gctgcagctg 8940
ccgtcatccc tgagcagggg ggccacttcg ttaagcatgt ccctgactcg catgttttcc 9000
ctgaccaaat ccgccagaag gcgctcgccg cccagcgata gcagttcttg caaggaagca 9060
aagtttttca acggtttgag accgtccgcc gtaggcatgc ttttgagcgt ttgaccaagc 9120
agttccaggc ggtcccacag ctcggtcacc tgctctacgg catctcgatc cagcatatct 9180
cctcgtttcg cgggttgggg cggctttcgc tgtacggcag tagtcggtgc tcgtccagac 9240
gggccagggt catgtctttc cacgggcgca gggtcctcgt cagcgtagtc tgggtcacgg 9300
tgaaggggtg cgctccgggc tgcgcgctgg ccagggtgcg cttgaggctg gtcctgctgg 9360
tgctgaagcg ctgccggtct tcgccctgcg cgtcggccag gtagcatttg accatggtgt 9420
catagtccag cccctccgcg gcgtggccct tggcgcgcag cttgcccttg gaggaggcgc 9480
cgcacgaggg gcagtgcaga cttttgaggg cgtagagctt gggcgcgaga aataccgatt 9540
ccggggagta ggcatccgcg ccgcaggccc cgcagacggt ctcgcattcc acgagccagg 9600
tgagctctgg ccgttcgggg tcaaaaacca ggtttccccc atgctttttg atgcgtttct 9660
tacctctggt ttccatgagc cggtgtccac gctcggtgac gaaaaggctg tccgtgtccc 9720
cgtatacaga cttgagaggc ctgtcctcga gcggtgttcc gcggtcctcc tcgtatagaa 9780
actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag gctaagtggg 9840
aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga agacacatgt 9900
cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg tgaccgggtg 9960
ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc tcttccgcat 10020
cgctgtctgc gagggccagc tgttggggtg agtactccct ctcaaaagcg ggcatgactt 10080
ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg 10140
tgatgccttt gagggtggcc gcgtccatct ggtcagaaaa gacaatcttt ttgttgtcaa 10200
gcttggtggc aaacgacccg tagagggcgt tggacagcaa cttggcgatg gagcgcaggg 10260
tttggttttt gtcgcgatcg gcgcgctcct tggccgcgat gtttagctgc acgtattcgc 10320
gcgcaacgca ccgccattcg ggaaagacgg tggtgcgctc gtcgggcact aggtgcacgc 10380
gccaaccgcg gttgtgcagg gtgacaaggt caacgctggt ggctacctct ccgcgtaggc 10440
gctcgttggt ccagcagagg cggccgccct tgcgcgagca gaatggcggt agtgggtcta 10500
gctgcgtctc gtccgggggg tctgcgtcca cggtaaagac cccgggcagc aggcgcgcgt 10560
cgaagtagtc tatcttgcat ccttgcaagt ctagcgcctg ctgccatgcg cgggcggcaa 10620
gcgcgcgctc gtatgggttg agtgggggac cccatggcat ggggtgggtg agcgcggagg 10680
cgtacatgcc gcaaatgtcg taaacgtaga ggggctctct gagtattcca agatatgtag 10740
ggtagcatct tccaccgcgg atgctggcgc gcacgtaatc gtatagttcg tgcgagggag 10800
cgaggaggtc gggaccgagg ttgctacggg cgggctgctc tgctcggaag actatctgcc 10860
tgaagatggc atgtgagttg gatgatatgg ttggacgctg gaagacgttg aagctggcgt 10920
ctgtgagacc taccgcgtca cgcacgaagg aggcgtagga gtcgcgcagc ttgttgacca 10980
gctcggcggt gacctgcacg tctagggcgc agtagtccag ggtttccttg atgatgtcat 11040
acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt 11100
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtaagagcct agcatgtaga 11160
actggttgac ggcctggtag gcgcagcatc ccttttctac gggtagcgcg tatgcctgcg 11220
cggccttccg gagcgaggtg tgggtgagcg caaaggtgtc cctaaccatg actttgaggt 11280
actggtattt gaagtcagtg tcgtcgcatc cgccctgctc ccagagcaaa aagtccgtgc 11340
gctttttgga acgcgggttt ggcagggcga aggtgacatc gttgaagagt atctttcccg 11400
cgcgaggcat aaagttgcgt gtgatgcgga agggtcccgg cacctcggaa cggttgttaa 11460
ttacctgggc ggcgagcacg atctcgtcaa agccgttgat gttgtggccc acaatgtaaa 11520
gttccaagaa gcgcgggatg cccttgatgg aaggcaattt tttaagttcc tcgtaggtga 11580
gctcttcagg ggagctgagc ccgtgctctg aaagggccca gtctgcaaga tgagggttgg 11640
aagcgacgaa tgagctccac aggtcacggg ccattagcat ttgcaggtgg tcgcgaaagg 11700
tcctaaactg gcgacctatg gccatttttt ctggggtgat gcagtagaag gtaagcgggt 11760
cttgttccca gcggtcccat ccaaggtccg cggctaggtc tcgcgcggcg gtcactagag 11820
gctcatctcc gccgaacttc atgaccagca tgaagggcac gagctgcttc ccaaaggccc 11880
ccatccaagt ataggtctct acatcgtagg tgacaaagag acgctcggtg cgaggatgcg 11940
agccgatcgg gaagaactgg atctcccgcc accagttgga ggagtggctg ttgatgtggt 12000
gaaagtagaa gtccctgcga cgggccgaac actcgtgctg gcttttgtaa aaacgtgcgc 12060
agtactggca gcggtgcacg ggctgtacat cctgcacgag gttgacctga cgaccgcgca 12120
caaggaagca gagtgggaat ttgagcccct cgcctggcgg gtttggctgg tggtcttcta 12180
cttcggctgc ttgtccttga ccgtctggct gctcgagggg agttacggtg gatcggacca 12240
ccacgccgcg cgagcccaaa gtccagatgt ccgcgcgcgg cggtcggagc ttgatgacaa 12300
catcgcgcag atgggagctg tccatggtct ggagctcccg cggcgtcagg tcaggcggga 12360
gctcctgcag gtttacctcg catagccggg tcagggcgcg ggctaggtcc aggtgatacc 12420
tgatttccag gggctggttg gtggcggcgt cgatggcttg caagaggccg catccccgcg 12480
gcgcgactac ggtaccgcgc ggcgggcggt gggccgcggg ggtgtccttg gatgatgcat 12540
ctaaaagcgg tgacgcgggc gggcccccgg aggtaggggg ggctcgggac ccgccgggag 12600
agggggcagg ggcacgtcgg cgccgcgcgc gggcaggagc tggtgctgcg cgcggaggtt 12660
gctggcgaac gcgacgacgc ggcggttgat ctcctgaatc tggcgcctct gcgtgaagac 12720
gacgggcccg gtgagcttga acctgaaaga gagttcgaca gaatcaattt cggtgtcgtt 12780
gacggcggcc tggcgcaaaa tctcctgcac gtctcctgag ttgtcttgat aggcgatctc 12840
ggccatgaac tgctcgatct cttcctcctg gagatctccg cgtccggctc gctccacggt 12900
ggcggcgagg tcgttggaga tgcgggccat gagctgcgag aaggcgttga ggcctccctc 12960
gttccagacg cggctgtaga ccacgccccc ttcggcatcg cgggcgcgca tgaccacctg 13020
cgcgagattg agctccacgt gccgggcgaa gacggcgtag tttcgcaggc gctgaaagag 13080
gtagttgagg gtggtggcgg tgtgttctgc cacgaagaag tacataaccc agcgccgcaa 13140
cgtggattcg ttgatatccc ccaaggcctc aaggcgctcc atggcctcgt agaagtccac 13200
ggcgaagttg aaaaactggg agttgcgcgc cgacacggtt aactcctcct ccagaagacg 13260
gatgagctcg gcgacagtgt cgcgcacctc gcgctcaaag gctacagggg cctcttcttc 13320
ttcttcaatc tcctcttcca taagggcctc cccttcttct tcttctggcg gcggtggggg 13380
aggggggaca cggcggcgac gacggcgcac cgggaggcgg tcgacaaagc gctcgatcat 13440
ctccccgcgg cgacggcgca tggtctcggt gacggcgcgg ccgttctcgc gggggcgcag 13500
ttggaagacg ccgcccgtca tgtcccggtt atgggttggc ggggggctgc cgtgcggcag 13560
ggatacggcg ctaacgatgc atctcaacaa ttgttgtgta ggtactccgc caccgaggga 13620
cctgagcgag tccgcatcga ccggatcgga aaacctctcg agaaaggcgt ctaaccagtc 13680
acagtcgcaa ggtaggctga gcaccgtggc gggcggcagc gggcggcggt cggggttgtt 13740
tctggcggag gtgctgctga tgatgtaatt aaagtaggcg gtcttgagac ggcggatggt 13800
cgacagaagc accatgtcct tgggtccggc ctgctgaatg cgcaggcggt cggccatgcc 13860
ccaggcttcg ttttgacatc ggcgcaggtc tttgtagtag tcttgcatga gcctttctac 13920
cggcacttct tcttctcctt cctcttgtcc tgcatctctt gcatctatcg ctgcggcggc 13980
ggcggagttt ggccgtaggt ggcgccctct tcctcccatg cgtgtgaccc cgaagcccct 14040
catcggctga agcagggcca ggtcggcgac aacgcgctcg gctaatatgg cctgctgcac 14100
ctgcgtgagg gtagactgga agtcgtccat gtccacaaag cggtggtatg cgcccgtgtt 14160
gatggtgtaa gtgcagttgg ccataacgga ccagttaacg gtctggtgac ccggctgcga 14220
gagctcggtg tacctgagac gcgagtaagc ccttgagtca aagacgtagt cgttgcaagt 14280
ccgcaccagg tactggtatc ccaccaaaaa gtgcggcggc ggctggcggt agaggggcca 14340
gcgtagggtg gccggggctc cgggggcgag gtcttccaac ataaggcgat gatatccgta 14400
gatgtacctg gacatccagg tgatgccggc ggcggtggtg gaggcgcgcg gaaagtcacg 14460
gacgcggttc cagatgttgc gcagcggcaa aaagtgctcc atggtcggga cgctctggcc 14520
ggtcaggcgc gcgcagtcgt tgacgctcta gaccgtgcaa aaggagagcc tgtaagcggg 14580
cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg accggggttc 14640
gaaccccgga tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt gtcgaaccca 14700
ggtgtgcgac gtcagacaac gggggagcgc tccttttggc ttccttccag gcgcggcgga 14760
tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt aagcggttag gctggaaagc 14820
gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg gttgagtcgc 14880
gggacccccg gttcgagtct cgggccggcc ggactgcggc gaacgggggt ttgcctcccc 14940
gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc ttttttgctt 15000
ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc ggcaagagca 15060
agagcagcgg cagacatgca gggcaccctc cccttctcct accgcgtcag gaggggcaac 15120
atccgcggct gacgcggcgg cagatggtga ttacgaaccc ccgcggcgcc ggacccggca 15180
ctacttggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct ctcctgagcg 15240
acacccaagg gtgcagctga agcgtgacac gcgcgaggcg tacgtgccgc ggcagaacct 15300
gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt tccatgcagg 15360
gcgcgagttg cggcatggcc tgaaccgcga gcggttgctg cgcgaggagg actttgagcc 15420
cgacgcgcgg accgggatta gtcccgcgcg cgcacacgtg gcggccgccg acctggtaac 15480
cgcgtacgag cagacggtga accaggagat taactttcaa aaaagcttta acaaccacgt 15540
gcgcacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt gggactttgt 15600
aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt tccttatagt 15660
gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag tagagcccga 15720
gggccgctgg ctgctcgatt tgataaacat tctgcagagc atagtggtgc aggagcgcag 15780
cttgagcctg gctgacaagg tggccgccat taactattcc atgctcagtc tgggcaagtt 15840
ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg taaagatcga 15900
ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc tgggcgttta 15960
tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc tcagcgaccg 16020
cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg atagagaggc 16080
cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac gcgccctgga 16140
ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca acgtcggcgg 16200
cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt actaagcggt 16260
gatgtttctg atcagatgat gcaagacgca acggacccgg cggtgcgggc ggcgctgcag 16320
agccagccgt ccggccttaa ctccacggac gactggcgcc aggtcatgga ccgcatcatg 16380
tcgctgactg cgcgcaaccc tgacgcgttc cggcagcagc cgcaggccaa ccggctctcc 16440
gcaattctgg aagcggtggt cccggcgcgc gcaaacccca cgcacgagaa ggtgctggcg 16500
atcgtaaacg cgctggccga aaacagggcc atccggcccg atgaggccgg cctggtctac 16560
gacgcgctgc ttcagcgcgt ggctcgttac aacagcagca acgtgcagac caacctggac 16620
cggctggtgg gggatgtgcg cgaggccgtg gcgcagcgtg agcgcgcgca gcagcagggc 16680
aacctgggct ccatggttgc actaaacgcc ttcctgagta cacagcccgc caacgtgccg 16740
cggggacagg aggactacac caactttgtg agcgcactgc ggctaatggt gactgagaca 16800
ccgcaaagtg aggtgtatca gtccgggcca gactattttt tccagaccag tagacaaggc 16860
ctgcagaccg taaacctgag ccaggctttc aagaacttgc aggggctgtg gggggtgcgg 16920
gctcccacag gcgaccgcgc gaccgtgtct agcttgctga cgcccaactc gcgcctgttg 16980
ctgctgctaa tagcgccctt cacggacagt ggcagcgtgt cccgggacac atacctaggt 17040
cacttgctga cactgtaccg cgaggccata ggtcaggcgc atgtggacga gcatactttc 17100
caggagatta caagtgttag ccgcgcgctg gggcaggagg acacgggcag cctggaggca 17160
accctgaact acctgctgac caaccggcgg caaaaaatcc cctcgttgca cagtttaaac 17220
agcgaggagg agcgcatttt gcgctatgtg cagcagagcg tgagccttaa cctgatgcgc 17280
gacggggtaa cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga accgggcatg 17340
tatgcctcaa accggccgtt tatcaatcgc ctaatggact acttgcatcg cgcggccgcc 17400
gtgaaccccg agtatttcac caatgccatc ttgaacccgc actggctacc gccccctggt 17460
ttctacaccg ggggattcga ggtgcccgag ggtaacgatg gattcctctg ggacgacata 17520
gacgacagcg tgttttcccc gcaaccgcag accctgctag agttgcaaca acgcgagcag 17580
gcagaggcgg cgctgcgaaa ggaaagcttc cgcaggccaa gcagcttgtc cgatctaggc 17640
gctgcggccc cgcggtcaga tgctagtagc ccatttccaa gcttgatagg gtctcttacc 17700
agcactcgca ccacccgccc gcgcctgctg ggcgaggagg agtacctaaa caactcgctg 17760
ctgcagccgc agcgcgaaaa gaacctgcct ccggcgtttc ccaacaacgg gatagagagc 17820
ctagtggaca agatgagtag atggaagacg tatgcgcagg agcacaggga tgtgcccggc 17880
ccgcgcccgc ccacccgtcg tcaaaggcac gaccgtcagc ggggtctggt gtgggaggac 17940
gatgactcgg cagacgacag cagcgtcttg gatttgggag ggagtggcaa cccgtttgca 18000
caccttcgcc ccaggctggg gagaatgttt taaaaaaaag catgatgcaa aataaaaaac 18060
tcaccaaggc catggcaccg agcgttggtt ttcttgtatt ccccttagta tgcggcgcgc 18120
ggcgatgtat gaggaaggtc ctcctccctc ctacgagagc gtggtgagcg cggcgccagt 18180
ggcggcggcg ctgggttcac ccttcgatgc tcccctggac ccgccgttcg tgcctccgcg 18240
gtacctgcgg cctaccgggg ggagaaacag catccgttac tctgagttgg cacccctatt 18300
cgacaccacc cgtgtgtacc ttgtggacaa caagtcaacg gatgtggcat ccctgaacta 18360
ccagaacgac cacagcaact ttctaaccac ggtcattcaa aacaatgact acagcccggg 18420
ggaggcaagc acacagacca tcaatcttga cgaccggtcg cactggggcg gcgacctgaa 18480
aaccatcctg cataccaaca tgccaaatgt gaacgagttc atgtttacca ataagtttaa 18540
ggcgcgggtg atggtgtcgc gctcgcttac taaggacaaa caggtggagc tgaaatacga 18600
gtgggtggag ttcacgctgc ccgagggcaa ctactccgag accatgacca tagaccttat 18660
gaacaacgcg atcgtggagc actacttgaa agtgggcagg cagaacgggg ttctggaaag 18720
cgacatcggg gtaaagtttg acacccgcaa cttcagactg gggtttgacc cagtcactgg 18780
tcttgtcatg cctggggtat atacaaacga agccttccat ccagacatca ttttgctgcc 18840
aggatgcggg gtggacttca cccacagccg cctgagcaac ttgttgggca tccgcaagcg 18900
gcaacccttc caggagggct ttaggatcac ctacgatgac ctggagggtg gtaacattcc 18960
cgcactgttg gatgtggacg cctaccaggc aagcttgaaa gatgacaccg aacagggcgg 19020
gggtggcgca ggcggcggca acaacagtgg cagcggcgcg gaagagaact ccaacgcggc 19080
agctgcggca atgcagccgg tggaggacat gaacgatcat gccattcgcg gcgacacctt 19140
tgccacacgg gcggaggaga agcgcgctga ggccgaggca gcggccgaag ctgccgcccc 19200
cgctgcggag gctgcacaac ccgaggtcga gaagcctcag aagaaaccgg tgattaaacc 19260
cctgacagag gacagcaaga aacgcagtta caacctaata agcaatgaca gcaccttcac 19320
ccagtaccgc agctggtacc ttgcatacaa ctacggcgac cctcaggccg ggatccgctc 19380
atggaccctg ctttgcactc ctgacgtaac ctgcggctcg gagcaggtat actggtcgtt 19440
gcccgacatg atgcaagacc ccgtgacctt ccgctccacg cgccagatca gcaactttcc 19500
ggtggtgggc gccgagctgt tgcccgtgca ctccaagagc ttctacaacg accaggccgt 19560
ctactcccag ctcatccgcc agtttacctc tctgacccac gtgttcaatc gctttcccga 19620
gaaccagatt ttggcgcgcc cgccagcccc caccatcacc accgtcagtg aaaacgttcc 19680
tgctctcaca gatcacggga cgctaccgct gcgcaacagc atcggaggag tccagcgagt 19740
gaccattact gacgccagac gccgcacctg cccctacgtt tacaaggccc tgggcatagt 19800
ctcgccgcgc gtcctatcga gccgcacttt ttgagcaagc atgtccatcc ttatatcgcc 19860
cagcaataac acaggctggg gcctgcgctt cccaagcaag atgtttggcg gggccaagaa 19920
gcgctccgac caacacccag tgcgcgtgcg cgggcactac cgcgcgccct ggggcgcgca 19980
caaacgcggc cgcactgggc gcaccaccgt cgatgacgcc atcgacgcgg tggtggagga 20040
ggcgcgcaac tacacgccca cgccgccgcc agtgtccacc gtggacgcgg ccattcagac 20100
cgtggtgcgc ggagcccggc gctacgctaa aatgaagaga cggcggaggc gcgtagcacg 20160
tcgccaccgc cgccgacccg gcactgccgc ccaacgcgcg gcggcggccc tgcttaaccg 20220
cgcacgtcgc accggccgac gggcggccat gcgagccgct cgaaggctgg ccgcgggtat 20280
tgtcactgtg ccccccaggt ccaggcgacg agcggccgcc gcagcagccg cggccattag 20340
tgctatgact cagggtcgca ggggcaacgt gtactgggtg cgcgactcgg ttagcggcct 20400
gcgcgtgccc gtgcgcaccc gccccccgcg caactagatt gcaataaaaa actacttaga 20460
ctcgtactgt tgtatgtatc cagcggcggc ggcgcgcatc gaagctatgt ccaagcgcaa 20520
aatcaaagaa gagatgctcc aggtcatcgc gccggagatc tatggccccc cgaagaagga 20580
agagcaggat tacaagcccc gaaagctaaa gcgggtcaaa aagaaaaaga aagatgatga 20640
tgatgatgaa cttgacgacg aggtggaact gttgcacgcg accgcgccca ggcgacgggt 20700
acagtggaaa ggtcgacgcg taagacgtgt tttgcgaccc ggcaccaccg tagtctttac 20760
gcccggtgag cgctccaccc gcacctacaa gcgcgtgtat gatgaggtgt acggcgacga 20820
ggacctgctt gagcaggcca acgagcgcct cggggagttt gcctacggaa agcggcataa 20880
ggacatgctg gcgttgccgc tggacgaggg caacccaaca cctagcctaa agcccgtgac 20940
actgcagcag gtgctgcccg cgcttgcacc gtccgaagaa aagcgcggcc taaagcgcga 21000
gtctggtgac ttggcaccca ccgtgcagct gatggtaccc aagcgtcagc gactggaaga 21060
tgtcttggaa aaaatgaccg tggagcctgg gctggagccc gaggtccgcg tgcggccaat 21120
caagcaggtg gcaccgggac tgggcgtgca gaccgtggac gttcagatac ccaccaccag 21180
tagcactagt attgccactg ccacagaggg catggagaca caaacgtccc cggttgcctc 21240
ggcggtggca gatgccgcgg tgcaggcggc cgctgcggcc gcgtccaaga cctctacgga 21300
ggtgcaaacg gacccgtgga tgtttcgtgt ttcagccccc cggcgtccgc gccgttcaag 21360
gaagtacggc gccgccagcg cgctactgcc cgaatatgcc ctacatcctt ccatcgcgcc 21420
tacccccggc tatcgtggct acacctaccg ccccagaaga cgagcaacta cccgacgccg 21480
aaccaccact ggaacccgcc gccgccgtcg ccgtcgccag cccgtgctgg ccccgatttc 21540
cgtgcgcagg gtggctcgcg aaggaggcag gaccctggtg ctgccaacag cgcgctacca 21600
ccccagcatc gtttaaaagc cggtctttgt ggttcttgca gatatggccc tcacctgccg 21660
cctccgtttc ccggtgccgg gattccgagg aagaatgcac cgtaggaggg gcatggccgg 21720
ccacggcctg acgggcggca tgcgtcgtgc gcaccaccgg cggcggcgcg cgtcgcaccg 21780
tcgcatgcgc ggcggtatcc tgcccctcct tattccactg atcgccgcgg cgattggcgc 21840
cgtgcccgga attgcatccg tggccttgca ggcgcagaga cactgattaa aaacaagtta 21900
catgtggaaa aatcaaaata aaagtctgga ctctcacgct cgcttggtcc tgtaactatt 21960
ttgtagaatg gaagacatca actttgcgtc actggccccg cgacacggct cgcgcccgtt 22020
catgggaaac tggcaagata tcggcaccag caatatgagc ggtggcgcct tcagctgggg 22080
ctcgctgtgg agcggcatta aaaatttcgg ttccgccgtt aagaactatg gcagcaaagc 22140
ctggaacagc agcacaggcc agatgctgag ggacaagttg aaagagcaaa atttccaaca 22200
aaaggtggta gatggcctgg cctctggcat tagcggggtg gtggacctgg ccaaccaggc 22260
agtgcaaaat aagattaaca gtaagcttga tccccgccct cccgtagagg agcctccacc 22320
ggccgtggag acagtgtctc cagaggggcg tggcgaaaag cgtccgcgac ccgacaggga 22380
agaaactctg gtgacgcaaa tagacgagcc tccctcgtac gaggaggcac taaagcaagg 22440
cctgcccacc acccgtccca tcgcgcccat ggctaccgga gtgctgggcc agcacacacc 22500
cgtaacgctg gacctgcctc cccccgccga cacccagcag aaacctgtgc tgccaggccc 22560
gtccgccgtt gttgtaaccc gtcctagccg cgcgtccctg cgccgcgccg ccagcggtcc 22620
gcgatcgttg cggcccgtag ccagtggcaa ctggcaaagc acactgaaca gcatcgtggg 22680
tttgggggtg caatccctga agcgccgacg atgcttctga tagctaacgt gtcgtatgtg 22740
tgtcatgtat gcgtccatgt cgccgccaga ggagctgctg agccgccgcg cgcccgcttt 22800
ccaagatggc taccccttcg atgatgccgc agtggtctta catgcacatc tcgggccagg 22860
acgcctcgga gtacctgagc cccgggctgg tgcagttcgc ccgcgccacc gagacgtact 22920
tcagcctgaa taacaagttt agaaacccca cggtggcgcc tacgcacgac gtgaccacag 22980
accggtctca gcgtttgacg ctgcggttca tccccgtgga ccgcgaggat actgcgtact 23040
cgtacaaggc gcggttcacc ctagctgtgg gtgataaccg tgtgctagac atggcttcca 23100
cgtactttga catccgcggc gtgctggaca ggggccctac ttttaagccc tactctggca 23160
ctgcctacaa cgcactggcc cccaagggtg cccccaactc gtgcgagtgg gaacaaaatg 23220
aaactgcaca agtggatgct caagaacttg acgaagagga gaatgaagcc aatgaagctc 23280
aggcgcgaga acaggaacaa gctaagaaaa cccatgtata tgcccaggct ccactgtccg 23340
gaataaaaat aactaaagaa ggtctacaaa taggaactgc cgacgccaca gtagcaggtg 23400
ccggcaaaga aattttcgca gacaaaactt ttcaacctga accacaagta ggagaatctc 23460
aatggaacga agcggatgcc acagcagctg gtggaagggt tcttaaaaag acaactccca 23520
tgaaaccctg ctatggctca tacgctagac ccaccaattc caacggcgga cagggcgtta 23580
tggttgaaca aaatggtaaa ttggaaagtc aagtcgaaat gcaatttttt tccacatcca 23640
caaatgccac aaatgaagtt aacaatatac aaccaacagt tgtattgtac agcgaagatg 23700
taaacatgga aactccagat actcatcttt cttataaacc taaaatgggg gataaaaatg 23760
ccaaagtcat gcttggacaa caagcaatgc caaacagacc aaattacatt gcttttagag 23820
acaattttat tggtctcatg tattacaaca gcacaggtaa catgggtgtc cttgctggtc 23880
aggcatcgca gttgaacgct gttgtagatt tgcaagacag aaacacagag ctgtcctacc 23940
agcttttgct tgattcaatt ggcgacagaa caagatactt ttcaatgtgg aatcaagctg 24000
ttgacagcta tgatccagat gtcagaatta ttgagaacca tggaactgag gatgagttgc 24060
caaattattg ctttcctctt ggtggaattg ggattactga cacttttcaa gctgttaaaa 24120
caactgctgc taacggggac caaggcaata ctacctggca aaaagattca acatttgcag 24180
aacgcaatga aataggggtg ggaaataact ttgccatgga aattaacctg aatgccaacc 24240
tatggagaaa tttcctttac tccaatattg cgctgtacct gccagacaag ctaaaataca 24300
accccaccaa tgtggaaata tctgacaacc ccaacaccta cgactacatg aacaagcgag 24360
tggtggctcc tgggcttgta gactgctaca ttaaccttgg ggcgcgctgg tctctggact 24420
acatggacaa cgttaatccc tttaaccacc accgcaatgc gggcctgcgt taccgctcca 24480
tgttgttggg aaacggccgc tacgtgccct ttcacattca ggtgccccaa aagttttttg 24540
ccattaaaaa cctcctcctc ctgccaggct catacacata tgaatggaac ttcaggaagg 24600
atgttaacat ggttctgcag agctctctgg gaaacgacct tagagttgac ggggctagca 24660
ttaagtttga cagcatttgt ctttacgcca ccttcttccc catggcccac aacacggcct 24720
ccacgctgga agccatgctc agaaatgaca ccaacgacca gtcctttaat gactaccttt 24780
ccgccgccaa catgctatat cccatacccg ccaacgccac caacgtgccc atctccatcc 24840
catcgcgcaa ctgggcagca tttcgcggtt gggccttcac acgcttgaag acaaaggaaa 24900
ccccttccct gggatcaggc tacgaccctt actacaccta ctctggctcc ataccatacc 24960
ttgacggaac cttctatctt aatcacacct ttaagaaggt ggccattact tttgactctt 25020
ctgttagctg gccgggcaac gaccgcctgc ttactcccaa tgagtttgag attaagcgct 25080
cagttgacgg ggagggctat aacgtagctc agtgcaacat gacaaaggac tggttcctag 25140
tgcagatgtt ggccaactac aatattggct accagggctt ctacattcca gaaagctaca 25200
aagaccgcat gtactcgttc ttcagaaact tccagcccat gagccggcaa gtggtggacg 25260
atactaaata caaagattat cagcaggttg gaattatcca ccagcataac aactcaggct 25320
tcgtaggcta cctcgctccc accatgcgcg agggacaagc ttaccccgct aatgttccct 25380
acccactaat aggcaaaacc gcggttgata gtattaccca gaaaaagttt ctttgcgacc 25440
gcaccctgtg gcgcatcccc ttctccagta actttatgtc catgggtgcg ctcacagacc 25500
tgggccaaaa ccttctctac gcaaactccg cccacgcgct agacatgacc tttgaggtgg 25560
atcccatgga cgagcccacc cttctttatg ttttgtttga agtctttgac gtggtccgtg 25620
tgcaccagcc gcaccgcggc gtcatcgaga ccgtgtacct gcgcacgccc ttctcggccg 25680
gcaacgccac aacataaaga agcaagcaac atcaacaaca gctgccgcca tgggctccag 25740
tgagcaggaa ctgaaagcca ttgtcaaaga tcttggttgt gggccatatt ttttgggcac 25800
ctatgacaag cgcttcccag gctttgtttc cccacacaag ctcgcctgcg ccatagttaa 25860
cacggccggt cgcgagactg ggggcgtaca ctggatggcc tttgcctgga acccgcgctc 25920
aaaaacatgc tacctctttg agccctttgg cttttctgac caacgtctca agcaggttta 25980
ccagtttgag tacgagtcac tcctgcgccg tagcgccatt gcctcttccc ccgaccgctg 26040
tataacgctg gaaaagtcca cccaaagcgt gcaggggccc aactcggccg cctgtggcct 26100
attctgctgc atgtttctcc acgcctttgc caactggccc caaactccca tggatcacaa 26160
ccccaccatg aaccttatta ccggggtacc caactccatg cttaacagtc cccaggtaca 26220
gcccaccctg cgccgcaacc aggaacagct ctacagcttc ctggagcgcc actcgcccta 26280
cttccgcagc cacagtgcgc aaattaggag cgccacttct ttttgtcact tgaaaaacat 26340
gtaaaaataa tgtactagga gacactttca ataaaggcaa atgtttttat ttgtacactc 26400
tcgggtgatt atttaccccc acccttgccg tctgcgccgt ttaaaaatca aaggggttct 26460
gccgcgcatc gctatgcgcc actggcaggg acacgttgcg atactggtgt ttagtgctcc 26520
acttaaactc aggcacaacc atccgcggca gctcggtgaa gttttcactc cacaggctgc 26580
gcaccatcac caacgcgttt agcaggtcgg gcgccgatat cttgaagtcg cagttggggc 26640
ctccgccctg cgcgcgcgag ttgcgataca cagggttaca gcactggaac actatcagcg 26700
ccgggtggtg cacgctggcc agcacgctct tgtcggagat cagatccgcg tccaggtcct 26760
ccgcgttgct cagggcgaac ggagtcaact ttggtagctg ccttcccaaa aagggtgcat 26820
gcccaggctt tgagttgcac tcgcaccgta gtggcatcag aaggtgaccg tgcccagtct 26880
gggcgttagg atacagcgcc tgcatgaaag ccttgatctg cttaaaagcc acctgagcct 26940
ttgcgccttc agagaagaac atgccgcaag acttgccgga aaactgattg gccggacagg 27000
ccgcgtcatg cacgcagcac cttgcgtcgg tgttggagat ctgcaccaca tttcggcccc 27060
accggttctt cacgatcttg gccttgctag actgctcctt cagcgcgcgc tgcccgtttt 27120
cgctcgtcac atccatttca atcacgtgct ccttatttat cataatgctc ccgtgtagac 27180
acttaagctc gccttcgatc tcagcgcagc ggtgcagcca caacgcgcag cccgtgggct 27240
cgtggtgctt gtaggttacc tctgcaaacg actgcaggta cgcctgcagg aatcgcccca 27300
tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg caacccgcgg tgctcctcgt 27360
ttagccaggt cttgcatacg gccgccagag cttccacttg gtcaggcagt agcttgaagt 27420
ttgcctttag atcgttatcc acgtggtact tgtccatcaa cgcgcgcgca gcctccatgc 27480
ccttctccca cgcagacacg atcggcaggc tcagcgggtt tatcaccgtg ctttcacttt 27540
ccgcttcact ggactcttcc ttttcctctt gcatccgcat accccgcgcc actgggtcgt 27600
cttcattcag ccgccgcacc gtgcgcttac ctcccttgcc gtgcttgatt agcaccggtg 27660
ggttgctgaa acccaccatt tgtagcgcca catcttctct ttcttcctcg ctgtccacga 27720
tcacctctgg ggatggcggg cgctcgggct tgggagaggg gcgcttcttt ttctttttgg 27780
acgcaatggc caaatccgcc gtcgaggtcg atggccgcgg gctgggtgtg cgcggcacca 27840
gcgcatcttg tgacgagtct tcttcgtcct cggactcgag acgccgcctc agccgctttt 27900
ttgggggcgc gcggggaggc ggcggcgacg gcgacgggga cgagacgtcc tccatggttg 27960
gtggacgtcg cgccgcaccg cgtccgcgct cgggggtggt ttcgcgctgc tcctcttccc 28020
gactggccat ttccttctcc tataggcaga aaaagatcat ggagtcagtc gagaaggagg 28080
acagcctaac cgcccccttt gagttcgcca ccaccgcctc caccgatgcc gccaacgcgc 28140
ctaccacctt ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt atcgagcagg 28200
acccaggttt tgtaagcgaa gacgacgaag atcgctcagt accaacagag gataaaaagc 28260
aagaccagga cgacgcagag gcaaacgagg aacaagtcgg gcggggggac caaaggcatg 28320
gcgactacct agatgtggga gacgacgtgc tgttgaagca tctgcagcgc cagtgcgcca 28380
ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg gatgtcagcc 28440
ttgcctacga acgccacctg ttctcaccgc gcgtaccccc caaacgccaa gaaaacggca 28500
catgcgagcc caacccgcgc ctcaacttct accccgtatt tgccgtgcca gaggtgcttg 28560
ccacctatca catctttttc caaaactgca agatacccct atcctgccgt gccaaccgca 28620
gccgagcgga caagcagctg gccttgcggc agggcgctgt catacctgat atcgcctcgc 28680
tcgacgaagt gccaaaaatc tttgagggtc ttggacgcga cgagaagcgc gcggcaaacg 28740
ctctgcaaca agaaaacagc gaaaatgaaa gtcactgtgg agtgctggtg gaacttgagg 28800
gtgacaacgc gcgcctagcc gtgctgaaac gcagcatcga ggtcacccac tttgcctacc 28860
cggcacttaa cctacccccc aaggttatga gcacagtcat gagcgagctg atcgtgcgcc 28920
gtgcacgacc cctggagagg gatgcaaact tgcaagaaca aaccgaggag ggcctacccg 28980
cagttggcga tgagcagctg gcgcgctggc ttgagacgcg cgagcctgcc gacttggagg 29040
agcgacgcaa gctaatgatg gccgcagtgc ttgttaccgt ggagcttgag tgcatgcagc 29100
ggttctttgc tgacccggag atgcagcgca agctagagga aacgttgcac tacacctttc 29160
gccagggcta cgtgcgccag gcctgcaaaa tttccaacgt ggagctctgc aacctggtct 29220
cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa cgtgcttcat tccacgctca 29280
agggcgaggc gcgccgcgac tacgtccgcg actgcgttta cttatttctg tgctacacct 29340
ggcaaacggc catgggcgtg tggcagcagt gcctggagga gcgcaacctg aaggagctgc 29400
agaagctgct aaagcaaaac ttgaaggacc tatggacggc cttcaacgag cgctccgtgg 29460
ccgcgcacct ggcggacatt atcttccccg aacgcctgct taaaaccctg caacagggtc 29520
tgccagactt caccagtcaa agcatgttgc aaaactttag gaactttatc ctagagcgtt 29580
caggaattct gcccgccacc tgctgtgcgc ttcctagcga ctttgtgccc attaagtacc 29640
gtgaatgccc tccgccgctt tggggtcact gctaccttct gcagctagcc aactaccttg 29700
cctaccactc cgacatcatg gaagacgtga gcggtgacgg cctactggag tgtcactgtc 29760
gctgcaacct atgcaccccg caccgctccc tggtctgcaa ttcacaactg cttagcgaaa 29820
gtcaaattat cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag tccgcggctc 29880
cggggttgaa actcactccg gggctgtgga cgtcggctta ccttcgcaaa tttgtacctg 29940
aggactacca cgcccacgag attaggttct acgaagacca atcccgcccg ccaaatgcgg 30000
agcttaccgc ctgcgtcatt acccagggcc acatccttgg ccaattgcaa gccattaaca 30060
aagcccgcca agagtttctg ctacgaaagg gacggggggt ttacttggac ccccagtccg 30120
gcgaggagct caacccaatc cccccgccgc cgcagcccta tcagcagccg cgggcccttg 30180
cttcccagga tggcacccaa aaagaagctg cagctgccgc cgccgccacc cacggacgag 30240
gaggaatact gggacagtca ggcagaggag gttttggacg aggaggagga gatgatggaa 30300
gactgggaca gcctagacga ggaagcttcc gaggccgaag aggtgtcaga cgaaacaccg 30360
tcaccctcgg tcgcattccc ctcgccggcg ccccagaaat cggcaaccgt tcccagcatt 30420
gctacaacct ccgctcctca ggcgccgccg gcactgcccg ttcgccgacc caaccgtaga 30480
tgggacacca ctggaaccag ggccggtaag tctaagcagc cgccgccgtt agcccaagag 30540
caacaacagc gccaaggcta ccgctcgtgg cgcgtgcaca agaacgccat agttgcttgc 30600
ttgcaagact gtgggggcaa catctccttc gcccgccgct ttcttctcta ccatcacggc 30660
gtggccttcc cccgtaacat cctgcattac taccgtcatc tctacagccc ctactgcacc 30720
ggcggcagcg gcagcaacag cagcggccac gcagaagcaa aggcgaccgg atagcaagac 30780
tctgacaaag cccaagaaat ccacagcggc ggcagcagca ggaggaggag cactgcgtct 30840
ggcgcccaac gaacccgtat cgacccgcga gcttagaaac aggatttttc ccactctgta 30900
tgctatattt caacagagca ggggccaaga acaagagctg aaaataaaaa acaggtctct 30960
gcgctccctc acccgcagct gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct 31020
ggaagacgcg gaggctctct tcagcaaata ctgcgcgctg actcttaagg actagtttcg 31080
cgccctttct caaatttaag cgcgaaaact acgtcatctc cagcggccac acccggcgcc 31140
agcacctgtc gtcagcgcca ttatgagcaa ggaaattccc acgccctaca tgtggagtta 31200
ccagccacaa atgggacttg cggctggagc tgcccaagac tactcaaccc gaataaacta 31260
catgagcgcg ggaccccaca tgatatcccg ggtcaacgga atccgcgccc accgaaaccg 31320
aattctcctc gaacaggcgg ctattaccac cacacctcgt aataacctta atccccgtag 31380
ttggcccgct gccctggtgt accaggaaag tcccgctccc accactgtgg tacttcccag 31440
agacgcccag gccgaagttc agatgactaa ctcaggggcg cagcttgcgg gcggctttcg 31500
tcacagggtg cggtcgcccg ggcagggtat aactcacctg aaaatcagag ggcgaggtat 31560
tcagctcaac gacgagtcgg tgagctcctc tcttggtctc cgtccggacg ggacatttca 31620
gatcggcggc gctggccgct cttcatttac gccccgtcag gcgatcctaa ctctgcagac 31680
ctcgtcctcg gagccgcgct ccggaggcat tggaactcta caatttattg aggagttcgt 31740
gccttcggtt tacttcaacc ccttttctgg acctcccggc cactacccgg accagtttat 31800
tcccaacttt gacgcggtaa aagactcggc ggacggctac gactgaatga ccagtggaga 31860
ggcagagcaa ctgcgcctga cacacctcga ccactgccgc cgccacaagt gctttgcccg 31920
cggctccggt gagttttgtt actttgaatt gcccgaagag catatcgagg gcccggcgca 31980
cggcgtccgg ctcaccaccc aggtagagct tacacgtagc ctgattcggg agtttaccaa 32040
gcgccccctg ctagtggagc gggagcgggg tccctgtgtt ctgaccgtgg tttgcaactg 32100
tcctaaccct ggattacatc aagatcttat tccattcaac taacaataaa cacacaataa 32160
attacttact taaaatcagt cagcaaatct ttgtccagct tattcagcat cacctccttt 32220
ccctcctccc aactctggta tttcagcagc cttttagctg cgaactttct ccaaagtcta 32280
aatgggatgt caaattcctc atgttcttgt ccctccgcac ccactatctt catattgttg 32340
cagatgaaac gcgccagacc gtctgaagac accttcaacc ctgtgtaccc atatgacacg 32400
gaaaccggcc ctccaactgt gcctttcctt acccctccct ttgtgtcgcc aaatgggttc 32460
caagaaagtc cccccggagt gctttctttg cgtctttcag aacctttggt tacctcacac 32520
ggcatgcttg cgctaaaaat gggcagcggc ctgtccctgg atcaggcagg caaccttaca 32580
tcaaatacaa tcactgtttc tcaaccgcta aaaaaaacaa agtccaatat aactttggaa 32640
acatccgcgc cccttacagt cagctcaggc gccctaacca tggccacaac ttcgcctttg 32700
gtggtctctg acaacactct taccatgcaa tcacaagcac cgctaaccgt gcaagactca 32760
aaacttagca ttgctaccaa agagccactt acagtgttag atggaaaact ggccctgcag 32820
acatcagccc ccctctctgc cactgataac aacgccctca ctatcactgc ctcacctcct 32880
cttactactg caaatggtag tctggctgtt accatggaaa acccacttta caacaacaat 32940
ggaaaacttg ggctcaaaat tggcggtcct ttgcaagtgg ccaccgactc acatgcacta 33000
acactaggta ctggtcaggg ggttgcagtt cataacaatt tgctacatac aaaagttaca 33060
ggcgcaatag ggtttgatac atctggcaac atggaactta aaactggaga tggcctctat 33120
gtggatagcg ccggtcctaa ccaaaaacta catattaatc taaataccac aaaaggcctt 33180
gcttttgaca acaccgcaat aacaattaac gctggaaaag ggttggaatt tgaaacagac 33240
tcctcaaacg gaaatcccat aaaaacaaaa attggatcag gcatacaata taataccaat 33300
ggagctatgg ttgcaaaact tggaacaggc ctcagttttg acagctccgg agccataaca 33360
atgggcagca taaacaatga cagacttact ctttggacaa caccagaccc atccccaaat 33420
tgcagaattg cttcagataa agactgcaag ctaactctgg cgctaacaaa atgtggcagt 33480
caaattttgg gcactgtttc agctttggca gtatcaggta atatggcctc catcaatgga 33540
actctaagca gtgtaaactt ggttcttaga tttgatgaca acggagtgct tatgtcaaat 33600
tcatcactgg acaaacagta ttggaacttt agaaacgggg actccactaa cggtcaacca 33660
tacacttatg ctgttgggtt tatgccaaac ctaaaagctt acccaaaaac tcaaagtaaa 33720
actgcaaaaa gtaatattgt tagccaggtg tatcttaatg gtgacaagtc taaaccattg 33780
cattttacta ttacgctaaa tggaacagat gaaaccaacc aagtaagcaa atactcaata 33840
tcattcagtt ggtcctggaa cagtggacaa tacactaatg acaaatttgc caccaattcc 33900
tataccttct cctacattgc ccaggaataa agaatcgtga acctgttgca tgttatgttt 33960
caacgtgttt atttttcaat tgcagaaaat ttcaagtcat ttttcattca gtagtatagc 34020
cccaccacca catagcttat actaatcacc gtaccttaat caaactcaca gaaccctagt 34080
attcaacctg ccacctccct cccaacacac agagtacaca gtcctttctc cccggctggc 34140
cttaaacagc atcatatcat gggtaacaga catattctta ggtgttatat tccacacggt 34200
ctcctgtcga gccaaacgct catcagtgat gttaataaac tccccgggca gctcgcttaa 34260
gttcatgtcg ctgtccagct gctgagccac aggctgctgt ccaacttgcg gttgctcaac 34320
gggcggcgaa ggagaagtcc acgcctacat gggggtagag tcataatcgt gcatcaggat 34380
agggcggtgg tgctgcagca gcgcgcgaat aaactgctgc cgccgccgct ccgtcctgca 34440
ggaatacaac atggcagtgg tctcctcagc gatgattcgc accgcccgca gcataaggcg 34500
ccttgtcctc cgggcacagc agcgcaccct gatctcactt aagtcagcac agtaactgca 34560
gcacagtacc acaatattgt ttaaaatccc acagtgcaag gcgctgtatc caaagctcat 34620
ggcggggacc acagaaccca cgtggccatc ataccacaag cgcaggtaga ttaagtggcg 34680
acccctcata aacacgctgg acataaacat tacctctttt ggcatgttgt aattcaccac 34740
ctcccggtac catataaacc tctgattaaa catggcgcca tccaccacca tcctaaacca 34800
gctggccaaa acctgcccgc cggctatgca ctgcagggaa ccgggactgg aacaatgaca 34860
gtggagagcc caggactcgt aaccatggat catcatgctc gtcatgatat caatgttggc 34920
acaacacagg cacacgtgca tacacttcct caggattaca agctcctccc gcgtcagaac 34980
catatcccag ggaacaaccc attcctgaat cagcgtaaat cccacactgc agggaagacc 35040
tcgcacgtaa ctcacgttgt gcattgtcaa agtgttacat tcgggcagca gcggatgatc 35100
ctccagtatg gtagcgcggg tttctgtctc aaaaggaggt agacgatccc tactgtacgg 35160
agtgcgccga gacaaccgag atcgtgttgg tcgtagtgtc atgccaaatg gaacgccgga 35220
cgtagtcata tttcctgaag caaaaccagg tgcgggcgtg acaaacagat ctgcgtctcc 35280
ggtctcgccg cttagatcgc tctgtgtagt agttgtagta tatccactct ctcaaagcat 35340
ccaggcgccc cctggcttcg ggttctatgt aaactccttc atgcgccgct gccctgataa 35400
catccaccac cgcagaataa gccacaccca gccaacctac acattcgttc tgcgagtcac 35460
acacgggagg agcgggaaga gctggaagaa ccatgttttt ttttttattc caaaagatta 35520
tccaaaacct caaaatgaag atctattaag tgaacgcgct cccctccggt ggcgtggtca 35580
aactctacag ccaaagaaca gataatggca tttgtaagat gttgcacaat ggcttccaaa 35640
aggcaaacgg ccctcacgtc caagtggacg taaaggctaa acccttcagg gtgaatctcc 35700
tctataaaca ttccagcacc ttcaaccatg cccaaataat tctcatctcg ccaccttctc 35760
aatatatctc taagcaaatc ccgaatatta agtccggcca ttgtaaaaat ctgctccaga 35820
gcgccctcca ccttcagcct caagcagcga atcatgattg caaaaattca ggttcctcac 35880
agacctgtat aagattcaaa agcggaacat taacaaaaat accgcgatcc cgtaggtccc 35940
ttcgcagggc cagctgaaca taatcgtgca ggtctgcacg gaccagcgcg gccacttccc 36000
cgccaggaac catgacaaaa gaacccacac tgattatgac acgcatactc ggagctatgc 36060
taaccagcgt agccccgatg taagcttgtt gcatgggcgg cgatataaaa tgcaaggtgc 36120
tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag cacatcgtag tcatgctcat 36180
gcagataaag gcaggtaagc tccggaacca ccacagaaaa agacaccatt tttctctcaa 36240
acatgtctgc gggtttctgc ataaacacaa aataaaataa caaaaaaaca tttaaacatt 36300
agaagcctgt cttacaacag gaaaaacaac ccttataagc ataagacgga ctacggccat 36360
gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa agcaccaccg acagctcctc 36420
ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca tcaggttgat tcacatcggt 36480
cagtgctaaa aagcgaccga aatagcccgg gggaatacat acccgcaggc gtagagacaa 36540
cattacagcc cccataggag gtataacaaa attaatagga gagaaaaaca cataaacacc 36600
tgaaaaaccc tcctgcctag gcaaaatagc accctcccgc tccagaacaa catacagcgc 36660
ttccacagcg gcagccataa cagtcagcct taccagtaaa aaagaaaacc tattaaaaaa 36720
acaccactcg acacggcacc agctcaatca gtcacagtgt aaaaaagggc caagtgcaga 36780
gcgagtatat ataggactaa aaaatgacgt aacggttaaa gtccacaaaa aacacccaga 36840
aaaccgcacg cgaacctacg cccagaaacg aaagccaaaa aacccacaac ttcctcaaat 36900
cgtcacttcc gttttcccac gttacgtcac ttcccatttt aagaaaacta caattcccaa 36960
cacatacaag ttactccgcc ctaaaaccta cgtcacccgc cccgttccca cgccccgcgc 37020
cacgtcacaa actccacccc ctcattatca tattggcttc aatccaaaat aaggtatatt 37080
attgatgatg 37090
<210>5
<211>5955
<212>DNA
<213>人工序列
<220>
<223>NS cDNA序列
<221>CDS
<222>(1)...(5955)
<400>5
atg gcg ccc atc acg gcc tac tcc caa cag acg cgg ggc cta ctt ggt 48
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly
1 5 10 15
tgc atc atc act agc ctt aca ggc cgg gac aag aac cag gtc gag gga 96
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
20 25 30
gag gtt cag gtg gtt tcc acc gca aca caa tcc ttc ctg gcg acc tgc 144
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys
35 40 45
gtc aac ggc gtg tgt tgg acc gtt tac cat ggt gct ggc tca aag acc 192
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr
50 55 60
tta gcc ggc cca aag ggg cca atc acc cag atg tac act aat gtg gac 240
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp
65 70 75 80
cag gac ctc gtc ggc tgg cag gcg ccc ccc ggg gcg cgt tcc ttg aca 288
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr
85 90 95
cca tgc acc tgt ggc agc tca gac ctt tac ttg gtc acg aga cat gct 336
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110
gac gtc att ccg gtg cgc cgg cgg ggc gac agt agg ggg agc ctg ctc 384
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
115 120 125
tcc ccc agg cct gtc tcc tac ttg aag ggc tct tcg ggt ggt cca ctg 432
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
130 135 140
ctc tgc cct tcg ggg cac gct gtg ggc atc ttc cgg gct gcc gta tgc 480
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145 150 155 160
acc cgg ggg gtt gcg aag gcg gtg gac ttt gtg ccc gta gag tcc atg 528
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met
165 170 175
gaa act act atg cgg tct ccg gtc ttc acg gac aac tca tcc ccc ccg 576
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro
180 185 190
gcc gta ccg cag tca ttt caa gtg gcc cac cta cac gct ccc act ggc 624
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly
195 200 205
agc ggc aag agt act aaa gtg ccg gct gca tat gca gcc caa ggg tac 672
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr
210 215 220
aag gtg ctc gtc ctc aat ccg tcc gtt gcc gct acc tta ggg ttt ggg 720
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly
225 230 235 240
gcg tat atg tct aag gca cac ggt att gac ccc aac atc aga act ggg 768
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly
245 250 255
gta agg acc att acc aca ggc gcc ccc gtc aca tac tct acc tat ggc 816
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly
260 265 270
aag ttt ctt gcc gat ggt ggt tgc tct ggg ggc gct tat gac atc ata 864
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile
275 280 285
ata tgt gat gag tgc cat tca act gac tcg act aca atc ttg ggc atc 912
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile
290 295 300
ggc aca gtc ctg gac caa gcg gag acg gct gga gcg cgg ctt gtc gtg 960
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val
305 310 315 320
ctc gcc acc gct acg cct ccg gga tcg gtc acc gtg cca cac cca aac 1008
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn
325 330 335
atc gag gag gtg gcc ctg tct aat act gga gag atc ccc ttc tat ggc 1056
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly
340 345 350
aaa gcc atc ccc att gaa gcc atc agg ggg gga agg cat ctc att ttc 1104
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe
355 360 365
tgt cat tcc aag aag aag tgc gac gag ctc gcc gca aag ctg tca ggc 1152
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly
370 375 380
ctc gga atc aac gct gtg gcg tat tac cgg ggg ctc gat gtg tcc gtc 1200
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val
385 390 395 400
ata cca act atc gga gac gtc gtt gtc gtg gca aca gac gct ctg atg 1248
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met
405 410 415
acg ggc tat acg ggc gac ttt gac tca gtg atc gac tgt aac aca tgt 1296
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys
420 425 430
gtc acc cag aca gtc gac ttc agc ttg gat ccc acc ttc acc att gag 1344
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu
435 440 445
acg acg acc gtg cct caa gac gca gtg tcg cgc tcg cag cgg cgg ggt 1392
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly
450 455 460
agg act ggc agg ggt agg aga ggc atc tac agg ttt gtg act ccg gga 1440
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly
465 470 475 480
gaa cgg ccc tcg ggc atg ttc gat tcc tcg gtc ctg tgt gag tgc tat 1488
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr
485 490 495
gac gcg ggc tgt gct tgg tac gag ctc acc ccc gcc gag acc tcg gtt 1536
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val
500 505 510
agg ttg cgg gcc tac ctg aac aca cca ggg ttg ccc gtt tgc cag gac 1584
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp
515 520 525
cac ctg gag ttc tgg gag agt gtc ttc aca ggc ctc acc cac ata gat 1632
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp
530 535 540
gca cac ttc ttg tcc cag acc aag cag gca gga gac aac ttc ccc tac 1680
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr
545 550 555 560
ctg gta gca tac caa gcc acg gtg tgc gcc agg gct cag gcc cca cct 1728
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro
565 570 575
cca tca tgg gat caa atg tgg aag tgt ctc ata cgg ctg aaa cct acg 1776
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr
580 585 590
ctg cac ggg cca aca ccc ttg ctg tac agg ctg gga gcc gtc caa aat 1824
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn
595 600 605
gag gtc acc ctc acc cac ccc ata acc aaa tac atc atg gca tgc atg 1872
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met
610 615 620
tcg gct gac ctg gag gtc gtc act agc acc tgg gtg ctg gtg ggc gga 1920
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly
625 630 635 640
gtc ctt gca gct ctg gcc gcg tat tgc ctg aca aca ggc agt gtg gtc 1968
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val
645 650 655
att gtg ggt agg att atc ttg tcc ggg agg ccg gct att gtt ccc gac 2016
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp
660 665 670
agg gag ttt ctc tac cag gag ttc gat gaa atg gaa gag tgc gcc tcg 2064
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser
675 680 685
cac ctc cct tac atc gag cag gga atg cag ctc gcc gag caa ttc aag 2112
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys
690 695 700
cag aaa gcg ctc ggg tta ctg caa aca gcc acc aaa caa gcg gag gct 2160
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala
705 710 715 720
gct gct ccc gtg gtg gag tcc aag tgg cga gcc ctt gag aca ttc tgg 2208
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp
725 730 735
gcg aag cac atg tgg aat ttc atc agc ggg ata cag tac tta gca ggc 2256
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly
740 745 750
tta tcc act ctg cct ggg aac ccc gca ata gca tca ttg atg gca ttc 2304
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe
755 760 765
aca gcc tct atc acc agc ccg ctc acc acc caa agt acc ctc ctg ttt 2352
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe
770 775 780
aac atc ttg ggg ggg tgg gtg gct gcc caa ctc gcc ccc ccc agc gcc 2400
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala
785 790 795 800
gct tcg gct ttc gtg ggc gcc ggc atc gcc ggt gcg gct gtt ggc agc 2448
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser
805 810 815
ata ggc ctt ggg aag gtg ctt gtg gac att ctg gcg ggt tat gga gca 2496
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala
820 825 830
gga gtg gcc ggc gcg ctc gtg gcc ttc aag gtc atg agc ggc gag atg 2544
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met
835 840 845
ccc tcc acc gag gac ctg gtc aat cta ctt cct gcc atc ctc tct cct 2592
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro
850 855 860
ggc gcc ctg gtc gtc ggg gtc gtg tgt gca gca ata ctg cgt cga cac 2640
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His
865 870 875 880
gtg ggt ccg gga gag ggg gct gtg cag tgg atg aac cgg ctg ata gcg 2688
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala
885 890 895
ttc gcc tcg cgg ggt aat cat gtt tcc ccc acg cac tat gtg cct gag 2736
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu
900 905 910
agc gac gcc gca gcg cgt gtt act cag atc ctc tcc agc ctt acc atc 2784
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile
915 920 925
act cag ctg ctg aaa agg ctc cac cag tgg att aat gaa gac tgc tcc 2832
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser
930 935 940
aca ccg tgt tcc ggc tcg tgg cta agg gat gtt tgg gac tgg ata tgc 2880
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys
945 950 955 960
acg gtg ttg act gac ttc aag acc tgg ctc cag tcc aag ctc ctg ccg 2928
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro
965 970 975
cag cta ccg gga gtc cct ttt ttc tcg tgc caa cgc ggg tac aag gga 2976
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly
980 985 990
gtc tgg cgg gga gac ggc atc atg caa acc acc tgc cca tgt gga gca 3024
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala
995 1000 1005
cag atc acc gga cat gtc aaa aac ggt tcc atg agg atc gtc ggg cct 3072
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro
1010 1015 1020
aag acc tgc agc aac acg tgg cat gga aca ttc ccc atc aac gca tac 3120
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr
1025 1030 1035 1040
acc acg ggc ccc tgc aca ccc tct cca gcg cca aac tat tct agg gcg 3168
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala
1045 1050 1055
ctg tgg cgg gtg gcc gct gag gag tac gtg gag gtc acg cgg gtg ggg 3216
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly
1060 1065 1070
gat ttc cac tac gtg acg ggc atg acc act gac aac gta aag tgc cca 3264
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro
1075 1080 1085
tgc cag gtt ccg gct cct gaa ttc ttc acg gag gtg gac gga gtg cgg 3312
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg
1090 1095 1100
ttg cac agg tac gct ccg gcg tgc agg cct ctc cta cgg gag gag gtt 3360
Leu Hi s Arg TyrAla Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val
1105 1110 1115 1120
aca ttc cag gtc ggg ctc aac caa tac ctg gtt ggg tca cag cta cca 3408
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro
1125 1130 1135
tgc gag ccc gaa ccg gat gta gca gtg ctc act tcc atg ctc acc gac 3456
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp
1140 1145 1150
ccc tcc cac atc aca gca gaa acg gct aag cgt agg ttg gcc agg ggg 3504
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly
1155 1160 1165
tct ccc ccc tcc ttg gcc agc tct tca gct agc cag ttg tct gcg cct 3552
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro
1170 1175 1180
tcc ttg aag gcg aca tgc act acc cac cat gtc tct ccg gac gct gac 3600
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp
1185 1190 1195 1200
ctc atc gag gcc aac ctc ctg tgg cgg cag gag atg ggc ggg aac atc 3648
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile
1205 1210 1215
acc cgc gtg gag tcg gag aac aag gtg gta gtc ctg gac tct ttc gac 3696
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp
1220 1225 1230
ccg ctt cga gcg gag gag gat gag agg gaa gta tcc gtt ccg gcg gag 3744
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu
1235 1240 1245
atc ctg cgg aaa tcc aag aag ttc ccc gca gcg atg ccc atc tgg gcg 3792
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala
1250 1255 1260
cgc ccg gat tac aac cct cca ctg tta gag tcc tgg aag gac ccg gac 3840
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp
1265 1270 1275 1280
tac gtc cct ccg gtg gtg cac ggg tgc ccg ttg cca cct atc aag gcc 3888
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala
1285 1290 1295
cct cca ata cca cct cca cgg aga aag agg acg gtt gtc cta aca gag 3936
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu
1300 1305 1310
tcc tcc gtg tct tct gcc tta gcg gag ctc gct act aag acc ttc ggc 3984
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly
1315 1320 1325
agc tcc gaa tca tcg gcc gtc gac agc ggc acg gcg acc gcc ctt cct 4032
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro
1330 1335 1340
gac cag gcc tcc gac gac ggt gac aaa gga tcc gac gtt gag tcg tac 4080
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr
1345 1350 1355 1360
tcc tcc atg ccc ccc ctt gag ggg gaa ccg ggg gac ccc gat ctc agt 4128
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser
1365 1370 1375
gac ggg tct tgg tct acc gtg agc gag gaa gct agt gag gat gtc gtc 4176
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val
1380 1385 1390
tgc tgc tca atg tcc tac aca tgg aca ggc gcc ttg atc acg cca tgc 4224
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys
1395 1400 1405
gct gcg gag gaa agc aag ctg ccc atc aac gcg ttg agc aac tct ttg 4272
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu
1410 1415 1420
ctg cgc cac cat aac atg gtt tat gcc aca aca tct cgc agc gca ggc 4320
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly
1425 1430 1435 1440
ctg cgg cag aag aag gtc acc ttt gac aga ctg caa gtc ctg gac gac 4368
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp
1445 1450 1455
cac tac cgg gac gtg ctc aag gag atg aag gcg aag gcg tcc aca gtt 4416
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val
1460 1465 1470
aag gct aaa ctc cta tcc gta gag gaa gcc tgc aag ctg acg ccc cca 4464
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro
1475 1480 1485
cat tcg gcc aaa tcc aag ttt ggc tat ggg gca aag gac gtc cgg aac 4512
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn
1490 1495 1500
cta tcc agc aag gcc gtt aac cac atc cac tcc gtg tgg aag gac ttg 4560
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu
1505 1510 1515 1520
ctg gaa gac act gtg aca cca att gac acc acc atc atg gca aaa aat 4608
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn
1525 1530 1535
gag gtt ttc tgt gtc caa cca gag aaa gga ggc cgt aag cca gcc cgc 4656
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg
1540 1545 1550
ctt atc gta ttc cca gat ctg gga gtc cgt gta tgc gag aag atg gcc 4704
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala
1555 1560 1565
ctc tat gat gtg gtc tcc acc ctt cct cag gtc gtg atg ggc tcc tca 4752
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser
1570 1575 1580
tac gga ttc cag tac tct cct ggg cag cga gtc gag ttc ctg gtg aat 4800
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn
1585 1590 1595 1600
acc tgg aaa tca aag aaa aac ccc atg ggc ttt tca tat gac act cgc 4848
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg
1605 1610 1615
tgt ttc gac tca acg gtc acc gag aac gac atc cgt gtt gag gag tca 4896
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser
1620 1625 1630
att tac caa tgt tgt gac ttg gcc ccc gaa gcc aga cag gcc ata aaa 4944
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys
1635 1640 1645
tcg ctc aca gag cgg ctt tat atc ggg ggt cct ctg act aat tca aaa 4992
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys
1650 1655 1660
ggg cag aac tgc ggt tat cgc cgg tgc cgc gcg agc ggc gtg ctg acg 5040
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr
1665 1670 1675 1680
act agc tgc ggt aac acc ctc aca tgt tac ttg aag gcc tct gca gcc 5088
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala
1685 1690 1695
tgt cga gct gcg aag ctc cag gac tgc acg atg ctc gtg aac gga gac 5136
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp
1700 1705 1710
gac ctt gtc gtt atc tgt gaa agc gcg gga acc caa gag gac gcg gcg 5184
Asp Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala
1715 1720 1725
agc cta cga gtc ttc acg gag gct atg act agg tac tct gcc ccc ccc 5232
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro
1730 1735 1740
ggg gac ccg ccc caa cca gaa tac gac ttg gag ctg ata aca tca tgt 5280
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys
1745 1750 1755 1760
tcc tcc aat gtg tcg gtc gcc cac gat gca tca ggc aaa agg gtg tac 5328
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr
1765 1770 1775
tac ctc acc cgt gat ccc acc acc ccc ctc gca cgg gct gcg tgg gaa 5376
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu
1780 1785 1790
aca gct aga cac act cca gtt aac tcc tgg cta ggc aac att atc atg 5424
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met
1795 1800 1805
tat gcg ccc act ttg tgg gca agg atg att ctg atg act cac ttc ttc 5472
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe
1810 1815 1820
tcc atc ctt cta gca cag gag caa ctt gaa aaa gcc ctg gac tgc cag 5520
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln
1825 1830 1835 1840
atc tac ggg gcc tgt tac tcc att gag cca ctt gac cta cct cag atc 5568
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile
1845 1850 1855
att gaa cga ctc cat ggc ctt agc gca ttt tca ctc cat agt tac tct 5616
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser
1860 1865 1870
cca ggt gag atc aat agg gtg gct tca tgc ctc agg aaa ctt ggg gta 5664
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val
1875 1880 1885
cca ccc ttg cga gtc tgg aga cat cgg gcc agg agc gtc cgc gct agg 5712
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg
1890 1895 1900
cta ctg tcc cag ggg ggg agg gcc gcc act tgt ggc aag tac ctc ttc 5760
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe
1905 1910 1915 1920
aac tgg gca gtg aag acc aaa ctc aaa ctc act cca atc ccg gct gcg 5808
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala
1925 1930 1935
tcc cag ctg gac ttg tcc ggc tgg ttc gtt gct ggt tac agc ggg gga 5856
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly
1940 1945 1950
gac ata tat cac agc ctg tct cgt gcc cga ccc cgc tgg ttc atg ctg 5904
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu
1955 1960 1965
tgc cta ctc cta ctt tct gta ggg gta ggc atc tac ctg ctc ccc aac 5952
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn
1970 1975 1980
cga 5955
Arg
1985
<210>6
<211>1984
<212>PRT
<213>人工序列
<220>
<223>NS序列
<400>6
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
50 55 60
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
180 185 190
Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser
195 200 205
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys
210 215 220
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala
225 230 235 240
Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly Val
245 250 255
Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly Lys
260 265 270
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile
275 280 285
Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile Gly
290 295 300
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu
305 310 315 320
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn Ile
325 330 335
Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys
340 345 350
Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe Cys
355 360 365
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly Leu
370 375 380
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile
385 390 395 400
Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr
405 410 415
Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val
420 425 430
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr
435 440 445
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg
450 455 460
Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu
465 470 475 480
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp
485 490 495
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val Arg
500 505 510
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His
515 520 525
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala
530 535 540
His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu
545 550 555 560
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro
565 570 575
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu
580 585 590
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu
595 600 605
Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met Ser
610 615 620
Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val
625 630 635 640
Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val Ile
645 650 655
Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp Arg
660 665 670
Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser His
675 680 685
Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys Gln
690 695 700
Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala Ala
705 710 715 720
Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp Ala
725 730 735
Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly Leu
740 745 750
Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe Thr
755 760 765
Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe Asn
770 775 780
Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala Ala
785 790 795 800
Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser Ile
805 810 815
Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala Gly
820 825 830
Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met Pro
835 840 845
Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro Gly
850 855 860
Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His Val
865 870 875 880
Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala Phe
885 890 895
Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu Ser
900 905 910
Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile Thr
915 920 925
Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser Thr
930 935 940
Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys Thr
945 950 955 960
Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro Gln
965 970 975
Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly Val
980 985 990
Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala Gln
995 1000 1005
Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro Lys
1010 1015 1020
Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr Thr
1025 1030 1035 1040
Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala Leu
1045 1050 1055
Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly Asp
1060 1065 1070
Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro Cys
1075 1080 1085
Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg Leu
1090 1095 1100
His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val Thr
1105 1110 1115 1120
Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro Cys
1125 1130 1135
Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp Pro
1140 1145 1150
Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly Ser
1155 1160 1165
Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser
1170 1175 1180
Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp Leu
1185 1190 1195 1200
Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile Thr
1205 1210 1215
Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp Pro
1220 1225 1230
Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu Ile
1235 1240 1245
Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala Arg
1250 1255 1260
Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp Tyr
1265 1270 1275 1280
Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala Pro
1285 1290 1295
Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu Ser
1300 1305 1310
Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly Ser
1315 1320 1325
Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro Asp
1330 1335 1340
Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr Ser
1345 1350 1355 1360
Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp
1365 1370 1375
Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val Cys
1380 1385 1390
Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys Ala
1395 1400 1405
Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu Leu
1410 1415 1420
Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly Leu
1425 1430 1435 1440
Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp His
1445 1450 1455
Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val Lys
1460 1465 1470
Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro His
1475 1480 1485
Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn Leu
1490 1495 1500
Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu Leu
1505 1510 1515 1520
Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu
1525 1530 1535
Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu
1540 1545 1550
Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu
1555 1560 1565
Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser Tyr
1570 1575 1580
Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn Thr
1585 1590 1595 1600
Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys
1605 1610 1615
Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser Ile
1620 1625 1630
Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys Ser
1635 1640 1645
Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly
1650 1655 1660
Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr
1665 1670 1675 1680
Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala Cys
1685 1690 1695
Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp Asp
1700 1705 1710
Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala Ser
1715 1720 1725
Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly
1730 1735 1740
Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser
1745 1750 1755 1760
Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr Tyr
1765 1770 1775
Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr
1780 1785 1790
Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met Tyr
1795 1800 1805
Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe Ser
1810 1815 1820
Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln Ile
1825 1830 1835 1840
Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile Ile
1845 1850 1855
Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro
1860 1865 1870
Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val Pro
1875 1880 1885
Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu
1890 1895 1900
Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe Asn
1905 1910 1915 1920
Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala Ser
1925 1930 1935
Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly Asp
1940 1945 1950
Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu Cys
1955 1960 1965
Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn Arg
1970 1975 1980
<210>7
<211>4909
<212>DNA
<213>人工序列
<220>
<223>pV1J核酸
<400>7
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcagattgg 240
ctattggcca ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg 300
tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac 360
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 420
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 480
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 540
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 600
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 660
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 720
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 780
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 840
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 900
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca 960
tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg gaacgcggat 1020
tccccgtgcc aagagtgacg taagtaccgc ctatagactc tataggcaca cccctttggc 1080
tcttatgcat gctatactgt ttttggcttg gggcctatac acccccgctt ccttatgcta 1140
taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc 1200
tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactatctc 1260
tattggctat atgccaatac tctgtccttc agagactgac acggactctg tatttttaca 1320
ggatggggtc ccatttatta tttacaaatt cacatataca acaacgccgt cccccgtgcc 1380
cgcagttttt attaaacata gcgtgggatc tccacgcgaa tctcgggtac gtgttccgga 1440
catgggctct tctccggtag cggcggagct tccacatccg agccctggtc ccatgcctcc 1500
agcggctcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac 1560
agcacaatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct 1620
gaaaatgagc gtggagattg ggctcgcacg gctgacgcag atggaagact taaggcagcg 1680
gcagaagaag atgcaggcag ctgagttgtt gtattctgat aagagtcaga ggtaactccc 1740
gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg 1800
cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc 1860
tgcagtcacc gtccttagat ctaggtacca gatatcagaa ttcagtcgac agcggccgcg 1920
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 1980
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 2040
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 2100
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgctgcggc 2160
caggtgctga agaattgacc cggttcctcc tgggccagaa agaagcaggc acatcccctt 2220
ctctgtgaca caccctgtcc acgcccctgg ttcttagttc cagccccact cataggacac 2280
tcatagctca ggagggctcc gccttcaatc ccacccgcta aagtacttgg agcggtctct 2340
ccctccctca tcagcccacc aaaccaaacc tagcctccaa gagtgggaag aaattaaagc 2400
aagataggct attaagtgca gagggagaga aaatgcctcc aacatgtgag gaagtaatga 2460
gagaaatcat agaatttctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 2520
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 2580
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 2640
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 2700
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 2760
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 2820
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 2880
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 2940
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 3000
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 3060
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 3120
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 3180
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 3240
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 3300
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 3360
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 3420
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 3480
tgcctgactc gggggggggg ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc 3540
ataccaggcc tgaatcgccc catcatccag ccagaaagtg agggagccac ggttgatgag 3600
agctttgttg taggtggacc agttggtgat tttgaacttt tgctttgcca cggaacggtc 3660
tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca gcaaaagttc gatttattca 3720
acaaagccgc cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc 3780
aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt catatcagga 3840
ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg 3900
cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca 3960
atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga 4020
gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca gacttgttca 4080
acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt 4140
cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca attacaaaca 4200
ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa 4260
tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt ggtgagtaac 4320
catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc 4380
agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt 4440
ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt cgcacctgat 4500
tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt 4560
aatcgcggcc tcgagcaaga cgtttcccgt tgaatatggc tcataacacc ccttgtatta 4620
ctgtttatgt aagcagacag ttttattgtt catgatgata tatttttatc ttgtgcaatg 4680
taacatcaga gattttgaga cacaacgtgg ctttcccccc ccccccatta ttgaagcatt 4740
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 4800
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 4860
atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 4909
<210>8
<211>35935
<212>DNA
<213>腺病毒血清型6
<400>8
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg 480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc 540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga 600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc 660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc 720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt 780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca 840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa 900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga 960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg 1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg 1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga 1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa 1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag 1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga 1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt 1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt 1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag 1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga 1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt 1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg 1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat 1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg 1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg 1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac 1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct 1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg 2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac 2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag 2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga 2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga 2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg 2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc 2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc 2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt 2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga 2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg 2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg 2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg 2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta 2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct 2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg 2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct 3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat 3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc 3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata 3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc 3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc 3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc 3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc 3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt 3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg 3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg 3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc 3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc 3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg 3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg 3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg 3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt 3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca 4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt 4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt 4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat 4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg 4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt 4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt 4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt 4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag 4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact 4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg 4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt 4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg 4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg 4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg 4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc 4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc 4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt 5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag 5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa 5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat 5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag 5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac 5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct 5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc 5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga 5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca 5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc 5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag 5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg 5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat 5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg 6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc 6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac 6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc 6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag 6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc 6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac 6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag 6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc 6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc 6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc 6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga 6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt 6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg 6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg 6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc 6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac 7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc 7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta 7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg 7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag 7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt 7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc 7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt 7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta 7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt 7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt 7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa 7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg 7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag 7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc 7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg 7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg 8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc 8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg 8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc 8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac 8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac 8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg 8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata 8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg 8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc 8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg 8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg 8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag 8760
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg 8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc 8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg 8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc 9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc 9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag 9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc 9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc 9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga 9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct 9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg 9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc 9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc 9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc 9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg 9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag 9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg 9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg 9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg 9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct 9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg 10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc 10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc 10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg 10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc 10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa 10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc 10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg 10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg 10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg 10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg 10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt 10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc 10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg 10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa 10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc 10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc 10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc 11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag 11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg 11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg 11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag 11280
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac 11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca 11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag 11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta 11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac 11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt 11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata 11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc 11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc 11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag 11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc 11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt 12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac 12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag 12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg 12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc 12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg 12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc 12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca 12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct 12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg 12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct 12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg 12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg 12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc 12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga 12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag 12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc 12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt 13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag 13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt 13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg 13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa 13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc 13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca 13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg 13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg 13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca 13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc 13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag 13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta 13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc 13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga 13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag 13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg 13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg 14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata 14100
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg 14160
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc 14220
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc 14280
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc 14340
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct 14400
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag 14460
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga 14520
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa 14580
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa 14640
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga 14700
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct 14760
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt 14820
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt 14880
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg 14940
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa 15000
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca 15060
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa 15120
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga 15180
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc 15240
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct 15300
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca 15360
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg 15420
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc 15480
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt 15540
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 15600
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa 15660
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc 15720
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 15780
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc 15840
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag 15900
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg 15960
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa 16020
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc 16080
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt 16140
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg 16200
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc 16260
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt 16320
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc 16380
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg 16440
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc 16500
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat 16560
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga 16620
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga 16680
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg 16740
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg 16800
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct 16860
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat 16920
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca 16980
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg 17040
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt 17100
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca 17160
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac 17220
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt 17280
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca 17340
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta 17400
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc 17460
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac 17520
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg 17580
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag 17640
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg 17700
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg 17760
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat 17820
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc 17880
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg 17940
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta 18000
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg 18060
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc 18120
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga 18180
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg 18240
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc 18300
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg 18360
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa 18420
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc 18480
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa 18540
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg 18600
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat 18660
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg 18720
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc 18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa 18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc 18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag 18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg 19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta 19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta 19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc 19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac 19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca 19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac 19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt 19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc 19500
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc 19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag 19620
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt 19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat 19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat 19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa 19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga 19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag 19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat 20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt 20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga 20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat 20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta 20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac 20340
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct 20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa 20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat 20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac 20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga 20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt 20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga 20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc 20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt 20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac 20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa 21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc 21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa 21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg 21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc 21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct 21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca 21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac 21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat 21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc 21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt 21600
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta 21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca 21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt 21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac 21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg 21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct 21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc 22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg 22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg 22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc 22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc 22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact 22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc 22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc 22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg 22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg 22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat 22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg 22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag 22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc 22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc 22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc 22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg 22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag 23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc 23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt 23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc 23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg 23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc 23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact 23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc 23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg 23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc 23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg 23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct 23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa 23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc 23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg 23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg 23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg 24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc 24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc 24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca 24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc 24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc 24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc 24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct 24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc 24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc 24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa 24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg 25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc 25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac 25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa 25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag 25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg 25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg 25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt 25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc 25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt 25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac 25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc 25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 25980
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt 26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct 26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt 26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca 26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact 26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa 26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg 26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg 26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg 26700
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca 26760
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg 26820
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg 26880
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag 26940
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc 27000
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat 27060
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac 27120
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca 27180
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag 27240
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc 27300
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca 27360
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa 27420
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta 27480
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta 27540
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct 27600
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca 27660
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca 27720
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg 27780
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg 27840
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg 27900
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat 27960
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc 28020
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg 28080
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt 28140
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat 28200
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct 28260
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt 28320
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc 28380
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa 28440
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag 28500
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag 28560
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg 28620
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg 28680
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt 28740
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg 28800
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact 28860
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc 28920
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt 28980
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac 29040
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac 29100
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta 29160
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt 29220
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt 29280
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat 29340
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt 29400
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca 29460
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct 29520
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat 29580
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg 29640
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg 29700
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct 29760
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg 29820
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc 29880
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca 29940
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc 30000
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat 30060
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc 30120
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag 30180
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat 30240
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa 30300
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca 30360
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac 30420
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg 30480
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc 30540
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt 30600
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct 30660
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca 30720
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg 30780
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat 30840
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta 30900
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca 30960
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc 31020
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc 31080
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt 31140
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa 31200
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac 31260
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc 31320
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact 31380
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc 31440
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca 31500
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt 31560
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa 31620
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta 31680
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact 31740
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt 31800
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt 31860
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata 31920
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca 31980
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct 32040
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac 32100
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg 32160
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac 32220
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta 32280
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt 32340
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa 32400
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg 32460
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac 32520
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa 32580
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc 32640
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca 32700
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac 32760
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat 32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca 32880
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc 32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat 33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc 33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct 33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg 33180
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg 33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 33660
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca 33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg 33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 33960
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga 34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt 34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct 34140
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc 34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg 34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag 34320
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca 34380
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc 34440
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc 34500
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt 34560
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta 34620
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc 34680
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa 34740
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca 34800
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct 34860
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag 34920
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa 34980
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg 35040
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg 35100
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc 35160
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac 35220
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg 35280
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag 35340
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc 35400
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc 35460
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag 35520
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg 35580
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg 35640
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac 35700
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt 35760
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact 35820
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc 35880
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg 35935
<210>9
<211>35935
<212>DNA
<213>腺病毒血清型5
<400>9
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg 480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc 540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga 600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc 660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc 720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt 780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca 840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa 900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga 960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg 1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg 1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga 1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa 1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag 1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga 1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt 1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt 1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag 1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga 1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt 1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg 1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat 1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg 1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg 1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac 1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct 1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg 2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac 2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag 2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga 2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga 2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg 2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc 2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc 2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt 2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga 2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg 2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg 2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg 2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta 2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct 2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg 2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct 3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat 3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc 3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata 3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc 3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc 3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc 3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc 3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt 3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg 3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg 3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc 3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc 3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg 3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg 3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg 3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt 3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca 4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt 4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt 4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat 4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg 4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt 4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt 4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt 4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag 4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact 4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg 4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt 4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg 4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg 4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg 4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc 4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc 4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt 5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag 5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa 5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat 5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag 5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac 5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct 5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc 5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga 5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca 5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc 5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag 5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg 5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat 5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg 6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc 6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac 6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc 6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag 6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc 6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac 6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag 6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc 6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc 6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc 6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga 6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt 6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg 6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg 6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc 6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac 7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc 7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta 7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg 7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag 7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt 7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc 7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt 7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta 7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt 7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt 7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa 7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg 7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag 7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc 7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg 7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg 8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc 8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg 8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc 8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac 8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac 8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg 8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata 8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg 8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc 8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg 8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg 8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag 8760
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg 8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc 8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg 8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc 9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc 9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag 9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc 9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc 9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga 9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct 9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg 9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc 9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc 9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc 9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg 9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag 9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg 9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg 9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg 9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct 9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg 10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc 10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc 10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg 10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc 10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa 10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc 10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg 10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg 10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg 10560
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg 10620
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt 10680
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc 10740
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg 10800
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa 10860
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc 10920
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc 10980
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc 11040
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag 11100
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg 11160
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg 11220
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag 11280
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac 11340
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca 11400
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag 11460
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta 11520
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac 11580
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt 11640
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata 11700
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc 11760
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc 11820
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag 11880
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc 11940
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt 12000
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac 12060
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag 12120
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg 12180
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc 12240
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg 12300
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc 12360
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca 12420
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct 12480
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg 12540
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct 12600
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg 12660
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg 12720
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc 12780
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga 12840
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag 12900
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc 12960
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt 13020
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag 13080
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt 13140
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg 13200
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa 13260
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc 13320
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca 13380
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg 13440
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg 13500
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca 13560
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc 13620
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag 13680
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta 13740
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc 13800
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga 13860
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag 13920
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg 13980
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg 14040
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata 14100
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg 14160
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc 14220
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc 14280
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc 14340
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct 14400
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag 14460
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga 14520
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa 14580
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa 14640
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga 14700
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct 14760
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt 14820
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt 14880
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg 14940
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa 15000
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca 15060
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa 15120
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga 15180
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc 15240
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct 15300
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca 15360
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg 15420
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc 15480
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt 15540
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 15600
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa 15660
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc 15720
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 15780
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc 15840
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag 15900
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg 15960
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa 16020
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc 16080
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt 16140
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg 16200
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc 16260
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt 16320
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc 16380
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg 16440
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc 16500
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat 16560
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga 16620
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga 16680
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg 16740
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg 16800
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct 16860
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat 16920
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca 16980
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg 17040
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt 17100
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca 17160
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac 17220
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt 17280
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca 17340
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta 17400
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc 17460
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac 17520
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg 17580
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag 17640
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg 17700
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg 17760
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat 17820
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc 17880
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg 17940
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta 18000
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg 18060
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc 18120
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga 18180
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg 18240
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc 18300
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg 18360
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa 18420
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc 18480
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa 18540
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg 18600
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat 18660
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg 18720
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc 18780
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa 18840
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc 18900
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag 18960
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg 19020
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta 19080
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta 19140
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc 19200
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac 19260
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca 19320
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac 19380
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt 19440
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc 19500
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc 19560
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag 19620
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt 19680
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat 19740
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat 19800
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa 19860
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga 19920
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag 19980
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat 20040
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt 20100
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga 20160
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat 20220
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta 20280
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac 20340
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct 20400
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa 20460
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat 20520
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac 20580
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga 20640
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt 20700
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga 20760
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc 20820
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt 20880
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac 20940
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa 21000
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc 21060
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa 21120
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg 21180
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc 21240
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct 21300
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca 21360
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac 21420
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat 21480
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc 21540
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt 21600
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta 21660
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca 21720
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt 21780
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac 21840
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg 21900
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct 21960
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc 22020
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg 22080
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg 22140
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc 22200
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc 22260
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact 22320
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc 22380
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc 22440
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg 22500
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg 22560
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat 22620
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg 22680
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag 22740
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc 22800
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc 22860
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc 22920
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg 22980
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag 23040
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc 23100
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt 23160
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc 23220
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg 23280
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc 23340
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact 23400
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc 23460
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg 23520
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc 23580
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg 23640
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct 23700
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa 23760
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc 23820
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg 23880
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg 23940
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg 24000
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc 24060
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc 24120
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag 24180
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca 24240
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc 24300
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag 24360
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc 24420
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc 24480
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta 24540
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc 24600
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct 24660
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc 24720
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct 24780
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc 24840
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc 24900
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa 24960
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg 25020
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc 25080
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag 25140
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac 25200
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa 25260
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt 25320
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag 25380
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg 25440
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg 25500
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt 25560
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc 25620
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt 25680
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac 25740
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc 25800
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg 25860
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct 25920
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac 25980
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt 26040
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg 26100
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc 26160
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct 26220
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga 26280
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt 26340
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca 26400
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact 26460
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa 26520
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg 26580
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg 26640
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg 26700
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca 26760
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg 26820
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg 26880
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag 26940
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc 27000
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat 27060
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac 27120
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca 27180
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag 27240
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc 27300
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca 27360
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa 27420
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta 27480
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta 27540
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct 27600
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca 27660
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca 27720
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg 27780
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg 27840
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg 27900
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat 27960
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc 28020
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg 28080
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt 28140
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat 28200
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct 28260
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt 28320
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc 28380
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa 28440
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag 28500
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag 28560
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg 28620
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg 28680
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt 28740
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg 28800
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact 28860
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc 28920
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt 28980
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac 29040
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac 29100
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta 29160
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt 29220
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt 29280
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat 29340
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt 29400
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca 29460
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct 29520
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat 29580
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg 29640
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg 29700
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct 29760
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg 29820
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc 29880
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca 29940
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc 30000
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat 30060
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc 30120
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag 30180
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat 30240
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa 30300
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca 30360
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac 30420
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg 30480
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc 30540
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt 30600
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct 30660
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca 30720
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg 30780
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat 30840
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta 30900
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca 30960
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc 31020
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc 31080
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt 31140
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa 31200
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac 31260
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc 31320
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact 31380
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc 31440
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca 31500
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt 31560
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa 31620
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta 31680
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact 31740
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt 31800
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt 31860
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata 31920
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca 31980
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct 32040
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac 32100
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg 32160
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac 32220
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta 32280
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt 32340
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa 32400
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg 32460
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac 32520
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa 32580
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc 32640
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca 32700
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac 32760
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat 32820
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca 32880
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc 32940
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat 33000
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc 33060
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct 33120
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg 33180
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 33240
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 33300
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg 33360
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 33420
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 33480
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 33540
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 33600
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 33660
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca 33720
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 33780
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg 33840
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 33900
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 33960
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga 34020
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt 34080
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct 34140
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc 34200
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg 34260
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag 34320
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca 34380
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc 34440
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc 34500
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt 34560
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta 34620
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc 34680
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa 34740
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca 34800
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct 34860
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag 34920
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa 34980
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg 35040
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg 35100
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc 35160
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac 35220
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg 35280
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag 35340
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc 35400
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc 35460
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag 35520
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg 35580
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg 35640
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac 35700
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt 35760
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact 35820
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc 35880
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg 35935
<210>10
<211>5965
<212>DNA
<213>人工序列
<220>
<223>NSsuboptmut
<400>10
gccaccatgg cccccatcac cgcctacagc cagcagacca ggggcctgct gggctgcatc 60
atcaccagcc tgaccggacg cgacaagaac caggtggagg gagaggtgca ggtggtgagc 120
accgctaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac 180
ggagccggaa gcaagaccct ggccggaccc aagggcccta tcacccagat gtacaccaat 240
gtggatcagg atctggtggg ctggcaggcc cctcccggag ccaggagcct gacaccctgt 300
acctgtggaa gcagcgacct gtacctggtg acacgccacg ccgatgtgat ccccgtgagg 360
cgcaggggcg attctcgcgg aagcctgctg agccctaggc ccgtgagcta cctgaagggc 420
agcagcggag gacccctgct gtgtccttct ggccatgccg tgggcatttt tcgcgctgcc 480
gtgtgtacca ggggcgtggc caaagccgtg gattttgtgc ccgtggaaag catggagacc 540
accatgcgca gccctgtgtt caccgacaac agctctcccc ctgccgtgcc ccaatcattc 600
caggtggctc acctgcacgc ccctaccgga tctggcaaga gcaccaaggt gcccgctgcc 660
tacgccgctc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc taccctgggc 720
ttcggcgctt acatgagcaa ggcccatggc atcgacccca acatccgcac aggcgtgcgc 780
accatcacca ccggagctcc cgtgacctac agcacctacg gcaagttcct ggccgatgga 840
ggctgcagcg gaggagccta cgacatcatc atctgcgacg agtgccacag caccgacagc 900
accaccatcc tgggcattgg caccgtgctg gatcaggccg aaacagctgg agccaggctg 960
gtggtgctgg ccacagctac ccctcctggc agcgtgaccg tgccccatcc caatatcgag 1020
gaggtggccc tgagcaacac aggcgagatc cccttctacg gcaaggccat ccccatcgag 1080
gccatccgcg gaggcaggca cctgatcttc tgccacagca agaagaagtg cgacgagctg 1140
gctgccaagc tgagcggact gggcatcaac gccgtggcct actacagggg cctggacgtg 1200
tcagtgatcc ccaccatcgg cgatgtggtg gtggtggcca ccgacgccct gatgacaggc 1260
tacaccggag acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac 1320
ttcagcctgg accccacctt caccatcgaa accaccaccg tgcctcagga tgctgtgagc 1380
aggagccaga ggcgcggacg caccggaagg ggcaggcgcg gaatttatcg ctttgtgacc 1440
cctggcgaaa ggccctctgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgct 1500
ggctgcgctt ggtacgagct gacacccgct gaaaccagcg tgcgcctgcg cgcttatctg 1560
aatacccctg gcctgcccgt gtgtcaggac cacctggagt tctgggagag cgtgttcaca 1620
ggactgaccc acatcgacgc ccatttcctg agccagacca agcaggctgg cgacaacttc 1680
ccctatctgg tggcctatca ggccaccgtg tgtgctaggg cccaagctcc acctccttca 1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccctacccct 1800
ctgctgtacc gcctgggagc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag 1860
tacatcatgg cctgcatgag cgctgatctg gaagtggtga ccagcacctg ggtgctggtg 1920
ggaggcgtgc tggccgctct ggctgcctac tgcctgacca ccggaagcgt ggtgatcgtg 1980
ggacgcatca tcctgagcgg aaggcccgct atcgtgcccg atcgcgagtt cctgtaccag 2040
gagttcgacg agatggagga gtgtgccagc cacctgccct acatcgagca gggcatgcag 2100
ctggccgaac agttcaagca gaaggccctg ggcctgctgc agacagccac caaacaggcc 2160
gaagctgccg ctcccgtggt ggaaagcaag tggagggccc tggagacctt ctgggctaag 2220
cacatgtgga acttcatctc tggcatccag tacctggccg gactgagcac cctgcctggc 2280
aaccccgcta tcgccagcct gatggccttc accgctagca tcacctctcc cctgaccacc 2340
cagagcaccc tgctgttcaa cattctgggc ggatgggtgg ccgctcagct ggcccctcct 2400
tcagctgctt ctgcctttgt gggcgctggc attgccggag ccgctgtggg cagcattggc 2460
ctgggcaaag tgctggtgga tattctggct ggctatggcg ctggcgtggc cggagccctg 2520
gtggccttca aggtgatgag cggagagatg cccagcaccg aggacctggt gaacctgctg 2580
cctgccattc tgagccctgg agccctggtg gtgggcgtgg tgtgtgctgc cattctgagg 2640
cgccatgtgg gacccggaga gggcgctgtg cagtggatga accgcctgat cgccttcgcc 2700
tctcgcggaa accacgtgag ccctacccac tacgtgcctg agagcgacgc cgctgccagg 2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg 2820
atcaacgagg actgcagcac accctgcagc ggaagctggc tgagggacgt gtgggactgg 2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccaactg 2940
cctggcgtgc ccttcttctc atgccagcgc ggatacaagg gcgtgtggag gggcgatggc 3000
atcatgcaga ccacctgtcc ctgcggagcc cagatcacag gccacgtgaa gaacggcagc 3060
atgcgcatcg tgggccctaa gacctgcagc aacacctggc acggcacctt ccccatcaac 3120
gcctacacca ccggaccctg cacacccagc cctgctccca actacagcag ggccctgtgg 3180
agggtggctg ccgaggagta cgtggaggtg accagggtgg gagacttcca ctacgtgacc 3240
ggaatgacca ccgacaacgt gaagtgtccc tgtcaggtgc ccgctcccga attttttacc 3300
gaagtggatg gcgtgcgcct gcatcgctat gcccctgcct gtaggcccct gctgcgcgaa 3360
gaagtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag 3420
cctgagcccg atgtggccgt gctgaccagc atgctgaccg accccagcca catcacagcc 3480
gaaaccgcta aaaggcgcct ggccaggggc tctcctccaa gcctggcctc aagcagcgct 3540
agccagctgt ctgctcccag cctgaaggcc acctgcacca cccaccacgt gagccccgac 3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc 3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag 3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct 3780
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac 3840
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct 3900
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct 3960
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga 4020
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag 4080
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc 4140
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac 4200
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac 4260
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct 4320
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac 4380
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc 4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc 4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag 4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg 4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgctc gcctgatcgt gttccccgat 4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgcctcag 4740
gtggtgatgg gctcaagcta cggcttccag tacagccctg gccagcgcgt ggagttcctg 4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac acgctgcttc 4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac 4920
ctggcccctg aggccaggca ggccatcaag agcctgaccg agcgcctgta catcggaggc 4980
cctctgacca acagcaaggg acagaactgc ggatacaggc gctgtagggc ctctggcgtg 5040
ctgaccacca gctgtggcaa caccctgacc tgctacctga aggccagcgc tgcctgtcgc 5100
gctgccaagc tgcaggactg caccatgctg gtgaacgccg ctggcctggt ggtgatttgt 5160
gaaagcgctg gcacccagga agatgctgcc agcctgcgcg tgttcaccga ggccatgacc 5220
aggtactctg cccctcccgg agacccccct cagcccgaat acgacctgga gctgatcacc 5280
agctgctcaa gcaacgtgag cgtggctcac gacgccagcg gaaagcgcgt gtactacctg 5340
acacgcgatc ccaccacccc tctggctcgc gctgcctggg aaaccgctcg ccatacaccc 5400
gtgaacagct ggctgggcaa catcatcatg tacgccccta ccctgtgggc tcgcatgatc 5460
ctgatgaccc acttcttcag catcctgctg gctcaggagc agctggagaa ggccctggac 5520
tgccagattt acggcgcttg ctacagcatc gagcccctgg acctgcccca aatcatcgag 5580
cgcctgcacg gcctgtctgc cttcagcctg cacagctaca gccctggcga aattaatcgc 5640
gtggccagct gtctgcgcaa actgggcgtg cctcctctgc gcgtgtggag gcatagggct 5700
aggagcgtga gggctaggct gctgagccag ggaggcaggg ccgctacctg tggaaagtac 5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ctatccctgc cgctagccag 5820
ctggacctga gcggatggtt cgtggctggc tacagcggag gcgacatcta ccacagcctg 5880
tctcgcgctc gccctcgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc 5940
atctacctgc tgcccaaccg ctaaa 5965
<210>11
<211>5965
<212>DNA
<213>人工序列
<220>
<223>嵌合NSsuboptmut
<400>11
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc 60
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc 120
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac 180
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac 240
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc 300
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc 360
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc 420
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc 480
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc 540
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc 600
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc 660
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc 720
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc 780
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc 840
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc 900
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg 960
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag 1020
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag 1080
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg 1140
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg 1200
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc 1260
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac 1320
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc 1380
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc 1440
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc 1500
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg 1560
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc 1620
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc 1680
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc 1740
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc 1800
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag 1860
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg 1920
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg 1980
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag 2040
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag 2100
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc 2160
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag 2220
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc 2280
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc 2340
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc 2400
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc 2460
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg 2520
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg 2580
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc 2640
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc 2700
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc 2760
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg 2820
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg 2880
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg 2940
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc 3000
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc 3060
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac 3120
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg 3180
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc 3240
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc 3300
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag 3360
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag 3420
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc 3480
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc 3540
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac 3600
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc 3660
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag 3720
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct 3780
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac 3840
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct 3900
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct 3960
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga 4020
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag 4080
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc 4140
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac 4200
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac 4260
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct 4320
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac 4380
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc 4440
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc 4500
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag 4560
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg 4620
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac 4680
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag 4740
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg 4800
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc 4860
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac 4920
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc 4980
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg 5040
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc 5100
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc 5160
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc 5220
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc 5280
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg 5340
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc 5400
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc 5460
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac 5520
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag 5580
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc 5640
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc 5700
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac 5760
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag 5820
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg 5880
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc 5940
atctacctgc tgcccaaccg ctaaa 5965
<210>12
<211>10
<212>RNA
<213>人工序列
<220>
<223>核糖体结合位点
<400>12
gccaccaugg 10
<210>13
<211>49
<212>RNA
<213>人工序列
<220>
<223>合成的聚腺苷酸化信号
<400>13
aauaaaagau cuuuauuuuc auuagaucug uguguugguu uuuugugug 49
<210>14
<211>28
<212>DNA
<213>人工序列
<220>
<223>pVIJns-NS中存在的其它核苷酸
<400>14
tctagagcgt ttaaaccctt aattaagg 28
<210>15
<211>15
<212>DNA
<213>人工序列
<220>
<223>Additional nucleotides present in pV1Jns-NSOPTmut
<400>15
tttaaatgtt taaac 15
<210>16
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>16
tcgaatcgat acgcgaacct acgc 24
<210>17
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>17
tcgacgtgtc gacttcgaag cgcacaccaa aaacgtc 37