CN1578789A

CN1578789A - 新的丙型肝炎病毒基因型及其作为预防剂、治疗剂和诊断剂的用途

Info

Publication number: CN1578789A
Application number: CNA028217519A
Authority: CN
Inventors: E·萨布隆; L·－J·范多恩; W·昆特
Original assignee: Innogenetics NV SA
Current assignee: Fujirebio Europe NV SA
Priority date: 2001-08-31
Filing date: 2002-08-30
Publication date: 2005-02-09
Also published as: CA2457865A1; AU2002333773A1; US7196183B2; WO2003020970A2; US20030152591A1; WO2003020970A3; EP1427752A2

Abstract

本发明涉及相当于新型HCV的非编码区和编码区的基因组核苷酸序列和氨基酸序列。本发明涉及不同于已知HCV类型和亚型序列的新的HCV类型和亚型序列。具体地讲，本发明涉及所述新的HCV类型序列；用于制备所述序列的方法，及其在诊断、预防和治疗上的用途。更具体地讲，本发明提供了新的HCV类型的5′NCR，核心，E1和NS5区的新的类型特异性序列。所述新的HCV序列可用于诊断生物学样品中HCV类型基因型或血清型的存在。另外，所述新的类型特异性序列的可利用性，能够提高HCV检测的总体灵敏度，并且还被证实可用于预防和治疗目的。

Description

新的丙型肝炎病毒基因型及其作为预防剂、治疗剂和诊断剂的用途

本发明领域

本发明涉及新的丙型肝炎病毒(HCV)基因型的序列及其作为预防剂、治疗剂和诊断剂的用途。更具体地讲，本发明涉及相当于所述新的HCV-型基因组的非编码区和编码区的基因组核苷酸序列和氨基酸序列。

更具体地讲，本发明提供了来自迄今为止尚属未知的HCV类型和/或亚型的新的HCV序列。具体地讲，本发明提供了所述新的HCV类型的5’非编码区(NCR)，核心，E1和NS5区的新的类型特异性序列。所述新的HCV序列可用于诊断HCV基因型或血清型在生物学样品中的存在。另外，所述新的类型特异性序列的可利用性，能够提高HCV检测的总体灵敏度，并且还被证实可用于预防和治疗目的。因此，本发明涉及新的HCV序列，制备所述序列的方法，及其在诊断、预防和治疗上的用途。

本发明背景

业已发现，丙型肝炎病毒(HCV)是非甲、非乙肝炎的主要致病原因。业已测定了包括若干原型分离物的完整基因组的cDNA克隆的序列，并且包括HCV基因型1a(例如，GenBank编号AF009606)，1b(例如，GenBank编号AB016785)，1c(例如，GenBank编号D14853)，2a(例如，GenBank编号AB047639)，2b(例如，GenBank编号AB030907)，2c(例如，GenBank编号D50409)2k(例如，GenBank编号AB031663)，3a(例如，GenBank编号AF046866)，3b(例如，GenBank编号D49374)，4a(例如，GenBank编号Y11604)，5a(例如，GenBank编号AF064490)，6a(例如，GenBank编号Y12083)，6b(例如，GenBank编号D84262)，7b(例如，GenBank编号D84263)，8b(例如，GenBank编号D84264)，9a(例如，GenBank编号D84265)，10a(例如，GenBank编号D63821)和11a(例如，GenBank编号D63822)的完整的原型基因组。曾经鉴定的第一个完整的HCV基因组，后来被确定为HCV基因型1a(HCV-1；Choo等，1991)，1b(HCV-J；Kato等，1990)，2a(HC-J6；Okamoto等，1991)和2b(HC-J8；Okamoto等，1992)。比较这些分离物发现，核苷酸序列的变异性可用于区别至少两种不同的基因型，1型(HCV-1和HCV-J)和2型(HC-J6和HC-J8)，平均同源性大约为68％。在每一种类型中，存在至少两种亚型(例如，1型用1a HCV-1和1b型HCV-J表示)，平均同源性为大约79％。HCV基因组属于相同的亚型，具有超过90％的平均同源性(Okamoto等，1992)。不过，HCV-T分离物的NS5区的部分核苷酸序列表现出与以前公开的序列具有最多67％的同源性，表明了存在另一种HCV类型(Mori等，1992)。业已公开了这种3型的5’非翻译区(UR，UTR或非编码区，NCR)，核心，NS3，和NS5区的一部分，另外，建立了三种主要基因型及其亚型之间的类似的进化距离(Chan等，1992)。随后发现了4型(Stuyver等，1993b；Simmonds等，1993a；Bukh等，1993；Stuyver等，1994a)，接下来是5型(Stuyver等，1993b；Simmonds等，1993c；Bukh等，1993；Stuyver等，1994b)和6型HCV类型(Bukh等，1993；Simmonds等，1993c)。在表3中提供了在过去使用的以及在(部分)现行命名系统中使用的HCV基因型分类系统的概述。由本申请的发明人所提出的命名系统(在表示主要类型的阿拉伯数字后面，接着用小写罗马字母表示每一种亚型)目前已在世界范围内被科学家所接受(Simmonds等，1994)。目前有11种HCV基因型是已知的，可将它们划分成6个进化枝。因此，HCV基因型1，2，4，和5被分别确定为进化枝1，2，4和5，HCV基因型3和10属于进化枝3；而HCV基因型6，7，8，9和11是进化枝6的成员(Robertson等，1998；还可参见本发明的图3)，现有的分类系统是基于将要进一步说明的3倍等级系统。大体上讲，该分类系统是根据序列之间的百分同源性区分以下类型：

-属于不同类型的HCV分离物；

-属于相同类型，但属于不同亚型的HCV分离物；

-属于相同亚型的HCV分离物(Maertens和Stuyver 1997)。

HCV基因型1-11的核酸和氨基酸序列不仅披露于公开的数据库中，而且还披露于以下文献中：例如，国际专利公开号WO94/12670，WO94/25601和WO96/13590。

本发明概述

在一方面，本发明涉及一种进化枝(clade)6 HCV基因型，它所包括的HCV多核酸不同于进化枝6 HCV基因型6-9和11的HCV多核酸。

另一方面，更具体地讲，本发明涉及本发明HCV基因型所特有的分离的多核酸，或本发明的HCV基因型所特有的多核酸的片段，或所述多核酸或所述片段的互补体。所述分离的多核酸包括5’UTR，核心，E1和NS5B多核酸，例如，由SEQ ID NOs：1，2，4，6，8，10，12，14，36-47或49中任意一种所定义的多核酸，以及它们的同源物。本发明的其他多核酸包括编码核心，E1和NS5B蛋白，如由SEQ ID NOs：3，5，7，9，11，13，15，50-61，或63中任意一种所定义的蛋白的核酸，以及它们的同源物。

本发明还涉及由来自本发明的HCV多核酸并且为它所特有的至少8个连续核苷酸组成或包括其的寡核苷酸。例如，所述寡核苷酸可以用作可以特异性地扩增本发明的HCV多核酸的引物，用作可以与本发明的HCV多核酸特异性地杂交的探针，用作能够特异性地检测本发明的HCV多核酸的寡核苷酸，或用作能够确定本发明HCV多核酸的基因型的寡核苷酸。

在本发明的另一方面，披露了包括本发明HCV多核酸的重组载体。所述载体可以是表达载体。还涉及包括本发明的多核酸或用本发明的重组载体转化过的宿主细胞。

本发明的另一方面涉及本发明HCV基因型所特有的分离的多肽，或本发明的HCV基因型所特有的多肽的片段。所述多肽包括由SEQ IDNOs：3，5，7，9，11，13，15，50-61或63中任意一项所定义的多肽，以及它们的同源物。所包括的其他多肽是如SEQ ID NOs：1，2，4，6，8，10，12，14，36-47或49的序列所编码的多肽，以及它们的同源物。本发明还包括用于生产所述多肽以及所述多肽的抗体的方法。

包括本发明核酸，多肽或抗体的药物组合物构成了本发明的另一个方面。所述组合物可用于预防或治疗HCV感染的方法中。

本发明的其他方面包括用于检测HCV病毒在生物学样品中的存在，确定HCV病毒基因型在生物学样品中的存在，确定HCV抗原或HCV抗体在生物学样品中的存在，或HCV的类型分析的方法和诊断试剂盒。所述方法和试剂盒一般取决于用于检测本发明核酸的扩增、杂交或测序反应，或取决于用于检测本发明多肽、抗原或抗体的免疫学反应。

附图说明

图1A表示SEQ ID NO：1。SEQ ID NO：1是从血清样品IG57272中获得的HCV分离物的5′NCR-区的核苷酸序列(299个核苷酸)。本发明的新的HCV类型所特有的核苷酸序列用黑色阴影框表示。正的核苷酸编号，表示与Kato等(1990)所采用的核苷酸编号一致，即所述HCV多蛋白的ATG起始密码子的腺嘌呤的核苷酸编号是330。所示出的负的核苷酸编号与国际上认可的HCV核苷酸编号方法一致。在这里，所述HCV多蛋白的ATG/AUG起始密码子的腺嘌呤的核苷酸编号为+1，而紧邻所述ATG/AUG起始密码子的腺嘌呤、并且位于其上游的核苷酸的核苷酸编号为-1。

图1B表示SEQ ID NOs：2，3和4。SEQ ID NO：2是从含有从血清样品IG57272中获得的HCV分离物的核心/E1-区的克隆28454的核苷酸序列(628个核苷酸)。SEQ ID NO：3是SEQ ID NO：2的翻译，克隆28454的氨基酸序列包括从血清样品IG57272中获得的HCV分离物的核心/E1-区(完整的核心和部分E1)(209个氨基酸)。SEQID NO：4是克隆28452的核苷酸序列，包括从血清样品IG57272中获得的HCV分离物的部分核心区(484个核苷酸)。

图1C表示SEQ ID NOs：5，6和7。SEQ ID NO：5是SEQ ID NO：4的翻译，克隆28452的氨基酸序列包括从血清样品IG57272中获得的HCV分离物的部分核心区(161个氨基酸)。SEQ ID NO：6是克隆28451的核苷酸序列，包括从血清样品IG57272中获得的HCV分离物的核心/E1-区(完整的核心和部分E1)(628个核苷酸)。SEQ ID NO：7是SEQ ID NO：6的翻译，克隆28451的氨基酸序列包括从血清样品IG57272中获得的HCV分离物的核心/E1-区(完整的核心和部分E1)(209个核苷酸)。

图1D表示SEQ ID NOs：8和9。SEQ ID NO：8是从血清样品IG57272中获得的HCV分离物的NS5B-区的核苷酸序列(324个核苷酸)。SEQ ID NO：9是SEQ ID NO：8的翻译，它是从血清样品IG57272中获得的HCV分离物的NS5B-区的氨基酸序列(107个氨基酸)。所示出的SEQ ID NO：8的核苷酸编号与Kato等(199O)所使用的核苷酸编号一致，即所述HCV多蛋白的ATG起始密码子的腺嘌呤的核苷酸编号为330。所示出的SEQ ID NO：9的氨基酸编号与Kato等(1990)所使用的氨基酸编号一致，即相当于起始密码子ATG的甲硫氨酸(其中，腺嘌呤的核苷酸编号为330)是所述HCV多蛋白的1号氨基酸。

图2A和2B表示SEQ ID NOs：11，13，15，3，7和5的比对，即核心/E1的氨基酸序列(SEQ ID NOs：11，13和15；均为373个氨基酸，和SEQ ID NOs：3和7；均为209个氨基酸，参见图1B和1C)，以及从血清样品IG57272中获得的HCV分离物的部分核心区的氨基酸序列(SEQ ID NO：5；161个氨基酸，参见图1C)。所示出的氨基酸编号与Kato等(1990)所采用的氨基酸编号一致，即相当于起始密码子ATG的甲硫氨酸(其中，腺嘌呤的核苷酸编号为330)是所述HCV多蛋白的1号氨基酸。191和192号氨基酸之间的竖线表示所述核心和E1蛋白之间的边界。跨17-209号氨基酸的“核心/E1区”(SEQ ID NOs：50，51和52)用圆括弧加以标注。V-核心区的氨基酸(SEQ ID NO：57)用一个‘*’标注，V1-区的氨基酸(SEQ ID NO：58)用一个′+′标注，V2-区的氨基酸(SEQ ID NO：59)用一个′#′表示，V3-区的氨基酸(SEQ ID NO：60)用一个′^′标注，V4-区的氨基酸(SEQ ID NO：61)用一个′@′标注，V5-区的氨基酸(SEQ IDNO：62)用一个′§′标注，而V6-区的氨基酸(SEQ ID NO：63)用一个′！′标注。

图3A和3B表示已知HCV基因型的NS5B核苷酸序列(例如“18-HCV2C”是HCV基因型2c分离物)和从血清样品IG57272中获得的HCV分离物的NS5B核苷酸序列(加下划线，并且用指向左侧的箭头标注)的系统树。注意，该系统树业已被分开，图3A的底部两个分支与图3B的上部两个分支是重复的。标明了统一不同HCV进化枝(进化枝1-6)的HCV基因型的系统树的主要分支。

图4A-4E表示SEQ ID NOs：10，12，14，2，4和6的比对，即核心/E1的核苷酸序列(SEQ ID NOs：10，12和14；均为1126个核苷酸)和从血清样品IG57272中获得的HCV分离物的核心区的核苷酸序列SEQ ID NO：2，4和6；还可参见图1B和1C)。业已从SEQ IDNOs：10，12和14中去掉了HCPr667和HCPr637引物序列(参见实施例2)。所标明的核苷酸编号与Kato等(1990)所采用的核苷酸编号一致，即所述HCV多蛋白的ATG起始密码子的腺嘌呤的核苷酸编号为330。在括号之间(图4A和4D)标明了由本发明的HCV基因组的378-957号核苷酸组成的核心/E1区(SEQ ID NOs：36，37和38)(核苷酸编号与Kato等(1990)一致)，该区域可用于HCV基因组的系统发育分析和系统发育分类。

本发明的详细说明

在导致本发明的研究中，采用LiPA系统INNO-LiPA HCV II(参见Stuyver等，1993b)确定存在于HCV-感染患者的血清中的HCV病毒的基因型。保留来自患者的一份样品(其中所包含的HCV类型，被称为IG57272分离物)作进一步的分析，因为它与INNO-LiPA HCV II条带具有异常反应性。不过，测序结果表明，发现了新的HCV基因型。在本发明的框架内，分析了以前尚未报导过的5′NCR，核心，核心/E1和NS5B区的核苷酸序列。在本发明中首次报导了这种新的HCV类型的基因组序列。

因此，本发明涉及HCV多核酸，特别涉及具有以前未鉴定过的HCV类型所特有的核苷酸序列的分离的HCV多核酸，并因此具有充分不同于已知HCV类型1，2，3，4，5，6，7，8，9，10，11和12或它们的任何亚型(包括HCV亚型1a，1b，1c，1d，1e，1f，1g，2a，2b，2c，2d，2e，2f，2g，2h，2i，2k，2l，3a，3b，3c，3d，3e，3f，3g，4a，4b，4c，4d，4e，4f，4g，4h，4i，4j，4k，4l，4m，5a，6a，6b，7a，7b，7c，7d，8a，8b，8c，8d，9a，9b，9c，10a和11a)的原型多核酸序列的核苷酸序列，以便可以对本发明的HCV多核酸进行分类，因此，包括所述多核酸的丙型肝炎病毒属于新的HCV基因型。可以将本发明的HCV多核苷酸以及包括所述多核酸的丙型肝炎病毒归类成一种新的HCV基因型。将本发明的HCV多核酸归类为新的HCV基因型的分类，是通过将一部分NS 5基因核苷酸序列，更具体地讲，NS 5B区的核苷酸序列，确定在本发明中分离的新的HCV类型，与诸如上文所列举的已知HCV类型或亚型的相应的NS 5B区序列进行比较而建立的。“NS5B区”表示HCV基因组跨8261-8600号核苷酸的部分，或者更具体地讲，表示8267-8590号核苷酸，其中，所述核苷酸编号与Kato等(1990)所采用的核苷酸编号一致，更具体地讲，在Kato等(1990)所采用的HCV基因组核苷酸编号中，以及在本发明中，编码HCV多蛋白的N-末端甲硫氨酸的ATG起始密码子的腺嘌呤残基“A”的核苷酸编号为330(参见Kato等，1990，图2)。本发明的新的HCV基因型的原型NS5B核苷酸序列如SEQ ID NO：8所示，而由它衍生的氨基酸序列用SEQ ID NO：9表示(图1D)。

在本发明中以及如Kato等(1990)所述，在核酸(HCV基因组)水平上，所述腺嘌呤残基被确定为330号位置，并且在氨基酸(HCV多蛋白)水平上，所述N-末端甲硫氨酸被确定为1号位置。术语“HCV多蛋白”表示包括通过HCV多蛋白前体的蛋白水解加工而产生的所有独立的HCV蛋白。按照从所述HCV蛋白的N-末端至C-末端的顺序列举，所述独立的HCV蛋白包括：核心，E1，E2，p7，NS2，NS3，NS4A，NS4B，NS5A和NS5B。在HCV-J分离物中(Kato等，1990)，位于330号位置上的腺嘌呤残基(Kato等，1990)是具有HCV-J和其他类型1b分离物的3010个氨基酸，和HCV-1和其他类型1a分离物的3010个氨基酸，以及2型分离物HC-J6和HC-J8的3033个氨基酸的长的HCV多蛋白的起始ATG密码子的第一个残基(Okamoto等，1992)。由于1a型分离物在NS5A区包括一个额外的氨基酸，1a型和1b型的编码序列在核心，E1，NS3，和NS4区具有相同的编号，但是，在NS5B区不同，如表1所示。与1型分离物相比，2型分离物在E2区具有四个额外的氨基酸，在NS5区具有17或18个额外的氨基酸，并且如表1所示，与1型分离物的NS3/4区和NS5b区的编号不同。在3a型序列中也可以看到与1型相比具有类似的插入(但是具有不同的插入大小)，这种插入会相应地影响3a型氨基酸的编号。在与已知HCV序列比对之后，可以方便地观察到出现在1，2，3，4，5，6，7，8，9，10和11型序列中的其他插入或缺失。披露了多种HCV基因型的基因型特异性基因组和多蛋白变异，包括HCV基因型1a，1b，1c，2a，2b，3a，3b，4a，5a，6a，6b，9a，10a和11a，参见Maertens和Stuyver(1997)的文章的第198页和表13.3。

术语“编码区”通常相当于编码一种蛋白的一部分核酸或多核酸，具体到HCV来说，所述编码区是HCV基因组的编码HCV多蛋白的区。完整的HCV基因组包括HCV多蛋白编码区，以及5’非翻译区和3’非翻译区。

具体地讲，本发明的新的HCV基因型与已知的HCV基因型6，7，8，9和11在系统发育上是不同的，并且具有明显差别，但是在系统发育上聚类，即关系最密切(图3)。因此，本发明的HCV基因型属于Robertson等(1998)所确定的HCV进化枝6。从例4和图3可以看出，本发明的HCV基因型与已知的HCV进化枝6的HCV基因型在系统发育上具有足够的差别，因此将它归类为新的基因型。

本发明的其他分离的HCV多核酸包括所述新的原型HCV基因组的其他部分。所述部分包括涵盖5’非翻译区(5′UTR，5′NCR，5′UR或5′NR)的全部或部分的核酸序列，如SEQ ID NO：1所表示的序列或它的部分(参见图1A)；以及核心和/或核心/E1和/或E1区的全部或部分，如由SEQ ID Nos：2，4，6，10，12，14，和36-49所表示的序列或它们的部分。在本发明的说明书中提供了所述新的HCV类型的原型序列，使得本领域技术人员能够通过采用常见技术，如Sambrook等，1989所披露的技术克隆完整的新的原型HCV基因组。更具体地讲，可以将诸如基因步移或分离重叠cDNA克隆的公知技术，用于获得本发明的完整长度的新型HCV基因组序列。

因此，在一方面，本发明包括一种具有不同于进化枝6HCV基因型6-9和11的基因型的进化枝6HCV病毒的分离的HCV多核酸，所述多核酸的特征在于，它包括选自下列任意一种的核酸序列：

-由SEQ ID NOs：1，2，4，6，8，10，12，14，36-47或49中任意一种所定义的核酸序列；

-包括相对HCV多蛋白编码序列的起始密码子而言，位于-159号位置上的腺嘌呤核苷酸的5’UTR核酸序列；

-与SEQ ID NOs：39-41中任意一种的同一性至少为85％的核心核酸序列；

-与SEQ ID NO：42的同一性至少为71％的E1核酸序列；

-与SEQ ID NOs：10，12，14中任意一种的同一性至少为78％的核心/E1核酸序列；

-与SEQ ID NOs：36-38中任意一种的同一性至少为84％的核心/E1核酸序列；

-与SEQ ID NO：8的同一性至少为75％的NS5B核酸序列；

-编码由SEQ ID NOs：3，5，7，9，11，13，15，50-61，或63中任意一种所定义的HCV多蛋白片段的核酸序列；

-编码与SEQ ID NOs：53-55中任意一种的同一性至少为92％的核心蛋白片段的核酸序列；

-编码与SEQ ID NO：56的同一性至少为79％的E1蛋白片段的核酸序列；

-编码与SEQ ID NOs：11，13，15中任意一种的同一性至少为85％的核心/E1蛋白片段的核酸序列；

-编码与SEQ ID NOs：50-52中任意一种的同一性至少为91％的核心/E1蛋白片段的核酸序列；

-编码与SEQ ID NO：9的同一性至少为87％的NS5B蛋白片段的核酸序列；

为所述HCV基因型所特有的上述核酸序列中任意一种的片段；或为HCV基因型所特有的所述任意一种核酸序列或所述任意一种核酸序列的片段的互补体。

更具体地讲，本发明的分离的HCV多核酸可以是RNA，DNA，cDNA或合成多核酸。

本发明的另一方面涉及包括来自本发明分离的HCV多核酸并且为它所特有的至少8个连续的核苷酸或由其组成的寡核苷酸。在一种实施方案中，本发明的寡核苷酸是能够特异性地扩增本发明的HCV多核酸的引物。在另一种实施方案中，本发明的寡核苷酸是能够与本发明的HCV多核酸特异性杂交的探针。在另一种实施方案中，本发明的寡核苷酸能够特异性地检测本发明的HCV多核酸。在另一种实施方案中，本发明的寡核苷酸能够确定本发明HCV多核酸的基因型。更具体地讲，本发明的寡核苷酸除了脱氧核糖核酸单体之外，可以包括一个或多个修饰过的核苷酸碱基，标记过的核苷酸，修饰过的多核苷酸主链，肽核酸单体，锁闭的核酸单体，和/或核糖核酸单体。

通过将跨8261-8600号位置，更具体地讲，跨8267-8590号位置的NS5基因核苷酸序列的一部分与表1中所示的氨基酸编号，以及与所述含有不同于来自所述已知HCV核苷酸序列的至少一个核苷酸的多核酸或它的互补体进行比较，在表3中对所述HCV类型和亚型进行分类。已知HCV分离物的序列可以从本领域公知的任何核苷酸序列数据库中查找(例如，EMBL或GenBank数据库，例如，参见本发明的背景部分)。

因此，本发明还涉及具有本发明的新的HCV类型所特有的核苷酸序列的多核酸，所述HCV类型是按照本文所披露的方法进行分类的。

应当指出的是，本发明的多核酸中的核苷酸的差别可能导致由所述多核酸编码的相应的氨基酸序列的序列上的氨基酸差别。本发明的组合物可以仅含有多核酸序列或含有与本领域已知的用于诊断、预防或治疗目的的任何赋形剂混合的多核酸序列。

根据一种优选实施方案，本发明涉及一种编码HCV多蛋白的多核酸，在所述多蛋白的氨基酸序列中，包括至少一个特有的氨基酸残基。注释部分包括通过单字母代码表示氨基酸残基的字母，和表示按照Kato等，(1980)的方法进行氨基酸编号的编号，如表1所示，或如表5所定义的为本发明新的HCV类型所特有的所述多核酸的一部分，并且它包括至少一个不同于已知HCV核苷酸序列或它的互补体的核苷酸。

上述所提到的每一个残基可以从图1，2，和4中查阅到，这些附图示出了本发明的新的核酸和新的氨基酸序列。

本发明所使用的术语“基因型”表示类型和/或亚型。

术语“HCV类型”相当于一种类型的HCV分离物，其中：

-完整的基因组核酸序列相互之间具有超过73％，优选超过74％的同源性；或

-在核酸水平上，位于8261和8600号核苷酸位置之间的NS5区，或更具体地讲跨8267-8590号核苷酸的区域相互之间具有超过75.4％的同源性；或

-在氨基酸水平上，完整的HCV多蛋白相互具有超过78％的同源性；或

-在氨基酸水平上，位于2465-2753号氨基酸位置之间的NS5区，或更具体地讲跨2645和2757号氨基酸的区域具有超过80％的相互同源性；

其中，所示出的核苷酸编号和氨基酸编号与Kato等(1990)所用的核苷酸编号和氨基酸编号一致，即相当于起始密码子ATG的甲硫氨酸(其中，腺嘌呤的核苷酸编号为330)是HCV多蛋白的1号氨基酸(参见Kato等，1990，图2)。

术语“HCV亚型”相当于一组HCV分离物，其中：

-完整的基因组或多蛋白分别在核酸水平上具有超过90％，例如90％-99％(90％，91％，92％，93％，94％，95％，96％，97％，98％，99％)的相互同源性，或在氨基酸水平上具有超过90％，例如95％或96％(或90％，91％，92％，93％，94％，97％，98％，99％)的相互同源性，或

-在核酸水平上，位于8261和8600号核苷酸位置之间的NS5区，或更具体地讲跨8267-8590号核苷酸的区域具有超过90％的相互同源性；

其中，核苷酸编号与Kato等(1990)所采用的核苷酸编号一致，即，HCV多蛋白的ATG起始密码子的腺嘌呤残基″A″的核苷酸编号为330(参见Kato等，1990，图2)。

表1.在本发明中所采用的HCV核苷酸和氨基酸编号系统(*)与其他原型分离物的编号的比较。例如，8352/8564表示由从8352号核苷酸到8564号核苷酸所确定的区域，正如Kato等所披露的(1990)。

区	在本发明中所披露的位置^*	披露的HCV-J的位置(Katoet al.，1990)	披露的HCV-1的位置(Chooet al.，1991)	披露的HCV-J6，HC-J8的位置(Okamoto et al.，1992)
区	在本发明中所披露的位置^*	披露的HCV-J的位置(Katoet al.，1990)	披露的HCV-1的位置(Chooet al.，1991)	披露的HCV-J6，HC-J8的位置(Okamoto et al.，1992)	核苷酸	NS5B	8352/85648261/86008267/8590	8352/85648261/86008267/8590	8026/82387935/82747941/8264	8433/86458342/86818348/8671
	本发明的编码区	330/9359	1/9033	342/9439	核苷酸	NS5B	8352/85648261/86008267/8590	8352/85648261/86008267/8590	8026/82387935/82747941/8264	8433/86458342/86818348/8671
	本发明的编码区	330/9359	1/9033	342/9439	氨基酸	NS5B	2675/27452645/27572647/2753	2675/27452645/27572647/2753	2676/27462646/27582648/2754	2698/27682668/27802670/2776

属于不同HCV类型的HCV分离物，在核酸水平上在整个基因组上具有低于74％，优选低于73％的相互同源性，而在氨基酸水平上具有低于78％的相互同源性。

属于相同HCV类型，但属于不同的HCV亚型的HCV分离物优选在核酸水平上具有超过74％，更优选大约76％-82％(更优选大约77％-80％)的同源性，并且在氨基酸水平上具有超过78％，更优选85％-86％的同源性。

更优选的是，HCV类型的确定是根据它们的核苷酸距离进行的HCV分离物分类得出的，所述核苷酸距离是按以下说明计算的：

(1)根据对NS5B区的7935-8274号(Choo等，1991)或8261-8600号(Kato等，1990)或8342-8681号(Okamoto等，1991)核苷酸之间的核酸序列进行的系统发育分析，属于相同HCV类型的分析物具有低于0.34的核苷酸距离，通常低于0.33，更常见的是低于0.32，而属于相同亚型的分离物具有低于0.135的核苷酸距离，通常低于0.13，更常见的是低于0.125，一般在0.0003-0.1151范围内，因此，属于相同类型，但属于不同亚型的分离物具有0.135-0.34的核苷酸距离，通常在0.1384-0.2977范围内，更常见的是在0.15-0.32范围内，属于不同HCV类型的分离物具有大于0.34的核苷酸距离，通常大于0.35，更常见的是大于0.358，更常见的是在0.3581-0.6670范围内。

(2)根据对核心/E1区的378-957号核苷酸之间的核酸序列之间的系统发育分析，属于相同HCV类型的分离物具有低于0.38的核苷酸距离，通常低于0.37，更常见的是低于0.364，而属于相同亚型的分离物具有低于0.17的核苷酸距离，通常低于0.16，更常见的是低于0.15，更常见的是低于0.135，更常见的是低于0.134，因此，属于相同类型，但属于不同亚型的分离物具有0.15-0.38的核苷酸距离，通常在0.16-0.37范围内，更常见的是在0.17-0.36范围内，更常见的是在0.133-0.379范围内，并且，属于相同类型的HCV分离物具有大于0.34，0.35，0.36的核苷酸距离，通常大于0.365，更常见的是大于0.37。

在对现有序列进行的对照系统发育分析中，根据通过系统发育推测软件包PHYLIP 3.5c版的DNADISTE程序(Felsenstein，1993)进行的19781个成对的比较，计算了所述基因组的不同区域的分子进化距离。结果如表2所示，并且表明了尽管在每一个区所获得的距离的主要部分与某种分离物的分类吻合，但是只有在340bp NS5B-区获得的范围是非重叠的，并因此是结论性的。不过，正如在本发明中所进行的，优选在对特定分离物进行最终分类之前，从至少两个区域获得序列信息。

多种不同类型HCV的名称和HCV命名，是根据按时间顺序发现的所述不同类型进行的。在本发明中所采用的编号系统仍然有可能根据国际公约或指南而改变。例如，“12型”可能改变成“7型”或“9型”。另外，在类型和亚型和分离物之间随意选择的边界距离，仍有可能按照国际指南或公约改变。因此，举例来说，7a，8a，8b，9a类型将来有可能被确定为6b，6c，6d和6d；与基因型3相关的10a型有可能被确定为3g，以取代10a。

表2.通过PHYLIP程序DNADIST产生的数字是以最小值到最大值形式表示的(平均值±标准差)。提供了属于相同亚型的分离物(‘分离物’)，属于相同类型的不同亚型的分离物(‘亚型’)，和属于不同类型的分离物(‘类型’)的系统发育距离。

区	核心/E1579bp	E1384bp	NS5B340bp	NS5B222bp
区	核心/E1579bp	E1384bp	NS5B340bp	NS5B222bp	分离物	0.0017-0.1347(0.0750±0.0245)	0.0026-0.2031(0.0969±0.0289)	0.0003-0.1151(0.0637±0.0229)	0.000-0.1323(0.0607±0.0205)
亚型	0.1330-0.3794(0.2786±0.0363)	0.1645-0.4869(0.3761±0.0433)	0.1384-0.2977(0.2219±0.0341)	0.117-0.3538(0.2391±0.0399)	分离物	0.0017-0.1347(0.0750±0.0245)	0.0026-0.2031(0.0969±0.0289)	0.0003-0.1151(0.0637±0.0229)	0.000-0.1323(0.0607±0.0205)
亚型	0.1330-0.3794(0.2786±0.0363)	0.1645-0.4869(0.3761±0.0433)	0.1384-0.2977(0.2219±0.0341)	0.117-0.3538(0.2391±0.0399)	类型	0.3479-0.6306(0.4703±0.0525)	0.4309-0.9561(0.6308±0.0928)	0.3581-0.6670(0.4994±0.0495)	0.3457-0.7471(0.5295±0.0627)

可以理解的是，诸如E1，E2和NS4区的高度可变区所具有的同源性，低于多蛋白的整个基因组的平均同源性。

采用上述标准，可以将HCV分离物划分成至少11种类型。根据5′NCR和编码区的同源性，在类型1，2，3，4和7中，可以明确区分若干种亚型：1a，1b，1c，1d，1e，1f，1g，2a，2b，2c，2d，2e，2f，2g，2h，2i，2k，2l，3a，3b，3c，3d，3f，3g，4a，4b，4c，4d，4e，4f，4g，4h，4i，4j，4k，4l，4m，7a，7c，和7d。在表3中提供了大部分报导过的分离物的概述，以及它们的根据本发明分类系统的推荐分类，以及其他推荐的分类。

术语“多核酸”表示单链或双链核酸序列，它可能包括至少5个连续的核苷酸(例如，至少6，7，8，9，10，11，12，13，14，15，16，17，18，19，20，21，22，23，24，25，30，35，40，45，50，60，70，75，80，85，90，95，100或更多个连续的核苷酸)。其长度多达大约100个核苷酸的多核酸，通常又被称为寡核苷酸。多核酸可能由脱氧核糖核苷酸或核糖核苷酸，核苷酸类似物或修饰过的核苷酸组成，或者可以进行修饰以便适合治疗目的。多核酸还可以包括双链cDNA克隆，可将其用于克隆目的，或用于体内治疗或预防。

被用作引物或探针的本发明的寡核苷酸还可以包括或含有核苷酸类似物，如硫代磷酸酯(Matsukura等，1987)，烷基磷酸酯(Miller等，1979)或肽核酸(Nielsen等，1991，1993)，或者可以含有嵌入剂(Asseline等，1984)。

由于将大部分其他改变或修饰导入了本发明的原始DNA序列，这些变化要求对将所述寡核苷酸用于获得所需要的特异性和灵敏度的相应条件进行调整。不过，最终结果将大体上与用未修饰过的寡核苷酸获得的结果相同。所述修饰的导入，可能有利于对诸如杂交动力学、杂交体形成的可逆性，寡核苷酸分子的生物学稳定性之类的特征产生正面影响。

本发明的多核酸可以包含在任何类型的组合物中。所述组合物可用于诊断、治疗或预防目的。

术语“互补体”表示互补于所标明的序列，并且它能够与所标明的序列杂交的核苷酸序列。

本发明的组合物可以包括多种组合。举例来说，本发明的组合物可以包括：

-来自相同区域的两种(或两种以上)核酸或，

-分别来自相同分离物或不同分离物的不同区域的两种(或两种以上)核酸，

-或来自相同区域或来自(相同分离物或不同分离物)的至少两个不同区域的核酸。

-短语“本发明的HCV类型所特有的序列”表示任何其他类型或亚型的HCV所不具备的序列，并因此可以被用于专门检测本发明的HCV类型。在本发明中证实了新发现的本发明HCV类型的克隆之间的序列变异性(参见图2和4)。类似地，本领域技术人员可以通过采用常见技术，如在实施例3和实施例4中所披露的技术，不需要过多的实验或创造性劳动，就可以确定本发明的新鉴定的HCV类型与已知HCV类型和亚型，例如HCV类型1-12序列之间的序列变异性。因此，根据所述具有序列变异性的区域，特别是类型或亚型特异性多核酸，寡核苷酸，可以获得多肽和肽。术语类型或亚型特异性表示一种序列为相关的特定HCV类型或亚型所特有这一事实。

短语“相应于...的核苷酸”表示与特定核苷酸序列或特定HCV序列内的区域同源或互补的核苷酸。

表3.由不同作者分类的若干种已知HCV类型和亚型的概述(Okamoto等，1992；Mori等，1992；Cha等，1992；Nakao等，1991)

HCV分类

OKAMOTO MORI CHA NAKAO PROTO原型

1a I I Pt GI HCV-l，HCV-H，HC-J1

1b II II KI GII HCV-J，HCV-BK，HCV-T，HC-JK1，

HC-J4，HCV-CHINA

1c HC-G9

2a III III K2a GIII HC-J6

2b IV IV K2b GIII HC-J8

2c S83，ARG6，ARG8，I10，T983

2d NE92

3a V V K3 GIV BR36，BR56，HD10，N2L1，BR33，Ta，

E-b1

3b VI K3 GIV HCV-TR，Tb，NE137

3c NE48

3d NE274

3e NE145

3f NE125

4a Z4，GB809-4

4b Z1

4c GB116，GB358，GB215，Z6，Z7

4d DK13

4e GB809-2，CAM600，CAM736

4f CAM622，CAM627

4g GB549

4h GB438

4i CAR4/1205

4j CAR1/905

5a GV SA3，SA4，SA1，SA7，SA11，BE95

6a HK1，HK2，HK3，HK4，VN11

“HCV多核酸”或者更具体地讲“分离的HCV多核酸”，表示包括单链多核酸，双链多核酸或成三链体多核酸，它是直接从样品中获得的或者在复制、倍增或扩增之后获得的。在本文中“获得的”表示从生物学样品中分离和/或纯化和/或扩增所述多核酸。“样品”可以是直接从受感染的人体(或动物)内采集的，或是培养(富集)之后的任何生物学材料。例如，生物学材料可以是任何类型的痰液、支气管洗液，血液，皮肤组织，生物活检物，精液，淋巴细胞血液培养材料，结肠，液体培养物，粪便样品，尿液等。生物学材料还可以是人工感染的细胞培养物或它的液相。术语“生物学样品”一般表示含有HCV核酸序列的任何生物学样品(组织或液体)，并且更具体地讲，表示血清或血浆样品。“复制、放大或扩增”表示包括产生核酸的任何核酸扩增方法，所述扩增方法还包括测序。因此，能产生包括本发明HCV核酸的一部分或全部的核酸分子的任何测序技术，都被理解成包括在术语“复制，放大或扩增”范围内。

具体地讲，“多核酸”一般可能包括至少，或多达5个连续的核苷酸(例如，至少或多达6，7，8，9，10，11，12，13，14，15，16，17，18，19，20，21，22，23，24，25，26，27，28，29，30，35，40，45，50，55，60，65，70，75，80，85，90，95，100，105，110，115，120，125，130，135，140，145，150，155，160，165，170，175，180，185，190，195，200或更多个连续的核苷酸)。其长度多达大约200个核苷酸的多核酸通常又被称为寡核苷酸。

本发明明显涉及用于制备本发明多核酸的任何方法，得到了合成多核酸。

本文所使用的术语“合成多核酸”表示单链多核酸，双链多核酸或成三链体多核酸。多核酸可以通过核苷酸序列扩增方法在体外制备。如果所扩增的多核酸是双链核酸的话，可以通过合适的外切核酸酶实现向单链分子的转化，其前提是，需要的单链多核酸不受所述外切核酸酶活性的作用。另外，多核酸可源于含有包括相应的多核酸序列的插入片段的重组质粒，如果必要的话，通过使用合适的核酸酶将插入片段从克隆的质粒上裂解下来，并且回收所述片段，例如，根据分子量进行分离。另外，多核酸可以是天然存在的或克隆的DNA或RNA或cDNA的分离的片段。体外制备合成多核酸的其他方法包含在任何核酸测序方法中。因此，术语“合成多核酸”明确包括测序反应的产物。本发明的多核酸还可以是化学合成的，例如，采用常规的磷酸二酯(Agarwal等，1976)或三酯(Hsiung等，1979)化学方法或亚磷酰胺化学方法(Beaucage等，1981)。所述多核酸可以是在由多个生产商出售的商业化仪器上自动合成的。

“核苷酸序列(DNA或RNA)扩增”包括所有能导致靶核苷酸序列拷贝的数量增加的方法。核苷酸序列扩增方法包括聚合酶链式反应(PCR；DNA扩增)，链置换扩增(SDA；DNA扩增)，转录型扩增系统(TAS；RNA扩增)，自我维持的序列复制(3SR；RNA扩增)，核酸序列型扩增(NASBA；RNA扩增)，转录介导的扩增(TMA；RNA扩增)，Qβ-复制酶介导的扩增和失控转录。在扩增期间，可以用标记过的引物或通过掺入标记过的核苷酸，对扩增的产物方便地进行标记。标记物可以是同位素(³²P，³⁵S等)或非同位素(生物素，洋地黄毒苷等)。

最广泛地推广的核苷酸序列扩增技术是PCR。一般来说，将两种引物，一种有义引物和一种反义引物与变性的DNA底物一起退火，并且通过热稳定性DNA聚合酶延伸。所述聚合酶能够进行快速和重复的热循环(在三个步骤的PCR中，包括变性/退火/延伸；在两个步骤的PCR中，包括变性/退火+延伸)。靶DNA被以指数形式扩增。扩增反应重复20-70次，优选25-45次。很多方法都依赖于PCR，包括AFLP(扩增的片段长度多态性)，IRS-PCR(散布的重复序列PCR)，iPCR(反向PCR)，RAPD(多态性DNA的快速扩增)，RT-PCR(逆转录PCR)和实时PCR。后面某些方法将在下文作更详细地说明。RT-PCR可以用同时具有逆转录酶和DNA聚合酶活性的一种热稳定性酶进行(Myers等，1991)。另外，采用两种酶(逆转录酶和热稳定性DNA聚合酶)的单一试管反应是可行的(Cusi等，1994)。

与PCR不同，SDA是等温DNA复制方法。在该方法中使用的有义和反义引物具有包括一个限制酶识别位点的5’末端突出部分。两种引物都是在存在α-S-dNTP的调节下，通过Klenow聚合酶延伸的。然后通过所述限制酶对所得到的半硫代磷酸化dsDNA的未修饰过的链进行切口(ss-切口)。这使得Klenow聚合酶能够延伸所得到的引物片段，从而置换下游非模板链(Walker等，1992)。

在TAS中，使用在其5’末端包括一个由DNA依赖型RNA聚合酶(如噬菌体T7，T3或SP6 RNA聚合酶)识别的启动子的第一种有义引物和与RNA的3’末端互补的第二种反义引物启动逆转录。在所述引物变性和重新退火之后，可以进行另一轮逆转录，而在第一轮RT反应中所形成的ssDNA链被用作RT或退火的底物，在这两种情况下都形成了包括完整的DNA依赖型RNA聚合酶启动子的dsDNA。所述完整启动子的形成，使得能够转录和合成多个拷贝的原始靶RNA(Kwoh等，1989)。

3SR与TAS基于类似的原理，不过，它的两种引物都携带有相同的DNA-依赖型RNA聚合酶启动子。另外，在RT之后，通过RNAseH将RNA/DNA杂交体转化成ssDNA。因此，不再需要变性，它还消除了在每一轮变性之后对添加新的逆转录酶的需求。因此，3SR是TAS的等温变化形式(Gingeras等，1990)。

NASBA是TAS和3SR的杂交形式，它使用包括DNA依赖型RNA聚合酶启动子的单一引物，并且使用RNAseH(Kievits等，1991)。

TMA类似于NASBA，但是具有核糖体RNA作为模板。扩增的rRNA的序列的检测是通过扩增子的化学发光检测进行的，在杂交保护分析(HPA)中，采用吖啶酯-标记的DNA探针(Stary等，1998)。

Qβ-复制酶介导的扩增基于噬菌体Qβ的RNA-定向RNA聚合酶在体外等温扩增RNA的能力。与Qβ噬菌体异源的RNAs可以通过将它们与同源RQ RNAs偶联进行扩增(Lizardi等，1988)。

失控转录是一种常用于诸如制备核糖探针或RNA探针的方法。将感兴趣的DNA置于由DNA依赖型RNA聚合酶(例如T3，T7，SP6 RNA聚合酶)识别的启动子后面，将其克隆在合适的载体上。另外，用限制酶对所述感兴趣的DNA的合适位点进行消化，以便可以用RNA聚合酶合成需要的核糖探针。当所述RNA聚合酶达到所述DNA的消化过的末端时，它会离开所述底物，并且可用于新一轮的RNA合成。

本文所使用的术语“多核苷酸”，“多核酸”，“核酸序列”，“核苷酸序列”，“核酸分子”，“寡核苷酸”，“探针”，或“引物”表示任何长度或任何形状(例如，分支的DNA)的聚合形式的核苷酸，或者是核糖核苷酸，或者是脱氧核糖核苷酸，肽核苷酸或锁闭核苷酸，或它们的组合。所述术语还包括双链(ds)和单链(ss)多核苷酸，以及三链多核苷酸。所述术语还包括已知的核苷酸修饰，如甲基化，环化和“加帽”和用诸如肌苷或诸如HEG(六乙二醇)的不可扩增的单体取代一个或多个天然存在的核苷酸。核糖核苷酸表示为NTPs，脱氧核糖核苷酸表示为dNTPs，而双脱氧核糖核苷酸表示为ddNTPs。一般，核苷酸可以进行放射性标记，化学发光标记，荧光标记，磷光标记或用红外线染料或用表面增强拉曼标记物或等离子共振颗粒(PRP)标记。

核苷酸的修饰包括对多核苷酸主链和/或核苷酸碱基的任何修饰，以及在多核苷酸主链和/或核苷酸碱基上添加任何原子或分子。“核苷酸碱基”表示核苷酸的嘧啶或嘌呤部分，“主链”表示形成多核苷酸的结构，并且在它上面连接核苷酸碱基；一般来说，所述主链包括一个糖部分(例如，核糖或脱氧核糖)和磷酸。另一种修饰是在核酸分子中存在嵌入剂。

多核苷酸的其他修饰包括半抗原或蛋白标记。例如，半抗原包括生物素和洋地黄毒苷，而蛋白包括酶，如大豆或辣根过氧化物酶，β-半乳糖苷酶，荧光素酶，碱性磷酸酶，谷胱甘肽S转移酶或二氢叶酸还原酶或者可以构成异源表位(如组氨酸)₆-标记，蛋白A，麦芽糖结合蛋白，诸如Tag·100，c-myc，FLAG，HA，蛋白C或VSV的表位；或lacZ，CMP(钙调蛋白结合肽)。其他蛋白包括组蛋白，单链结合蛋白(ssB)以及天然的和工程合成的荧光蛋白，如绿色、红色、兰色、黄色、青色荧光蛋白。交联部分还可以是掺入的，如香豆素，呋喃香豆素，或苯并芘，或它们中任意一种的衍生物。

所述术语“多核苷酸”，“多核酸”，“核酸序列”，“核苷酸序列”，“核酸分子”，“寡核苷酸”，“探针”或“引物”还包括肽核酸(PNAs)，DNA类似物，其中，主链是由N-(2-氨基乙基)-甘氨酸单位而不是糖组成的拟肽。PNAs能模拟DNA的行为，并且结合互补核酸链。PNA的中性主链产生了比正常情况下获得的更强的结合，和更高的特异性。另外，业已将PNA的独特的化学、物理和生物学特性，用于生产有效的生物分子工具，反义和反基因制剂，分子探针和生物传感器。一般，PNA探针可以比DNA探针短，并且其长度一般为6-20个碱基，更优选其长度为12-18个碱基(Nielsen，2001)。所述术语还包括锁闭的核酸(LNAs)，它是RNA衍生物，其中，核糖环受到了2′-氧和4′-碳之间的亚甲基键的限制。LNAs表现出对DNA或RNA靶序列的没有先例的结合亲和力。LAN核苷酸可以是寡聚化，并且可以掺入嵌合的或混合的LNA/DNA或LNA/RNA分子。LNAs似乎对培养的细胞没有毒性(Orum等，2001；Wahlestedt等，2000)。一般来说，考虑DNA，RNA，PNA和LNA的任意的嵌合体或混合物，以及其中的胸腺嘧啶被尿嘧啶所取代的任一种形式。

本发明特别涉及如本文所定义的多核酸，它具有选自SEQ ID NOs：1，2，4，6，8，10，12，14，或36-49中任意一项的序列或所述多核酸的一部分，所述序列是表5中所确定的任何HCV亚型或类型所特有的，并且它包括不同于已知HCV多核酸或它的互补体的至少一个核苷酸。

更具体地讲，本发明涉及本文所定义的本发明的新的HCV的多核酸，它编码5′NCR，核心/E1，或NS5B区或它的一部分。

更具体地讲，本发明涉及如本文所定义的多核酸，它是一种cDNA序列。

本发明还包括选自在上面所提供的序列号中所提供的任何核苷酸序列的多核酸的序列变体，所述序列变体包括一个或多个核苷酸的缺失和/或插入，特别是一个或多个密码子的插入或缺失，主要位于寡核苷酸的末端(3′或5′末端)，或其他核苷酸(包括修饰过的核苷酸和/或肌苷)对某些非必需核苷酸(即不是区别不同的HCV基因型所必需的核苷酸)的取代，例如，可以通过用7型的类型特异性核苷酸取代1型或2型序列的某些核苷酸，将1型或2型序列修饰成7型序列。

本发明的特别优选的变体多核酸还包括能在严格条件下与本发明的任一种多核酸序列杂交的序列。具体地讲，优选与本文所披露的本发明的任意一种多核酸具有高度同源性(相似性)的序列。更优选的是，与本发明的所述核酸序列具有至少80％，81％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％或更高的同源性的序列。与所述多核酸序列的原始核苷酸相比，所述序列优选具有低于20％，15％，10％，或5％的差异。

更具体地讲，一种序列与特定的参考序列具有nn％的同源性或同一性，表示所述序列与所述特定参考序列分别具有高于nn％(nn+0.5)％，(nn+1)％，(nn+1.5)％-99％的同源性或同一性。因此，如果nn＝80的话，所述序列与所述特定参考序列具有分别为至少80％，80.5％，81％，81.5％，82％，83％，84％，85％，86％，87％，88％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％，或至少99％的同源性或同一性。在另一种例子中，其中，nn＝87，所述序列与所述特定参考序列分别具有至少87％，87.5％，88％，88.5％，89％，90％，91％，92％，93％，94％，95％，96％，97％，98％或至少99％的同源性或同一性。在本文中“参考序列”表示与另一种序列进行比较的序列(核酸或氨基酸序列)，例如，用于进行序列比对或确定百分同源性或同一性。对于本发明的新的HCV多核酸或氨基酸序列来说，表6提供了所述序列的概况，以及同源HCV多核酸或氨基酸的百分同一性需要落入本发明的范围。因此，如果在表6中所示出的特定HCV序列与本发明的参考原型HCV序列的同一性至少为nn％(参见上文的nn％同一性的定义)的话，那么所述特定HCV序列就属于本发明的范围。同样，表7和8提供了本发明HCV多核酸序列的某些片段的概况(分别为E1和NS5B)，以及落入本发明范围所需要的同源HCV多核酸片段的百分同一性。从表7和8可以看出，某些片段包括在不同基因型的HCV分离物中更为保守的区域。这体现在特定的HCV核酸片段需要与表7和8所示出的片段具有更高的百分同一性，以便落入本发明的范围。

可以按照本领域的任何已知技术鉴定和分离与SEQ ID NOs：1，2，4，6，8，10，12，14，或36-49所示序列同源的多核酸序列，如通过序列特异性引物扩增，在严格性较高或较低条件下与序列特异性探针杂交，血清学筛选方法或通过LiPA分类系统。

本发明的其他优选的变体多核酸包括与上文所提供的本发明的任意一种多核酸相比，因为遗传密码的简并性而产生的冗余的序列。因此，所述变体多核酸序列能编码的氨基酸序列，与衍生它的多核酸序列所编码的氨基酸序列相同。

本发明的范围还包括可以方便地从本文所披露的新的HCV类型中获得的5’非编码区的序列，例如，SEQ ID NO：1所示的序列。所述序列可能包括类型或亚型特异性基序，可将其用于类型和/或亚型特异性杂交分析，例如，由Stuyver等(1993)所披露的分析方法。

具体地讲，SEQ ID NO：1在它的核苷酸序列上包括位于5’UTR的171号位置上的核苷酸残基腺嘌呤(″A171″)，所述数字表示图1A所示的核苷酸编号。核苷酸A171是本发明的新HCV基因型的5′UTR所特有的。另外，还可以给核苷酸A171确定-159的编号，其中，该核苷酸编号是相对HCV多蛋白的AUG/ATG起始密码子的第一个腺嘌呤的编号，即，所述起始密码子的第一个腺嘌呤的核苷酸编号为+1，而紧邻所述第一个腺嘌呤，并且位于它上游的核苷酸的核苷酸编号为-1。本文所示出的来自在本发明的实施例，附图和序列表中没有示出的部分的基因组的多核酸序列，可以通过本领域任何已知技术获得，如采用来自在本发明的图1和4中提供的新的基因组的序列的合适引物的扩增技术。

本发明还涉及构成本文所定义的多核酸的一部分的寡核苷酸引物，所述引物可以用作用于特异性扩增衍生所述引物的属于本发明的新的HCV基因型的某些HCV分离物的核酸。

术语“引物”表示可以作为引物延伸产物合成起点的单链DNA寡核苷酸序列，它互补于要拷贝的核酸链。引物的长度和序列必须能够启动一种延伸产物合成。所述引物优选为大约5-50个核苷酸。具体长度和序列将取决于所需DNA或RNA目标的复杂性，并且取决于引物使用的条件，如温度和离子强度。因此，举例来说，引物的长度可以是5，8，9，10，11，12，13，14，15，16，17，18，19，20，21，22，23，24，25，26，27，28，29，30，31，32，33，34，35，40，45或50个核苷酸。

在文献中大量报导了以下事实：扩增引物不必与相应的模板序列精确地匹配，以便确保正确的扩增(Kwok等，1990)。

本发明还涉及包括本文所定义的多核酸的一部分的寡核苷酸探针，所述探针能够用作杂交探针，以便特异性检测含有所述核苷酸序列的HCV核酸和/或将其分类成类型和/或亚型，任选对所述探针进行标记或与固体基质连接。

术语“探针”表示单链序列特异性寡核苷酸，它的序列互补于要检测的HCV基因型的靶序列。所述探针的长度优选为大约5-50个核苷酸，更优选大约10-25个核苷酸。因此，举例来说，探针的长度可以为例如5，8，9，10，11，12，13，14，15，16，17，18，19，20，21，22，23，24，25，26，27，28，29，30，31，32，33，34，35，40，45或50个核苷酸。

上述引物和探针还可以包括修饰过的核苷酸碱基和/或修饰过的多核苷酸主链和/或肽核酸和/或锁闭核酸和/或标记过的核苷酸和/或携带半抗原或蛋白的核苷酸，均如上文所述。

另外，本发明的寡核苷酸还可以包括一种修饰，以便将所述寡核苷酸连接在固体支持物上。

例如，所述修饰可以是寡核苷酸的胺-，硫醇-，3’-丙胺或Acrydite-修饰，或可以包括在所述寡核苷酸上添加均聚物尾(通过末端转移酶酶促添加的或通过合成添加的寡聚(dT)-尾)。如果所述均聚物尾位于所述寡核苷酸的3’末端或者在所述寡核苷酸中掺入能阻止酶促延伸的任何其他3’末端修饰的话，就可能减弱或破坏所述寡核苷酸的引导能力。其他修饰披露于诸如(Beaucage，2001)的文献中。

术语“固体支持物”可以表示能够偶联寡核苷酸探针的任何基质，其前提是，它能保留它的杂交特性，并且杂交的背景水平仍然很低。通常，所述固体基质是微球(珠)，硝酸纤维素或尼龙膜，玻璃载玻片或融合的硅(石英)载玻片(后者被称为核酸阵列或纤维阵列或被称为核酸芯片)，金薄膜，聚吡咯薄膜，光学纤维或聚丙烯酰胺凝胶或微量滴定板孔。在结合到所述固体支持物上或在固定之前，通常需要对所述核酸探针进行修饰，以便有利于固定或提高杂交效率。所述修饰可以包括添加均聚物尾，与不同的反应基团偶联，如脂族基团，NH₂基团，SH基团，羧基基团，或与生物素或半抗原偶联。

本发明还涉及用于确定HCV的基因型的诊断试剂盒，所述试剂盒包括本文所定义的引物。

本发明还涉及用于确定HCV的基因型的诊断试剂盒，所述试剂盒包括本文所定义的探针。

本发明还涉及本文所定义的诊断试剂盒，其中，所述探针连接在一种固体基质上。

本发明还涉及本文所定义的诊断试剂盒，其中，将多种所述探针连接在固体基质的特定位置上。

本发明还涉及本文所定义的诊断试剂盒，其中，所述固体支持物是膜片，并且，所述探针以平行线的方式偶联在所述膜上。

本发明还涉及用于检测本发明的一新HCV类型的核酸的方法。

目前，有大量的能够检测核苷酸序列和核苷酸序列多态性的分析方法可供利用。所述分析方法可以鉴定特殊的突变，单核苷酸多态性(SNPs)，基因型-特异性核苷酸等。上述某些方法基于物理方法，而其他方法采用酶促方法。

在本文中，“物理检测方法”表示核苷酸序列多态性检测方法，该方法需要一个或多个物理方法来检测，不过，并不排除包括一种或多种核苷酸序列多态性的靶DNA序列的现有PCR扩增的酶促过程。所述物理方法包括电泳，层析，光谱分析，光学信号传感和光谱学。

物理核苷酸序列多态性检测分析包括电泳方法，如SSCP，CDCE，CDGE，DGGE，TGGE，DGCE，非等度CZE，TDGS，CSGE，MADGE和DSCA；层析方法包括DHPLC。物理核苷酸序列多态性检测分析，能有效鉴定已知的或新的突变，并且可能需要通过直接DNA测序证实。

单链构象多态性(SSCP)是基于由于单链DNA的序列依赖型二级和三级结构的改变而产生的迁移率的差异。对于SSCP来说，重要的是实验条件，包括凝胶温度和凝胶组成。SSCP是一种业已完善的并且被广泛应用的分析方法，它可以可靠地分析大小为200个碱基对(bp)或更小的DNA片段。SSCP分析可以通过凝胶或毛细管电泳方法进行，并且可以与基于荧光的ssDNAs的检测组合(Kristensen等，2001；Nishimura等，2000；Bosserhoff等，1999；Iwahana等，1996；Bosserhoff等，1999；Bosserhoff等，1999；Bosserhoff等，1999)。

恒定的变性毛细管电泳(CDCE)和恒定的变性凝胶电泳(CDGE)，都是基于同和异双链DNA分子之间的电泳迁移率的差异的。所述迁移率的差异，取决于所述DNA双链体的解链特性的差异。在CDCE和CDGE中，靶DNA双链体的解链是通过在凝胶或毛细管中使用一个具有稳定温度和恒定的变性组成的区域而实现的。CDCE和CDGE可以与DNA分子的荧光检测组合。CDCE还可应用于罕见突变体的富集。CDCE和CDGE中的靶DNA双链体的长度通常为80-200bp(Khrapko等，2001；Kristensen等，2001；Li-Sucholeiki等，2000；Khrapko等，1997；Khrapko等，1994；Khrapko等，1997；Khrapko等，1994)。在变性梯度凝胶电泳(DGGE)中，靶双链DNA分子的解链，是通过聚丙烯酰胺凝胶中从低到高的变性剂梯度实现的。在温度梯度凝胶电泳中，所述解链是通过从低到高的温度梯度实现的。在双重梯度毛细管电泳(DGCE)中，同和异双链靶DNA分子的解链是通过化学或热梯度实现的，并且分离的同和异双链DNA随后在共线性第二多孔性梯度中重新变得紧密。毛细区电泳(CZE)又被称为无溶液毛细管电泳(FSCE)。非等度CZE，或热梯度毛细管电泳(TGCE)可被用于分离靶DNA的同源和异源双链分子，其中，在所述毛细管内部产生温度梯度(Kristensen等，2001；Righetti等，1997；Kristensen等，2001)。二维基因扫描(TDGS)包括二维DNA电泳，它包括第一个步骤中的大小分离，和第二个步骤中的DGGE。TDGS能够检测具有不同大小的一组靶双链DNAs的核苷酸多态性，例如，通过多重PCR反应所获得的DNA(Vijg等，1999)。在DNA片段的末端添加(例如，通过PCR引物掺入)GC-钳(人工高熔点结构域)，使得能够通过基于变性的电泳方法分析几乎所有的DNA序列，以便检测核苷酸多态性(Sheffield等，1989；Myers等，1985)。业已将微量滴定板阵列对角凝胶电泳(MADGE)改良成(热)变性方案，并且，通过GC-钳制的同微量滴定板和异靶DNAs证实了核苷酸多态性的检测(Day等，1998)。

在构象敏感型凝胶电泳(CSGE)中，温和的变性条件能诱导dsDNA的构象改变，这种改变对于同和异双链靶DNA来说是不同的。因此，在电泳期间，同和异双链DNAs表现出不同的迁移率。可以对CSGE进行改良，以便能够进行基于荧光的检测(Ganguly等，1998；Korkko等，1998；Ganguly等，1998)。

双链构象分析(DSCA)是一种基于构象的突变检测系统，其中，在单链上用荧光素标记过的已知双链参考DNA(荧光素标记的参考或FLR DNA)与未知样品DNA杂交。所述荧光同和异双链体的电泳迁移率的差异，使得能够鉴定核苷酸多态性(Arguello等，1998)。一种类似技术被称为HMA(异双链体迁移率分析)，但是，它是根据DNA的凝胶染色检测DNA双链体的(Delwart等，1993)。在HTA(异双链体轨迹分析)中，将一种放射性标记的探针与PCR产物一起退火，并且通过凝胶电泳分离探针-产物异双链体。业已披露了多位点特异性HTA(Resch等，2001；Delwart等，1994；Delwart等，1994)。

上文披露了通过变性电泳分离同和异双链靶DNA分子。所述分离还可以通过变性液相层析进行，其中，由温度决定灵敏度。另外，变性高效液相层析(DHPLC)能够在单一的毛细管柱中进行，从而能够建立一种阵列系统。基于荧光的检测是可行的，还可以与质谱分析仪联机。通过在靶DNA片段的末端添加GC钳，可以提高通过DHPLC检测核苷酸多态性的效率(Huber等，2001；Narayanaswami等，2001；Xiao等，2001；Huber等，2001)。

业已将MALDI-TOF MS(距阵辅助的激光解吸-离子化飞行时间质谱分析)成功地用作100bp以下的DNA片段的直接DNA测序工具，并且用作检测单核苷酸多态性的工具。业已证实等位基因特异性PNA-寡聚物(肽核酸)与单链靶DNA的杂交，与MALDI-TOF MS分析是高度兼容的((Griffin等，2000)，以及其中的参考文献)。

在本文中，“用于制备发出核苷酸序列多态性信号的产物的酶促方法”表示取决于用于制备所述信号传导产物的一种或多种酶的活性的方法。酶包括DNA限制内切核苷酸，DNA聚合物，DNA连接酶，DNA/RNA结构特异性内切核苷酸，DNA/RNA flap内切核苷酸酶，DNA外切核苷酸和逆转录酶(RTs)。酶促方法通常需要一种物理过程(例如，上文所述)，以便检测酶促产生的信号。所述酶促方法包括RFLP，AFLP，ASO-PCR，实时PCR，LCR或LDR，CFLP，Invader分析，ddF，Bi-ddF，dnF，BESS和DNA微型测序或测序。正如下文所披露的，上述某些酶促方法可以取代化学或物理方法。

限制片段长度多态性(RFLP)是一种通常使用一种或多种DNA限制内切核苷酸酶产生靶DNA分子的指纹的分析方法。为了检测突变或简单的或单一的核苷酸多态性，通常通过PCR扩增靶DNA(Schumm等，1988)。在扩增片段长度多态性(AFLP)中，用限制性内切核苷酸酶消化靶DNA，并且在将接头序列连接到所获得的片段上之后，通过PCR扩增所获得的片段(Vos等，1995)。用于检测核苷酸序列多态性的更具体的酶促方法，包括使用等位基因特异性寡核苷酸(ASO)引物的PCR(ASO-PCR)，其中，所述ASOs可以通过其3’末端核苷酸分辩不同的模板。可以通过掺入一个靠近3’分辩碱基的额外的有意引入的错配，改良ASO-PCR，所述错配的引入能明显减弱不包括ASO引物的分辩3’碱基的模板的扩增(Cha等，1992；Wu等，1989)。

在实时PCR中，可以实时跟踪PCR反应的进程，并且可以通过分别监测杂交中的或杂交过的DNA分子的退火和解链曲线，检测突变体或核苷酸序列多态性。已知的实时PCR方法包括三种类型。在第一种类型的实时PCR中，PCR的数量是通过测定诸如SYBR Green I的dsDNA染料的荧光测定的。如果是用ASO引物进行的话，可以将这种类型的实时PCR用于检测突变体或核苷酸序列多态性。另外两种类型的实时PCR是基于发光标记物或供体或荧光团和捕获由所述供体发射的光线的标记物之间的荧光共振能量转移(FRET)的原理，所述光线捕获标记物被称为受体或淬火剂或受体。所述受体可以是荧光性的或非荧光性的。如果所述受体也是荧光性的话，所转移的能量能够作为所述受体的荧光特征发射。如果所述受体不是荧光性的话，即淬火剂，所述能量就会通过与溶剂的平衡而消失。所述受体-供体对可以整合在相互相邻杂交(在5个碱基对之内)的两种不同的寡核苷酸内(杂交探针)，或整合在一种双重标记的探针内(外切核苷酸或‘′TaqMan’探针和发卡或‘Molecular Beacons’探针)。

另外，存在两种形式的杂交探针。在所述引物/探针方案中，从内部对所述引物进行标记，通常使用受体染料，而互补于所述引物延伸产物的探针是进行3’末端标记的，通常采用供体荧光团。如果所述引物具有ASO形式的话，或者如果所述探针可以区别不同变体的话，这种实时PCR类型就可用于检测突变体或核苷酸序列多态性。在所述探针/探针方案中，所述供体和受体染料与两种不同的寡核苷酸的5’和3’末端偶联。另外，对5’末端标记的探针的3’末端进行封闭，以避免聚合物酶的延伸。能够区别不同变体的探针使得能够将所述实时PCR类型用于检测突变体或核苷酸序列多态性。所述引物/探针或探针/探针方案的变化形式包括使用两种寡核苷酸(探针或引物)，每一种寡核苷酸具有不同的‘通用’尾。所述通用尾可以与互补性通用探针杂交，一种是用受体染料标记的，而另一种是用供体染料标记的。通过两种有通用尾的寡核苷酸(探针或引物)使两个通用探针彼此靠近，所述寡核苷酸同时与一个共同的目标杂交，并且与所述通用探针杂交。采用这种方法，同时结合等位基因特异性引物(扩增方案)或等位基因特异性探针(杂交方案)，能够检测核苷酸序列多态性(Beaudet等，2001)。

外切核苷酸酶或′TaqMan′探针携带有荧光团供体和淬火受体，它们在正向和反向PCR引物之间杂交，在PCR引物延伸步骤中应当百分之百的杂交，并且应当具有封闭的3’末端(如果不是被供体或受体封闭)。在PCR延伸步骤中，遇到杂交的TaqMan探针杂交的Taq聚合酶会因为所述聚合酶的内在的5’-3’外切核酸酶活性而破坏所述探针。因此，所述荧光团与所述退火剂分离，其结果是增强了荧光。如果所述外切核苷酸探针能够分辨不同的变体的话，就可将它应用于突变体或核苷酸序列多态性的实时PCR型检测。外切核酸和发卡探针之间的差异包括(i)具有互补的5’和3’尾(包括5个或更多个核苷酸)的特异性杂交探针的延伸能够形成一个发卡和(ii)和所述供体和淬火标记连接在所述发卡尾的5’和3’末端。所述发卡探针与模板的杂交，导致了所述供体和淬火标记的空间隔离，并因此产生荧光。如果发卡探针能够分辨不同变体的话，即可将它应用于突变体或核苷酸序列多态性的实时PCR检测。除了采用dsDNA-染料的方案之外，任一种方案的多种实时PCR可以使用不同的供体/受体对和/或使用具有不同解链温度的引物或探针(Bernard等，2001；Wittwer，2001；Tyagi等，1998；Tyagi等，1996)。

包括Molecular Beacon型结构，它的环，但是不与靶DNA结合，并且还包括能够与所述靶DNA杂交的3’单链延伸部分的发卡引物，可用于直接检测所述PCR扩增的靶DNA。在所述扩增之后，可以检测荧光的增强，因为所述发卡是以开放构象存在于扩增子中的。这种发卡引物类型被称为Sunrise^TM引物。所述发卡引物还可以以引物特异性方式设计，并且还可用于启动环化挂锁引物的滚环扩增，同时与能够启动互补链DNA合成的第二种引物结合(Faruqi等，2001；Nazarenko等，1997；Nazarenko等，1997)。下面将更详细地说明滚动循环扩增。同一主题的另一种变化形式是这样的：其中，第一轮PCR是用包括能够与具有′通用′尾的Sunrise-型探针杂交的′通用′5’尾的等位基因特异性引物启动的。所述具有‘通用’尾的发卡引物被称为Amplifluor^TM引物。从第三轮循环开始，所述Amplifluor引物起着启动DNA合成的作用，并且从第四轮开始合成互补于所述Amplifluor引物-启动的ssDNA的链，导致打开所述发卡，并因此出现荧光(Myakishev等，2001)。

上文所述的发卡引物的其他改进包括在发卡环中掺入一个能够与新扩增的靶DNA的一部分杂交的序列。在PCR期间，所述引物的发卡的扩增是通过在发卡的3’末端/引物部分的5’末端掺入一个封闭性不可扩增的单体而抑制的。例如，所述单体是六乙二醇(HEG)。荧光是在由于发卡环与扩增的靶DNA杂交导致所述发卡打开之后出现的。这种类型的发卡引物被称为蝎子引物(Whitcombe等，1999)。

还可以涉及PCR产物合成的实时测定的方法，以便所述PCR产物只能被测定一次，例如，在最后一轮PCR之后测定。因此，上述后一种方法包括PCR产物的‘终点’测定。

连接酶链式反应(LCR)或连接酶检测反应(LDR)利用热稳定性DNA连接酶连接两对互补的探针。只有在上游探针的3’末端和下游探针的5’末端(它们必须是磷酸化的)与靶DNA完全匹配时，所述DNA连接酶才能够连接所述上游和下游探针。这一过程的热循环，能够指数扩增探针加成物。至少嗜热栖热菌(Tth)DNA连接酶分辨缺口3’侧的错配的效率，高于分辨缺口的5’侧的错配的效率。通过在所述分辨碱基上游两个碱基的位置上掺入另外一个有意的错配或通用核苷(例如3-硝基吡咯脱氧核糖核苷酸)，可以提高Tth DNA连接酶的保真度。业已披露了具有进一步提高的保真度的突变型Tth DNA连接酶(例如K294R和K294P变体)。作为LCR或LDR的模板，可以使用PCR扩增的DNA目标。可以使用以不同方式(荧光)标记的等位基因特异性探针和/或具有略微不同的长度的等位基因特异性探针实施多次LCR/LDR(Khanna等，1999；Luo等，1996；Barany，1991)。

Backman等，(1991；EP0439182)业已披露了LCR的变化形式。所述变化形式包括使用至少一种改进的探针。变化形式包括GAP-LCR，其中，上游和下游探针之间的空位，是通过在没有互补于下游探针的5’末端碱基的dNTP的条件下，用一种DNA聚合酶延伸所述上游探针而填充的。GAP-LCR可以包括分别在所述引物对中的1个或2个上的一个1或2个空位。空位还可以通过使用其他的空位填充探针填充。

另一种探针改进包括引入突出的修饰末端(上游探针的3’末端或下游探针的5’末端)，如可以通过核糖核酸酶除去的核糖核苷酸尾，或可以通过特化DNA内切核酸酶除去的脱碱基位点。还可以将LCR/LDR探针改良成FRET形式。这样，就将PCR和LCR组合成一种两个步骤的热循环，通过FRET实时监测序列和等位基因特异性染料标记的寡核苷酸连接(DOL)(Chen等，1998)。

滚环扩增(RCA)包括可环化的探针或挂锁探针或开环探针或C-探针(具有至少26个核苷酸)，在它的任意一端结合有引物，在与靶DNA退火之后可以连接。与所披露的GAP-LCR方案类似，可以将所述挂锁探针修饰成‘GAP-挂锁探针’。将3’末端核苷酸用作分辨碱基，实现所述挂锁探针的等位基因特异性环化。然后使用在等温或热循环条件下启动滚动循环扩增的(第一)引物，扩增环化的挂锁探针。如果第二种引物互补于所添加的RCA的引物的话，就会产生高度分支的DNA和释放的DNA片段的混合物。可以在所述挂锁探针的主链环上掺入一个限制酶位点，以便将所述扩增子转化成能够在诸如凝胶电泳之后检测的单体。另外，可以用特殊的标记过的寡核苷酸标记修饰串联的DNA序列(Baner等，1998；Lizardi等，1998；Zhang等，1998；Nilsson等，1994；Zhang等，1998；Baner等，1998)。

有多种核苷酸序列多态性分析方法可供利用。这些方法是基于结构特异性内切核酸酶的活性的。

第一种内切核酸酶型核苷酸序列多态性检测分析方法是CFLP或切割酶(Cleavase)片段长度多态性。CFLP使用一种工程合成的热稳定性结构特异性内切核酸酶，这种酶被称为切割酶I(Third WaveTechnologies Inc.，Madison，WIS，USA)。向DNA分子中导入由切割酶I识别的二级结构形式，例如，通过PCR获得的扩增子，包括短时间的热变性，随后是快速冷却。很显然，在其他相同的DNA分子的序列组成上的微小差别，例如单一的或简单的核苷酸多态性，会产生不同的二级结构。因此，由所述变体DNA分子产生的切割酶I片段，构成了不同的和种类特异性DNA指纹。例如，CFLP-指纹分析业已被用于进行存在于生物学样品中的丙型肝炎病毒(HCVs)的基因分类(Sreevatsan等，1998)。还报导了CFLP比诸如SSCP或DDGE的方法更可靠，并且可再现性更高(De Francesco，1998；Brow等，1996；Brow等，1996)。使用噬菌体解离酶T4内切核酸酶VII的类似分析方法被称为EMD(酶促突变检测；(DelTito BJ等，1998))。CFLP和EMD都可用于荧光标记的靶DNA分子。然后通过凝胶或毛细管电泳，分离通过CFLP或EMD获得的片段。用于DNA异源双链体裂解分析的其他酶包括MutS，MutY和胸腺嘧啶糖基化酶(Taylor，1999)。存在用于分辨RNA/DNA和RNA/RNA异源双链体的一种类似类型的分析方法。对于RNA/RNA双链体来说，所述技术被称为NIRCA(非各向同性Rnase裂解分析)，它包括从包含在以前用于通过PCR扩增靶DNA的引物中的DNA依赖型RNA聚合酶启动子合成RNA(Goldrick等，1996；Grange等，1990；Myers等，1985)。Faudoa等业已披露了NIRCA的改进(Faudoa等，2000)。业已披露了另一种化学方法，该方法被称为CCM(错配的化学裂解)。对错配的胸腺嘧啶和胞嘧啶进行化学修饰，然后对dsDNA进行哌啶介导的裂解。业已将CCM改进成与荧光检测和异双链体的固相捕获兼容(Taylor，1999；Rowley等，1995；Rowley等，1995)。

第二种内切核酸酶型核苷酸多态性检测分析方法是Invader^TM分析(Third Wave Technologies，Inc.，Madison，Wis.)。在所述Invader^TM分析中，由一种热稳定性flap内切核酸酶(FEN)识别的DNA结构是通过与信号探针的至少一个碱基重叠的Invader探针形成的。所述信号探针的没有配对的单链部分，在FEN反应中被释放出来，并且可以通过各种方法检测，如在用荧光素标记的核苷酸捕获并且延伸释放的信号探针部分之后测定荧光(ELISA-方法)，质谱法，变性凝胶电泳等。据报导，Invader^TM分析能在含有比例为1/1000的突变体/野生型目标的混合物中检测突变型目标。为了分辨野生型和变体(突变体或多态性；相对野生型)目标，设计Invader和信号探针，以便裂解位点是所述变异位点。Invader^TM分析独立于PCR，并且同样适应于DNA和RNA目标(Lyamichev等，1999；Ryan等，1999；DeFrancesco，1998)。

Invader^TM分析的一种变化形式是Invader^TM Squared FRET分析。除了Invader和信号探针之外，需要一种FRET(荧光共振能量转移)探针。开始的FEN反应所释放的信号探针片段，随后被用作Invader探针，侵入在FRET探针分子内形成的发卡的基因片段。该方法会诱导第二次FEN反应，在该反应中，FRET探针中的荧光团与附近的FRET探针中的淬火染料分离，导致荧光的产生。这两次FEN反应，都是在等温条件下进行的(接近探针的解链温度)，这样能够进行线性信号放大。另外，FRET探针的环被去掉，以便所释放的起始FEN反应的信号探针片段侵入由第二个目标和互补于所述第二个目标的FRET探针所形成的部分dsDNA。任选对所述第二个目标进行修饰，以便3’末端的最后5个核苷酸是2′-O-甲基-RNA，并且它包括一个3’NH₂基团。任选添加互补于未裂解的主要信号探针的2′-O-甲基-RNA抑制寡核苷酸，以便对后者进行螯合。这两种操作都能抑制非特异性背景信号。Invader Squared分析方法可应用于检测DNA和RNA目标。不过，为了检测RNA目标，需要一种改进的内切核酸酶(Eis等，2001；Hall等，2000；Ledford等，2000；Eis等，2001；Eis等，2001)。Invader^TM分析的另一种变化形式是Invader^TM Squared MALDI-TOF MS分析。在该分析方法中，释放的信号探针片段不是通过释放荧光团的第二个FEN反应测定的，而是通过释放生物素标记的寡核苷酸的第二个FEN反应测定的，所述寡核苷酸是通过MALDI-TOF MS鉴定的(Griffin等，1999)。

Mein等提供了应用于PCR扩增子的Invader分析的用途的说明(Mein等，2000)。

MIDAS(突变鉴定DNA分析)是基于标记过的探针与靶DNA的退火。如果发生错配的话(通常靠近所述探针的中央)，所得到的探针片段在热动力学方面的稳定性低于完整长度探针的稳定性，并且与靶DNA解离。可以使用多种探针片段检测方法。该系统中还可以使用′TaqMan′-型探针(Bazar等，1999)。

为了分析RNA靶分子的核苷酸序列多态性，可以使用核糖酶(锤头，发卡，I型内含子，核糖核酸酶P或肝炎δ病毒型核糖酶)或脱氧核糖酶(′DNAzymes′)。另外，这一特征是所述酶在治疗或基因治疗中的可能的用途的基础(Cairns等，2000；James等，1995)。

双脱氧指纹分析(ddF)是Sanger双脱氧测序和SSCP的杂交形式。三个反应是用一种标记过的ddNTP和一种引物完成的，得到了一类嵌套5’共同末端的DNA片段。对所述片段进行变性，并且在非变性凝胶上分析(即SSCP)。一条带的消失或一条新带的出现(都是相对参考靶DNA的指纹而言)，表明了相应突变的存在。在双向ddF(Bi-ddF)中，在Sanger反应中使用有义和反义引物。Bi-ddF可以筛选靶DNA的较大区域的突变。对于包括富含GC的区域的DNA目标来说，通过与变性凝胶电泳组合，可以加强ddF或Bi-ddF。后一种技术被称为变性ddF或dnF.(Liu等，1998；Liu等，1996；Langemeier等，1994；Sarkar等，1992)。

DNA小量测序是一种基于未标记的引物与靶DNA分子的退火的方法，并且用一种标记过的ddNTP延伸所述引物。DNA小量测序可用于有效筛选核苷酸序列的多态性，如果所述引物的3’末端位于紧靠所述多态性靶核苷酸的上游的话。整合的ddNTPs的性质可以通过电泳、MALDI-TOF检测，或者通过阵列方法检测，其中，将靶DNA(s)或未标记过的引物固定在固体支持物上。多重DNA小量测序是可行的(Bray等，2001；Pastinen等，1997；Pastinen等，1996)。小量测序可以与通过电极或压电晶体进行的电子检测组合使用(Patosky等，2001)。还可以将小量测序改良成适合FRET方案。用诸如供体染料的标记物对要延伸的引物进行标记，并且用诸如受体染料的标记物对整合的核苷酸进行标记。然后测定所述染料的荧光强度(Chen等，1997)。小量测序的另一种变化形式是GBA(Genetic bit analysis)。首先，通过PCR扩增靶DNA，使用常规引物和硫代磷酸酯修饰的引物或其他修饰过的对5′-3′dsDNA-特异性外切核酸酶有抗性的修饰过的引物。然后通过5′-3′dsDNA-特异性外切核酸酶将dsDNA扩增子转化成ssDNA。然后通过固定的寡核苷酸捕捉所得到的ssDNA，所述寡核苷酸的3’末端核苷酸靠近所述多态性位点，并且通过一个核苷酸对它进行延伸(Nikiforov等，1994)。小量测序还可以用RNA作模板，并且使用逆转录酶(Pastinen等，2000)。

碱基切除序列扫描(BESS)是一种涉及将dUTP掺入扩增的靶DNA分子上的技术。然后在BESS-T^TM-扫描反应(EpicentreTechnologies，Madison，WI，USA)中，用包括尿嘧啶-N-糖基化酶(UNG)和大肠杆菌内切核酸酶IV的酶混合物消化所述靶分子。这两种酶的作用，导致了所述DNA在dUTP整合位点的裂解。在BESS-G-Tracker^TM反应中(Epicentre Technologies，Madison，WI，USA)，对脱氧鸟嘌呤进行修饰，然后酶促切除修饰过的脱氧鸟嘌呤。并且裂解所述DNA。通过凝胶电泳分离这两种反应产物，得到了类似于通过双脱氧测序(参见下文)获得的T和G梯的结果。与以相同方式分析的参考DNA进行比较，可以鉴定核苷酸序列的多态性(Hawkins等，1999)。

仍然被认为是确定核苷酸序列多态性的‘金标准’是直接DNA测序。DNA测序的方法之一是由Maxam和Gilbert设计的方法(Maxam等，1977)。最常见的并且被广泛采用的DNA测序方法是基于Sanger反应或双脱氧核苷酸链终止反应的(Sanger等，1977)。可以对测序引物进行标记，以便检测终止的链，或可以对延伸的产物进行内部标记。另一种DNA测序方法是热测序，在这里，由于在两个核苷酸-三磷酸之间形成磷酸二酯而释放焦磷酸(PPi)。通过二级分析或PPi中的标记过的磷酸(γ-Pi或β-Pi)测定释放的PPi，其中，四种dNTPs中的每一种具有一个不同的标记(例如，参见Williams 2000-WO00/36152；(Ronaghi等，1998))。

循环测序是基于Sanger反应的，但是采用了热稳定性聚合酶。与PCR不同，在循环测序中使用一种引物。由于靶DNA的线性扩增，与典型的双脱氧测序相比，循环测序所需要的模板DNA要少的多。另外，消除了对制备单链测序模板的需要。可以分别用不同的荧光标记(‘染料终止子’)对每一种ddNTPs进行标记，这样可以在一个凝胶泳道上分析四种反应/染料。另外，可以将所述标记物结合在所述引物(′染料引物′)上。PCR(或RT-PCR)和测序还可以组合成一个反应，被称为CAS(组合的扩增和测序)，或它的一种改进形式被称为CLIp^TM，该方法是在Visible Genetics Clipper测序仪上进行的，该方法使用MicroCel^TM聚丙烯酰胺凝胶盒。CLIP^TM测序能够用一个试管同时从PCR扩增子的两个方向确定核苷酸序列，使用用不同染料(Cy5和Cy5.5)标记过的两种测序引物(Yager等，1999；Ruano等，1991)。

在不久的将来，纳米孔测序也可能成为现实(Meller等，2000)。

其他DNA测序方法包括分子共振测序，该方法使用与Fourier转化离子回旋共振(FTICR)质谱分析组合的电喷离子化(ESI)(Smith等，1994)，而对于较小的DNA片段来说，使用MALDI-TOF MS(参见上文)。另外，业已披露了通过组合的DNA特异性裂解，以及随后对片段进行质谱分析进行的诊断测序(例如，参见Stanssens和Zabeau2000-WO00/66771)。

确定核苷酸序列变异的另一种方法包括双脱氧核苷酸测序(Sanger反应)，其中，通过修饰过的dNTPs(如α-硫代dNTPs)取代规则的dNTPs，它限制了对3’末端双脱氧核苷酸的延伸产物的3’外切核酸酶敏感性。然后纯化所述双脱氧末端的ssDNAs(例如，通过用生物素化的测序引物固定它们)，并且与已知参考DNA杂交。然后添加校正聚合酶，一级测序反应的未标记过的ddNTP和其他三种(以不同方式)标记过的ddNTPs。对于3’错配来说，所述聚合酶能将未标记过的ddNTP换成正确的错配标记过的ddNTP。另外，所述二级反应包括在一级反应中所使用的校正聚合酶和相同的ddNTP，但是进行过改进，以便它能抗3’外切核酸酶活性。在完全匹配的一级延伸产物(相对参考DNA而言)中，3’末端ddNTP被修饰过的ddNTP所取代，而在3’错配一级延伸产物中，3’末端ddNTP被去掉，而不是被修饰过的ddNTP取代。随后除去修饰过的ddNTP，并且在存在正常dNTPs的条件下进一步延伸。后一种过程仅仅在原始3’错配中发生。该方法的另一种变体包括向所述二级反应中添加正常的dNTPs和校正聚合酶。具有紧靠所述ddNTP的5’末端的错配(相对参考DNA而言)的一级测序产物不会被延伸(3’末端ddNTP被去掉，但是靠近所述ddNTP的5’末端的修饰过的dNTP能抗3’外切核酸酶活性)。在另一种替代方案中，进行Sanger-型反应，其中，用抗3’外切核酸酶活性修饰过的dNTP取代ddNTP。用3’外切核酸酶消化所得到的产物，纯化所述单链，并且与已知参考DNA杂交。如果修饰过的dNTP与参考DNA匹配的话，还会发生所述单链的聚合酶介导的延伸。在所提到过的所有四种变化形式中，在分离最终反应产物之后的带形，表明了核苷酸序列多态性的位置和性质(Dahlhauser 2000-US 6150105)。

另一种DNA测序方法被称为SBH或测序预杂交，它采用一系列所有可能的n-核苷酸寡聚体(n-聚体)鉴定包含在未知DNA样品中的n-聚体(Drmanac等，1993)。所述高密度寡核苷酸阵列还可用于检测DNA序列多态性，所述阵列最终成为VDA(变体检测阵列)(Sapolsky等，1999；Hacia等，1996)。显微镜载玻片可以被光学纤维取代，用于作为寡核苷酸的固体支持物(Healey等，1997)。上述SBH的一种变化形式是基于探针与已知信息区或信息标记与要测序的靶DNA片段的溶液杂交。所述信号标记可以是DNA条形码(最终包括修饰过的碱基)，分子条形码或纳米颗粒条形码，并且构成了鉴定和表征杂交的靶DNA的基础(Drmanac 2000-WO/0056937)。

所述高密度寡核苷酸阵列或DNA芯片消除了对设计一系列能在相同条件下与一系列多态性核苷酸序列特异性杂交的寡核苷酸的需要。通过仔细调整寡核苷酸探针中错配核苷酸的长度、极性和位置，将后一种方法应用于常规反向印迹分子中(Saiki等，1989)。不过，用于核苷酸序列多态性基因分类和检测的常规反向印迹杂交分析，业已成功地商业化，例如，用于LiPA(Line Probe Assay)方法(Innogenetics，Ghent，Belgium)(Stuyver等，1997；Stuyver等，1996)。

另外，将Acrydite^TM修饰过的寡核苷酸探针共聚化到聚丙烯酰胺凝胶中。使单链靶DNA目标电泳通过所述凝胶，并且取决于电泳条件(温度和/或变性剂)。由固定在捕捉凝胶层中的寡核苷酸捕获。该方法还可用于检测核苷酸序列多态性(Kenney等，1998)。

用于检测核苷酸序列多态性的其他杂交型方法包括液相夹心杂交分析，其中，通过靶特异性固定化捕获探针捕获靶DNA，并且通过扩增引物或接头探针检测。业已披露了两种信号发生方法。第一种方法使用能够与所述接头探针的、没有与靶DNA结合的瓣(flap)杂交的分支寡核苷酸。然后，让标记过的探针与所述扩增探针的分支杂交，并且对结合标记的数量进行定量。在第二种方法中，让(部分)双链扩增探针与所述接头探针的没有与靶DNA结合的瓣杂交。双链(部分的)所述扩增探针包括由DNA-依赖型RNA聚合酶识别的启动子。所产生的信号是由从扩增探针新转录的RNA形成的。对所述信号的量进行定量(例如，参见Urdea 1991-WO91/10746)。

核苷酸序列多态性还可以通过DASH(动态基因等位特异性杂交)分析检测，该方法基于解链曲线分析和在加热情况下的荧光测定。这种分析可以在PCR产物上进行，例如，所述产物是生物素标记过的，并且固定在微量平板孔中。解链曲线是通过测定ds-DNA-特异性嵌入染料的荧光确定的(Prince等，2001；Howell等，1999；Prince等，2001)。荧光标记的探针与靶DNA的杂交还可以通过荧光极化光谱学测定(Murakami等，1991)。

″FRET″或“荧光共振能量转移”包括两种染料，供体染料和受体染料，这两种染料通常是不同的。在这种场合下，如果所述受体本身是能发出荧光的话，FRET是通过受体染料的荧光检测的(′敏化荧光′)，或者如果所述受体是淬火性非荧光染料的话，是通过供体染料荧光的淬火检测的。如果供体染料长时间释放荧光的话，FRET可能推迟。这种方法被称为″TR-FRET″或″时间分离FRET″。供体和受体染料也可以是相同的，在这种情况下，FRET是通过所得到的荧光去极化检测的(Runnels等，1995)。染料还可以是共价偶联的，以便形成串联的荧光染料或串联染料或串联偶联物。例如，一种供体染料能够同时激发两种受体染料，导致多种波长的光线的发射。为了FRET能够工作，供体发射波长曲线应当与受体吸收波长曲线至少部分重叠。

常用的荧光染料包括BODIPY FL，Cy3，Cy3.5，Cy5，Cy5.5，EDANS，FAM，荧光素，HEX，IAEDANS，JOE，Oregon Green，(LC)Red640，(LC)Red705，ROX，TAMRA，TET，四甲基罗丹明和Texas Red。

常见的淬火染料包括BHQ-1^TM，BHQ-2^TM，BHQ-3^TM，DABCYL，诸如金纳米颗粒的金属团(Dubertret等，2001)和QSy7^TM。常用的供体/受体对包括荧光素/四甲基罗丹明，荧光素/荧光素，荧光素/QSY7，荧光素/LC RED640，荧光素/LC Red705 IAEDANS/荧光素，EDANS/DABCYL，BODIPY FL/BODIPY FL，FAM/BHQ-1，TET/BHQ-1，JOE/BHQ-1，HEX/BHQ-1，Oregon Green/BHQ-1，TAMRA/BHQ-2，ROX/BHQ-2，Cy3/BHQ-2，Cy3.5/BHQ-2，Texas Red/BHQ-2，TexasRed/BHQ-2，Cy5/BHQ-3和Cy5.5/BHQ-3。

本领域技术人员可以理解的是，可以对上文所披露的核苷酸序列和核苷酸多态性检测方法进行多种改变和组合。这些改变和组合在此引入本发明中。

基于上文对用于检测本发明核苷酸序列和多态性的方法的说明，下面的其他实施方案包括在本发明范围内。

可以对上述本发明的寡核苷酸进行改良，以便可将其用于上述任意一种方法中，用于检测本发明HCV核苷酸序列，或它的至少一种多态性或基因型特异性核苷酸。

因此，在本发明的另一种实施方案中，本发明的寡核苷酸还包括末端延伸和/或发卡结构，其中，所述延伸和/或发卡结构被掺入所述寡核苷酸的任一末端或两个末端。例如，所述末端延伸可用于与另一种核酸分子特异性杂交(例如，发挥捕获探针的作用)和/或用于促进所述寡核苷酸与所述固体支持物的连接，和/或用于通过酶，核糖酶或DNA酶修饰所述具尾寡核苷酸。

在本发明的另一种实施方案中，本发明的寡核苷酸包括在上述挂锁探针内或包含在发卡结构上。

在另一种实施方案中，本发明的寡核苷酸具有能够检测和/或捕获所述寡核苷酸的修饰。所述寡核苷酸的检测和/或捕获还能够检测和/或捕获与它杂交的靶核酸。所述寡核苷酸和所述靶核酸之间的相互作用可以通过交联稳定，所述交联是通过向所述寡核苷酸和/或所述靶核酸中导入交联修饰而产生的。

在另一种实施方案中，本发明的寡核苷酸包括3’末端错配核苷酸，并且任选包括3’近端错配核苷酸。所述寡核苷酸特别适用于实施多态性特异性PCR和LCR(或GAP-LCR)。

本发明还包括含有至少一种上文所披露的寡核苷酸的组合物。

技术人员可以理解的是，可以将上述任意一种用于检测核苷酸序列和核苷酸序列的多态性，如HCV基因型特异性核苷酸的方法用作检测HCV病毒在生物学样品中存在的方法，和/或用于检测存在于生物学样品中的HCV病毒的基因型，即基因型分析。

本发明的一个方面涉及用于检测HCV病毒在生物学样品中的存在的方法和/或用于检测存在于生物学样品中的HCV病毒的基因型的方法，所述方法包括本发明的HCV多核酸或它的片段的存在的步骤。

例如，所述方法是基于扩增反应，杂交反应，反向杂交反应或测序反应的。在上述任意一种反应中，可以使用本发明的寡核苷酸。所述方法还可以包括将本发明的寡核苷酸用于检测本发明的HCV多核酸或它的片段和/或用于确定存在于获得所述HCV多核酸或片段的生物学样品中的HCV病毒的基因型。

包括所述方法的一种具体实施方案，包括以下步骤：

(i)从被怀疑含有本发明HCV多核酸或它的片段的生物学样品中获得靶HCV核酸；

(ii)获得步骤(i)中的靶HCV多核酸的核酸序列；

(iii)从在步骤(ii)中获得的核酸序列推断本发明HCV多核酸或它的片段的存在，并且由此推断HCV在所述生物学样品中的存在和/或存在于所述生物学样品中的HCV病毒的基因型。

包括所述方法的另一种具体实施方案包括：

(i)获得存在于生物学样品中的靶HCV的多核酸和/或获得它的核苷酸序列，其中，所述生物学样品被怀疑含有具有本发明基因型的HCV病毒；

(ii)如果合适的话，对在步骤(i)中获得的多核酸进行部分或完全变性，或酶促修饰；

(iii)如果合适的话，对在步骤(ii)中获得的变性的多核酸进行复性，优选在存在本发明的至少一种寡核苷酸的条件下进行，并且，如果必要的话，包括酶促修饰，包括延伸所述寡核苷酸的步骤；

(iv)如果合适的话，检测通过分析在步骤(ii)中获得的部分或完全变性的多核酸的分析所获得的分辨信号，和/或在步骤(iii)中形成的杂交体，和/或在步骤(ii)和/或(iii)中获得的酶促修饰；

(v)通过在步骤(i)中获得的分辨信号和/或通过在步骤(i)中获得的核苷酸信号，推断所述HCV病毒在所述生物学样品中的存在和/或存在于所述生物学样品中的所述HCV病毒的基因型。

在另一种具体实施方案中，所述方法包括：

(i)从被怀疑含有本发明的HCV多核酸或它的片段的生物学样品中获得靶HCV多核酸；

(ii)让步骤(i)中的靶HCV多核酸与能够分辨存在于所述靶HCV核酸中的至少一个基因型特异性核苷酸的寡核苷酸接触，并且，所述接触产生了一种分辨信号；

(iii)根据在步骤(ii)中获得的分辨信号，推断本发明HCV多核酸或它的片段的存在，并通过它推断HCV病毒在所述生物学样品中的存在和/或存在于所述生物学样品中的所述HCV的基因型。

在后一种方法中，在步骤(ii)中的所述分辨可以是基于杂交的，并且在步骤(iii)中的所述分辨信号是杂交信号。

“至少一个基因型特异性核苷酸/氨基酸”表示本发明的新的HCV类型的核酸/氨基酸序列所特有的单个核苷酸/氨基酸或一组核苷酸/氨基酸。所述一组的特有核苷酸/氨基酸可以构成本发明新的HCV类型的核酸/氨基酸序列上的连续序列或者分散在该序列的有限区域内。一般，包括所述组的特有核苷酸/氨基酸的有限区域限于本文所定义的寡核苷酸/寡肽的大小。

为本发明的新的HCV类型所特有的核酸/氨基酸序列被解释为“独有的”，即不存在于任何其他已知的HCV类型。该术语表示单个核苷酸/氨基酸，以及一系列核苷酸/氨基酸，正如上文所描述的。包括所述单个核苷酸/氨基酸或一系列这样的核苷酸/氨基酸的区域被认为是本发明的新的HCV类型所特有或独有的区域。

“能够分辨多核酸中的至少一个基因型特异性核苷酸的寡核苷酸”表示一种寡核苷酸在接触包括所述至少一个基因型特异性核苷酸的多核酸时能产生一种信号，但是在接触不含有所述至少一个基因型特异性核苷酸的多核酸时不能产生信号。所述信号又被称为“分辨信号”，该信号可以是能够通过用所述寡核苷酸在上述能够检测核苷酸序列和核苷酸序列多态性的任意一种分析方法中获得的任何信号。例如，所述信号包括荧光信号，(化学)发光信号，发射性信号，光信号，杂交信号，质谱信号，光谱信号，层析信号，电信号，电子信号，电泳信号，实时PCR信号，PCR信号，LCR信号，CFLP-分析信号和Invader-分析信号。

“让一种寡核苷酸与(多)核酸接触”一般表示所述寡核苷酸与所述(多)核酸退火或所述寡核苷酸与所述(多)核酸杂交。“让一种寡核苷酸与(多)核酸接触”不排除，并且可能还包括所述寡核苷酸的酶促修饰，其中，所述修饰可能发生在所述寡核苷酸的末端和/或发生在所述寡核苷酸的核苷酸序列内部。例如，寡核苷酸的酶促修饰的例子，提供在本文所披露的能够检测核苷酸序列和核苷酸序列多态性的分析方法中。

在本发明的另一种实施方案中，所述方法还包括在必要时将所获得的核酸序列与数据库中的一系列HCV核酸序列进行比对和/或比较。

“数据库”在本文中表示核酸或氨基酸序列，更确切的讲HCV核酸或氨基酸序列的总汇。数据库被理解成包括至少一种核酸或至少一种氨基酸序列。数据库可以记录在多种载体上。所述载体包括计算机可读的载体。

序列比较，例如，确定序列之间的百分同一性，和序列比对可以用数学程序进行。序列之间的百分同一性的确定取决于以前的序列比对。序列之间的百分同一性(和相似性)可以通过使用诸如GAP程序的程序进行(GCG的一部分，Genetics Computer Group，software；现在可以通过以下网站获得http：//www.accelrys.com)。例如，序列之间的比对可以用C1ustalW程序完成(例如，GCG软件的一部分或VNTI软件的一部分，由InforMax Inc.提供)。比对通常是有空位的比对，即可以在序列上引入空位，以便优化比对。尚未开发出有空位的比对的详细统计学理论，并且在特定取代矩阵中使用的最佳空位值是通过经验确定的。所述程序可以用氨基酸取代矩阵检测异化序列之间的相似性(Altschul，1991)。还可将取代矩阵应用于DNA序列比较(States等，1991)。本领域技术人员可以理解的是，比对相似氨基酸残基的效率还决定了序列之间的百分同一性。一种常用的取代矩阵是BLOSUM62矩阵。对于特别长的和弱的比对来说，可以使用BLOSUM45矩阵。为了比较短的序列来说，可以使用旧的PAM(百分接受突变)-矩阵(例如PAM30，PAM70)。通过以较大的数字使用PAM取代矩阵(例如，通过使用PAM100取代PAM40)，可以获得具有较大进化距离的序列的良好比对。BLOSUM矩阵后面的数字(例如BLOSUM62)表示用于构建所述矩阵的模块的最低百分同一性；较大的数字表示较小的距离。可以用感兴趣的核酸或氨基酸序列作为‘查询序列’检索数据库。用于检索数据库的程序通常基于BLAST软件(Altschul等，1990)，并且包括：1)BLASTN，用于在核酸序列数据库中检索核酸查询序列；2)BLASTP，用于在氨基酸序列数据库中检索氨基酸查询序列；3)TBLASTN，用于在翻译的核酸序列数据库(以六种可能的读框翻译)中检索氨基酸查询序列；3)BLASTX，用于在氨基酸序列数据库中检索翻译的核酸查询序列(以六种可能的读框翻译)；和4)TBLASTX，用于在翻译的核酸序列(以六种可能的读框翻译)的数据库中检索翻译的核酸查询序列(以六种可能的读框翻译)。对于短的查询序列来说，预期阈值优选被设定的较高，例如，对于核苷酸序列来说，设定为1000，而对于氨基酸序列来说，设定为20000。

本发明的另一方面涉及用于检测HCV病毒在生物学样品中的存在和/或用于确定存在于生物学样品中的HCV病毒的基因型的诊断试剂盒，所述试剂盒包括至少一种用于检测本发明HCV多核酸存在的方式。

例如，所述诊断试剂盒包括本发明的寡核苷酸。所述寡核苷酸可以与固体支持物连接。另外，将多种这样的寡核苷酸连接或偶联在所述固体支持物的特定位点上，例如，以平行线形式连接。典型的固体支持物是膜。

一种具体的实施方案包括所述诊断试剂盒，该试剂盒包括：

(i)用于从被怀疑含有本发明的HCV多核酸或它的片段的生物学样品中获得靶HCV多核酸的核酸序列的工具；

(ii)用于根据从所述靶HCV多核酸获得的核酸序列推断本发明HCV多核酸所特有的多核酸的存在，或至少一个基因型特异性核苷酸在其中的存在，并由此推断HCV在所述生物学样品中的存在和/或所述HCV的基因型的工具。

在另一种具体实施方案中，所述诊断试剂盒包括能够分辨所述HCV多核酸上的至少一个基因型特异性核苷酸的寡核苷酸。

在另一种实施方案中，所述诊断试剂盒还包括用于检测通过接触所述HCV多核酸或所述寡核苷酸获得的分辨信号的工具。

另外，所述诊断试剂盒是这样的，其中，所述寡核苷酸连接或固定在一种固体支持物上。

另一种具体实施方案包括所述诊断试剂盒，该试剂盒包括：

(i)一种用于获得存在于所述生物学样品中的靶HCV多核酸和/或获得它的核苷酸序列的工具；

(ii)如果合适的话，至少一个适合扩增本发明的靶HCV多核酸的寡核苷酸对；

(iii)如果合适的话，用于使核酸变性的工具；

(iv)如果合适的话，至少一种本发明的寡核苷酸；

(v)如果合适的话，一种能够修饰双链或单链核酸分子的酶；

(vi)如果合适的话，一种杂交缓冲液，或生产所述缓冲液所需要的成分；

(vii)如果合适的话，洗涤溶液，或生产所述溶液所需要的成分；

(viii)如果合适的话，用于检测部分或完全变性的核酸的工具和/或用于检测在前面的杂交中所产生的杂交体的工具和/或用于检测核酸的酶促修饰的工具，其中，所述工具是产生分辨信号；

(ix)如果合适的话，用于将寡核苷酸连接在固体支持物已知位点上的方式；

(x)用于根据在步骤(viii)中检测的分辨信号和/或分析在步骤(i)中获得的核苷酸序列，推断本发明HCV多核酸所特有的多核酸的存在，或其中的至少一个基因型特异性核苷酸的存在，以及由此推断所述HCV病毒在所述生物学样品中的存在和/或存在于所述生物学样品中的所述HCV病毒的基因型的方式。

“用于根据核酸序列推断一种基因型特异性核苷酸的存在的方式”表示在所述核酸序列中定位和鉴定所述基因特异性核苷酸的任何技术或方法。所述工具可以包括手工进行的方法，或计算机控制进行的方法，或手工和/或计算机控制进行的方法。所述工具可以包括将获得的核酸序列与数据库中所包括的一系列核酸序列进行比对和/或比较。另外，所述工具可以包括以报告形式提供的所述方法的结果，其中，所述报告可以是纸张形式的，电子形式的或记录在计算机可读的载体或介质上。另外，所述方式可以包括检索(核酸和/或氨基酸)序列数据库和/或产生(核酸和/或氨基酸)序列比对，其结果可以包含或不包含在所述报告中。另外，所述工具可以包括一种用于检测分辨信号的装置或说明如何解释检测到的分辨信号或说明特定的分辨信号是否会出现的试剂盒插页或试剂盒图表，例如，所述信号出现在携带有多种核苷酸的固体载体上，所述核苷酸可以排列成斑，线，点等，并且可以解释出现在特定位置上的所述分辨信号。

涉及上述本发明任意一种方法的其他实施方案的特征还在于，所述方法是基于核苷酸序列测定的。

涉及上述本发明任意一种方法的其他实施方案的特征还在于，所述方法是基于杂交分析的。

涉及上述本发明任意一种方法的其他实施方案的特征还在于，所述方法是基于反向杂交分析的。

涉及上述本发明任意一种诊断试剂盒的其他实施方案的特征还在于，所述诊断试剂盒是基于核酸序列测定的。

涉及上述本发明任意一种诊断试剂盒的其他实施方案的特征还在于，所述诊断试剂盒是基于杂交分析的。

涉及上述本发明任意一种诊断试剂盒的其他实施方案的特征还在于，所述诊断试剂盒是基于反向杂交分析的。

涉及上述本发明任意一种诊断试剂盒的其他实施方案的特征还在于，所述诊断试剂盒是基于线性探针分析的。

本发明还涉及用于检测存在于生物学样品中的HCV核酸的方法，包括：

(i)任选提取样品核酸，

(ii)用至少一种用本文所定义的引物扩增所述核酸；

(iii)检测所扩增的核酸。

本发明还涉及用于检测存在于生物学样品中的HCV的方法，包括：

(i)任选提取样品核酸，

(ii)任选用至少一种用本文所定义的引物，或用通用HCV引物扩增所述核酸，

(iii)任选在变性条件下，在适当条件下，让所述生物学样品的核酸与一种或多种本文所定义的探针杂交，所述探针优选连接在固体基质上，

(iv)任选在合适条件下洗涤，

(v)检测所形成的杂交体。

本发明具体涉及用于检测存在于生物学样品中的HCV核酸的方法，包括：

(i)任选提取样品核酸，

(ii)通过测序反应确定本发明HCV型核酸序列的存在。

本发明还涉及用于检测一种或多种HCV基因型在生物学样品中存在的方法，包括：

(i)任选提取样品核酸，

(ii)用至少一种本文所定义的引物特异性地扩增所述核酸，

(iii)检测所述扩增的核酸，

(iv)根据所观察到的扩增产物的形式，推断一种或多种HCV基因型的存在。

本发明还涉及用于检测一种或多种HCV基因型在生物学样品中的存在的方法，包括：

(i)任选提取样品核酸，

(ii)任选用至少一种本文所定义的引物或用通用HCV引物扩增所述核酸，

(iv)任选在合适条件下洗涤，

(v)检测所形成的杂交体，

(vi)根据所观察到的杂交形式，推断一种或多种HCV基因型的存在。

本发明还涉及一种本文所定义的方法，其中，所述探针还具有本文所定义的特征。

在上述本发明的任意一种方法中，所述生物学样品被怀疑或有可能含有HCV或它的核酸。

本发明还涉及一种本文所定义的方法，其中，所述核酸是在扩增期间或扩增之后标记的。该技术优选可以在5’非编码区(NCR)，核心区，E1区和/或NS5B区进行。

术语“核酸”还可以被称为分析物链，并且相当于单链或双链核酸分子。该分析物链优选是正或负链RNA，cDNA或扩增的cDNA。

术语“通用HCV引物”表示互补于大多数或所有HCV基因型的HCV基因组中保守的任何区域的寡核苷酸。

短语“合适的杂交和洗涤条件”被理解成严格条件，并且为本领域所普遍公知(例如Sambrook等，1989)。不过，根据杂交溶液(SSC，SSPE，等)，所述探针应当在它们的合适温度下杂交，以便获得足够的特异性。为了使杂交能够发生，通常对所述核酸分子进行热、化学(例如氢氧化钠)或电化学变性，以便将双链解链成两条单链和/或从单链核酸上除去发卡或其他二级结构。杂交的严格性受诸如温度、盐浓度和杂交缓冲液组成的影响。杂交的高严格性条件包括高温和/或低盐浓度(盐包括氯化钠和柠檬酸钠)和/或在杂交缓冲液中包括甲酰胺和/或降低杂交缓冲液中诸如SDS(洗涤剂)的化合物的浓度和/或从杂交缓冲液中排除诸如硫酸葡聚糖或聚乙二醇(促进分子聚合)的化合物。例如，常规杂交条件披露于Sambrook等(Sambrook等，1989)的著作中，不过，技术人员可以理解的是，可以根据已知的或预期的同源性和/或核酸序列的长度，设计多种不同的杂交条件。一般，为了能在没有甲酰胺的条件下与DNA探针杂交，推荐温度为68℃，而对于在使用50％(v/v)甲酰胺的条件下进行的杂交来说，推荐温度为42℃。对于与寡核苷酸的杂交来说，最佳条件(甲酰胺浓度和/或温度)取决于探针的长度和碱基组成，并且必须分别确定。一般，长度大约为10-50个碱基的寡核苷酸的最佳杂交，是在比特定双链体的解链温度低大约5℃的条件下进行的。在低于所述最佳条件的温度下培养，可能使得错配的序列杂交，并因此产生较低的特异性。在有甲酰胺(50％v/v)的条件下使用RNA寡核苷酸时，为了检测靶RNA，推荐使用68℃的杂交温度，为了检测靶DNA，推荐使用50℃的温度。另外，可以使用高SDS杂交溶液(Church等，1984)。另外，可以通过交联部分在核酸探针上的存在确保杂交的特异性(例如Huan等，2000-WO00/14281)。所述交联部分能够将所述核酸探针与靶核苷酸序列共价连接在一起，因此，可以使用严格性洗涤条件。所述交联的核酸探针，还可以包括适合检测/定量与所述目标杂交的探针的另一种标记。

术语“标记过的”表示标记过的核酸的使用，它可以包括使用在扩增的聚合酶步骤中掺入的标记过的核苷酸，如Saiki等(1988)或Bej等(1990)所披露的核苷酸，或标记过的引物，或采用本领域技术人员所公知的任何其他方法。

本发明方法包括让本文所定义的任意一种探针与下列因子之一接触的步骤：

-生物学样品，其中，所述核酸可用于杂交，

-或包含在所述生物学样品中的纯化的核酸，

-源于所述纯化核酸的单一拷贝，

-或源于所述纯化核酸的扩增拷贝，所述因子或所述探针连接在固体基质上。

短语“根据观察到的杂交形式了解一种或多种HCV基因型的存在”表示通过分析一组寡核苷酸探针的结合形式，确定HCV基因组在所述样品中的存在。单个探针可以提供有关HCV基因组在样品中的存在或缺乏的有用信息。另一方面，HCV基因组的变异在本质上是分散的，因此，很难用任何一种探针独特地鉴定特定HCV基因型。相反，可以根据对不同的HCV基因组的(不同的)片段特异的一组寡核苷酸探针的结合形式，了解一种HCV基因型的身份。根据所述寡核苷酸探针的选择，在使用特定组合的探针时，每一种已知的HCV基因型相应于一种特定杂交形式。根据寡核苷酸探针的选择，每一种HCV基因型还能够有别于用相同的引物扩增的任何其他HCV基因型。通过比较含有一种或多种未知HCV序列的样品的阳性杂交探针、所产生的形式和预期的杂交形式，人们可以清楚地了解存在于所述样品中的HCV基因型。

因此，本发明涉及一种本文所定义的方法，其中，一种或多种杂交探针是选自SEQ ID NOs：1，2，4，6，8，10，12，14，或36-49中任意一种的寡核苷酸片段或本文所定义的它的序列变体。

为了分辨不同的扩增的靶HCV基因组，将扩增的HCV多核酸与一系列靶定位于所述HCV多核酸上的HCV基因型区域(独特区)的序列特异性DNA杂交。所述探针的大部分靶定HCV基因型的大部分类型或亚型特异区，不过，某些探针可能导致与一种以上的HCV基因型杂交。根据杂交溶液(SSC，SSPE等)，所述探针应当在它们的合适温度下严格性地杂交，以便获得足够的特异性。不过，通过对所述DNA探针进行小的修饰，包括在它的末端(3′或5′末端)添加或缺失一个或若干个核苷酸，或用其他核苷酸(包括修饰过的核苷酸或肌苷)取代某些非必需核苷酸(即不是分辨不同类型所必需的核苷酸)，能使得所述探针或它的变体，在相同杂交条件(相同温度和相同杂交溶液)下特异性杂交。另外，改变所使用的探针量(浓度)可能有利于获得特异性更高的杂交结果。应当指出的是，在本发明中，相同长度的探针，无论其GC含量如何，在大致相同的温度下，在TMACI溶液，即四烷基铵盐溶液中都能特异性地杂交(Jacobs等，1988)。本发明的用于检测由寡核苷酸探针和样品中的核酸序列形成的杂交体的合适的分析方法，包括本领域已知的任何分析方法，如常规斑点印迹方法，夹心杂交或反向杂交，例如，所述检测可以使用斑点印迹方法进行，将业已标记过的扩增样品结合在一种膜上，在合适的杂交和洗涤条件下在所述膜上结合至少一种标记过的探针，并且监测结合探针的存在。一种替代的和优选的方法是“反向”斑点印迹方法，其中，扩增的序列包括一种标记。在该方法中，将未标记过的寡核苷酸探针结合在一种固体支持物上，并且在适当严格性的条件下接触标记过的样品，并且随后接触洗涤条件。可以理解的是，还可以使用取决于样品的核酸和本发明的寡核苷酸探针之间的杂交体形成的任何其他分析方法。

根据一种优选实施方案，检测包含在生物学样品中的一种或多种HCV基因型的方法，包括让源于所述生物学样品的扩增HCV核酸与业已以平行线形式固定在固体支持物上的寡核苷酸探针接触的步骤。

根据这种优选方法，所述探针是以线性探针分析(LiPA)方式固定的。这是一种使用膜条带的反向杂交方法(Saiki等，1988)，在所述膜条带上可以以平行线形式方便地涂敷若干种寡核苷酸探针(包括负或阳性对照寡核苷酸)。LiPA是一种非常快速而且对用户友善的杂交测试。可以在开始杂交之后4小时读取结果。在通常将非同位素标记整合到扩增产物中的扩增和碱基变性之后，让扩增产物与所述膜上的探针接触，并且进行杂交约1-1.5小时，检测杂交的多核酸。根据所产生的杂交形式，可以通过肉眼，但是优选使用专用软件分析HCV类型。所述LiPA方法与商业化扫描装置是完全兼容的，因此，能够非常可靠地自动解读所述结果。上述所有优点都使得LiPA方法能够以常规参数用于HCV检测。LiPA方法应当特别适用于检测不同HCV基因型的存在。

因此，本发明还涉及固体支持物，优选膜条带，在所述支持物的表面上携带有一种或多种本文所定义的探针，该探针以平行线形式与所述支持物偶联。

本发明还涉及用于检测和鉴定不同于已知HCV基因组的新型HCV基因型的方法，包括以下步骤：

-按照本文所定义的方法确定存在于生物学样品中的核苷酸属于哪一种HCV基因型，

-在观察到样品不能产生与诸如表3所限定的模式兼容的杂交模式的场合下，对HCV基因组序列的相当于要测定的新的HCV基因型的异常杂交探针的部分进行测序。

本发明还特别涉及具有由本文所定义的多核酸编码的氨基酸序列或它的一部分的多肽，这种多肽为表5所示的本发明新的HCV类型所特有，并且，它包括至少一个不同于任何已知HCV类型或亚型的氨基酸，或它的大体上同源的，并且在生物学上等同的类似物。

因此，在另一方面，本发明包括具有不同于进化枝6基因型6-9和11的基因型的进化枝6HCV病毒的分离的HCV多肽，所述多肽的特征是，它包括选自下面任意一种的氨基酸序列：

-由SEQ ID NOs：3，5，7，9，11，13，15，50-61或63中任意一种所限定的氨基酸序列；

-与SEQ ID NOs：53-55中任意一种的同一性至少为92％的核心氨基酸序列；

-与SEQ ID NO：56的同一性至少为79％的E1氨基酸序列；

-与SEQ ID NOs：11，13，15中任意一种的同一性至少为85％的核心/E1氨基酸序列；

-与SEQ ID NOs：50-52中任意一种的同一性至少为91％的核心/E1氨基酸序列；

-与SEQ ID NO：9的同一性至少为87％的NS5B氨基酸序列；

-由与SEQ ID NOs：39-41中任意一种的同一性至少为85％的核酸序列编码的核心氨基酸序列；

-由与SEQ ID NO：42的同一性至少为71％的核酸序列编码的E1氨基酸序列；

-由与SEQ ID NOs：10，12，14中任意一种的同一性至少为78％的核酸序列编码的核心/E1氨基酸序列；

-由与SEQ ID NOs：36-38中任意一种的同一性至少为84％的核酸序列编码的核心/E1氨基酸序列；

-由与SEQ ID NOs：8的同一性至少为75％的核酸序列编码的NS5B氨基酸序列；或

所述任意一种氨基酸序列的片段，该片段是所述HCV基因型所特有的。

更具体地讲，本发明的多肽或它的片段包括重组多肽，合成多肽，或包括一个或多个修饰过的或标记过的氨基酸的多肽。

术语′多肽′表示氨基酸的聚合物，并且不表示特定长度的产物；因此，肽、寡肽和蛋白都包含在多肽的定义内。该术语同样不表示或排除多肽的表达后修饰，例如，糖基化，乙酰化，和磷酸化等。例如，在该定义范围内包括含有一个或多个氨基酸类似物的多肽(例如，包括非天然氨基酸，PNA等)，具有取代过的连键的多肽，以及本领域已知的其他修饰，包括天然存在的和非天然存在的修饰。术语“蛋白”，“肽”或“寡肽”在本文中用于表示任何长度的聚合形式的氨基酸，所述术语还包括已知氨基酸修饰，如二硫键形成，半胱氨酸化，氧化，谷胱甘肽化，甲基化，乙酰化，法尼化，生物素化，硬脂酰化，甲酰化，脂肪酸添加，磷酸化，硫酸化，遍在化，豆蔻酰化，棕榈酰化，香叶基香叶基化，环化(例如，焦谷氨酸形成)，氧化，脱氨，脱水，糖基化(例如戊糖，己胺，N-乙酰己胺，脱氧己糖，己糖，唾液酸等)，和酰化以及非天然存在的氨基酸残基，L-氨基酸残基和D-氨基酸残基。本领域技术人员可以理解的是，作为翻译后修饰的结果，可能出现多种所述氨基酸修饰。其他修饰包括在蛋白，肽或寡肽的一个或多个氨基酸上添加化学基团。例如，所述化学基团包括生物素。所述化学基团还包括导入半胱氨酸-硫醇上的基团，产生可逆地或不可逆地封闭的半胱氨酸-硫醇；半胱氨酸-修饰化合物的例子包括N-乙基马来酰亚胺，生物素-N-乙基马来酰亚胺(乙烯基吡啶，碘乙酸，碘乙酰胺，吖丙啶和甲基碘。另外，可以通过磺基水解反应，将半胱氨酸转化成S-磺基-半胱氨酸。另外，蛋白，肽或寡肽一般还可以进行放射性、化学发光、荧光、磷光标记，使用红外线染料或使用表面强化拉曼标记物或和细胞质基因组共振颗粒。在本说明书和权利要求书中所使用的“生物学等同物”，表示有关组合物在免疫学上与本文所定义的本发明的蛋白(多肽)或肽相同。

在随后的说明书和权利要求书中，用于描述蛋白和肽的“大体上同源的”表示在氨基酸序列水平上与本发明蛋白和肽的同源性程度。所述同源性程度优选超过90％，例如，超过91％，92％，93％，94％，优选超过95％，例如，超过96％，97％，98％，特别优选的蛋白类型与本发明蛋白或肽的同源性超过99％。

在说明书或权利要求书中用于描述本发明的蛋白或肽的术语“类似物”，包括具有与本文专门示出的序列大体上相同的氨基酸序列的任何蛋白或肽，其中，一个或多个残基业已用生物学等同残基进行了保守性取代。保守性取代的例子包括用诸如异亮氨酸，缬氨酸或甲硫氨酸的一种极性(疏水性)残基取代另一种极性残基，用一种极性(亲水性)残基取代另一种亲水性残基，如精氨酸和赖氨酸之间的取代，谷氨酸和天冬酰胺之间的取代，甘氨酸和丝氨酸之间的取代，用诸如赖氨酸，精氨酸或组氨酸的碱性残基取代另一种碱性残基，或用诸如天冬氨酸或谷氨酸的酸性残基取代另一种酸性残基。本发明允许的突变的例子可以从表4中查阅到。

短语“保守性取代”还包括用化学衍生化的残基取代非衍生化的残基，其前提是，所得到的蛋白或肽在生物学上与本发明的蛋白或肽等同。

“化学衍生物”表示具有通过功能性侧基反应，化学衍生化的一个或多个残基的蛋白或肽。所述衍生化分子的例子包括，但不局限于其中的游离氨基业已被衍生化形成氢氯化物，对甲苯磺酰基团，苄酯基，叔丁氧基羰基，氯己酰基或甲酰基的分子。可以将羧基基团衍生成盐，甲基酯和乙基酯，或其他类型的酯或酰肼。可以将游离的羟基基团衍生成O-酰基或O-烷基衍生物。可以将组氨酸的咪唑氮衍生成N-im-苯基组氨酸。作为化学衍生物，还包括含一个或多个天然存在的20种标准氨基酸的氨基酸衍生物的蛋白或肽。例如，4-羟基脯氨酸可以取代脯氨酸；5-羟基赖氨酸可以取代赖氨酸；3-甲基组氨酸可以取代组氨酸；高丝氨酸可以取代丝氨酸，而鸟氨酸可以取代赖氨酸。本发明的蛋白或肽还包括相对本文示出序列的肽而言，具有一个或多个残基的添加和/或缺失的任何蛋白或肽，只要所述肽在生物学上等同于本发明的蛋白或肽就行。应当指出的是，在氨基酸序列水平上，至少一个氨基酸差异(相对已知的氨基酸序列而言)对于本发明的一部分来说就足够了，这意味着本发明的多肽相应于具有与所编码的多蛋白的氨基酸差异相关的至少一个核苷酸差异(具有已知HCV多核酸序列)的多核酸。由于已知NS4和核心区包括若干种表位，例如，在专利申请号EP-A-0489968中所披露的，以及由于预计E1蛋白作为病毒外被的部分是免疫攻击的对象，并且预计包括表位，本文所披露的新类型和亚型的NS4，核心和E1表位都将不同于存在于以前已知基因型中的表位。Simmonds等(1993c)和Stuyver等(1993b)以及PCT/EP94/01323中所披露的NS4合成肽的类型特异性，和Maertens等(1994)所披露的重组E1蛋白的类型特异性证实了这一点。

本发明的肽优选包括至少3个，优选4，5个连续的HCV氨基酸，优选6，7个，不过，优选至少8个连续的HCV氨基酸，至少10或至少15个(例如，至少9，10，11，12，13，14，15，16，17，19，20，21，22，23，24，25，26，27，28，29，30，31，32，33，34，35，40，45，50，55，60，65，70，75，80，85，90，95，100或更多个氨基酸)。

本发明的多肽，特别是多肽片段可以通过典型的化学合成制备。所述合成能够以均匀的溶液或以固相形式进行。例如，可以使用的以均匀溶液形式进行的合成技术是由Houbenweyl在标题为“有机化学方法”的著作中披露的，编辑E.Wunsh，vol.15-I ET II.THIEME，Stuttgart 1974。本发明的多肽还可以按照Atherton和Shepard在他们的标题为“固相肽合成”的著作(IRL Press，Oxford，1989)中披露的方法，以固相形式制备。本发明的多肽可以通过披露于以下文献中的重组DNA技术制备：Sambrook等，Molecular Cloning：ALaboratory Manual 2nd edition，New York，Cold Spring HarborLaboratory，1989)。

因此，本发明涉及具有由本文所定义的多核酸所编码的氨基酸序列的多肽或本发明新的HCV类型所特有的它的一部分，或本发明的新的HCV类型所特有的它的类似物，并且，它是大体上同源的，并且在生物学上是等同的。

本发明特别涉及本文所定义的多肽，在它的氨基酸序列上包括至少一个独特的氨基酸残基。如表1所示(还可参见图1和2中的编号)，注释包括由它的单字母代码表示的氨基酸残基的字母，和表示按照Kato等，1990的氨基酸编号的数字，或如表5中所定义的至少一种HCV亚型或类型所特有的它的一部分，并且，它包括至少一个不同于任何已知HCV类型或亚型的氨基酸，或与所述多肽或它的一部分大体上同源，并且在生物学上等同的它的类似物。

表4.可以构成本文所定义的类似物(突变蛋白)的基础的氨基酸取代概述

氨基酸同义基团

Ser(S) Ser，Thr，Gly，Asn

Arg(R) Arg，His，Lys，Glu，Gln

Leu(L) Leu；Ile，Met，Phe，Val，Tyr

Pro(P) Pro，Ala，Thr，Gly

Thr(T) Thr，Pro，Ser，Ala，Gly，His，Gln

Ala(A) Ala，Pro，Gly，Thr

Val(V) Val，Met，Ile，Tyr，Phe，Leu，Val

Gly(G) Gly，Ala，Thr，Pro，Ser

IIe(I) Ile，Met，Leu，Phe，Val，IIe，Tyr

Phe(F) Phe，Met，Tyr，Ile，Leu，Trp，Val

Tyr(Y) Tyr，Phe，Trp，Met，Ile，Val，Leu

Cys(C) Cys，Ser，Thr，Met

His(H) His，Gln，Arg，Lys，Glu，Thr

Gln(Q) Gln，Glu，His，Lys，Asn，Thr，Arg

Asn(N) Asn，Asp，Ser，Gln

Lys(K) Lys，Arg，Glu，Gln，His

Asp(D) Asp，Asn，Glu，Gln

Glu(E) Glu，Gln，Asp，Lys，Asn，His，Arg

Met(M) Met，Ile，Leu，Phe，Val

所述独特的氨基酸残基可以根据将在图1中示出的新的HCV氨基酸序列与所有已知的HCV序列进行比对而推测。例如，可以用SEQ IDNOs：3，5，7，9，11，13，15，或50-63所示的新的序列进行比对。可以看出的是，在所述附图中所提供的比对，可以用所有已知的HCV序列完成，以便说明上面所提供的任何独特的残基确实是本发明的至少一个新的HCV序列所特有的。在本发明的特有的核心的氨基酸残基类型中，可以发现特有的残基按照本发明所使用的HCV分类系统而言，是所述新的HCV类型所特有的。为了获得所述残基，可以由本领域技术人员进行比对，以便推测本文所提供的任何独特残基的类型和/或亚型特异性。

本发明该实施方案的多肽任选进行标记，或者与固体基质连接，或与诸如生物素的载体分子结合，或与合适的佐剂混合，以上所有措施都是本领域所公知的，并且符合预期的用途(诊断，治疗和预防)。

本发明还涉及本文所定义的多肽，在它的氨基酸序列上包括至少一个由本文所列举的SEQ ID NOs：3，5，7，9，11，13，15，或50-63所示出的序列，或包括如表5所定义的为本发明的新的HCV类型所特有的它的一部分，或与所述多肽或它的一部分大体上同源，并且在生物学上等同的它的类似物。

因此，本发明还涉及具有如SEQ ID NOs：3，5，7，9，11，13，15，或50-63中任意一种所示出的氨基酸序列的多肽，或如表5中所定义的为本发明的新的HCV类型所特有的它的一部分，或与所述多肽或它的一部分大体上同源，并且在生物学上等同的类似物。

业已证实核心蛋白的可变区(V-核心)可用于血清型分析(Machida等，1992)。本发明新的HCV类型的V-核心序列，在该区域表现出类型特异性特征。例如，本领域技术人员可以方便地确定跨68-78号氨基酸的区域(V-核心区)的氨基酸是本发明新的HCV类型所特有的。因此，本发明新的HCV类型的V-核心区还是HCV多蛋白所特有的，并且是本发明的新的HCV类型的HCV核心蛋白所特有的。该V-核心区如SEQ ID NO：57所示。

同样，本发明的新的HCV类型的E1蛋白包括独特的可变区，该可变区包括V1区(SEQ ID NO：58；包括本发明新的HCV类型的E1蛋白的191-203号氨基酸)，V2区(SEQ ID NO：59；包括本发明新的HCV类型的E1蛋白的213-223号氨基酸)，V3区(SEQ ID NO：60；包括本发明新的HCV类型的E1蛋白的230-242号氨基酸)，V4区(SEQID NO：61；包括本发明新的HCV类型的E1蛋白的248-257号氨基酸)，和V6区(SEQ ID NO：63；包括本发明新的HCV类型的E1蛋白的330-342号氨基酸)。相反，V5区(SEQ ID NO：62；包括本发明新的HCV类型的E1蛋白的294-303号氨基酸)不是本发明新的HCV类型所特有的，因为正如国际专利申请号WO94/25601中所披露的，它出现在5a型HCV分离物中。

在本文中所列举的本发明的新的HCV类型的肽以及它的一部分，特别适用于治疗和疫苗和诊断开发。

本发明还包括在它们的肽链上含有至少一个表位，如源于上述任意一种本发明新的HCV类型的肽的线性表位的任何合成肽(参见下文)或多肽。本发明还包括在其肽链上含有源于上述本发明新的HCV类型的任何肽的至少4，5，6，7，8，9，10，11，12或13个连续氨基酸的任何合成肽或多肽。

在本文中，′表位′或′抗原决定簇′表示具有免疫活性的氨基酸序列。一般，表位包括至少3-4个氨基酸，更常见的是，包括至少5或6个氨基酸，有时候所述表位包括大约7，8或9个，或者甚至大约10个氨基酸。

本发明特别涉及包含在SEQ ID NOs：3，5，7，9，11，13，15，或50-63中的任意一种氨基酸序列中的任何肽(参见下文)或多肽(参见表5和图1和2，实施例部分)。

本发明还涉及由上文所定义的多核酸编码的重组多肽，或为表5中所定义的HCV亚型或类型所特有的它的一部分，或与所述多肽大体上同源，并且在生物学上等同的它的类似物。

本发明还涉及包括本发明的HCV多核酸或它的一部分的重组载体。所述重组载体可以是能够启动由包含在所述载体上的HCV多核酸编码的HCV肽的表达的表达载体。在所述表达载体中，本发明的HCV多核酸或它的一部分任选与原核、真核或病毒转录和翻译控制元件连接。

在另一方面，本发明包括含有本发明的HCV多核酸或它的一部分的宿主细胞，或用上述重组载体转化过的宿主细胞。

一般，所述重组载体包括一个载体序列，一个合适的原核，真核或病毒启动子序列，随后是如上文所定义的核苷酸序列，所述重组载体在以裸露的DNA形式注射时，能够在原核，或真核宿主或在活的哺乳动物体内表达上述任意一种多肽，为了表达核心蛋白，更具体地讲，重组载体可以表达具体跨以下氨基酸位置的任何本发明新的HCV序列：

-用于表达核心蛋白，始于1-10号位置之间的区域，并且止于70-420号位置之间的区域的任何位置的多肽，更具体地讲，跨1-70号位置，1-85号位置，1-120号位置，1-150号位置，1-191号位置，或1-200号位置，和用于表达核心和E1蛋白，跨1-263号位置，1-362号位置，1-383号位置，或1-420号位置的多肽；

-用于表达E1，始于117-192号位置之间的区域的任何位置，并且止于263-420号位置之间的区域的任何位置的多肽，或具有缺失的疏水区的形式(264-293号位置加上或减去8个氨基酸)；

-更具体地讲，用于表达NS4，始于1556-1688号位置之间的区域的任何位置，并且止于1739-1764号位置之间的区域的任何位置的多肽；更具体地讲，为了表达NS4a抗原，始于1658号位置，并且止于1711号位置的多肽；更具体地讲，为了表达NS4b抗原或它的一部分，始于1712号位置，并且止于1743-1972号位置之间的区域的多肽(例如1712-1743，1712-1764，1712-1782，1712-1972，1712-1782，1712-1902)。

本领域已知的任何其他的HCV载体构建同样可用于本发明的重组多肽。

还可将任何已知的纯化重组蛋白的方法用于生产本发明的重组多肽，特别是在以Innogenetics N.V.的名义申请的PCT/EP 95/03031中所披露的重组多肽纯化方法。

术语“载体”可以包括质粒，粘粒，噬菌体，或病毒或转基因动物。特别适用于疫苗开发的可能是BCG或腺病毒载体，以及禽痘重组病毒。

本发明还涉及用于生产如上文所定义的重组多肽的方法，包括：

-用重组载体转化合适的细胞宿主，在所述载体中业已插入了受合适的调控元件控制的如上文所定义的多核酸或它的一部分，

-在能够表达所述插入片段的条件下，培养所述转化的细胞宿主，和

-收获所述多肽。

在本发明中所使用的术语′重组表达的′表示本发明的蛋白是通过重组表达方法在原核生物、低等或高等真核生物中生产的这一事实，正如在下文详细讨论的。

术语“低等真核生物”表示诸如酵母和真菌等的宿主细胞。低等真核生物一般(但并不一定)是单细胞的。优选的低等真核生物是酵母，特别是酵母属，裂殖酵母属，克鲁维酵母属，毕赤酵母属(例如，巴斯德毕赤酵母)，汉逊酵母属(例如，多形汉逊酵母)，许旺酵母属，接合酵母属，和Yarowia等的属内的种。酿酒酵母，卡尔酵母和乳酸克鲁维酵母是最常用的酵母宿主，并且是常用的真菌宿主。

术语′原核生物′表示诸如大肠杆菌，乳杆菌属，乳球菌属，链球菌属，枯草芽孢杆菌或链霉属的宿主。在本发明范围内同样涉及这些宿主。

术语′高等真核生物′表示源于高等动物的宿主细胞，如哺乳动物，爬行动物和昆虫等，本发明优选的高等真核生物宿主细胞源于中国仓鼠(例如CHO)，猴(例如COS和Vero细胞)，幼仓鼠肾(BHK)，猪肾(PK15)，兔肾13细胞(RK13)，人骨肉瘤细胞系143B，人细胞系HeLa和人肝癌细胞系样Hep G2，和昆虫细胞系(例如草地贪夜蛾)。所述宿主细胞能够以悬浮液或烧瓶培养物，组织培养物，和器官培养物等形式提供。另外，所述宿主细胞还可以是转基因动物。

术语′重组多核苷酸或核酸′表示来源于基因组，cDNA，来自半合成或合成起源的多核苷酸或核酸。根据它的来源或操作：(1)不与在天然状态下和它结合的多核苷酸的全部或一部分结合，(2)与不是在天然状态下与它连接的多核苷酸连接，或(3)不是天然存在的。

术语′重组宿主细胞′，′宿主细胞′，′细胞′，′细胞系′，′细胞培养物′以及表示作为单细胞实体培养的微生物或高等真核细胞系的其他诸如此类的术语，表示可以用作或者业已被用作重组载体或其他转移多核苷酸的受体的细胞，并且包括业已转染过的所述原始细胞的后代。应当理解的是，由于存在天然、意外或有意引入的突变，单一亲本细胞的后代不一定在形态学或在基因组或总DNA互补体方面与原始亲本完全相同。

术语′复制子′是在细胞内可以作为多核苷酸复制的自主单位，即能够在自身控制下复制的任何遗传元件，例如，质粒，染色体，病毒，粘粒等。

术语′载体′是还包括提供需要的开放读框复制和/或表达的序列的复制子。

术语′控制序列′表示实现与它连接的编码序列表达所必须的多核苷酸序列。所述控制序列的性质根据宿主生物而不同。在真核生物中，所述控制序列一般包括启动子，核糖体结合位点，剪接位点和终止子；在真核生物中，所述控制序列一般包括启动子，剪接位点和终止子，并且在某些场合下包括增强子。术语′控制序列′意在起码包括表达所需要的所有因子，并且还可以包括有利于表达的其他成分，例如，控制分泌的前导序列。

术语′启动子′是由共有序列组成的核苷酸序列，它能将RNA聚合酶结合在DNA模板上，以便mRNA生产从相邻的结构基因的正常转录起始位点开始。

短语′可操作地连接′表示一种并列关系，其中，所述因子的关系使得它们能以预期的方式起作用。与编码序列′可操作地连接′的控制序列是以这种方式连接的：所述编码序列的表达是通过在与所述控制序列兼容的条件下实现的。

插入所述载体序列中的编码需要的序列的HCV cDNA的片段，可以与信号序列连接。所述序列信号可以来自非HCV来源，例如，为了在哺乳动物细胞中表达，可以是IgG或组织纤溶酶原激活物(tpa)前导序列，或为了在酵母细胞中表达，可以是α-交配因子序列，不过，本发明特别优选的结构，包括出现在HCV基因组中位于相应的蛋白起始位点前面的信号序列。

有多种载体可用于获得本发明HCV单一或特异性寡聚外被蛋白的重组表达。诸如酵母和糖基化突变菌株的低等真核生物通常是用质粒转化的，或者是用重组病毒转化的。所述载体可以在所述宿主中独立复制，或整合到宿主细胞基因组中。

高等真核生物可以用载体转化，或者可以用重组病毒感染，例如用重组痘苗病毒感染。用于将外源DNA插入痘苗病毒的技术和载体为本领域所熟知，并且，采用诸如同源重组的技术。在本领域可以获得多种病毒启动子序列，可能的终止子序列和poly(A)-添加序列，还可能包括增强子序列以及可能的扩增子序列，所有这些序列都是哺乳动物表达所需要的。痘苗病毒是特别优选的，因为痘苗病毒能抑制宿主细胞蛋白的表达，痘苗还是非常优选的，因为它能够在用活的重组痘苗病毒免疫的细胞或个体中表达诸如HCV的E1和E2蛋白的蛋白。对于人类免疫来说，禽痘病毒和Ankara修饰过的病毒(AMV)是特别有用的载体。

同样已知的是源于杆状病毒苜蓿银纹夜蛾核多角体病毒(AcNPV)的昆虫表达转移载体，它是一种辅助独立型病毒表达载体。源于该系统的表达载体，通常使用强的病毒多角体蛋白基因启动子启动异源基因的表达。为了进行杆状病毒表达，本领域技术人员可以获得不同的载体和用于将异源DNA导入杆状病毒的需要的位点的方法。另外，由昆虫细胞识别的用于翻译后修饰的不同信号在本领域中也是已知的。

本发明还涉及用上述重组载体转化过的宿主细胞。

本发明还涉及用于检测存在于生物学样品中的HCV抗体的方法，包括：

(i)让要分析HCV存在的所述生物学样品与本文所定义的多肽接触，

(ii)检测由所述抗体和所述多肽形成的免疫学复合物。

本发明还涉及HCV类型分析方法，包括：

(ii)检测由所述抗体和所述多肽形成的免疫学复合物。

在上述本发明的任意方法中，所述生物学样品被怀疑或容易含有HCV或HCV抗体。

本发明还涉及用于检测HCV存在的诊断试剂盒，所述试剂盒包括至少一种由本文所定义的多肽，所述多肽优选与固体支持物结合。本发明还涉及用于HCV分类的诊断试剂盒，所述试剂盒包括至少一种由本文所定义的多肽，所述多肽优选与固体支持物结合。

本发明还涉及如上文所定义的诊断试剂盒，所述试剂盒包括与固体基质的特定位点连接的多种所述多肽。

本发明还涉及如上文所定义的诊断试剂盒，其中，所述固体支持物是膜条带，并且，所述多肽以平行线的形式与所述膜偶联。

本发明的免疫分析方法可以采用来自本发明的新的和特有的多肽序列的不同结构域的抗原，所述抗原保留了由存在于来自受HCV感染的个体的血清中的抗体识别的线性(对肽而言)和构象表位(对多肽而言)。例如，本发明包括使用单一或特异性寡聚抗原，二聚抗原，以及单一的或特异性寡聚抗原的组合。本发明的HCV抗原实际上可应用于采用已知抗原检测抗体的任何分析方法中。当然，应当避免或改良会使HCV构象表位变性的方法。上述所有分析方法的共同特征是，让所述抗原接触被怀疑含有HCV抗体的身体成分接触，所述接触是在所述抗原能够结合存在于所述成分中的任何这样的抗体的条件下进行的。所述条件通常是生理学温度，pH和离子强度，使用过量的抗原。在将所述抗原与所述样本一起温育之后，检测包括所述抗原的免疫复合物。

免疫分析方法的设计可以进行多种改变，并且，很多方案为本领域所公知。例如，可以设计使用固体支持物或免疫沉淀的方案。大部分分析方法包括使用标记过的抗体或多肽；例如，所述标记可以是酶促、荧光、化学发光、放射性、或染料分子。由免疫复合物放大所述信号的分析方法同样是已知的。所述分析方法的例子是使用生物素和亲和素或链亲和素的分析方法，以及酶标记过的和介导的免疫分析方法，如ELISA分析。

所述免疫分析方法可以是，但不局限于异源或同源方法，并且是标准型或竞争型的。在异源方法中，所述多肽通常与固体基质或支持物结合，以便有利于在培养之后从所述多肽中分离所述样品。可以使用的固体支持物的例子是硝酸纤维素(例如，薄膜或微量滴定孔形式的)。聚氯乙烯(例如，片材或微量滴定孔形式的)，聚苯乙烯乳胶(例如，珠或微量滴定板形式的)，聚偏氟乙烯(被称为Immunolon^TM)，重氮化纸，尼龙膜，活化珠，和蛋白A珠。例如，可以将DynatechImmunolon^TM1或Immunolon^TM2微量滴定板用于异源方案中。通常在它与测试样品分离之后，并且在检测结合的抗体之前，对含有所述抗原多肽的固体支持物进行洗涤。标准方法和竞争型方法都是本领域所公知的。

在同源方法中，将所述测试样品与在溶液中组合的抗原一起温育。例如，可以在能使所形成的任何抗原-抗体复合物沉淀的条件下温育。这种分析方法的标准和竞争方案都是本领域公知的。

在一种标准方法中，直接监测抗体-抗原复合物中的HCV抗体量。这一目的可以通过确定能识别抗HCV抗体上的抗原的标记过的抗异种(例如抗人)抗体是否会因为复合物的形成而结合而实现。在竞争方法中，样品中HCV抗体的数量是通过监测对所述复合物中以知数量的标记抗体(或其他竞争配体)的竞争作用而推测的。

所形成的包括抗HCV抗体的复合物(或对于竞争分析来说，竞争抗体的数量)是根据所述方法通过多种已知技术中的任意一种检测的。例如，复合物中未标记过的HCV抗体可以用与一种标记物(例如酶标记)复合的抗异种Ig的偶联物检测。

在免疫沉淀或凝集分析方法中，所述HCV抗原和所述抗体之间的反应，形成了能够从溶液或悬浮液中沉淀出来的网，并且形成了沉淀物的可见的层或薄膜。如果在测试样本中不存在抗HCV抗体的话，就不会形成可见的沉淀物。

目前存在若干种特殊类型的颗粒凝集(PA)分析方法。所述分析方法被用于检测涂在支持物上的各种抗原的抗体。一种类型的这样的分析方法是血凝分析方法，该方法使用红血细胞(RBCs)，所述细胞是通过在RBC上被动吸附抗原(或抗体)而敏化的。存在于身体成分中的特定抗原抗体的添加(如果有的话)，导致了用纯化抗原包衣的RBCs凝集。为了消除血凝分析中潜在的非特异性反应，可以用两种人工载体取代PA中的RBC。最常见的载体是乳胶颗粒。不过，也可以使用明胶颗粒。采用上述任意一种载体的分析方法，都是基于用纯化抗原包衣的颗粒的被动凝集。

包括构象表位的本发明的HCV抗原通常是以试剂盒形式包装的，以便用于所述免疫分析方法。所述试剂盒通常在独立的容器中装有天然HCV抗原，对照抗体制剂(阳性对照和/或阴性对照)。标记过的抗体，如果分析方法需要这样的抗体的话，以及信号发生试剂(例如酶底物)，如果所述标记不能直接产生信号的话。所述天然HCV抗原可能已经结合在固体基质上或独立于用于将它结合在所述基质上的试剂。在所述试剂盒中通常还包括用于指导实施所述分析的说明书(例如，纸件、磁带、CD-ROM等)。

采用天然HCV抗原的免疫分析方法，可用于筛选血液，用于制备有可能缺少传染性HCV的血液来源。用于制备所述血液来源的方法包括以下步骤。让一种身体成分，优选来自供血个体的血液或血液成分与本发明的HCV多肽起反应，以便在HCV抗体(如果有的话)和所述HCV抗原之间发生免疫学反应。检测是否因为所述反应形成了抗HCV抗体-HCV抗原复合物。构成所述血液来源的血液，来自不具有抗天然HCV抗原的抗体的供体。

在对HCV抗原呈阳性反应的条件下，优选重复所述免疫分析，以便降低假阳性的可能性。例如，在为了生产血液制品(例如，输血，血浆，因子VIII，免疫球蛋白等)的大规模血液筛选中，′筛选′实验通常被设计成能提高灵敏度(以确保没有污染的血液通过)，其代价是牺牲了特异性；即提高了假阳性比例。因此，通常只需要进一步测试′重复起反应的′供体；即在对提供的样品进行两轮或两轮以上的免疫分析中呈阳性。不过，为了证实HCV的阳性性质，通常将′验证′实验设计成能提高特异性(以确保不会验证假阳性样品)，其代价是牺牲了灵敏度。

所选择的固相可以包括聚合珠或玻璃珠，硝酸纤维素，微型颗粒，反应盘的微孔，试管和磁珠。所述信号发生化合物可以包括酶，发光化合物，生色物质，放射性元素和化学发光化合物。酶的例子包括碱性磷酸酶，辣根过氧化物酶和β-半乳糖苷酶。增强化合物的例子包括生物素，抗生物素和亲和素。增强化合物结合成员的例子包括生物素，抗生物素和亲和素。为了阻断类风湿因子样物质的作用，让所述测试样品接触足以阻断类风湿因子样物质的作用的条件。所述条件包括让所述样品与一定数量的抗人IgG接触，以便形成一种混合物，并且在足以产生基本上不含类风湿因子样物质的反应混合物产物的条件下将所述混合物温育一定时间。

本发明特别涉及一种免疫分析方法，其中，本发明的肽或多肽以一种平行线的形式与一种膜偶联。该分析方法特别有利于HCV类型分析目的。

本发明还涉及包括至少一种本文定义的(重组)多肽或肽，以及合适的赋形剂，稀释剂或载体的药物组合物。

本发明还涉及本发明的药物组合物，用于预防HCV感染的方法，包括给哺乳动物施用有效量的所述药物组合物，以便刺激所述保护性抗体或保护性T-细胞反应的产生。

本发明涉及将本文定义的组合物用于预防HCV感染的方法中的用途。

本发明还涉及使哺乳动物对HCV感染免疫的疫苗，包括存在于可以药用的载体中的至少一种本文所定义的(重组)多肽或肽。

在另一方面，本发明涉及一种包括至少一种本发明的HCV多核酸或它的片段，以及合适的赋形剂，稀释剂或载体的药物组合物。所述组合物适用于预防或治疗HCV感染的方法中，该方法包括给哺乳动物施用有效量的所述药物组合物，以便刺激保护性抗体或保护性T-细胞应答的产生。

本发明的另一方面涉及用于使哺乳动物对HCV感染免疫的DNA疫苗，它包括至少一种本发明的HCV多核酸或它的片段，以及可以药用的载体。

一般，含有DNA的药物组合物或疫苗能够在用所述组合物或疫苗处理过的宿主或在给所述宿主施用所述组合物或疫苗之后表达所述DNA所编码的蛋白或肽，在本发明中是表达HCV蛋白或肽。

术语′免疫原性′或“免疫”表示在有或没有佐剂的条件下，一种物质单独或者与载体连接之后导致体液和/或细胞反应的能力。′中和′表示能部分或完全抑制感染剂的感染性的免疫反应。′疫苗′是部分或全面地引起对HCV的保护作用的免疫原性组合物。还可以将疫苗用于治疗个体，在这种情况下，称之为治疗性疫苗。

术语′治疗剂′表示能够治疗HCV感染的组合物。

术语′有效量′表示足以在施用它的个体内诱导免疫反应，或在预期的系统中产生其他可检测免疫反应(例如免疫分析)的具有表位的多肽的数量。所述有效量优选足以实现治疗，如上文所定义的。所需要的确切用量会根据用途而改变。例如，对于疫苗或对于制备多克隆抗血清/抗体的用途来说，有效量可能根据所述个体的物种、年龄和一般状况，要治疗的状况的严重程度，所选择的特定多肽以及它的施用模式等而改变。人们还认为，所述有效量具有相对大的非临界的范围。合适的有效量可以仅仅使用常规实验方便地确定。用于预防HCV疾病的优选的蛋白用量范围为0.01-100微克/剂，优选0.1-50微克/剂。每一个个体可能需要若干个剂量，以便获得足够的免疫反应，并且随后能抗HCV疾病。

本发明还涉及如上文所定义的疫苗，包括至少一种如上文所定义的(重组)多肽，所述多肽是上文所定义的新的HCV类型所特有的。所述疫苗可以包括预防性和治疗性疫苗。

可以药用的载体包括它本身不会诱导对使用该化合物的个体有害的抗体产生的任何载体。合适的载体通常是大的、缓慢代谢的大分子，如蛋白，多糖，聚乳酸，聚乙醇酸，聚氨基酸，氨基酸共聚物；以及失活的病毒颗粒。所述载体是本领域普通技术人员所公知的。

正如在美国专利号4,606,918中所披露的，用于增强所述组合物效果的优选佐剂包括，但不局限于：氢氧化铝(明矾)，N-乙酰-胞壁酰-L-苏氨酰-D-异谷氨酰胺(thr-MDP)，N-乙酰-正胞壁酰-L-丙氨酰-D-异谷氨酰胺(nor-MDP)，N-乙酰胞壁酸-L-丙氨酰-D-异谷氨酰胺-L-丙氨酸-2-(1′2′-二棕榈酰-sn-甘油-3-羟基磷脂酰氧)-乙胺(MTP-PE)和RIBI，它含有从细菌中提取的三种成分：单磷脂酰脂A，海藻糖二分支菌酸，和细胞壁骨骼(MPL+TDM+CWS)，存在于2％的角鲨烯/Tween 80乳液中。所述三种成分MPL，TDM或CWS中的任意一种还可以单独使用或者两两组合使用。另外，还可以使用诸如Stimulon(Cambridge Bioscience，Worcester，MA)的佐剂。

用作疫苗的免疫组合物包括′足够量′或′免疫有效量′的本发明的蛋白，以及需要的任何其他上面提到过的成分。′免疫有效量′表示给一个个体施用该用量，无论是单一剂量或作为一系列剂量的一部分都能有效治疗，如上文所定义的。该用量根据接受治疗的个体的健康和体能状况，要治疗的个体的物种分类(例如，非人灵长类，灵长类等)，个体免疫系统合成抗体的能力，需要的保护程度，疫苗的配方，主治医生对医学状况的评估，传染性HCV的菌株，以及其他相关因素而不同。预计，所述用量分布在一个较大的范围内，该范围可以通过常规实验确定。通常，所述用量为0.01-1000微克/剂，更具体地讲，为0.1-100微克/剂。

本发明的蛋白还可以用作疫苗载体，以与乙型肝炎表面抗原相同的方式呈递同源(例如，T细胞表位或B细胞表位，例如，这些表位来自核心，E1，E2，NS2，NS3，NS4或NS5区)或异源(非-HCV)半抗原(例如，参见欧洲专利申请号EP-0174 444)。这种用途中，外被蛋白提供了能够刺激对半抗原或与所述聚集物偶联的抗原的免疫反应的免疫原性载体。所述抗原可以是通过常规化学方法偶联的，或者可以克隆到编码E1和/或E2的基因的相当于所述蛋白的亲水区的位点。所述亲水区包括V1区(包括191-203号氨基酸)，V2区(包括213-223号氨基酸)，V3区(包括230-242号氨基酸)，V4区(包括248-257号氨基酸)，V5区(包括294-303号氨基酸)，和V6区(包括330-342号氨基酸)。用于插入半抗原的其他有用的位点是疏水区(大体上包括264-293号氨基酸)。在本发明中业已证实，该区可以缺失，而又不会影响缺失的E1蛋白与抗血清的反应性。因此，可以将半抗原插入所述缺失位点。

所述免疫原性组合物通常是以肠胃外方式施用的，通常是通过注射，例如，皮下注射或肌内注射。适用于其他施用方法的其他制剂包括口服制剂和栓剂。剂量治疗可以是单一剂量方案或多剂量方案。所述疫苗可以与其他免疫调节剂组合使用。本发明免疫原的施用可以是出于预防性或治疗性目的。在预防性使用时，所述免疫原是在接触任何HCV之前或在出现由于HCV感染而出现的任何症状之前使用的。预防性施用所述免疫原可以预防或缓解HCV对哺乳动物的任何随后的感染。在治疗性使用时，所述免疫原是在感染发作时(或在发作后不久)或在由HCV导致的感染或发病症状出现时使用的。治疗性使用所述免疫原可以减轻感染或疾病。

除了用作疫苗之外，可将所述组合物用于制备HCV(E1)蛋白的抗体。所述抗体可以作为抗病毒制剂直接使用。为了制备抗体，用病毒颗粒的天然E1蛋白对宿主动物进行免疫，所述蛋白结合在上文说明疫苗时所披露的载体上。按照合适的时间间隔采集宿主血清或血浆，以便提供含有能与所述病毒颗粒的(E1)蛋白起反应的抗体的组合物。例如，γ球蛋白级份或IgG抗体可以通过使用饱和硫酸铵或DEAESephadex或本领域人员公知的其他技术获得。所述抗体基本上没有多种独立的副作用，这些副作用可能与诸如药物的其他抗病毒制剂相关。

本发明还具体涉及相当于由上文所定义的至少一种HCV基因组序列所编码的氨基酸序列的肽，所述肽是本发明新的HCV类型所特有的，如在表5中所定义的，并且，它包括至少一个不同于任何已知HCV类型或亚型的氨基酸，或它的大体上同源的并且在生物学上等同的类似物。

本发明特别涉及包括如SEQ ID NOs：3，5，7，9，11，13，15，或50-63所示出的本发明新的序列的至少一个独特表位的肽。

本发明还特别涉及在它的序列上包括如本文所定义的本发明的独特氨基酸残基的肽。

本发明特别涉及生物素化的肽，正如在WO 93/18054中所披露的。

上面为了本发明的多肽而说明的所有实施方案(免疫分析方法、疫苗、组合物、用途等)也涉及本发明的肽。

(i)让要分析HCV存在的所述生物学样品与本文定义的肽接触，

(ii)检测由所述抗体和所述肽形成的免疫复合物。

本发明还涉及HCV类型分析方法，包括：

(i)让要分析HCV存在的所述生物学样品与本文定义的肽接触，

(ii)检测由所述抗体和所述肽形成的免疫复合物。

在本发明的上述任意一种方法中，所述生物学样品被怀疑或有可能含有HCV或HCV的抗体。

本发明还涉及用于检测HCV存在的诊断试剂盒，所述试剂盒包括至少一种本文所定义的肽，所述肽优选与固体支持物结合。

本发明还涉及用于HCV分类的诊断试剂盒，所述试剂盒包括至少一种本文所定义的肽，所述肽优选与固体支持物结合。

本发明还涉及如上文所定义的诊断试剂盒，其中，所述肽选自下列一组：

-至少一种NS4肽

-至少一种NS4肽和至少一种核心肽，

-至少一种NS4肽和至少一种核心肽和至少一种E1肽，

-至少一种NS4肽和至少一种E1肽，

-至少一种NS5肽，和

-至少一种NS5肽和至少一种核心肽。

本发明还涉及如上文所定义的诊断试剂盒，所述试剂盒包括多种所述肽，所述肽连接在固体基质的特定位点上。

本发明还涉及如上文所定义的诊断试剂盒，其中，所述固体支持物是膜条带，而所述肽以平行线的形式与所述膜偶联。

本发明还涉及上文所定义的疫苗，它包括至少一种上文所定义的肽，所述肽是本发明新的HCV类型所特有的，如在表5中所定义的。

另外，本发明涉及通过接种至少一种本文定义的多肽或肽而产生的抗体，所述抗体能与所述多肽或肽中的任意一种特异性地反应，并且，所述抗体优选是单克隆抗体。

本发明的单克隆抗体可以用任何杂交瘤生产，所述杂交瘤容易按照传统方法从动物的体细胞，特别是由小鼠或大鼠制备，一方面所述细胞是用上文所定义的本发明的HCV多肽免疫的，另一方面，所述细胞是骨髓瘤细胞系的细胞，并且通过所述杂交瘤产生识别最初被用于免疫所述动物的多肽的单克隆抗体的能力进行选择。

本发明所涉及的抗体可以通过酶促、荧光、或放射活性类型的合适的标记进行标记。

根据本发明的该优选实施方案的单克隆抗体可以是通过重组DNA技术制备的人源化形式的小鼠单克隆抗体，它不同于编码H和L链的小鼠和/或人基因组DNA序列部分或不同于编码H和L链的cDNA克隆。

另外，根据本发明该优选实施方案的单克隆抗体可以是人单克隆抗体。根据本发明该实施方案的所述抗体还可以来自受本发明新的HCV类型感染的或用HCV免疫的患者的人外周血淋巴细胞。例如，所述人单克隆抗体是通过严重联合免疫缺陷(SCID)小鼠的人外周血淋巴细胞(PBL)再群体化(最近的综述，参见Duchosal等，1992)或通过本发明的抗原筛选受感染的或免疫的个体的Epstein Barr-病毒转化的淋巴细胞中反应性B-细胞的存在而制备的。

本发明还涉及通过所有成分克隆方法，用本发明的蛋白，它的突变蛋白，或由它衍生的肽筛选重组抗体的用途(Persson等，1991)。

源于某种基因型的肽的抗体可用于检测所述HCV基因型，或用作治疗。

本发明还涉及用于检测存在于生物学样品中的HCV抗原的方法，包括：

(i)让所述生物学样品与本文所定义的抗体接触

(ii)检测由所述HCV抗原和所述抗体形成的免疫复合物。

本发明还涉及用于对存在于生物学样品中的HCV进行类型分析的方法，包括：

(i)让所述生物学样品与本文所定义的抗体接触

(ii)检测由所述HCV抗原和所述抗体形成的免疫复合物。

在本发明的上述任意一种方法中，所述生物学样品被怀疑或有可能含有HCV或它的抗原。

本发明还涉及用于检测HCV存在的诊断试剂盒，所述试剂盒包括至少一种本文定义的抗体，所述抗体优选与固体支持物结合。

本发明还涉及用于HCV类型分析的诊断试剂盒，所述试剂盒包括至少一种本文所定义的抗体，所述抗体优选与固体支持物结合。

本发明还涉及本文所定义的诊断试剂盒，所述试剂盒包括多种与固体基质上的特定位点连接的所述抗体。

本发明还涉及一种药物组合物，该组合物包括至少一种上文所定义的抗体，以及合适的赋形剂，稀释剂或载体。

本发明还涉及预防或治疗HCV感染的方法，包括给哺乳动物施用有效量的如本文所定义的药物组合物。

本发明还涉及将本文所定义的组合物用于预防或治疗HCV感染的方法中的用途。

所述基因型还可以通过本文所定义的类型特异性抗体检测，所述抗体还可以与任何多核苷酸序列连接，所述多核苷酸序列随后可以通过PCR扩增，以便检测所形成的免疫复合物(Immuno-PCR，Sano等，1992)。

本发明特别涉及5′NCR(非编码区)。可以理解的是，术语“5′NCR”，“5′非编码区”，″5′UTR″和″5′非翻译区″在本文中可以交换使用。

本发明特别涉及本发明的多核酸或所述多核酸的一部分，或所述多核酸或所述部分的互补体，在它的核苷酸序列上至少包括以下核苷酸残基：A171，它的注释包括通过单字母代码表示核苷酸残基的字母，和表示核苷酸编号的数字，正如在表1中所示出的，或至少包括所述核苷酸残基的所述多核酸的一部分，或所述多核酸或所述部分的互补体。另外，A171可以表示为位于HCV基因组的-159号位置的腺嘌呤核苷酸(参见上文)。

本发明特别涉及以任意一种随后的5′UTR核苷酸序列：SEQ ID NO：1为特征的HCV病毒。

本发明特别涉及用于检测生物学样品中本发明病毒感染的存在的方法。

本发明特别涉及用于检测生物学样品中本发明病毒感染的存在的方法，该方法是基于基因型特异性序列的存在或存在于SEQ ID NO：1中的分离物特异性突变的存在。

本发明特别涉及用于根据SEQ ID NOs：1，2，4，6，8，10，12，14，或36-49的至少一部分的存在检测生物学样品中本发明病毒的感染的存在的方法。

本发明特别涉及如本文所定义的方法，其中，所述方法包括测序反应，杂交反应或扩增反应。

本发明特别涉及包括通过测序反应，杂交反应或扩增反应确定至少一种下列可变核苷酸区或任何HCV 5′UTR序列的位点在生物学样品中的存在的方法，其中，所述方法检测HCV菌株之间的存在于下列的至少一种HCV区域上的任何核苷酸变异：43-298号位置之间的类型特异性可变区。

本发明特别涉及本文所定义的方法，其中，所述方法包括确定存在于SEQ ID NO：1的所述区域上的所述核苷酸变异。

本发明特别涉及如本文所定义的方法，其中，所述方法包括确定下列序列中任意一种的至少一个以下核苷酸：位于SEQ ID NO：1的171号位置上的A。另外，A171还可以表示为HCV基因组的-159号位置上的腺嘌呤核苷酸(参见上文)。

本发明特别涉及如本文所定义的方法，用于鉴定本发明新的HCV类型的序列。

本发明特别涉及HCV基因型分析方法，包括本文所定义的方法的步骤。

本发明特别涉及如本文所定义的方法，其中，所述杂交反应是用与固体支持物偶联的杂交探针进行的，并且所述探针是任选的捕获探针。

本发明特别涉及用于扩增从本文所定义的HCV病毒中分离的HCV基因组序列的方法。

本发明特别涉及如本文所定义的方法，其中，所述扩增方法是PCR，PCR，LCR，NASBA，TAS，或通过Qβ复制酶进行的扩增。

本发明特别涉及如本文所定义的方法，其中，在所述扩增反应中掺入一种合适的标记物。

本发明特别涉及包括SFQ ID NO：1上的一个区域的分离的HCV5′UTR核酸，或它的互补体，其中，所述区包括菌株，分离物或基因型特异性核苷酸序列。

本发明特别涉及如本文所定义的核酸序列，它被用作杂交探针。

本发明特别涉及如本文所定义的核酸，它被用作类型或亚型特异性探针。

本发明特别涉及如本文所定义的核酸，它靶定以SEQ ID NO：1或它的互补体为特征的下列任意一种基因特异型基序的至少一部分。

本发明特别涉及如本文所定义的核酸，它靶定以SEQ ID NO：1或它的互补体为特征的下列任意一种通用基序的至少一部分。

本发明特别涉及如本文所定义的核酸，它包括一种标记和/或与固体支持物偶联。

本发明特别涉及如本文所定义的核酸，它被用作特异性扩增引物。

本发明特别涉及如本文所定义的核酸，它是一种捕获探针。

本发明还涉及包括至少一种病毒的HCV基因型，其特征是它的基因组包括由SEQ ID NO：1所限定的5′UTR区或由SEQ ID NO：8所限定的NS5核酸区的一部分。

本发明还涉及用于检测本文所定义的HCV病毒或基因型的感染在生物学样品中的存在的方法。

本发明还涉及用于检测本文所定义的病毒在生物学样品中的存在的方法，该方法是根据存在于编码SEQ ID NO：8的核酸序列的至少一部分的核酸序列的存在进行的。

本发明还涉及如本文所定义的方法，其中，所述杂交反应是用杂交探针进行的，所述探针与固体支持物偶联，优选与膜偶联，并且，所述探针任选是捕获探针。

本发明还涉及编码包含在选自SEQ ID NO：9的氨基酸序列中的一个区的分离的HCV NS5核酸，其中，所述区包括菌株，分离物或基因型特异性核苷酸序列。

本发明还涉及至少包括SEQ ID NO：9的一部分的多肽或肽，其中，所述部分是在它的基因组中包括由SEQ ID NO：8所限定的NS5核酸区的一部分的病毒所特有的。

本发明还涉及用于检测本文所定义的HCV病毒感染的存在的方法，包括检测本文所定义的氨基酸序列，多肽或肽的存在。

本发明还涉及将本文所定义的核酸用于检测HCV的用途。

本发明还涉及将本文所定义的核酸用于确定HCV基因型的用途。

本发明还涉及用于检测含有本文所定义的HCV 5′UTR核酸的生物学样品中的HCV的诊断试剂盒。

本发明还涉及用于检测含有本文所定义的HCV NS5核酸的生物学样品中的HCV的诊断试剂盒。

本发明还涉及用于检测含有本文所定义的HCV NS5氨基酸序列，肽或多肽的生物学样品中的HCV的诊断试剂盒。

本发明还涉及可以检测本文所定义的HCV病毒的诊断试剂盒。

本发明还涉及用于本文所定义的方法中的诊断试剂盒。

本文所提到的所有文献或专利申请都被收作参考。下面的实施例对本发明的各方面进行了说明，但并非要以任何方式限定本发明的范围。

实施例

实施例1.具有INNO-LiPA HCV II的样品的基因型分析

按照生产商披露的方法(Innogenetics NV，Zwijnaarde，Belgium)，以来自美国的血清样品为原材料(IG57272)，进行RNA分离，cDNA合成，PCR，并且通过INNO-LiPA HCV II基因型分析测定，进行基因型分析。在LiPA条带上，出现了一个异常的线条形式(阳性线条1，2和6)，它不可能是上述任何基因型造成的。

实施例2.样品IG57272的5′NCR，核心和NS 5B区的测序。

为了确定IG57272的5′NCR区的序列，按照Stuyver等(1996)披露的方法扩增300bp的5′NCR片段。然后将该PCR片段克隆到pGEM-T载体上(Promega Corp.，USA)，并且用载体SP6/T7引物对克隆进行测序。所得到的5′NCR序列如图1A所示。

为了确定IG57272的核心区的序列，用引物HCPr52，HCPr54，HCPr634，HCPr635，HCPr636，HCPr637，HCPr638，HCPr639，HCPr640，HCPr641，HCPr666，HCPr667扩增1172bp的核心/E1片段。对引物的所有可能的组合进行了分析，但是只有用于外PCR的引物组合HCPr666/HCPr635和用于嵌套PCR的引物组合HCPr667/HCPr637能够产生需要的PCR片段。随后将该PCR片段克隆到pGEM-T载体(PromegaCorp.，USA)上，并且用载体SP6/T7引物对克隆进行测序。在图1B和图1C中示出了来自所得到的来自三个独立克隆，即克隆28454(SEQID NO：2)，克隆28452(SEQ ID NO：4)和克隆28451(SEQ ID NO：6)的核心核酸序列。在图1B和1C中示出了由上述三个独立的克隆的核心核酸序列推测的氨基酸序列，即克隆28454(SEQ ID NO：3)，克隆28452(SEQ ID NO：5)和克隆28451(SEQ ID NO：7)。在图4中示出了由三个其他的独立克隆：即克隆33400(SEQ ID NO：10)，克隆33402(SEQ ID NO：12)和克隆33403(SEQ ID NO：14)获得的核心/E1核酸序列的比对。在图2中示出了由来自三个独立克隆：即克隆33400(SEQ ID NO：11)，克隆33402(SEQ ID NO：13)和克隆33403(SEQ ID NO：15)的核心/E1核酸序列推测的氨基酸序列的比对。由克隆28454，28452，28451，33400，33402和33403推测的氨基酸序列的Latter Clustal W(1.8)多重序列比对在所述三种克隆之间仅在37和52号位置上出现了差别。

为了确定IG57272的NS5B区的序列，用引物HCPr292和HCPr295扩增400bp的NS5B片段，然后用引物HCPr293和HCPr294进行嵌套PCR，最终得到了380bp的NS5B片段。该NS5B PCR片段是从1.5％LMT琼脂糖凝胶中提取的，并且用于使用引物HCPr293和HCPr294的循环测序。在图1D中示出了所得到的NS5B核酸序列(SEQ ID NO：8)。在图1D中还示出了由所述核酸序列推测的氨基酸序列(SEQ ID NO：9)。

用于克隆的引物如下表所示：

SEQ IDNO：	HCPr No.	引物序列(5′到3′)
SEQ IDNO：	HCPr No.	引物序列(5′到3′)	16	29	GCTCATG(A/G)TGCACGGTCTACGAGACCT
17	52	ATGTTGGGTAAGGTCATCGATACCCT	16	29	GCTCATG(A/G)TGCACGGTCTACGAGACCT
17	52	ATGTTGGGTAAGGTCATCGATACCCT	18	54	CTATTACCAGTTCATCATCATATCCCA
19	95	TCTAGCCATGGCGTTAGT(A/T)(G/T)GAGTGT	18	54	CTATTACCAGTTCATCATCATATCCCA
19	95	TCTAGCCATGGCGTTAGT(A/T)(G/T)GAGTGT	20	96	CACTCGCAAGCACCCTATCAGGCAGT
21	98	CCCTGTGAGGAACT(C/G)CTGTCTTCACGC	20	96	CACTCGCAAGCACCCTATCAGGCAGT
21	98	CCCTGTGAGGAACT(C/G)CTGTCTTCACGC	22	292	CCCTATGGGCTTCTCGTATGA
23	293	TATGACACCCGCTGCTTTGACTC	22	292	CCCTATGGGCTTCTCGTATGA
23	293	TATGACACCCGCTGCTTTGACTC	24	294	CCTGGTCATAGCCTCCGTGAA
25	295	GGGGCCGAGTACCTGGTCAT	24	294	CCTGGTCATAGCCTCCGTGAA
25	295	GGGGCCGAGTACCTGGTCAT	26	634	CTCTCTTGC(G/T)TGACTGTGCCCGC
27	635	CGCGTCGACGCCGGCAAATAGCAGC	26	634	CTCTCTTGC(G/T)TGACTGTGCCCGC
27	635	CGCGTCGACGCCGGCAAATAGCAGC	28	636	GC(G/T)TGACTGTGCCCGCTTC(A/T)GCC
29	637	TCGACGCCGGCAAA(G/T)AGCA(A/T)CAGCAC	28	636	GC(G/T)TGACTGTGCCCGCTTC(A/T)GCC
29	637	TCGACGCCGGCAAA(G/T)AGCA(A/T)CAGCAC	30	638	CTGTC(G/T)TG(G/T)TTGACC(A/T)TCCCAGC
31	639	CCCGTCAACGCCGGC(A/T)AAGAGTA(A/T)C	30	638	CTGTC(G/T)TG(G/T)TTGACC(A/T)TCCCAGC
31	639	CCCGTCAACGCCGGC(A/T)AAGAGTA(A/T)C	32	640	GT(G/T)TGACCA(G/T)CCCAGCTTCCGCT
33	641	TCAACGCCGGC(A/T)AA(A/T)AGTA(A/T)C(A/T)(G/T)CAC	32	640	GT(G/T)TGACCA(G/T)CCCAGCTTCCGCT
33	641	TCAACGCCGGC(A/T)AA(A/T)AGTA(A/T)C(A/T)(G/T)CAC	34	666	ACTGCCTGATAGGGTGCTTGCGAG
35	667	CCCGGGAGGTCTCGTAGACC	34	666	ACTGCCTGATAGGGTGCTTGCGAG

实施例3系统发育分析

以前公开的序列是从EMBL/Genbank数据库中获得的。比对是用程序HCVALIGN(Stuyver等，1994c)或GENEBASE(Applied Maths，Kortrijk，Belgium)产生的。系统树构建是用程序TREECON和GENEBASE完成的。所得到系统树如图3所示。

实施例4新的HCV基因型的鉴定

分离物IG57272与已知的12种HCV基因型中的任一种都不属于同簇(参见实施例3)。IG57272似乎与其他进化分支6基因型(基因型6，7，8，9，11)的相关性都非常远，但是系统发育分析表明，分离物IG57272应当被确定为一种新的基因型。根据确定类型和亚型水平的国际指南，可以将IG57272分类为HCV基因型13。

表5.不同克隆的概述，它们的核酸和氨基酸序列在基因组和本发明的新的HCV类型的多蛋白中的位置，并且在表下面提供了它们的SEQID Nos。还提供了本发明的新的HCV类型的基因组或蛋白的多个片段的序列位置，SEQ ID Nos和区域。所有序列都是从IG57272 HCV-分离物中获得的。

克隆	核苷酸序列位置	SEQIDNO：	区	克隆	核苷酸序列位置	SEQIDNO：	区
克隆	核苷酸序列位置	SEQIDNO：	区	克隆	核苷酸序列位置	SEQIDNO：	区		31-329	1	5’UTR	28454	1-209	3	核心/部分E1
28454	330-957	2	核心/部分E1	28452	1-161	5	部分核心		31-329	1	5’UTR	28454	1-209	3	核心/部分E1
28454	330-957	2	核心/部分E1	28452	1-161	5	部分核心	28452	330-813	4	部分核心	28451	1-209	7	核心/部分E1
28451	330-957	6	核心/部分E1		2647-2753	9	NS5B	28452	330-813	4	部分核心	28451	1-209	7	核心/部分E1
28451	330-957	6	核心/部分E1		2647-2753	9	NS5B		8267-8590	8	NS5B	30400	1-373	11	核心/E1
30400	323-1448	10	核心/E1	30402	1-373	13	核心/E1		8267-8590	8	NS5B	30400	1-373	11	核心/E1
30400	323-1448	10	核心/E1	30402	1-373	13	核心/E1	30402	323-1448	12	核心/E1	30403	1-373	15	核心/E1
30402	323-1448	14	核心/E1	30400	17-209	50	核心/部分E1	30402	323-1448	12	核心/E1	30403	1-373	15	核心/E1
30402	323-1448	14	核心/E1	30400	17-209	50	核心/部分E1	30400	378-957	36	核心/部分E1	30402	17-209	51	核心/部分E1
30402	378-957	37	核心/部分E1	30403	17-209	52	核心/部分E1	30400	378-957	36	核心/部分E1	30402	17-209	51	核心/部分E1
30402	378-957	37	核心/部分E1	30403	17-209	52	核心/部分E1	30403	378-957	38	核心/部分E1	30400	1-191	53	核心
30400	330-902	39	核心	30402	1-191	54	核心	30403	378-957	38	核心/部分E1	30400	1-191	53	核心
30400	330-902	39	核心	30402	1-191	54	核心	30402	330-902	40	核心	30403	1-191	55	核心
30403	330-902	41	核心		192-373	56	E1	30402	330-902	40	核心	30403	1-191	55	核心
30403	330-902	41	核心		192-373	56	E1		903-1448	42	E1		68-78	57	V-核心
	531-563	43	V-核心		191-203	58	V1		903-1448	42	E1		68-78	57	V-核心
	531-563	43	V-核心		191-203	58	V1		903-938	44	V1		213-223	59	V2
	966-998	45	V2		230-242	60	V3		903-938	44	V1		213-223	59	V2
	966-998	45	V2		230-242	60	V3		1017-1055	46	V3		248-257	61	V4
	1071-1100	47	V4		294-303	62	V5		1017-1055	46	V3		248-257	61	V4
	1071-1100	47	V4		294-303	62	V5		1209-1238	48	V5		330-342	63	V6
	1317-1355	49	V6						1209-1238	48	V5		330-342	63	V6

表6.本发明中的新HCV类型的蛋白和核苷酸区域的概述，示出了相应的SEQ ID NO：，所述片段在HCV多蛋白或基因组中的区域(参见对氨基酸和核苷酸进行编号的附图)，SEQ ID NO：中的片段区域(即由SEQ ID NO：所限定的序列长度)，以及特定HCV序列与本发明新的HCV类型的序列至少应当具有的百分同一性。

HCV蛋白区和相应的SEQ ID NO：	HCV蛋白区的片段	SEQ ID NO的片段(片段的SEQ ID NO)	百分同一性
HCV蛋白区和相应的SEQ ID NO：	HCV蛋白区的片段	SEQ ID NO的片段(片段的SEQ ID NO)	百分同一性	核心；SEQ ID NOs：53-55	1-191	1-191	＞92％
E1；SEQ ID NO：56	192-373	1-182	＞79％	核心；SEQ ID NOs：53-55	1-191	1-191	＞92％
E1；SEQ ID NO：56	192-373	1-182	＞79％	核心/E1；SEQ ID NOs：11，13，15	1-373	1-373	＞85％
核心/E1[17-209]；SEQ ID NOs：50-52	17-209	1-193	＞91％	核心/E1；SEQ ID NOs：11，13，15	1-373	1-373	＞85％
核心/E1[17-209]；SEQ ID NOs：50-52	17-209	1-193	＞91％	NS5B；SEQ ID NO：9	2647-2753	1-107	＞87％

HCV核酸区和相应的SEQ ID NO：	HCV核酸区的片段	SEQ ID NO的片段	百分同一性
HCV核酸区和相应的SEQ ID NO：	HCV核酸区的片段	SEQ ID NO的片段	百分同一性	5’UTR；SEQ ID NO：1	31-328	1-298	＞99％
核心；SEQ ID NOs：39-41	330-902	1-573	＞85％	5’UTR；SEQ ID NO：1	31-328	1-298	＞99％
核心；SEQ ID NOs：39-41	330-902	1-573	＞85％	E1；SEQ ID NO：42	903-1448	1-546	＞71％
核心/E1；SEQ ID NOs：10，12，14	330-1448	1-1119	＞78％	E1；SEQ ID NO：42	903-1448	1-546	＞71％
核心/E1；SEQ ID NOs：10，12，14	330-1448	1-1119	＞78％	核心/E1[378-957]；SEQ ID NOs：36-38	378-957	1-580	＞84％
NS5B；SEQ ID NO：8	8267-8590	1-324	＞75％	核心/E1[378-957]；SEQ ID NOs：36-38	378-957	1-580	＞84％

表7.本发明新的HCV类型的具有SEQ ID NO：42的E1核苷酸序列的片段的概述，表明了所述片段在SEQ ID NO：42中的区域(即SEQ ID NO：42是具有546个核苷酸的序列，其编号从1到546号)，以及特定HCV序列与本发明的新的HCV类型的E1片段至少应当具有的百分同一性。

E1片段SEQID NO：42的片段	百分同一性	E1片段SEQID NO：42的片段	百分同一性
E1片段SEQID NO：42的片段	百分同一性	E1片段SEQID NO：42的片段	百分同一性	19-92	85％	337-400	85％
26-63	89％	337-407	88％	19-92	85％	337-400	85％
26-63	89％	337-407	88％	208-282	84％	337-413	87％
220-272	88％	340-407	86％	208-282	84％	337-413	87％
220-272	88％	340-407	86％	223-282	83％	340-413	86％
241-272	90％	346-407	90％	223-282	83％	340-413	86％
241-272	90％	346-407	90％	307-410	92％	349-407	86％
316-406	82％	358-410	88％	307-410	92％	349-407	86％
316-406	82％	358-410	88％	316-407	83％	365-413	93％
323-407	85％	367-407	95％	316-407	83％	365-413	93％
323-407	85％	367-407	95％	325-407	85％	367-410	93％
327-410	84％	368-407	95％	325-407	85％	367-410	93％
327-410	84％	368-407	95％	328-407	83％	370-407	92％
328-410	85％	370-410	92％	328-407	83％	370-407	92％
328-410	85％	370-410	92％	328-413	86％	373-407	97％
329-407	83％	373-413	95％	328-413	86％	373-407	97％
329-407	83％	373-413	95％	330-400	84％	373-415	95％
330-401	84％	376-410	94％	330-400	84％	373-415	95％
330-401	84％	376-410	94％	330-407	83％	376-413	94％
330-410	83％	379-407	93％	330-407	83％	376-413	94％
330-410	83％	379-407	93％	331-407	81％	379-410	96％
331-410	83％	379-419	95％	331-407	81％	379-410	96％
331-410	83％	379-419	95％	334-407	86％	510-540	93％
335-407	84％			334-407	86％	510-540	93％

表8.本发明新的HCV类型的具有SEQ ID NO：8的NS5B核苷酸序列的片段的概述，表明了所述片段在SEQ ID NO：8中的区域(即SEQ ID NO：8是具有324个核苷酸的序列，其编号从1到324号)，以及特定HCV序列与本发明的新的HCV类型的NS5B片段至少应当具有的百分同一性。

NS5B片段SEQ ID NO：8的片段	百分同一性	NS5B片段SEQ ID NO：8的片段	百分同一性	NS5B片段SEQ ID NO：8的片段	百分同一性
NS5B片段SEQ ID NO：8的片段	百分同一性	NS5B片段SEQ ID NO：8的片段	百分同一性	NS5B片段SEQ ID NO：8的片段	百分同一性	23-48	96％	121-216	82％	155-222	83％
26-62	89％	122-216	80％	158-217	85％	23-48	96％	121-216	82％	155-222	83％
26-62	89％	122-216	80％	158-217	85％	26-123	80％	138-207	87％	161-218	86％
26-195	79％	138-208	84％	177-207	96％	26-123	80％	138-207	87％	161-218	86％
26-195	79％	138-208	84％	177-207	96％	34-240	81％	138-213	82％	177-208	93％
59-217	80％	139-162	95％	177-213	91％	34-240	81％	138-213	82％	177-208	93％
59-217	80％	139-162	95％	177-213	91％	71-216	80％	139-168	93％	177-216	90％
83-207	80％	139-180	90％	179-208	93％	71-216	80％	139-168	93％	177-216	90％
83-207	80％	139-180	90％	179-208	93％	82-208	81％	139-184	86％	179-216	89％
86-124	89％	139-201	87％	182-207	96％	82-208	81％	139-184	86％	179-216	89％
86-124	89％	139-201	87％	182-207	96％	86-133	87％	139-213	88％	182-208	96％
86-198	81％	139-216	83％	191-216	96％	86-133	87％	139-213	88％	182-208	96％
86-198	81％	139-216	83％	191-216	96％	86-206	80％	140-184	88％	247-297	84％
89-162	82％	146-207	87％	256-279	95％	86-206	80％	140-184	88％	247-297	84％
89-162	82％	146-207	87％	256-279	95％	89-198	82％	146-210	89％	256-282	96％
89-216	79％	146-216	88％	256-290	91％	89-198	82％	146-210	89％	256-282	96％
89-216	79％	146-216	88％	256-290	91％	92-162	84％	149-198	86％	256-297	88％
92-165	82％	149-207	84％	256-298	90％	92-162	84％	149-198	86％	256-297	88％
92-165	82％	149-207	84％	256-298	90％	92-216	80％	149-208	86％	256-299	90％
104-195	81％	152-217	83％	256-303	87％	92-216	80％	149-208	86％	256-299	90％
104-195	81％	152-217	83％	256-303	87％	194-207	80％	153-207	85％	257-282	96％
107-216	81％	155-204	88％	257-291	93％	194-207	80％	153-207	85％	257-282	96％
107-216	81％	155-204	88％	257-291	93％	110-180	84％	155-207	86％	257-298	90％
110-240	81％	155-208	87％	257-303	91％	110-180	84％	155-207	86％	257-298	90％
110-240	81％	155-208	87％	257-303	91％	121-162	88％	155-216	83％	272-294	95％
		155-217	84％	272-298	92％	121-162	88％	155-216	83％	272-294	95％

序列表

<110>Innogenetics N.V.

<120>新的丙型肝炎病毒基因型及其作为预防剂、治疗剂和诊断剂的用途

<130>124 PCT

<140>EP 01120969.9

<141>2001-08-31

<160>63

<170>PatentIn version 3.1

<210>1

<211>299

<212>DNA

<213>丙型肝炎病毒

<400>1

ccctgtgagg aactactgtc ttcacgcaga aagcgtctag ccatggcgtt agtatgagtg 60

tcgtgcagcc tccaggaccc cccctcccgg gagagccata gtggtctgcg gaaccggtga 120

gtacaccgga attgccagga agaccgggtc ctttcttgga ttaacccgct ctatgcctgg 180

tcatttgggc gtgcccccgc gagactgcta gccgagtagt gttgggtcgc gaaaggcctt 240

gtggtactgc ctgatagggt gcttgcgagt gccccgggag gtctcgtaga ccgtgcacc 299

<210>2

<211>628

<212>DNA

<213>丙型肝炎病毒

<220>

<221>misc_特征

<222>(53)..(53)

<223>n是任意核苷酸

<400>2

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg ttnccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttgtt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aaggcttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcattgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgttgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaagac 480

gggattaatt atgcaacggg gaatttgccc ggttgctcct tttctatctt cctcttagct 540

cttctctcat gcctcactgt acctgcttca gctgtcccct atgctaataa gtctggtatt 600

taccatctta ccaacgactg tcctaatt 628

<210>3

<211>209

<212>PRT

<213>丙型肝炎病毒

<220>

<221>MISC_特征

<222>(18)..(18)

<223>Xaa是任意氨基酸

<400>3

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Xaa Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Ala Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

180 185 190

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

195 200 205

Asn

<210>4

<211>484

<212>DNA

<213>丙型肝炎病毒

<400>4

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg tcgccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttggt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aagacttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcactgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgtcgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaggac 480

ggga 484

<210>5

<211>161

<212>PRT

<213>丙型肝炎病毒

<400>5

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Val Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly

<210>6

<211>628

<212>DNA

<213>丙型肝炎病毒

<400>6

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg tcgccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttgtt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aagacttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcactgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgtcgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaggac 480

gggattaatt atgcaacggg gaatttgccc ggttgctcct tttctatctt cctcttagct 540

cttctctcat gcctcactgt acctgcttca gctgtcccct atgctaataa gtctggtatt 600

taccatctta ccaacgactg tcctaatt 628

<210>7

<211>209

<212>PRT

<213>丙型肝炎病毒

<400>7

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

180 185 190

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

195 200 205

Asn

<210>8

<211>324

<212>DNA

<213>丙型肝炎病毒

<400>8

cgttaccgaa agagacattc gtaccgagga gtccatttac caatcatgcc agctcgaccc 60

ggttgcccgg aaagcaatta catcgcttac cgagaggctg tatgtgggag gccctatgtt 120

caactctagg ggcgagccct gcggttaccg caggtgccgc gctagtgggg tcctacccac 180

cagcatgggt aacaccatca catgctacct caaggctaca gccgcatgcc gagcagccgg 240

acccatggac cttgacatgc tcgtgtgtgg ggacgacttg gtggtcatct cggagagcgc 300

gggtacggct gatgatgcag ctgc 324

<210>9

<211>107

<212>PRT

<213>丙型肝炎病毒

<400>9

Val Thr Glu Arg Asp Ile Arg Thr Glu Glu Ser Ile Tyr Gln Ser Cys

1 5 10 15

Gln Leu Asp Pro Val Ala Arg Lys Ala Ile Thr Ser Leu Thr Glu Arg

20 25 30

Leu Tyr Val Gly Gly Pro Met Phe Asn Ser Arg Gly Glu Pro Cys Gly

35 40 45

Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Pro Thr Ser Met Gly Asn

50 55 60

Thr Ile Thr Cys Tyr Leu Lys Ala Thr Ala Ala Cys Arg Ala Ala Gly

65 70 75 80

Pro Met Asp Leu Asp Met Leu Val Cys Gly Asp Asp Leu Val Val Ser

85 90 95

Arg Arg Ala Arg Val Arg Leu Met Met Gln Leu

100 105

<210>10

<211>1126

<212>DNA

<213>丙型肝炎病毒

<400>10

gtgcaccatg agcacgaatc ctaaacctca aagacaaacc aaaagaaaca ccaaccgtcg 60

ccctaaggat attaagttcc cgggcggcgg acagatcgtt ggtggagttt acttgttacc 120

acgcaggggc ccacgattgg gtgtgcgtgc ggcgaggaag acttccgagc gatcggagcc 180

gcggagtaaa cgtcagcgta ttccaaaggc tcgccagcct acgggccggc actggggtca 240

acccggttac ccatggcccc tctacggcaa cgagggctgc ggttgggcag gatggctcct 300

gtccccccgc ggctctcggc caagttgggg ccccaatgac ccacggcgta ggtcacgcaa 360

tttgggtaag gtcatcgata ccctaacgtg tggcctcgcc gacctctttg ggtacatccc 420

tgtcgtcggc ggaccgcttg gcggtgtcgc ggcagcgctg gcgcatggcg tcagggctgt 480

tgaggacggg attaattatg caacggggaa tttgcccggt tgctcctttt ctatcttcct 540

cttagctctt ctctcatgcc tcactgtacc tgcttcagct gtcccctatg ctaataagtc 600

tggtatttac catcttacca acgactgtcc taattccagc atcatttatg aagccgagga 660

catcatcatg cacatgcccg gttgtgttcc gtgcgtgttg gttggcaaca tctctcgatg 720

ctgggtccct gcctccccca ccttggccat tcctaacgcg agcgtcccgg tgcggagctt 780

ccgcaagcat gtggatcttc tcgtcggggc tgctgcgctt tgctcggcca tgtacgtggg 840

tgatctttgc ggtggtgtct tcttggtcgg tcaactgatt agttatcggc cgcgacagca 900

cgctactgtg caagattgca actgctccat ctacgcgggc catgttactg gtcatcgtat 960

ggcgtgggac atgatgatga attggtcgcc gactgtaacg taccttgtgt ccagcattct 1020

caggataccc cagatcttaa ttgacatctt tgttggtggc cactggggag tcataggagc 1080

tgtcttgttt tactccatgc aggccaactg ggccaaggtg atctgt 1126

<210>11

<211>373

<212>PRT

<213>丙型肝炎病毒

<400>11

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 l25

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

180 185 190

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

195 200 205

Asn Ser Ser Ile Ile Tyr Glu Ala Glu Asp Ile Ile Met His Met Pro

210 215 220

Gly Cys Val Pro Cys Val Leu Val Gly Asn Ile Ser Arg Cys Trp Val

225 230 235 240

Pro Ala Ser Pro Thr Leu Ala Ile Pro Asn Ala Ser Val Pro Val Arg

245 250 255

Ser Phe Arg Lys His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys

260 265 270

Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly

275 280 285

Gln Leu Ile Ser Tyr Arg Pro Arg Gln His Ala Thr Val Gln Asp Cys

290 295 300

Asn Cys Ser Ile Tyr Ala Gly His Val Thr Gly His Arg Met Ala Trp

305 310 315 320

Asp Met Met Met Asn Trp Ser Pro Thr Val Thr Tyr Leu Val Ser Ser

325 330 335

Ile Leu Arg Ile Pro Gln Ile Leu Ile Asp Ile Phe Val Gly Gly His

340 345 350

Trp Gly Val Ile Gly Ala Val Leu Phe Tyr Ser Met Gln Ala Asn Trp

355 360 365

Ala Lys Val Ile Cys

370

<210>12

<211>1126

<212>DNA

<213>丙型肝炎病毒

<400>12

gtgcaccatg agcacgaatc ctaaacctca aagacaaacc aaaagaaaca ccaaccgtcg 60

ccctaaggat attaagttcc cgggcggcgg acagatcgtt ggtggagttt acttggtacc 120

acgcaggggc ccacgattgg gtgtgcgtgc ggcgaggaag acttccgagc gatcggagcc 180

gcggagtaaa cgtcagcgta ttccaaaggc tcgccagcct acgggccggc actggggtca 240

acccggttac ccatggcccc tctacggcaa cgagggctgc ggttgggcag gatggctcct 300

gtccccccgc ggctctcggc caagttgggg ccccaatgac ccacggcgta ggtcacgcaa 360

tttgggtaag gtcatcgata ccctaacgtg tggcctcgcc gacctctttg ggtacatccc 420

tgtcgtcggc ggaccgcttg gcggtgtcgc ggcagcgctg gcgcatggcg tcagggctgt 480

tgaggacggg attaattatg caacggggaa tttgcccggt tgctcctttt ctatcttcct 540

cttagctctt ctctcatgcc tcactgtacc tgcttcagct gtcccctatg ctaataagtc 600

tggtatttac catcttacca acgactgccc taattccagc atcatttatg aagccgagga 660

catcatcatg cacatgcccg gttgtgttcc gtgcgtgttg gttggcaaca tctctcgatg 720

ctgggtccct gcctccccca ccttggccat tcctaacgcg agcgtcccgg tgcggagctt 780

ccgcaagcat gtggatcttc tcgtcggggc tgctgcgctt tgctcggcca tgtacgtggg 840

tgatctttgc ggtggcgtct tcttggtcgg tcaactgatt agttatcggc cgcgacagca 900

cgctactgtg caagattgca actgctccat ctacgcgggc catgttactg gtcatcgtat 960

ggcgtgggac atgatgatga attggtcgcc gactgtaacg taccttgtgt ccagcattct 1020

caggataccc cagatcttaa ttgacatctt tgttggtggc cactggggag tcataggagc 1080

tgtcttgttt tactccatgc aggccaactg ggccaaggtg atctgt 1126

<210>13

<211>373

<212>PRT

<213>丙型肝炎病毒

<400>13

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Val Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 ll0

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

180 185 190

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

195 200 205

Asn Ser Ser Ile Ile Tyr Glu Ala Glu Asp Ile Ile Met His Met Pro

210 215 220

Gly Cys Val Pro Cys Val Leu Val Gly Asn Ile Ser Arg Cys Trp Val

225 230 235 240

Pro Ala Ser Pro Thr Leu Ala Ile Pro Asn Ala Ser Val Pro Val Arg

245 250 255

Ser Phe Arg Lys His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys

260 265 270

Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly

275 280 285

Gln Leu Ile Ser Tyr Arg Pro Arg Gln His Ala Thr Val Gln Asp Cys

290 295 300

Asn Cys Ser Ile Tyr Ala Gly His Val Thr Gly His Arg Met Ala Trp

305 310 315 320

Asp Met Met Met Asn Trp Ser Pro Thr Val Thr Tyr Leu Val Ser Ser

325 330 335

Ile Leu Arg Ile Pro Gln Ile Leu Ile Asp Ile Phe Val Gly Gly His

340 345 350

Trp Gly Val Ile Gly Ala Val Leu Phe Tyr Ser Met Gln Ala Asn Trp

355 360 365

Ala Lys Val Ile Cys

370

<210>14

<211>1126

<212>DNA

<213>丙型肝炎病毒

<400>14

gtgcaccatg agcacgaatc ctaaacctca aagacaaacc aaaagaaaca ccaaccgtcg 60

ccctaaggat attaagttcc cgggcggcgg acagatcgtt ggtggagttt acttgttacc 120

acgcaggggc ccacgattgg gtgtgcgtgc ggcgaggaag gcttccgagc gatcggagcc 180

gcggagtaaa cgtcagcgta ttccaaaggc tcgccagcct acgggccggc attggggtca 240

acccggttac ccatggcccc tctacggcaa cgagggctgc ggttgggcag gatggctcct 300

gtccccccgc ggctctcggc caagttgggg ccccaatgac ccacggcgta ggtcacgcaa 360

tttgggtaag gtcatcgata ccctaacgtg tggcctcgcc gacctctttg ggtacatccc 420

tgttgtcggc ggaccgcttg gcggtgtcgc ggcagcgctg gcgcatggcg tcagggctgt 480

tgaagacggg attaattatg caacggggaa tttgcccggt tgctcctttt ctatcttcct 540

cttagctctt ctctcatgcc tcactgtacc tgcttcagct gtcccctatg ctaataagtc 600

tggtatttac catcttacca acgactgtcc taattccagc atcatttatg aagccgagga 660

catcatcatg cacatgcccg gttgtgttcc gtgcgtgttg gttggcaaca tctctcgatg 720

ctgggtccct gcctccccca ccttggccat tcctaacgcg agcgtcccgg tgcggagctt 780

ccgcaagcat gtggatcttc tcgtcggggc tgctgcgctt tgctcggcca tgtacgtggg 840

tgatctttgc ggtggtgtct tcttggtcgg tcaactgatt agttatcggc cgcgacagca 900

cgctactgtg caagattgca actgctccat ctacgcgggc catgttactg gtcatcgtat 960

ggcgtgggac atgatgatga attggtcgcc gactgtaacg taccttgtgt ccagcattct 1020

caggataccc cagatcttaa ttgacatctt tgttggtggc cactggggag tcataggagc 1080

tgtcttgttt tactccatgc aggccaactg ggccaaggtg atctgt 1126

<210>15

<211>373

<212>PRT

<213>丙型肝炎病毒

<400>15

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Ala Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

180 185 190

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

195 200 205

Asn Ser Ser Ile Ile Tyr Glu Ala Glu Asp Ile Ile Met His Met Pro

210 215 220

Gly Cys Val Pro Cys Val Leu Val Gly Asn Ile Ser Arg Cys Trp Val

225 230 235 240

Pro Ala Ser Pro Thr Leu Ala Ile Pro Asn Ala Ser Val Pro Val Arg

245 250 255

Ser Phe Arg Lys His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys

260 265 270

Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly

275 280 285

Gln Leu Ile Ser Tyr Arg Pro Arg Gln His Ala Thr Val Gln Asp Cys

290 295 300

Asn Cys Ser Ile Tyr Ala Gly His Val Thr Gly His Arg Met Ala Trp

305 310 315 320

Asp Met Met Met Asn Trp Ser Pro Thr Val Thr Tyr Leu Val Ser Ser

325 330 335

Ile Leu Arg Ile Pro Gln Ile Leu Ile Asp Ile Phe Val Gly Gly His

340 345 350

Trp Gly Val Ile Gly Ala Val Leu Phe Tyr Ser Met Gln Ala Asn Trp

355 360 365

Ala Lys Val Ile Cys

370

<210>16

<211>27

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 29

<400>16

gctcatgytg cacggtctac gagacct 27

<210>17

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 52

<400>17

atgttgggta aggtcatcga taccct 26

<210>18

<211>27

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 54

<400>18

ctattaccag ttcatcatca tatccca 27

<210>19

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 95

<400>19

tctagccatg gcgttagtwk gagtgt 26

<210>20

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 96

<400>20

cactcgcaag caccctatca ggcagt 26

<210>21

<211>27

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 98

<400>21

ccctgtgagg aactsctgtc ttcacgc 27

<210>22

<211>21

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 292

<400>22

ccctatgggc ttctcgtatg a 21

<210>23

<211>23

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 293

<400>23

tatgacaccc gctgctttga ctc 23

<210>24

<211>21

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 294

<400>24

cctggtcata gcctccgtga a 21

<210>25

<211>20

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 295

<400>25

ggggccgagt acctggtcat 20

<210>26

<211>23

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 634

<400>26

ctctcttgck tgactgtgcc cgc 23

<210>27

<211>25

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 635

<400>27

cgcgtcgacg ccggcaaata gcagc 25

<210>28

<211>23

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 636

<400>28

gcktgactgt gcccgcttcw gcc 23

<210>29

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 637

<400>29

tcgacgccgg caaakagcaw cagcac 26

<210>30

<211>23

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 638

<400>30

ctgtcktgkt tgaccwtccc agc 23

<210>31

<211>25

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 639

<400>31

cccgtcaacg ccggcwaaga gtawc 25

<210>32

<211>23

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 640

<400>32

gtktgaccak cccagcttcc gct 23

<210>33

<211>26

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 641

<400>33

tcaacgccgg cwaawagtaw cwkcac 26

<210>34

<211>24

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 666

<400>34

actgcctgat agggtgcttg cgag 24

<210>35

<211>20

<212>DNA

<213>人工序列

<220>

<221>misc_特征

<223>HCPr 667

<400>35

cccgggaggt ctcgtagacc 20

<210>36

<211>580

<212>DNA

<213>丙型肝炎病毒

<400>36

cgtcgcccta aggatattaa gttcccgggc ggcggacaga tcgttggtgg agtttacttg 60

ttaccacgca ggggcccacg attgggtgtg cgtgcggcga ggaagacttc cgagcgatcg 120

gagccgcgga gtaaacgtca gcgtattcca aaggctcgcc agcctacggg ccggcactgg 180

ggtcaacccg gttacccatg gcccctctac ggcaacgagg gctgcggttg ggcaggatgg 240

ctcctgtccc cccgcggctc tcggccaagt tggggcccca atgacccacg gcgtaggtca 300

cgcaatttgg gtaaggtcat cgatacccta acgtgtggcc tcgccgacct ctttgggtac 360

atccctgtcg tcggcggacc gcttggcggt gtcgcggcag cgctggcgca tggcgtcagg 420

gctgttgagg acgggattaa ttatgcaacg gggaatttgc ccggttgctc cttttctatc 480

ttcctcttag ctcttctctc atgcctcact gtacctgctt cagctgtccc ctatgctaat 540

aagtctggta tttaccatct taccaacgac tgtcctaatt 580

<210>37

<211>580

<212>DNA

<213>丙型肝炎病毒

<400>37

cgtcgcccta aggatattaa gttcccgggc ggcggacaga tcgttggtgg agtttacttg 60

gtaccacgca ggggcccacg attgggtgtg cgtgcggcga ggaagacttc cgagcgatcg 120

gagccgcgga gtaaacgtca gcgtattcca aaggctcgcc agcctacggg ccggcactgg 180

ggtcaacccg gttacccatg gcccctctac ggcaacgagg gctgcggttg ggcaggatgg 240

ctcctgtccc cccgcggctc tcggccaagt tggggcccca atgacccacg gcgtaggtca 300

cgcaatttgg gtaaggtcat cgatacccta acgtgtggcc tcgccgacct ctttgggtac 360

atccctgtcg tcggcggacc gcttggcggt gtcgcggcag cgctggcgca tggcgtcagg 420

gctgttgagg acgggattaa ttatgcaacg gggaatttgc ccggttgctc cttttctatc 480

ttcctcttag ctcttctctc atgcctcact gtacctgctt cagctgtccc ctatgctaat 540

aagtctggta tttaccatct taccaacgac tgccctaatt 580

<210>38

<211>580

<212>DNA

<213>丙型肝炎病毒

<400>38

cgtcgcccta aggatattaa gttcccgggc ggcggacaga tcgttggtgg agtttacttg 60

ttaccacgca ggggcccacg attgggtgtg cgtgcggcga ggaaggcttc cgagcgatcg 120

gagccgcgga gtaaacgtca gcgtattcca aaggctcgcc agcctacggg ccggcattgg 180

ggtcaacccg gttacccatg gcccctctac ggcaacgagg gctgcggttg ggcaggatgg 240

ctcctgtccc cccgcggctc tcggccaagt tggggcccca atgacccacg gcgtaggtca 300

cgcaatttgg gtaaggtcat cgatacccta acgtgtggcc tcgccgacct ctttgggtac 360

atccctgttg tcggcggacc gcttggcggt gtcgcggcag cgctggcgca tggcgtcagg 420

gctgttgaag acgggattaa ttatgcaacg gggaatttgc ccggttgctc cttttctatc 480

ttcctcttag ctcttctctc atgcctcact gtacctgctt cagctgtccc ctatgctaat 540

aagtctggta tttaccatct taccaacgac tgtcctaatt 580

<210>39

<211>573

<212>DNA

<213>丙型肝炎病毒

<400>39

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg tcgccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttgtt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aagacttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcactgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgtcgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaggac 480

gggattaatt atgcaacggg gaatttgccc ggttgctcct tttctatctt cctcttagct 540

cttctctcat gcctcactgt acctgcttca gct 573

<210>40

<211>573

<212>DNA

<213>丙型肝炎病毒

<400>40

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg tcgccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttggt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aagacttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcactgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgtcgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaggac 480

gggattaatt atgcaacggg gaatttgccc ggttgctcct tttctatctt cctcttagct 540

cttctctcat gcctcactgt acctgcttca gct 573

<210>41

<211>573

<212>DNA

<213>丙型肝炎病毒

<400>41

atgagcacga atcctaaacc tcaaagacaa accaaaagaa acaccaaccg tcgccctaag 60

gatattaagt tcccgggcgg cggacagatc gttggtggag tttacttgtt accacgcagg 120

ggcccacgat tgggtgtgcg tgcggcgagg aaggcttccg agcgatcgga gccgcggagt 180

aaacgtcagc gtattccaaa ggctcgccag cctacgggcc ggcattgggg tcaacccggt 240

tacccatggc ccctctacgg caacgagggc tgcggttggg caggatggct cctgtccccc 300

cgcggctctc ggccaagttg gggccccaat gacccacggc gtaggtcacg caatttgggt 360

aaggtcatcg ataccctaac gtgtggcctc gccgacctct ttgggtacat ccctgttgtc 420

ggcggaccgc ttggcggtgt cgcggcagcg ctggcgcatg gcgtcagggc tgttgaagac 480

gggattaatt atgcaacggg gaatttgccc ggttgctcct tttctatctt cctcttagct 540

cttctctcat gcctcactgt acctgcttca gct 573

<210>42

<211>546

<212>DNA

<213>丙型肝炎病毒

<400>42

gtcccctatg ctaataagtc tggtatttac catcttacca acgactgtcc taattccagc 60

atcatttatg aagccgagga catcatcatg cacatgcccg gttgtgttcc gtgcgtgttg 120

gttggcaaca tctctcgatg ctgggtccct gcctccccca ccttggccat tcctaacgcg 180

agcgtcccgg tgcggagctt ccgcaagcat gtggatcttc tcgtcggggc tgctgcgctt 240

tgctcggcca tgtacgtggg tgatctttgc ggtggtgtct tcttggtcgg tcaactgatt 300

agttatcggc cgcgacagca cgctactgtg caagattgca actgctccat ctacgcgggc 360

catgttactg gtcatcgtat ggcgtgggac atgatgatga attggtcgcc gactgtaacg 420

taccttgtgt ccagcattct caggataccc cagatcttaa ttgacatctt tgttggtggc 480

cactggggag tcataggagc tgtcttgttt tactccatgc aggccaactg ggccaaggtg 540

atctgt 546

<210>43

<211>33

<212>DNA

<213>丙型肝炎病毒

<400>43

gctcgccagc ctacgggccg gcactggggt caa 33

<210>44

<211>36

<212>DNA

<213>丙型肝炎病毒

<400>44

gtcccctatg ctaataagtc tggtatttac catctt 36

<210>45

<211>33

<212>DNA

<213>丙型肝炎病毒

<400>45

atttatgaag ccgaggacat catcatgcac atg 33

<210>46

<211>39

<212>DNA

<213>丙型肝炎病毒

<400>46

gtgttggttg gcaacatctc tcgatgctgg gtccctgcc 39

<210>47

<211>30

<212>DNA

<213>丙型肝炎病毒

<400>47

attcctaacg cgagcgtccc ggtgcggagc 30

<210>48

<211>30

<212>DNA

<213>丙型肝炎病毒

<400>48

cggccgcgac agcacgctac tgtgcaagat 30

<210>49

<211>39

<212>DNA

<213>丙型肝炎病毒

<400>49

gtaacgtacc ttgtgtccag cattctcagg ataccccag 39

<210>50

<211>193

<212>PRT

<213>丙型肝炎病毒

<400>50

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

1 5 10 15

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

20 25 30

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

35 40 45

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

50 55 60

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

65 70 75 80

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

85 90 95

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

100 105 110

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

115 120 125

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

130 135 140

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

145 150 155 160

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

165 170 175

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

180 185 190

Asn

<210>51

<211>193

<212>PRT

<213>丙型肝炎病毒

<400>51

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

1 5 10 15

Gly Val Tyr Leu Val Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

20 25 30

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

35 40 45

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

50 55 60

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

65 70 75 80

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

85 90 95

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

100 105 110

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

115 120 125

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

130 135 140

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

145 150 155 160

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

165 170 175

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

180 185 190

Asn

<210>52

<211>193

<212>PRT

<213>丙型肝炎病毒

<400>52

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

1 5 10 15

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

20 25 30

Ala Arg Lys Ala Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

35 40 45

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

50 55 60

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

65 70 75 80

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

85 90 95

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

100 105 110

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

115 120 125

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

130 135 140

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

145 150 155 160

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val

165 170 175

Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Pro

180 185 190

Asn

<210>53

<211>191

<212>PRT

<213>丙型肝炎病毒

<400>53

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala

180 185 190

<210>54

<211>191

<212>PRT

<213>丙型肝炎病毒

<400>54

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Val Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Thr Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala

180 185 190

<210>55

<211>191

<212>PRT

<213>丙型肝炎病毒

<400>55

Met Ser Thr Asn Pro Lys Pro Gln Arg Gln Thr Lys Arg Asn Thr Asn

1 5 10 15

Arg Arg Pro Lys Asp Ile Lys Phe Pro Gly Gly Gly Gln Ile Val Gly

20 25 30

Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala

35 40 45

Ala Arg Lys Ala Ser Glu Arg Ser Glu Pro Arg Ser Lys Arg Gln Arg

50 55 60

Ile Pro Lys Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln Pro Gly

65 70 75 80

Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Cys Gly Trp Ala Gly Trp

85 90 95

Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Asn Asp Pro

100 105 110

Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125

Gly Leu Ala Asp Leu Phe Gly Tyr Ile Pro Val Val Gly Gly Pro Leu

130 135 140

Gly Gly Val Ala Ala Ala Leu Ala His Gly Val Arg Ala Val Glu Asp

145 150 155 160

Gly Ile Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile

165 170 175

Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Val Pro Ala Ser Ala

180 185 190

<210>56

<211>182

<212>PRT

<213>丙型肝炎病毒

<400>56

Val Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu Thr Asn Asp Cys

1 5 10 15

Pro Asn Ser Ser Ile Ile Tyr Glu Ala G1u Asp Ile Ile Met His Met

20 25 30

Pro Gly Cys Val Pro Cys Val Leu Val Gly Asn Ile Ser Arg Cys Trp

35 40 45

Val Pro Ala Ser Pro Thr Leu Ala Ile Pro Asn Ala Ser Val Pro Val

50 55 60

Arg Ser Phe Arg Lys His Val Asp Leu Leu Val Gly Ala Ala Ala Leu

65 70 75 80

Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Gly Val Phe Leu Val

85 90 95

Gly Gln Leu Ile Ser Tyr Arg Pro Arg Gln His Ala Thr Val Gln Asp

100 105 110

Cys Asn Cys Ser Ile Tyr Ala Gly His Val Thr Gly His Arg Met Ala

115 120 125

Trp Asp Met Met Met Asn Trp Ser Pro Thr Val Thr Tyr Leu Val Ser

130 135 140

Ser Ile Leu Arg Ile Pro Gln Ile Leu Ile Asp Ile Phe Val Gly Gly

145 150 155 160

His Trp Gly Val Ile Gly Ala Val Leu Phe Tyr Ser Met Gln Ala Asn

165 170 175

Trp Ala Lys Val Ile Cys

180

<210>57

<211>11

<212>PRT

<213>丙型肝炎病毒

<400>57

Ala Arg Gln Pro Thr Gly Arg His Trp Gly Gln

1 5 10

<210>58

<211>12

<212>PRT

<213>丙型肝炎病毒

<400>58

Val Pro Tyr Ala Asn Lys Ser Gly Ile Tyr His Leu

1 5 10

<210>59

<211>11

<212>PRT

<213>丙型肝炎病毒

<400>59

Ile Tyr Glu Ala Glu Asp Ile Ile Met His Met

1 5 10

<210>60

<211>13

<212>PRT

<213>丙型肝炎病毒

<400>60

Val Leu Val Gly Asn Ile Ser Arg Cys Trp Val Pro Ala

1 5 10

<210>61

<211>10

<212>PRT

<213>丙型肝炎病毒

<400>61

Ile Pro Asn Ala Ser Val Pro Val Arg Ser

1 5 10

<210>62

<211>10

<212>PRT

<213>丙型肝炎病毒

<400>62

Arg Pro Arg Gln His Ala Thr Val Gln Asp

1 5 10

<210>63

<211>13

<212>PRT

<213>丙型肝炎病毒

<400>63

Val Thr Tyr Leu Val Ser Ser Ile Leu Arg Ile Pro Gln

1 5 10

Claims

1.一种具有不同于进化枝6HCV基因型6-9和11的基因型的进化枝6 HCV病毒的分离的HCV多核酸，所述多核酸的特征在于，它包括选自下面任意一种的核酸序列：

-由SEQI D NOs：1，2，4，6，8，10，12，14，36-47或49中任意一种所限定的核酸序列；

-包括相对于HCV多蛋白编码序列的起始密码子而言，位于-159号位置上的腺嘌呤核苷酸的5’UTR核酸序列

-与SEQ ID NOs：39-41中任意一种的同一性至少为89％的核心核酸序列；

-与SEQ ID NO：42的同一性至少为71％的E1核酸序列；

-与SEQ ID NO：8的同一性至少为75％的NS5B核酸序列；

-编码由SEQ ID NOs：3，5，7，9，11，13，15，50-61或63中任意一种所限定的HCV多蛋白片段的核酸序列；

-编码与SEQ ID NO：53-55中任意一种的同一性至少为92％的核心蛋白片段的核酸序列；

为所述HCV基因组所特有的上述任意一种核酸序列的片段；或

为所述HCV基因型所特有的所述任意一种核酸序列或所述任意一种核酸序列的片段的互补体。

2.如权利要求1的分离的多核酸，它是RNA，DNA，cDNA或合成多核酸。

3.一种寡核苷酸，它包括来自权利要求1或2的HCV多核酸，并且为它所特有的至少8个连续的核苷酸。

4.一种寡核苷酸，它由来自权利要求1或2的HCV多核酸，并且为它所特有的至少8个连续的核苷酸组成。

5.如权利要求3或4的寡核苷酸，它是能够特异性地扩增权利要求1或2的HCV多核酸的引物。

6.如权利要求3或4的寡核苷酸，它是能够特异性地与权利要求1或2的HCV多核酸杂交的探针。

7.如权利要求3或4的寡核苷酸，它能够特异性地检测权利要求1或2的HCV多核酸。

8.如权利要求3或4的寡核苷酸，它能够确定权利要求1或2的HCV多核酸的基因型。

9.如权利要求3-8中任意一项的寡核苷酸，除了脱氧核糖核酸单体之外，它还包括下列一种或多种成分：

-修饰过的核苷酸碱基，

-标记过的核苷酸，

-修饰过的多核酸主链，

-肽核酸单体，

-锁闭的核酸单体，和/或

-核糖核酸单体。

10.一种重组载体，它包括权利要求1或2的HCV多核酸。

11.如权利要求10的载体，它是能够驱动由包含在所述载体中的HCV多核酸编码的HCV肽表达的表达载体。

12.一种宿主细胞，它包括权利要求1或2的HCV多核酸或用权利要求10或11的载体转化过。

13.一种具有不同于进化枝6基因型6-9和11的基因型的进化枝6 HCV病毒的分离的HCV多肽，所述多肽的特征在于，它包括选自下列任意一种的氨基酸序列：

-由SEQ ID NOs：3，5，7，9，11，13，15，50-61或63中任意一种所定义的氨基酸序列；

-与SEQ ID NO：56的同一性至少为79％的E1氨基酸序列；

-与SEQ ID NO：9的同一性至少为87％的NS5B氨基酸序列；

-由与SEQ ID NO：8的同一性至少为75％的核酸序列编码的NS5B氨基酸序列；或

为所述HCV基因型所特有的上述氨基酸序列中任意一种的片段。

14.如权利要求13的多肽或它的片段，它是重组多肽，合成多肽或含有一个或多个修饰过的或标记过的氨基酸的多肽。

15.一种用于生产权利要求13或14的重组多肽的方法，包括：

-用权利要求10或11的重组载体转化合适的细胞宿主，

-在能够表达所述插入片段的条件下培养所述转化过的细胞宿主，和

-收获所述多肽。

16.用权利要求13或14的至少一种多肽或它的片段进行免疫而产生的抗体，所述抗体能与所述多肽或它的片段中的任意一种特异性地反应，并且，所述抗体优选是单克隆抗体。

17.一种药物组合物，它含有至少一种权利要求13或14的多肽或它的片段，以及合适的赋形剂，稀释剂或载体。

18.权利要求17的药物组合物，用于预防或治疗HCV感染的方法。

19.一种用于免疫哺乳动物使其抗HCV感染的疫苗，包括至少一种权利要求13或14的多肽，以及可以药用的载体。

20.一种药物组合物，包括权利要求16的抗体和合适的赋形剂，稀释剂或载体。

21.权利要求20的药物组合物，用于预防或治疗HCV感染的方法。

22.一种用于检测生物学样品中HCV病毒的存在的方法，包括检测权利要求1或2的多核酸或它的片段的存在的步骤。

23.如权利要求22的方法，包括以下步骤：

(i)从被怀疑含有权利要求1或2的HCV多核酸或它的片段的生物学样品中获得靶HCV多核酸；

(ii)获得步骤(i)的靶HCV多核酸的核酸序列；

(iii)根据在步骤(ii)中获得的核酸序列，推断权利要求1或2的HCV多核酸或它的片段的存在，并由此推断HCV病毒在所述生物学样品中的存在。

24.如权利要求22的方法，包括以下步骤：

(ii)让步骤(i)的靶HCV多核酸与能够分辨存在于所述靶HCV多核酸中的至少一个基因型特异性核苷酸的寡核苷酸接触，并且，所述接触产生了一种分辨信号；

(iii)根据在步骤(ii)中获得的分辨信号，推断权利要求1或2的HCV多核酸或它的片段的存在，并由此推断HCV病毒在所述生物学样品中的存在。

25.一种用于确定存在于生物学样品中的HCV病毒的基因型的方法，包括检测权利要求1或2的HCV多核酸或它的片段的存在的步骤。

26.如权利要求25的方法，包括以下步骤：

(ii)获得步骤(i)的靶HCV多核酸的核酸序列；

(iii)根据在步骤(ii)中获得的核酸序列，推断权利要求1或2的HCV多核酸或它的片段的存在，并由此推断存在于所述生物学样品中的所述HCV病毒的基因型。

27.如权利要求25的方法，包括以下步骤：

(iii)根据在步骤(ii)中获得的分辨信号，推断权利要求1或2的HCV多核酸或它的片段的存在，并由此推断存在于所述生物学样品中的所述HCV的基因型。

28.如权利要求22或25的方法，它们是基于扩增反应，杂交反应，反向杂交反应或测序反应的。

29.如权利要求22或25的方法，包括：

-用权利要求5或9的寡核苷酸扩增权利要求1或2的多核酸或它的片段；

-让权利要求1或2的多核酸或它的片段与权利要求6或9的寡核苷酸杂交；或

-用权利要求7或9的寡核苷酸检测权利要求1或2的多核酸或它的片段。

30.如权利要求25的方法，包括用权利要求8或9的寡核苷酸确定权利要求1或2的多核酸或它的片段的基因型。

31.一种用于检测HCV病毒在生物学样品中的存在的诊断试剂盒，所述试剂盒包括如权利要求5-9中任意一项的寡核苷酸。

32.一种用于确定存在于生物学样品中的HCV病毒的基因型的诊断试剂盒，所述试剂盒包括权利要求5-9中任意一项的寡核苷酸。

33.如权利要求31或32的诊断试剂盒，其中，所述寡核苷酸是与固体支持物连接的。

34.如权利要求33的诊断试剂盒，其中，将多种寡核苷酸连接在所述固体支持物的特定位点上。

35.如权利要求34的诊断试剂盒，其中，所述固体支持物是膜条带，并且，所述寡核苷酸是以平行线形式与所述膜偶联的探针。

36.一种用于确定HCV病毒在生物学样品中的存在和/或确定HCV病毒的基因型的诊断试剂盒，所述试剂盒包括：

(i)用于从被怀疑含有权利要求1或2的HCV多核酸或它的片段的生物学样品中获得靶HCV多核酸的核酸序列的工具；

(ii)用于根据从所述靶HCV多核酸获得的核酸序列推断为权利要求1或2的HCV多核酸所特有的多核酸序列的存在，并由此推断HCV在所述生物学样品中的存在和/或所述HCV的基因型的工具。

37.一种用于检测存在于生物学样品中的HCV抗体的方法，包括：

(i)让所述要分析HCV的存在的生物学样品与权利要求13或14的多肽或它的片段接触，

(ii)检测由所述抗体和多肽形成的免疫复合物。

38.一种用于HCV类型分析的方法，包括：

(ii)检测由所述抗体和多肽形成的免疫复合物。

39.一种用于检测生物学样品中HCV病毒的存在的诊断试剂盒，所述试剂盒包括至少一种权利要求13或14的多肽或它的片段，所述多肽任选与固体支持物结合。

40.一种用于HCV类型分析的诊断试剂盒，所述试剂盒包括至少一种权利要求13或14的多肽或它的片段，所述多肽任选与固体支持物结合。

41.权利要求39或40的诊断试剂盒，所述试剂盒包括多种与固体支持物的特定位点连接的多肽。

42.权利要求41的诊断试剂盒，其中，所述固体支持物是膜条带，而所述多肽以平行线形式与所述膜偶联。

43.一种用于检测存在于生物学样品中的HCV抗原的方法，包括：

(I)让所述生物学样品与权利要求16的抗体接触，

(ii)检测由所述HCV抗原和所述抗体形成的免疫复合物。

44.一种用于检测生物学样品中HCV病毒的存在的诊断试剂盒，所述试剂盒包括至少一种权利要求16的抗体，所述抗体任选与固体支持物结合。

45.一种药物组合物，包括至少一种权利要求1或2的多核酸或它的片段，以及合适的赋形剂，稀释剂或载体。

46.权利要求45的药物组合物，用于预防或治疗HCV感染的方法。

47.一种用于免疫哺乳动物，使其抗HCV感染的DNA疫苗，包括至少一种权利要求1或2的多核酸，以及可以药用的载体。