KR20200003160A

KR20200003160A - 조혈모세포의 형질도입을 위한 개선된 렌티바이러스

Info

Publication number: KR20200003160A
Application number: KR1020197035650A
Authority: KR
Inventors: 마이클 로취리; 웨스 요네모토; 라미아 안카라; 잭 마이클 루나
Original assignee: 바이오마린 파머수티컬 인크.
Priority date: 2017-05-03
Filing date: 2018-05-03
Publication date: 2020-01-08
Also published as: US20210139932A1; WO2018204694A1; EP3619299A1; JP2020518275A; AU2018261637A1; CA3062450A1

Abstract

적어도 하나의 이종 외피 단백질을 포함하는 외피 내에 패키지화된, 이종 전이유전자를 운반하는 렌티바이러스 벡터를 포함하는 재조합 바이러스가 개시된다. 또한, 이러한 재조합 바이러스를 제조하는 방법과 이러한 바이러스를 사용하여 유전자를 선택된 표적세포로 전달하는 방법이 개시된다. 이러한 재조합 바이러스는 조혈모세포, 특히 CD34+ 세포를 형질도입하는 데 있어 특히 유용하다.

Description

조혈모세포의 형질도입을 위한 개선된 렌티바이러스

관련 출원의 상호 참조

본 출원은 2017년 5월 3일에 출원된 USSN 62/500,874의 혜택과 우선권을 주장하며, 해당 출원의 전체 내용은 모든 목적을 위하여 본 출원에 참조로서 포함된다.

기술분야

본 개시의 분야는 조혈모세포, 구체적으로 인간 CD34+ 세포의 렌티바이러스 형질도입 개선을 위한 것이다.

재조합 렌티바이러스는 아데노신 데아미나제 결손증(Farinelli, et al, 2014), β-지중해 빈혈, 겸상적혈구병(Negre et al., 2016), 증중복합 면역결핍증, 이염색 백색질장애, 부신백질 이영양증, Wiskott-Aldrich 증후군, 만성 육아종병(Booth et al., 2016) 및 일부 리소좀 축적질환(Rastall, et al., 2015)과 같은 유전질환을 치료하기 위하여 이종 전이유전자들(렌티바이러스로부터 유래하지 않는 유전자들)을 조혈모세포 내로 전달하는 데 유용하다.

그러나, 렌티바이러스의 제1 조혈모세포(예컨대, 인간 CD34+ 세포) 형질도입 효율은 293T 세포와 같은 형질전환 세포주만큼 높지 않다. 이러한 효율의 차이를 설명하기 위한 가설이 여럿 제안된 바 있다. 현재까지 제조된 거의 모든 재조합 렌티바이러스는 수포성 구내염 바이러스(VSV)의 Indiana 주(strain) 유래의 외피 단백질을 포함한다. 휴식기의 CD34 세포들은 저밀도 지단백질 수용체인(Finkelshtein, et al, 2013), VSV(Indiana)에 대한 주수용체를 매우 낮은 수준으로 발현하는 것으로 확인되었다(Amirache, et al., 2014). 동결된 CD34+ 세포의 생존률 유지 및 세포분열 촉진에 필요한, CD34 세포의 사이토카인 자극은 저밀도 지단백질 수용체를 상향 조절하며 VSV의 Indiana 주 유래의 외피 단백질을 포함하는 렌티바이러스에 의한 형질도입을 적절히 증가시킨다. 그러므로, 저밀도 지단백질 수용체를 세포 내 진입을 위한 수용체로서 사용하지 않는, 외피 단백질을 포함하는 재조합 렌티바이러스와, VSV 외피 단백질에 의한 형질도입 개선 방법이 유용할 것이다.

새로운 외피형 바이러스들이 계속해서 발견되고 있다. 특히, 최근 수년 동안 대량 병렬(또는 "심층") 핵산 서열분석 방법을 통해 바이러스들의 서열이 확인되었다. 이들 서열 중 다수는 생물학적 특징이 알려지지 않은 바이러스에서 유래한 것이다. 그러므로, 이들은 조혈모세포의 형질도입 개선과 같은 유용한 특성을 갖는 외피 단백질을 발견할 수 있는 기회를 제공한다.

조혈모세포의 형질도입 개선을 위한 또 다른 접근 방법은 렌티바이러스와 회합할 수 있는 비바이러스 단백질(즉, 세포 단백질)을 확인하고, 예를 들어 CD34+ 세포 또는 CD133+ 세포와 같이 장기간 재생 조혈모세포로 생각되는 기타 하위 세포들에 대한 결합을 강화하도록 하는 것이다. 이러한 목적을 위하여 CD133에 결합하여 홍역 바이러스 외피 단백질과 융합되는 단쇄 항체들이 사용되었다(Brendel, et al, 2015). 조작되고 융합된 외피 단백질을 갖는 이러한 렌티바이러스들은 표적세포에 대한 선택성은 더 우수할 수 있으나, 이때 바이러스 생산량이 감소되는 경우가 흔히 있다. CD34 세포의 표면에 단백질을 결합시키는 다른 단백질이 유용할 수 있는데, 특히 막관통 단백질일 경우 렌티바이러스의 막 내부로 더 쉽게 통합될 수 있다는 점에서 그러하다. 예컨대, CD52는 CD34+ 세포 내에서 발현되고(Klabusay, M., et al, 2007), SIGLEC10은 CD52에 대한 리간드로 알려져 있다(Bandala-Sanchez E., et al., 2013). CD34는 CD34+ 세포에서 발현되고, L-셀렉틴은 CD34에 결합하는 리간드로 알려져 있다(Nielsen, J. S., et al., 2009). 이러한 단백질들은 바이러스 생산자 세포(전형적으로, 인간 293T 세포) 내에서 발현되지 않는 것이 바람직한데, 그 이유는 바이러스 생산자 세포 내 외피-수용체 상호작용이 바이러스 생산자 세포 내에서 독성을 야기하여 바이러스 생산을 위하여 일시적인 트랜스펙션 시스템의 이용을 필요로 하게 하고 안정적인 렌티바이러스 생산 세포주의 발생을 방해할 것으로 생각되기 때문이다.

제1 인간 조혈모세포에 대한 렌티바이러스들의 형질도입 효율과 관련된 이러한 문제점들로 인해, 유전자치료 분야에서 인간 조혈모세포의 렌티바이러스 형질도입 개선이 요구된다 하겠다.

본 출원에는 재조합 렌티바이러스에 의한 인간 CD34+ 세포와 같은 조혈모세포의 형질도입을, 전형적인 VSV-G(Indiana 주) 슈도타입화된 렌티바이러스보다 효과적이게 하는 베지큘로바이러스 외피 단백질 및/또는 아레나바이러스 외피 단백질과, 예컨대 렌티바이러스 생산세포 내에서, L-셀렉틴과 같은 인간 CD34+ 세포에 결합하기 위한 리간드의 발현에 의한, 재조합 렌티바이러스에 의한 인간 CD34+ 세포의 형질도입을 개선하기 위한 방법이 개시되어 있다. 따라서, 다양한 측면에 있어서, 본 개시(들)은 하기의 구현예들 중 하나 이상을 포함하나 반드시 그에 제한되는 것은 아니다.

일 측면에 있어서, 본 발명은 조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스로서, 상기 재조합 렌티바이러스는 i) 이종 전이유전자, ii) 바이러스 외피 단백질 및 iii) CD34+ 세포와의 결합을 위한 리간드인 단백질을 포함하는 재조합 렌티바이러스를 제공한다. 일 구현예에 있어서, 상기 재조합 렌티바이러스는 베지큘로바이러스 외피 단백질을 포함한다. 예컨대, 상기 베지큘로바이러스 외피 단백질은 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 베지큘로바이러스 종으로부터 유래한다. VSV-G 외피 단백질은 VSV-G의 Arizona, Indiana 또는 New Jersey 주(strain)로부터 유래할 수 있다.

또한, 상기 재조합 렌티바이러스는 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43로 개시된 바이러스 외피 단백질의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 바이러스 외피 단백질을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 하나 이상의 다른 구현예에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43로 개시된 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

다른 구현예에 있어서, 상기 재조합 렌티바이러스는 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 하나를 포함하는 바이러스 외피 단백질을 포함한다. 또한, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개 전부를 포함한다.

다른 구현예에 있어서, 상기 재조합 렌티바이러스는 아레나바이러스 외피 단백질을 포함할 수 있다. 예컨대, 상기 아레나바이러스 외피 단백질은 마츄포(Machupo), 주닌(Junin), 악코조코아틀라(Ocozocoautla), 타카리브(Tacaribe), 구아나리토(Guanarito), 아마파르(Amapar), 쿠픽시(Cupixi), 사비아(Sabia) 또는 차프레(Chapre) 바이러스로부터 유래한다. 또한, 상기 재조합 렌티바이러스는 서열번호 제 41의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 바이러스 외피 단백질을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 하나 이상의 다른 구현예에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 41에 기재된 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

본 개시의 재조합 렌티바이러스 중 임의의 것은 인간 CD34+ 세포와 같은 조혈모세포를 형질도입할 수 있다.

본 개시의 재조합 렌티바이러스 중 임의의 것은 벡터를 더 포함하며, 상기 벡터는 프로모터에 작동 가능하게 연결된 상기 이종 전이유전자를 포함한다.

본 개시의 재조합 렌티바이러스 중 임의의 것은 자체 활성화(SIN) LTR을 포함한다.

다른 구현예에 있어서, 상기 재조합 렌티바이러스의 이종 전이유전자는 인간 단백질을 암호화한다. 선택적으로, 상기 이종 전이유전자는 인간 헤모글로빈 단백질을 암호화한다. 또 다른 구현예에 있어서, 상기 재조합 렌티바이러스는 또한 CD34+ 세포에 대한 결합용 리간드인 단백질을 포함한다. 선택적으로, CD34+ 세포에 대한 결합용 리간드인 상기 단백질은 상기 재조합 렌티바이러스의 표면에 존재한다. CD34+ 세포에 대한 결합용 리간드인 상기 단백질은 서열번호 39의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 선택적으로, 인간 CD34+ 세포에 대한 결합용 리간드인 상기 단백질은 서열번호 39의 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

또 다른 구현예에 있어서, 본 개시의 재조합 렌티바이러스 중 어느 하나는 상기 외피 단백질을 발현하는 벡터와 L-셀렉틴을 발현하는 상기 벡터의 농도비가 1:2 내지 1:5 범위인 세포에 의해 생산된다. 또한, 본 개시의 재조합 렌티바이러스 중 어느 하나에 있어서, 상기 외피 단백질과 L-셀렉틴의 농도비는 1:2 내지 1:5 범위이다.

본 개시의 다른 측면에 있어서, 조혈모세포 내로 이종 전이유전자를 도입하는 방법으로서, 상기 방법은 줄기세포에 (i) 상기 이종 전이유전자; (ii) 바이러스 외피 단백질; 및 (iii) CD34+ 세포에 대한 결합용 리간드인 단백질;을 포함하는 재조합 렌티바이러스를 형질도입하는 단계를 포함하는 방법이 제공된다. 조혈모세포 내로 이종 전이유전자를 도입하는 상기 방법에는 본 개시의 재조합 렌티바이러스 중 어느 하나가 사용될 수 있다. 상기 방법들 중 어느 하나에 있어서, 상기 조혈모세포는 인간 CD34+ 세포와 같은 인간 조혈모세포이다.

일 구현예에 있어서, 상기 방법은 베지큘로바이러스 외피 단백질을 포함하는 재조합 렌티바이러스를 포함한다. 예컨대, 상기 베지큘로바이러스 외피 단백질은 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 군으로부터 선택되는 베지큘로바이러스 종으로부터 유래한다.

또한, 상기 방법은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43로 개시된 바이러스 외피 단백질의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 바이러스 외피 단백질을 포함하는 재조합 렌티바이러스를 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 하나 이상의 다른 구현예에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43로 개시된 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

다른 구현예에 있어서, 상기 방법은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 하나를 포함하는 바이러스 외피 단백질을 포함하는 재조합 렌티바이러스를 포함한다. 또한, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개 전부를 포함한다.

다른 구현예에 있어서, 상기 방법은 아레나바이러스 외피 단백질을 포함하는 재조합 렌티바이러스를 포함한다. 예를 들어, 상기 아레나바이러스 외피 단백질은 마츄포(Machupo), 주닌(Junin), 악코조코아틀라(Ocozocoautla), 타카리브(Tacaribe), 구아나리토(Guanarito), 아마파르(Amapar), 쿠픽시(Cupixi), 사비아(Sabia) 또는 차프레(Chapre) 바이러스로부터 유래한다. 또한, 상기 방법은 서열번호 41의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하는 바이러스 외피 단백질을 포함하는 재조합 렌티바이러스를 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 하나 이상의 다른 구현예에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 41로 개시된 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

본 개시의 방법들 중 어느 하나에 있어서, 상기 재조합 렌티바이러는 벡터를 포함하며, 상기 벡터는 프로모터에 작동 가능하게 연결된 상기 이종 전이유전자를 포함한다. 또한, 본 개시의 방법들 중 어느 하나에 있어서, 본 개시의 재조합 렌티바이러스는 자체 활성화(SIN) LTR을 포함한다.

다른 구현예에 있어서, 본 개시의 방법들 중 어느 하나에 있어서, 상기 조혈모세포는 인간 단백질을 암호화는 이종 전이유전자로 형질도입된다. 선택적으로, 상기 이종 전이유전자는 인간 헤모글로빈 단백질을 암호화한다.

또 다른 구현예에 있어서, 본 개시의 방법들 중 어느 하나는 CD34+ 세포 결합용 리간드인 단백질을 포함하는 재조합 렌티바이러스를 포함한다. 선택적으로, CD34+ 세포 결합용 리간드인 상기 단백질은 상기 재조합 렌티바이러스의 표면에 존재한다. CD34+ 세포 결합용 리간드인 상기 단백질은 서열번호 39의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행된다. 선택적으로, CD34+ 세포 결합용 리간드인 상기 단백질은 서열번호 39의 아미노산 서열을 포함하거나, 그로부터 본질적으로 구성되거나 그로부터 구성된다.

또한, 본 개시의 방법들 중 어느 하나는 상기 외피 단백질을 발현하는 벡터와 L-셀렉틴을 발현하는 상기 벡터의 농도비가 1:2 내지 1:5 범위인 세포에 의해 생산된 재조합 렌티바이러스를 포함한다. 또한, 본 개시의 방법들 중 어느 하나는 상기 외피 단백질과 L-셀렉틴의 농도비가 1:2 내지 1:5 범위인 재조합 렌티바이러스를 포함한다.

일 구현예에 있어서, 본 개시의 방법들 중 어느 하나의 상기 형질도입 단계는 부착성 조혈모세포 상에서 수행된다. 다른 구현예에 있어서, 본 개시의 방법들 중 어느 하나의 상기 형질도입 단계는 부유 상태의 조혈모세포 상에서 수행된다.

다른 측면에 있어서, 본 개시는 조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스를 제공하며, 상기 재조합 렌티바이러스는 이종 전이유전자와, 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 군으로부터 선택되는 베지큘로바이러스 종으로부터 유래하는 바이러스 외피 단백질을 포함한다. 예를 들어, 본 개시는 조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스를 제공하며, 상기 재조합 렌티바이러스는 이종 전이유전자와, 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 상기 31 개 아미노산 중 적어도 하나를 포함하는 바이러스 외피 단백질을 포함한다.

또 다른 측면에 있어서, 본 개시는 조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스를 제공하며, 상기 재조합 렌티바이러스는 이종 전이유전자와, 제1형 트랜스페린 수용체(TfnR1)를 사용하여 세포를 감염시킬 수 있는 아레나바이러스 종으로부터 유래하는 바이러스 외피 단백질을 포함한다. 예컨대, 본 개시는 상기 아레나바이러스 외피 단백질이 마츄포 바이러스로부터 유래하는 재조합 렌티바이러스를 제공한다.

일 측면에 있어서, 본 개시는 본 개시의 재조합 렌티바이러스 중 어느 하나와 약학적으로 허용되는 담체를 포함하는 조성물을 제공한다.

다른 측면에 있어서, 본 개시는 본 개시의 재조합 렌티바이러스 중 어느 하나 또는 본 개시의 조성물 중 어느 하나로 형질도입된 조혈모세포를 투여하는 단계를 포함하는 이상혈색소 증상의 치료방법을 제공한다. 예를 들어, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈이다.

또 다른 측면에 있어서, 본 개시는 이상혈색소 증상을 치료하기 위한 약제의 제조를 위한, 본 개시의 재조합 렌티바이러스 중 어느 하나 또는 본 개시의 조성물 중 어느 하나로 형질도입된 조혈모세포의 용도를 제공한다. 예컨대, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈이다.

또한, 본 개시는 본 개시의 재조합 렌티바이러스 중 어느 하나로 형질도입된 조혈모세포를 포함하는, 이상혈색소 증상을 치료하기 위한 조성물을 제공한다. 예를 들어, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈이다.

도 1. 유연관계, 랍도바이러스 아과(subfamilies) 및 랍도바이러스 외피 단백질과 VSV Indiana 외피 단백질의 아미노산 % 동일성(%).
도 2. pCCL GLOBE1 βAS3 게놈과 해당 외피 단백질을 이용하여 생산된 렌티바이러스에 의한 인간 CD34+ 세포의 형질도입.
도 3. 베지큘로바이러스의 계통도. 인간 CD34+ 세포의 형질도입을 시험한 베지큘로바이러스 외피를 표시하였다. 구대륙 또는 신대륙에서 유래한 것임을 표시하였다. 인간 CD34+ 세포 형질도입 효율이 높거나 낮은 신대륙 유래 베지큘로바이러스 외피들이 표시되어 있다.
도 4A 내지 도 4C. 인간 CD34+ 세포 형질도입 결정자. 인간 CD34+ 세포의 형질도입 매개효율이 낮은 베지큘로바이러스 외피 3종(Imsfahan(서열번호 26), Piry(서열번호 57), Chandipura(서열번호 18))과 인간 CD34+ 세포의 형질도입 매개효율이 높은 베지큘로바이러스 외피 8종((VSV-G(Arizona)(서열번호 4), VSV-G(Indiana)(서열번호 8), VSV-G(New Jersey)(서열번호 14), Morreton(서열번호 12), Maraba(서열번호 10), Alagoas(서열번호 2), Carajas(서열번호 6), Cocal(서열번호 43))를 정렬하였다. 인간 CD34+ 세포의 형질도입 매개효율이 높은 외피 단백질에서는 모두 발견되지만 인간 CD34+ 세포의 형질도입 매개효율이 낮은 외피 단백질에서는 발견되지 않는 31 개 아미노산으로 구성된 인간 CD34+ 세포 형질도입 결정자를 표시하였다.
도 5. VSV-G(Indiana)의 단량체성 전(pre)-융합 구조체 상의 "인간 CD34+ 세포 형질도입 결정자" 내 아미노산들의 위치. CD34+ 세포 형질도입 결정자를 포함하는 아미노산들을 공간 채움 모형으로, 나머지는 골격 모형으로 표시하였다.
도 6. 렌티바이러스 생산자 세포 내에서 인간 L-셀렉틴의 발현에 의한 CD34+ 세포의 렌티바이러스 형질도입의 개선.
도 7. VSV-G Indiana에 의해 매개되는 CD34+ 세포의 렌티바이러스 형질도입은 L-셀렉틴과 비교하여 렌티바이러스 생산자 세포 내에서 인간 SIGLEC10의 공동발현에 의해 개선되지 않았다.
도 8. (75 cm² 플라스크 당) 1 ㎍의 VSV-G Indiana 플라스미드와 5 ㎍의 L-셀렉틴 플라스미드를 사용하여 생산한 바이러스가 5 ㎍의 VSV-G Indiana 플라스미드를 사용하여 생산한 바이러스에 비해 CD34+ 세포 형질도입 효율이 더 높았다.
도 9. L-셀렉틴 발현벡터(SELL)의 추가가 5 ㎍의 VSV-G(Indiana)(IN) 발현벡터를 포함하는 바이러스 생산의 최적화에 미치는 영향.
도 10. 인간 L-셀렉틴을 발현하는 VSV-G in 생산자 세포의 Indiana 주로부터 유래하는 VSV-G 외피 단백질로 생산된 렌티바이러스에 의한 인간 CD34+ 세포의 형질도입 개선은 인간 L-셀렉틴을 중성화하는 항체에 의해 억제된다.
도 11. eGFP를 발현하며 인간 L-셀렉틴 존재 또는 부존재 하에 생산된 렌티바이러스에 의한 CD34 음성 세포(293T 세포)의 형질도입.
도 12. 렌티바이러스 생산 과정에서 Maraba 외피 플라스미드와 L-셀렉틴 플라스미드 발현 간 투여량-관계(dose relationship) 및 인간 CD34+ 세포의 렌티바이러스 형질도입에 미치는 영향.
도 13. Maraba 외피와 L-셀렉틴으로 슈도타입화한 렌티바이러스는 VSV-G(Indiana) 외피로 슈도타입화한 렌티바이러스에 비해 다수의 기증자로부터 유래한 인간 CD34+ 세포에 대하여 개선된 형질도입을 보인다.
도 14. 바이러스를 생산하는 293T 세포 내에서 인간 L-셀렉틴의 발현에 의한 인간 CD34+ 세포의 Morreton 베지큘로바이러스 외피 매개 형질도입의 개선.
도 15. 바이러스를 생산하는 293T 세포 내에서 인간 L-셀렉틴의 공동발현에 의한 인간 CD34+ 세포의 Carajas 베지큘로바이러스 외피 매개 렌티바이러스 형질도입의 개선.
도 16. 인간 CD34+ 세포를 Machupo 바이러스(Carvallo 주) 유래 아레나바이러스 외피 단백질로 생산한 렌티바이러스에 의해 형질도입하였다.
도 17. 아레나바이러스 외피 단백질의 계통도.
도 18. pHCMV-VSV-G(Indiana)(서열번호 44)의 지도.
도 19. pHCMV-XL5-인간 L-셀렉틴(서열번호 45)의 지도.
도 20. eGFP 리포터 렌티바이러스 게놈 플라스미드(pCCL-c-MNU3- eGFP; 서열번호 46)의 지도.
도 21. pCCL GLOBE1-βAS3(서열번호 47)의 지도.
도 22. pRSV rev(서열번호 48)의 지도.
도 23. pMDL g/p RRE(서열번호 49)의 지도.

본 개시는 유전자치료 분야에서 요구되는 조혈모세포의 렌티바이러스 형질도입이 개선된 렌티바이러스의 생산에 유용한 조성물들과 방법들을 제공한다. 아래에 기재된 구체적 구현예들은 이러한 조성물들과 방법들의 예들을 설명한다. 그러나, 이러한 구현예들에 대한 설명으로부터, 본 발명의 다른 측면들이 하기 기재로부터 성립 및/또는 실행될 수 있다.

I. 일반적 기법들　

다른 언급이 없는 한, 본 발명은 세포생물학, 분자생물학, 세포배양, 바이러스학 등의 종래기술을 이용한다. 이러한 기법들은 최근의 문헌들에 상세하게 개시되어 있으며, 구체적으로 Sambrook, Fritsch and Maniatis eds., "Molecular Cloning, A Laboratory Manual", 2nd Ed., Cold Spring Harbor Laboratory Press (1989), Celis J. E. "Cell BIology, A Laboratory Handbook" Academic Press, Inc. (1994)와 Bahnson et al., J. of Virol. Methods, 54:131-143 (1995)을 참고할 수 있다. 또한, 본 명세서에서 인용된 모든 문헌들과 특허출원들은 본 개시과 관련된 기술분야의 당업자의 기술수준을 나타내며 그 전체 내용이 참조로서 포함된다.

II. 정의

본 명세서 전체에 걸쳐 아래에 정의된 용어들이 사용된다.

개방형 용어 "포함하는(comprising)"은 포함하는(including, containing) 또는 가지는(having)과 같은 비제한적 용어들과 동의어로서 사용되고 본 개시을 기술하고 구체예들을 청구하기 위해 사용되지만, "구성되는" 또는 "본질적으로 구성되는(consisting essentially of)"과 같은 보다 제한적인 용어에 의해 기술될 수도 있다.

본 명세서에 있어서, 수치에 적용된 용어 "약"은 계산 또는 측정이 약간 부정확할 수 있음(정확한 수치에 근접하거나, 그 수치에 근사적으로 또는 상당히 가깝거나, 거의 일치하는 경우)을 나타낸다. 만일, 어떤 이유로 당해 기술분야에서 "약"이 의미하는 부정확성이 이러한 일반적인 의미와 다르게 이해되는 경우, 본 명세서에서 사용된 "약"은 일반적인 측정방법 또는 변수를 사용함에 따라 적어도 편차가 발생할 수 있음을 나타낸다.

본 명세서에 있어서, 용어 "및/또는"은 나열된 관련 항목들의 하나 이상의 모든 조합을 포함한다.

용어 "렌티바이러스"는 복합 레트로바이러스의 군을 의미하고, 용어 "재조합 렌티바이러스"는 렌티바이러스 게놈(예컨대, HIV-1 게놈)으로부터 유래하는 재조합 바이러스로서 복제는 할 수 없지만 배양된 세포(예컨대, 293T 세포) 내에서 생산되어 관심 대상 세포로 유전자를 전달할 수 있도록 가공된 것을 의미한다.

용어 "베지큘로바이러스"는 Rhabdoviridae 과에 속하는 네거티브-센스(negative sense) 단일가닥 레트로바이러스의 속을 의미한다.

용어 "형질도입"은 관심 대상 세포를 감염시킨 후 유전자를 전달하고 발현하는 일련의 과정을 의미한다.

용어 "형질도입 결정자"는 바이러스에 의한 세포의 형질도입을 매개하거나 개선하는 바이러스 외피 단백질 내의 하나 이상의 특정한 아미노산을 의미한다. 예를 들어, "CD34+ 세포 형질도입 결정자"는 CD34+ 세포의 형질도입을 매개하거나 개선하는 바이러스 외피 단백질 내에서 발견되는 일단의 아미노산을 의미한다. 이러한 아미노산들은 렌티바이러스를 슈도타입화하여, 슈도타입화된 렌티바이러스가 전형적인 VSV-G Indiana 슈도타입화된 렌티바이러스와 동등한 또는 그 이상의 정도로 CD34+ 세포를 형질도입할 수 있게 한다.

용어 "외피 단백질"은 바이러스의 표면에 존재하는 막관통 단백질을 지칭하는 것으로, 해당 바이러스가 형질도입할 수 있는 세포의 종과 유형을 결정한다.

용어 "슈도타입화"는 바이러스의 임의의 성분을 이종 바이러스의 성분으로 교체하는 것을 의미한다. 특히, "슈도타입화"는 야생형 외피와 다른 외피를 포함하는 재조합 바이러스를 나타내며, 이에 따라 친화성이 달라짐을 의미한다. 슈도타입화된 렌티바이러스는 렌티바이러스로부터 유래하지 않거나 다른 종 또는 다른 아종의 렌티바이러스로부터 유래하는, 예컨대 다른 바이러스로부터 유래하거나, 세포로부터 유래하거나, 다른 바이러스 또는 세포로부터 유래하는 다른 세포막 단백질에 의해 교체된, 이종 외피를 갖는 렌티바이러스이다.

용어 "VSV 외피"는 수포성 구내염 바이러스(VSV)라고 불리는 랍도바이러스로부터 유래하는 외피 단백질을 의미한다. 이 단백질은 흔히 VSV-G 단백질이라고도 하는데, 이때 "G"는 당단백질을 의미한다. 랍도바이러스의 외피 단백질은 유일한 당화된 랍도바이러스 단백질이다.

용어 "조혈모세포"는 줄기세포 결핍 이식자에게 이식되는 경우 골수로 이동하고 분열하여 최종적으로 적혈구, T 세포, 호중구, 과립구, 단핵세포, 자연살해세포, 호염기구, 수지상 세포, 호산구, 비만세포, B 세포, 혈소판 및 거핵구와 같이 혈액에서 발견되는 골수 또는 적혈구 계통 세포로 분화하는 세포를 의미한다. 일부 구현예에 있어서, 상기 조혈모세포는 인간 조혈모세포이다.

CD34는 조혈모세포 및 내피 줄기세포와 같은 혈액 및 골수 유래 원시 전구세포에 대한 마커로 흔히 사용되는 당화된 막관통 단백질이다. 용어 "CD34+ 세포"는 조혈모세포, 내피 줄기세포 및 중간엽 줄기세포와 같이 CD34 단백질을 발현하는 세포를 의미한다.

용어 "부착성 조혈모세포"는 세포배양 용기 또는 다른 적당한 기질의 표면과 같은 고체 또는 반고체 기질에 부착하는 조혈모세포를 의미한다. 부착성 인간 조혈모세포는 생체 외에서 세포배양 용기 또는 기질의 이용 가능한 표면적을 덮을 때까지 또는 배지의 영양분이 고갈될 때까지 성장한다.

용어 "부유 상태의 조혈모세포"는 생체 외에서 성장하지만 세포배양 용기의 표면에 부착하지 않고 배양배지 내에 부유한 채 성장 중인 조혈모세포를 의미한다.

용어 "전이유전자"는 재조합 렌티바이러스 벡터와 같은 벡터에 의해 숙주세포 또는 생물체의 게놈 내로 도입된 외인성 핵산 서열을 의미한다. "이종 전이유전자"는 단백질, 펩티드, 폴리펩티드, 효소 또는 다른 관심 대상 생성물을 암호화하는, 한 생물체에서 다른 생물체 내로 도입된 외인성 핵산 서열과, 숙주세포 내에서 암호화된 생성물의 전사 및/또는 번역을 지시하며 숙주세포 내에서 암호화된 생성물의 발현을 가능하게 하는 조절서열을 의미한다. 예컨대, 이종 전이유전자는 렌티바이러스 서열에 대하여 이종이며 숙주세포 내에서 암호화된 생성물의 발현을 가능하게 한다.

용어 "서열 동일성"은 둘 이상의 뉴클레오티드 또는 아미노산 서열을 비교하여 결정되는 유사성을 의미한다. 당해 기술분야에서, "동일성"은 또한 경우에 따라 둘 이상의 뉴클레오티드 서열 또는 둘 이상의 아미노산 서열을 매칭하여 결정되는, 핵산 분자들 또는 폴리펩티드들 사이의 서열 관련성의 정도를 의미한다. "동일성"은 필요하다면 특정한 수학적 모델 또는 컴퓨터 프로그램을 이용하여 갭 정렬로 둘 이상의 서열 간의 동일한 부분의 백분율을 측정한다.

두 핵산 서열의 % 동일성을 결정하기 위하여, 최적 비교 목적으로 서열들을 정렬한다(예를 들어, 두 번째 아미노산 또는 핵산 서열과의 최적 정렬을 위해 첫 번째 핵산의 서열 내에 갭을 도입할 수 있다). 이어, 뉴클레오티드 위치의 뉴클레오티드 잔기들을 비교한다. 첫 번째 서열 내의 위치에 두 번째 서열 내의 해당 위치와 동일한 아미노산 또는 뉴클레오티드 잔기가 존재하는 경우, 두 분자는 해당 위치에서 동일하다. 두 서열 사이의 % 동일성은 두 서열이 공유하는 동일 위치의 수의 함수이다(즉, % 동일성 = 동일 위치의 수 / 위치의 총 수 (즉, 중첩 위치의 수)×100). 바람직하게, 두 서열은 길이가 같다.

서열 비교는 비교되는 서열들 전체 길이에 대하여 또는 두 서열의 단편에 대하여 수행될 수 있다. 전형적으로, 서열 비교는 비교되는 두 서열의 전체 길이에 대하여 수행된다. 그러나, 서열 동일성은 예를 들어, 약 20, 약 50, 약 100, 약 200, 약 500, 약 1000, 약 2000, 약 3000, 약 4000, 약 4500, 약 5000 또는 그 이상의 인접하는 핵산 잔기의 영역에 대하여 비교할 수 있다. 분석 대상 서열들 사이의 최대 매칭을 얻기 위하여 동일성 및/또는 유사성을 결정하기 위한 더 선호되는 방법들이 고안되어 있다. 동일성 및 유사성을 결정하기 위한 방법들은 공개적으로 구할 수 있는 컴퓨터 프로그램으로 기술되어 있다. 두 서열들 사이의 동일성 및 유사성을 결정하기 위한 구체적인 컴퓨터 프로그램에는 GAP(Devereux et al., Nucl. Acid. Res., 12:387 (1984); Genetics Computer Group, University of Wisconsin, Madison, WI), BLASTP, BLASTN 및 FASTA(Altschul et al., J. Mol. Biol., 215:403-410 (1990))를 포함하는 GCG 프로그램 패키지가 포함되나 이에 제한되는 것은 아니다. BLASTX 프로그램은 미국 국립생물공학정보센터(NCBI) 및 그 밖의 출처들(BLAST Manual, Altschul et al. NCB/NLM/NIH Bethesda, MD 20894; Altschul et al., supra)로부터 공개적으로 입수할 수 있다. 잘 알려진 Smith Waterman 알고리즘을 이용하여 동일성을 결정할 수도 있다.

용어 "CD34+ 세포 결합용 리간드"는 형질도입을 위하여 CD34+ 세포의 세포 표면에 대한 렌티바이러스의 결합을 촉진하는 분자를 의미한다. 리간드는 단백질, 당단백질, 당 또는 지질일 수 있다. 인간 CD34+ 세포에 결합하기 위한 리간드의 한 예는 L-셀렉틴이다. 용어 "벡터"는 핵산 서열을 세포 내로 도입하는 핵산 분자를 의미한다. 예를 들어, 재조합 렌티바이러스는 핵산 서열을 인간 CD34+ 세포 내로 도입하기 위한 벡터로서 작용한다.

용어 "작동 가능하게 연결된"은 하나의 핵산 분자, 예컨대 발현 카세트 또는 벡터에서 뉴클레오티드 서열들이, 하나 이상의 뉴클레오티드 서열의 기능이 상기 핵산 분자에 존재하는 적어도 하나의 다른 뉴클레오티드 서열에 영향을 받도록 연결된 것을 의미한다. 예를 들어, 프로모터와 같은 발현 조절 서열이 전이유전자의 핵산 서열을 발현시킬 수 있는 경우 해당 전이유전자에 작동 가능하게 연결된 것이다.

용어 "프로모터"는 DNA에서 RNA로의 전사를 개시하기 위하여 RNA 중합효소가 결합할 수 있는 핵산 서열을 의미한다. 이것은 전이유전자의 발현을 촉진하는 기능을 하는 발현 조절서열이다.

용어 "자체 비활성화 렌티바이러스 벡터"는 비기능성의 또는 변형된 3' 긴 말단 반복서열(LTR)을 포함하는 렌티바이러스 벡터를 의미한다. 이 서열은 융합 과정에서 벡터 게놈의 5' 말단으로 복제되어, 두 LTR에 의한 프로모터 활성을 비활성화한다.

III. 발명의 설명

A. 재조합 렌티바이러스

본 발명은 인간 CD34+ 세포와 같은 조혈모세포의 형질도입을 가능하게 하는, 렌티바이러스 유전자치료 벡터와 바이러스 외피 단백질을 함께 갖는 재조합 바이러스들을 제공한다. 일 구현예에 있어서, 본 개시는 랍도바이러스 외피 단백질의 결합 도메인 또는 그로부터 유래하는 아미노산 서열을 포함하는 이종 외피 내에 패키지화된 렌티바이러스 유전자 벡터로 구성되는 재조합 렌티바이러스를 제공한다. 본 개시의 렌티바이러스 벡터는 최소한 렌티바이러스 5' 긴 말단 반복서열(LTR)과, 숙주세포로의 전달을 위한 분자, 그리고 렌티바이러스 3' LTR 서열의 기능성 부분을 포함한다. 선택적으로, 상기 벡터는 ψ(psi) 캡시드화 서열, Rev 반응요소(RRE) 서열 또는 그와 동등하거나 유사한 기능을 제공하는 서열을 더 포함할 수 있다. 숙주세포로의 전달을 위해 벡터에 의해 운반되는 이종 분자는 폴리펩티드, 단백질, 효소, 탄수화물, 화학물질, 또는 올리고뉴클레오티드, RNA, DNA 및/또는 RNA/DNA 하이브리드를 포함할 수 있는 핵산 분자를 포함한 임의의 바람직한 물질일 수 있으나, 이에 제한되는 것은 아니다. 일 구현예에 있어서, 상기 이종 분자는 사람의 염색체 내로 특정한 유전적 변형, 예컨대 돌연변이된 유전자의 교정을 도입하는 핵산 분자이다. 또 다른 바람직한 구현예에 있어서, 상기 이종 분자는 원하는 단백질, 펩티드, 폴리펩티드, 효소 또는 그 밖의 생성물을 암호화하는 핵산 서열과, 숙주세포 내에서 암호화된 생성물의 전사 및/또는 번역을 지시하고 숙주세포 내에서 암호화된 생성물의 발현을 가능하게 하는 조절서열을 포함하는 전이유전자를 포함한다. 적절한 생성물들과 조절서열들은 아래에서 더 자세하게 설명한다. 그러나, 벡터에 의해 운반되고 본 개시의 바이러스에 의해 전달되는 이종 분자의 선택이 본 발명을 제한하는 것은 아니다.

1. 렌티바이러스의 성분들

본 개시의 렌티바이러스 벡터와 재조합 바이러스를 제조하기 위한 렌티바이러스의 성분들을 선택함에 있어서, 임의의 적당한 렌티바이러스와 임의의 적당한 렌티바이러스 혈청형 또는 주를 용이하게 선택할 수 있다. 적당한 렌티바이러스에는 예컨대 인간 면역결핍 바이러스(HIV), 유인원 면역결핍 바이러스(SIV), 염소 관절염 및 뇌염 바이러스(CAEV), 말 전염성 빈혈 바이러스(EIAV), 비스나바이러스, 고양이 면역결핍 바이러스(FIV), 소 면역결핍 바이러스(BIV)가 포함된다. 본 명세서에 제시된 실시예들에서는 HIV로부터 유래한 벡터의 사용이 설명되어 있다. 그러나, 비인간 유래의 FIV 및 기타 렌티바이러스들도 특히 바람직하게 사용될 수 있다. 본 개시에 사용된 서열들은 교육기관, 비영리기관(예컨대, American Type Culture Collection, Manassas, Virginia) 또는 상업적인 렌티바이러스 출처로부터 얻을 수 있다. 또한, 상기 서열은 유전공학 기법을 이용하여 재조합 방법에 의해 생산하거나, 공개된 전자 데이터베이스에 포함된 서열을 포함하는, 공개된 바이러스 서열을 참조하여, 종래의 기법(예컨대, G. Barony and R.B. Merrifield, THE PEPTIDES: ANALYSIS, SYNTHESIS & BIOLOGY, Academic Press, pp. 3-285 (1980))을 이용하여 합성할 수 있다.

a) LTR 서열

렌티바이러스 벡터는 게놈을 역전사하여 cDNA를 생성하기에 충분하며, 렌티바이러스 벡터 내에 존재하는 RNA 서열의 발현을 허용하기에 충분한 양의 렌티바이러스 긴 말단 반복서열(LTR)을 포함한다. 이들 서열은 벡터의 5' 말단에 위치하는 5' LTR 서열들과 벡터의 3' 말단에 위치하는 3' LTR 서열들을 모두 포함한다. 이들 LTR 서열은 선택된 렌티바이러스 또는 교차반응성 렌티바이러스에 고유한 손상되지 않은 LTR, 보다 바람직하게는 변형된 LTR일 수 있다.

렌티바이러스 LTR에 대한 다양한 변형이 보고되었다. 특히 바람직한 한 가지 변형은 H. Miyoshi et al, J. Virol., 72: 8150-8157 (Oct. 1998)에 기재된 것과 같은 HIV용 자체 비활성화 LTR이다. 이러한 HIV LTR에서, 5' LTR의 U3 영역은 강력한 이종 프로모터(예컨대, CMV)로 교체되고 3' LTR의 U3 영역 내에서 133 bp가 결실된다. 따라서, 역전사시 3' LTR의 결실이 5' LTR로 이전되어 LTR의 전사가 비활성화된다. HIV의 전체 뉴클레오티드 서열이 알려져 있다(L. Ratner et al. Nature. 313(6000):277-284 (1985) 참조). 또 다른 적절한 변형은 U3 영역의 완전히 결실을 포함하나, 이에 따라 5' LTR이 강력한 이종 프로모터와 R 영역, U5 영역만을 포함하고, 3' LTR이 polyA를 포함하는 B 영역만을 포함한다. 또 다른 구현예에서는 5' LTR의 U3 영역과 U5 영역이 모두 결실되고, 3' LTR은 R 영역만을 포함한다. 이러한 그리고 다른 적절한 변형들은 HIV 및/또는 다른 선택된 렌티바이러스의 비교 영역에서 당업자에 의해 용이하게 수행될 수 있다.

선택적으로, 렌티바이러스 벡터는 5' 렌티바이러스 LTR 서열의 다운스트림에 ψ(psi) 패키징 신호서열을 포함할 수 있다. 선택적으로, LTR 서열들 사이에, 그리고 ψ 서열의 바로 업스트림에 하나 이상의 스플라이스 공여부위가 위치할 수 있다. 본 발명에 따르면, ψ 서열은 gag 서열과의 중첩을 제거하고 패키지화를 개선하기 위해 변형될 수 있다. 예를 들어, gag 암호화 서열의 업스트림에 종결 코돈이 삽입될 수 있다. 당업자는 ψ 서열에 대하여 다른 적절한 변형을 수행할 수 있다. 본 발명은 그러한 변형에 의해 제한되지 않는다.

적절한 일 구현예에 있어서, 렌티바이러스 벡터는 LTR 및 ψ 서열의 다운스트림에 위치하는 렌티바이러스 Rev 반응요소(RRE) 서열을 포함한다. 적절하게, RRE 서열은 최소 약 275 내지 약 300 nt의 고유 렌티바이러스 RRE 서열을, 보다 바람직하게는, 적어도 약 400 내지 약 450 nt의 RRE 서열을 포함한다. 선택적으로, RRE 서열은 gag/pol의 발현과 세포핵으로의 이동을 돕는 적절한 다른 요소에 의해 대체될 수 있다. 예를 들어, 다른 적절한 서열들에는 Manson-Pfizer 바이러스의 CT 요소 또는 우드처크 간염 바이러스의 후조절 요소(WPRE)가 포함될 수 있다. 또한, gag와 gag/pol을 암호화하는 서열들을 변경하여 gag 및 gag/pol 폴리펩티드의 아미노산 서열 변경 없이 핵 이동이 변형되도록 할 수도 있다. 적절한 방법은 당업자에게 점차 더 명확해질 것이다.

b) 전이유전자

앞서 언급한 바와 같이, 바람직한 일 구현예에 있어서, 렌티바이러스 벡터에 의해 운반되는 분자는 전이유전자이다. 전이유전자는 렌티바이러스 서열에 대하여 이종이며 단백질, 펩티드, 폴리펩티드, 효소 또는 그 밖의 관심 대상 생성물을 암호화하는 핵산 서열과, 숙주세포 내에서 암호화된 생성물의 전사 및/또는 번역을 지시하며 숙주세포 내에서 암호화된 생성물의 발현을 가능하게 하는 조절서열을 포함하는 핵산 분자이다. 전이유전자의 조성은 본 개시의 벡터와 슈도타입화된 바이러스의 의도된 용도에 따라 달라진다.

예를 들어, 한 가지 유형의 전이유전자는 발현시 검출 가능한 신호를 생성하는 리포터 또는 마커 서열을 포함한다. 그러한 리포터 또는 마커 서열에는 β-락타마제, β-갈락토시다아제(LacZ). 알칼리 포스포타아제, 티미딘 키나아제, 녹색형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라제(CAT), 루시페라아제, 예컨대 CD2, CD4, CD8 및 인플루엔자 헤마글루티닌 단백질을 포함하는 막결합 단백질, 그 밖에 당해 기술분야에 잘 알려진 물질을 암호화하는 DNA 서열이 포함되지만, 이에 제한되는 것은 아니다. 또한, 본 개시의 재조합 바이러스는 예컨대 백신의 목적으로 항체 및/또는 세포 매개 면역반응을 야기하는 유전자 산물 및 다른 분자들을 전달하는 데 유용하다. 당업자는 바이러스와, 단세포 및 다세포 기생생물을 포함하는 원핵생물 및 진핵생물로부터 유래하는 면역원성 단백질들과 폴리펩티드들로부터 적절한 유전자 산물을 용이하게 선택할 수 있다. 또한, 본 개시의 재조합 바이러스는 연구 목적으로 바람직한 분자를 전달하는 데에도 유용하다.

특히 바람직한 일 구현예에 있어서, 본 개시의 재조합 바이러스는 정상적인 유전자가 발현되지만 그 수준이 정상 미만인 유전자 결함을 치료 또는 개선하는 것을 포함하지만 이에 제한되지 않는 치료 목적에 유용하다. 상기 재조합 바이러스는 기능성 유전자 산물이 발현되지 않는 유전적 결함을 치료 또는 개선하기 위해 사용될 수도 있다. 바람직한 유형의 전이유전자는 숙주세포 내에서 발현을 위한 바람직한 치료 산물을 암호화하는 서열을 포함한다. 전형적으로, 이러한 치료용 핵산 서열은 유전되는 또는 유전되지 않는 유전적 결함을 치료 또는 보완하거나, 후생적인 장애 또는 질환을 치료할 수 있는 산물들을 암호화한다. 따라서, 본 개시는 다수의 하위 단위체로 구성되는 단백질에 의한 유전자 결함을 치료 또는 완화하기 위하여 사용할 수 있는 재조합 바이러스를 생산하는 방법을 포함한다. 상황에 따라, 단백질의 각 하위 단위체를 암호화하기 위하여 다른 전이유전자가 사용될 수 있다. 이것은 예컨대 면역 글로불린이나 혈소판 유래 성장인자 수용체의 경우와 같이 단백질 하위 단위체를 암호화하는 DNA의 크기가 큰 경우에 바람직하다. 세포가 다수의 하위 단위체로 구성되는 단백질을 생산하도록 하기 위하여, 각 하위 단위체를 포함하는 재조합 바이러스로 세포를 감염시킬 수 있다. 또한, 동일한 전이유전자로 각 단백질의 여러 하위 단위체들을 암호화할 수도 있다. 이 경우, 하나의 전이유전자는 각 하위 단위체를 암호화하는 DNA를 포함할 수 있고, 각 하위 단위체에 대한 DNA는 내부 리보솜 진입부위(IRES)에 의해 분리될 수 있다. 이것은 각 하위 단위체를 암호화하는 DNA의 크기가 작아서 하위 단위체들을 암호화하는 DNA와 IRES의 전체 길이가 9 킬로베이스 미만인 경우에 바람직하다. 또한, IRES의 사용을 요하지 않는 다른 방법들도 단백질의 공동발현에 이용될 수 있다. 이러한 다른 방법들은 제 2의 내부 프로모터, 다른 스플라이스 신호, 또는 번역 중 또는 번역 후 단백질 분해와 같이 당업자에게 알려진 방법의 사용을 포함할 수 있다. 본 개시의 구체적인 일 실시예에 있어서, 전이유전자에 의해 암호화되는 유전자 산물은 기능성 인간 헤모글로빈 단백질이다.

그 밖의 유용한 전이유전자에는 키메릭 또는 하이브리드 폴리펩티드 또는 삽입, 결실 또는 아미노산 치환을 포함하는, 자연적으로 존재하지 않는 아미노산 서열을 갖는 폴리펩티드와 같은 자연적으로 존재하지 않는 폴리펩티드들이 포함된다. 다른 유형의 자연적으로 존재하지 않는 유전자 서열은 안티센스 분자들과 리보자임 같은 촉매성 핵산들을 포함하며, 유전자의 과발현을 줄이기 위해 사용될 수 있다. 전이유전자 서열 또는 렌티바이러스 벡터에 의해 운반되는 다른 분자의 선택은 본 발명을 제한하지 않는다. 전이유전자 서열의 선택은 본 출원의 개시내용을 참조할 때 당업자의 수준 내에 있다 하겠다.

c) 조절요소

세포와 숙주 내에서 원하는 유전자 산물을 얻기 위하여 전사, 번역 및/또는 발현을 요하는 전이유전자 또는 다른 핵산 서열의 설계는 암호화된 산물의 발현을 촉진하기 위하여 관심 대상 암호화 서열과 작동 가능하게 연결된 적절한 서열을 포함한다. "작동 가능하게 연결된" 서열은 관심 대상 핵산 서열과 인접하는 발현 조절서열과, 그 관심 대상 핵산 서열을 제어하기 위하여 트랜스로 또는 거리를 두고 작동하는 발현 조절서열을 모두 포함한다.

발현 조절서열은 적절한 전사 개시, 종료, 프로모터 및 인핸서 서열; 스플라이싱 신호 및 폴리아데닐화 신호와 같은 효과적인 RNA 처리신호; 세포질 mRNA를 안정화하는 서열; 번역 효율을 높이는 서열(Kozak 공통서열); 단백질 안정도를 높이는 서열; 그리고, 필요한 경우, 단백질 분비를 증가시키는 서열을 포함한다. 당해 기술분야에는 많은 수의 발현 조절서열들(원서열, 구조서열, 유도성 서열 및/또는 조직 특이적 서열)이 알려져 있으며, 원하는 발현 유형에 따라 이들을 이용하여 유전자를 발현시킬 수 있다. 진핵세포의 경우, 발현 조절서열은 전형적으로 프로모터, 면역 글로불린 유전자, SV40, 거대세포 바이러스 등으로부터 유래한 인핸서, 그리고 스플라이스 공여부위 및 수용부위를 포함할 수 있는 폴리아데닐화 서열을 포함한다. 폴리아데닐화(폴리A) 서열은 일반적으로 전이유전자 서열에 뒤이어, 그리고 3' 렌티바이러스 LTR 서열의 앞에 삽입된다. 가장 적절하게, 전이유전자 또는 다른 분자를 운반하는 렌티바이러스 벡터는 LTR 서열을 제공하는 렌티바이러스, 예컨대 HIV로부터 유래하는 폴리A를 포함한다. 그러나, 다른 출처로부터 유래하는 polyA도 용이하게 선택되어 본 개시의 구성에 포함될 수 있다. 일 구현예에 있어서, 소 성장호르몬의 폴리A가 선택된다. 또한, 본 개시의 렌티바이러스 벡터는 바람직하게 프로모터/인핸서 서열과 전이유전자 사이에 위치하는 인트론을 포함할 수 있다. 한 가지 가능한 인트론 서열 역시 SV-40로부터 유래하는데, 이를 SV-40 T 인트론 서열이라 한다. 벡터 내에 사용될 수 있는 또 다른 요소는 내부 리보솜 진입부위(IRES)이다. IRES 서열은 하나의 유전자 트랜스크립트로부터 둘 이상의 폴리펩티드를 생산하기 위하여 사용된다. IRES 서열을 이용하여 둘 이상의 폴리펩티드 사슬을 포함하는 단백질을 생산할 수 있다. 이러한 그리고 그 밖의 일반적인 벡터 요소들의 선택은 일반적이며 이러한 다수의 서열들이 입수 가능하다(예를 들어, Sambrook et al.과 여기에 인용된 문헌들, 예컨대 pp. 3.18-3.26과 16.17-16.27 및 Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY. John Wiley & Sons, New York, 1989를 참조).

일 구현예에 있어서, 높은 수준의 구조발현이 바람직할 것이다. 유용한 구조적 프로모터의 예로는 레트로바이러스 라우스육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서를 가짐), 거대세포 바이러스(CMV) 프로모터(선택적으로 CMV 인핸서를 가짐)(Boshart et al, Cell, 41:521-530 (1985) 참조), SV40 프로모터, 디히드로엽산 환원효소 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(PGK) 프로모터 및 EFlα 프로모터(Invitrogen)가 포함되나 이에 제한되는 것은 아니다. 외인성으로 공급되는 화합물에 의해 조절되는 유도성 프로모터 역시 유용하며, 아연 유도성 양 메탈로티오닌(MT) 프로모터, 덱사메타손(Dex) 유도성 생쥐 유선종양 바이러스(MMTV) 프로모터, T7 중합효소 프로모터 시스템(WO 98/10088); 엑디손 곤충 프로모터(No et al, Proc. Natl. Acad. Sci. USA. 93:3346-3351 (1996)), 테트라사이클린 억제성 시스템(Gossen et al. Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)), 테트라사이클린 유도성 시스템(Gossen et al, Science. 268: 1766-1769 (1995), 또한 Harvey et al, Curr. Opin. Chem. Biol. 2:512-518 (1998) 참조), RU486 유도성 시스템(Wang et al. Nat. Biotech. 15:239- 243 (1997) 및 Wang et al, Gene Ther. 4:432-441 (1997))과 라파마이신 유도성 시스템(Magari et al, J. Clin. Invest.. 100:2865-2872 (1997))을 포함한다. 이와 관련하여 유용할 수 있는 다른 유형의 유도성 프로모터는 예컨대 체온, 급성 단계, 세포의 특정 발현상태와 같은 특정한 생리적 상태에 의해 조절되거나 또는 복제 중인 세포 내에서만 조절되는 것들을 포함한다.

다른 구현예에 있어서, 전이유전자에 대한 고유 프로모터가 사용될 것이다. 전이유전자의 발현이 고유 발현과 유사해야 하는 경우에 고유 프로모터가 바람직할 수 있다. 전이유전자의 발현이 일시적으로 또는 발달 과정에 따라 조직 특이적인 방식으로 또는 특정한 전사 자극에 대한 반응으로서 조절되어야 하는 경우 고유 프로모터를 사용할 수 있다. 또 다른 구현예에 있어서, 인핸서 요소, 폴리아데닐화 부위 또는 Kozak 공통서열과 같은 다른 고유 발현 제어요소들 역시 고유 발현을 모방하기 위해 사용될 수 있다. 전이유전자의 또 다른 구현예는 조직 특이적 프로모터에 작동 가능하게 연결된 전이유전자를 포함한다.

모든 발현 조절서열이 본 개시의 모든 전이유전자를 동등하게 잘 발현하도록 기능하는 것은 아니다. 그러나, 당업자는 본 개시의 범위를 벗어나지 않고 이러한 발현 조절서열들로부터 선택할 수 있다. 당업자는 본 출원의 지침을 이용하여 적절한 프로모터/인핸서 서열을 선택할 수 있다. 그러한 선택은 일상적인 것이며 분자 또는 구조체를 제한하지 않는다. 예를 들어, 관심 대상 암호화 서열에 작동 가능하게 연결되고 본 개시의 전이유전자, 벡터 및 재조합 바이러스 내에 삽입되는 하나 이상의 발현 조절서열을 선택할 수 있다. 본 명세서에 개시된 또는 당해 기술분야에 알려진 렌티바이러스 벡터를 패키지화하기 위한 방법들 중 하나를 수행한 후에, 적절한 세포를 생체 외 또는 생체 내에서 감염시킬 수 있다. 서던 블로팅 또는 정량적 PCR에 의해 세포 내의 벡터의 카피 수를 모니터링할 수 있다. RNA 발현의 수준은 노던 블로팅 또는 정량적 RT- PCR에 의해 모니터링할 수 있다. 웨스턴 블로팅, 면역조직화학, ELISA, RIA 또는 유전자 산물의 생물학적 활성에 대한 시험에 의해 발현 수준을 모니터링할 수 있다. 따라서, 특정 발현 조절서열이 전이유전자에 의해 암호화된 구체적인 산물에 적합한지의 여부를 용이하게 분석할 수 있으며 가장 적절한 발현 조절서열을 용이하게 선택할 수 있다. 또한, 전달되는 분자가 발현을 요하지 않는 경우, 예컨대 탄수화물, 폴리펩티드, 펩티드 등인 경우, 발현 조절서열은 렌티바이러스 벡터 또는 다른 분자의 일부를 구성하지 않을 수 있다.

d) 기타 렌티바이러스 요소

선택적으로, 렌티바이러스 벡터는 당해 기술분야에서 잘 알려진 그 밖의 렌티바이러스 요소를 포함할 수 있으며, 이들 중 다수를 렌티바이러스 패키징 서열과 관련하여 아래에서 기재하였다. 그러나, 렌티바이러스 벡터는 렌티바이러스 외피 단백질과 결합하는 능력을 갖지 않는다는 점을 주목해야 한다. 이러한 렌티바이러스 벡터는 RRE에 해당하는 외피 서열의 일부를 포함할 수 있으나 다른 외피 서열은 갖지 않는다. 그러나, 보다 바람직하게, 복제 가능한 바이러스를 야기하는 재조합 반응의 가능성을 제거하기 위하여, 렌티바이러스 벡터는 어떠한 기능성 렌티바이러스 외피 단백질을 암호화하는 서열도 갖지 않는다.

따라서, 본 개시의 렌티바이러스 벡터는 최소한 렌티바이러스 5' 긴 말단 반복서열(LTR) 서열, (선택적으로) ψ(psi) 캡시드화 서열, 숙주세포로의 전달을 위한 분자, 그리고 렌티바이러스 3' LTR 서열의 기능성 부분을 포함한다. 바람직하게, 상기 벡터는 RRE 서열 또는 기능적으로 이와 유사한 서열을 더 포함한다. 적절하게, 본 개시의 렌티바이러스 벡터는 적절한 방법에 의해, 예컨대 렌티바이러스 벡터를 포함하는 "노출된" DNA 분자의 트랜스펙션에 의해 또는 상기한 다른 렌티바이러스 요소 및 조절요소와 그 밖의 벡터에서 흔히 발견되는 요소를 포함할 수 있는 벡터에 의해, 바이러스 내로의 패키지화를 위하여 숙주세포로 전달된다. "벡터"는 서열 또는 분자를 운반하여 세포로 전달할 수 있는 임의의 적절한 수단일 수 있다. 예컨대, 벡터는 플라스미드, 파지, 트랜스포존, 코스미드, 바이러스 등으로부터 용이하게 선택되나, 이에 제한되지 않는다. 본 개시에 이용되기에는 플라스미드가 특히 적합하다. 선택된 벡터는 트랜스펙션, 전기천공, 리포좀 전달, 막융합 기술, 고속 DNA 코팅 펠릿, 바이러스 감염 및 원형질체 융합을 포함하는 임의의 적절한 방법에 의해 전달될 수 있다. 본 개시에 따르면, 렌티바이러스 벡터는 본 개시의 재조합 바이러스를 형성하기 위한 아래 B 부분에 기술된 방법들을 이용하여 이종의(즉, 렌티바이러스가 아닌) 외피 내에 패키지화된다.

2. 외피 단백질

적절하게, 렌티바이러스 벡터가 패키지화되는 외피는 렌티바이러스 외피 단백질이 없으며 적어도 하나의 이종 외피 단백질의 결합 도메인을 포함한다. 일 구현예에 있어서, 상기 외피는 전적으로 랍도바이러스 당단백질로부터 유래하거나, 제 2의 바이러스의 외피 단백질, 폴리펩티드 또는 펩티드 내에 융합된 결합 도메인을 포함하는 랍도바이러스 외피(랍도바이러스 폴리펩티드 또는 펩티드)의 단편을 포함할 수 있다. 또한, 상기 외피는 도 4에 도시되고 아래에 기술한 CD34+ 세포 형질도입 결정자로부터 유래하는 서열을 포함하는 바이러스 외피 단백질을 포함할 수도 있다. 다른 구현예에 있어서, 상기 외피는 전적으로 아레나바이러스 당단백질 또는 그 단편으로부터 유래할 수 있다.

a) 랍도바이러스 외피 단백질

외피 단백질 또는 그 폴리펩티드 또는 펩티드(예컨대, 결합 도메인)를 암호화는 서열을 제공하는 랍도바이러스는 베지큘로바이러스 아군, 예컨대 VSV-G(Indiana), Morreton, Maraba, Cocal, Alagoa, Carajas, VSV-G(Arizona), Isfahan, VSV-G(New Jersey) 또는 Piry의 임의의 적절한 혈청형으로부터 유래할 수 있다. 외피 단백질을 암호화하는 서열은 바이러스원에 대한 유전공학 기법의 적용, 화학합성 및 기법, 재조합 생산 또는 이들의 조합을 포함하하는 임의의 적절한 방법에 의해 얻을 수 있다. 적절한 바이러스 서열의 출처가 당해 기술분야에서 잘 알려져 있으며, 여기에는 다양한 교육기관, 비영리기관 및 상업적 입수처와 전자 데이터베이스가 포함된다. 본 개시는 서열을 얻는 방법에 의해 제한되지 않는다. 바람직한 일 구현예에 있어서, 이종의 외피 서열은 인간 CD34+ 세포의 형질도입을 매개할 수 있는 모든 외피 단백질에서 발견되지만 인간 CD34+ 세포의 형질도입을 매개하지 못하는 외피 단백질에서는 발견되지 않는, 31 개 아미노산으로 구성된 인간 CD34+ 세포 형질도입 결정자로부터 유래한다.

따라서, 일 구현예에 있어서, 상기 외피 단백질은 변형되지 않은 랍도바이러스 당단백질이다. 또한, 최소한, 31 개 아미노산으로 구성된 인간 CD34+ 세포 형질도입 결정자 내에 위치하는, 랍도바이러스 외피 당단백질의 결합 도메인을 포함하는 선택된 랍도바이러스의 단편을 사용하는 것이 바람직할 수 있다. 적절하게, 이러한 랍도바이러스 단백질 단편은 링커에 의해 제 2의 비렌티바이러스 외피 단백질 또는 그 단편에 직접적으로 또는 간접적으로 융합된다. 이러한 융합 단백질은 얻어지는 외피 단백질의 패키지화, 수율 및/또는 정제를 개선하는 데 있어 바람직할 수 있다. 상기 제 2의 비렌티바이러스 외피 단백질 또는 그 단편은 최소한 막 도메인을 포함한다. 바람직한 일 구현예에 있어서, 31 개 아미노산으로 구성된 상기 인간 CD34+ 세포 형질도입 결정자의 잘린 단편이 VSV-G 외피 단백질에 융합된다. 당업자는 본 개시에 따른 또 다른 융합(키메릭) 단백질을 생성할 수 있다.

b) 아레나바이러스 외피 단백질

다른 구현예에 있어서, 상기 외피 단백질은 변형되지 않은 아레나바이러스 외피 단백질 또는 선택된 아레나바이러스 외피 단백질의 단편이며, 최소한 아레나바이러스 외피 당단백질의 결합 도메인을 포함한다. 적절하게, 이러한 아레나바이러스 단백질 단편은 링커에 의해 제 2의 비렌티바이러스 외피 단백질 또는 그 단편에 직접적으로 또는 간접적으로 융합된다. 이러한 융합 단백질은 얻어지는 외피 단백질의 패키지화, 수율 및/또는 정제를 개선하는 데 있어 바람직할 수 있다. 상기 제 2의 비렌티바이러스 외피 단백질 또는 그 단편은 최소한 막 도메인을 포함한다.

아레나바이러스 외피 당단백질(GP)에 대한 중화항체 면역은 미미한데, 이것은 감염 결과 재감염에 대한 항체 매개 보호작용이 미미하다는 의미이다. 이러한 특성으로 인해 아레나바이러스 외피 단백질을 포함하는 벡터를 이용한 반복 면역화가 가능하다. 전체 인구 중 아레나바이러스에 대해 면역을 가지는 비율은 낮거나 무시할 수 있는 수준이다. 또한, 아레나바이러스는 일반적으로 세포독성이 없으며(세포를 파괴하지 않음), 조건에 따라 동물 내에서 질환을 유발하지 않은 채 장기간 항체 발현을 유지할 수 있다.

아레나바이러스 외피 단백질은 Lassa 바이러스. Luna 바이러스, Lujo 바이러스, 림프구성 맥락수막염 바이러스(LCMV), Mobala 바이러스, Mopeia 바이러스, Ippy 바이러스, Amapari 바이러스, Flexal 바이러스, Guanarito 바이러스, Junin 바이러스, Latino 바이러스, Machupo 바이러스, Oliveros 바이러스, Parana 바이러스, Pichinde 바이러스, Pirital 바이러스, Sabia 바이러스, Tacaribe 바이러스, Tamiami 바이러스, Bear Canyon 바이러스, Whitewater Arroyo 바이러스, Merino Walk 바이러스, Menekre 바이러스, Morogoro 바이러스, Gbagroube 바이러스, Kodoko 바이러스, Lemniscomys 바이러스, Mus minutoides 바이러스, Lunk 바이러스, Giaro 바이러스, Wenzhou 바이러스, Patawa 바이러스, Pampa 바이러스, Tonto Creek 바이러스, Allpahuayo 바이러스, Catarina 바이러스, Skinner Tank 바이러스, Real de Catorce 바이러스, Big Brushy Tank 바이러스, Catarina 바이러스 및 Ocozocoautla de Espinosa 바이러스로부터 유래할 수 있다.

c) 키메릭 외피 당단백질

다른 구현예에 있어서, 유용한 외피는 제 2의 외피 당단백질의 단편 또는 랍도바이러스 또는 아레나바이러스 캡시드 단백질의 인접하지 않은 단편과 융합된 랍도바이러스 또는 아레나바이러스 외피 당단백질의 결합 도메인을 포함하는 키메릭 당단백질일 수 있다. 예를 들어, 선택된 랍도바이러스 또는 아레나바이러스 결합 도메인은 동일한 또는 다른 선택된 랍도바이러스 또는 아레나바이러스 주의 막관통 도메인에 융합될 수 있다. 다른 구현예에 있어서, 상기 제 2의 단백질 또는 단편은 다른 비렌티바이러스 출처로부터 유래할 수 있다. 예컨대, 한 가지 적절한 외피 단백질은 수포성 구내염 바이러스(VSV) 당단백질(G)로부터 유래하는 막 도메인을 포함할 수 있다. 또한, 다른 적절한 단편은 원하는 수준의 패키징을 제공하는 다른 적절한 바이러스원으로부터 선택될 수 있다. 상기 외피가 융합 단백질인 경우, 랍도바이러스 또는 아레나바이러스 외피 단백질(또는 그 단편)을 암호화하는 서열과 제 2의 외피 단백질(또는 그 단편)을 암호화하는 서열 사이에 링커가 삽입될 수 있다. 이러한 링커는 발현시 융합 단백질인 외피가 생산되도록 하기 위하여 바람직할 수 있다. 따라서, 상기 링커는 두 서열이 적절하게 번역되도록 하는 스페이서일 수 있다. 이러한 링커는 핵산(바람직하게는 비암호화 서열)일 수 있거나 화합물 또는 다른 적절한 모이어티일 수 있다. 그러한 융합 단백질을 설계하기 위한 적절한 기술들이 당업자에게 잘 알려져 있다. 일반적으로 Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratories, Cold Spring Harbor. New York를 참고하라.

3. CD34+ 세포 결합용 리간드

렌티바이러스 생산 세포 내에서 CD32+ 세포에 결합하기 위한 리간드가 발현되면 조혈모세포의 형질도입 효율이 개선된 렌티바이러스가 생산된다. CD34+ 조혈모세포는 형질도입을 위한 렌티바이러스의 세포 표면 결합을 촉진하는, 세포 표면의 리간드에 결합된다. 상기 리간드는 단백질, 당단백질, 당 또는 지질일 수 있다. CD34+ 세포 리간드의 구체적인 예는 L-셀렉틴이다. 셀렉틴은 특수한 탄수화물 결정자에 결합하는 렉틴으로서, α(2,3)-연결된 시알산 치환(들)과 α(1,3)-연결된 푸코신 변형(들)을 포함하는 시알로푸코실화로 구성되며, 전형적으로는 4당류인 시알릴 Lewis X(sLe.sup.x; Neu5Ac.alpha.2-3Gal.beta.1-4[Fuc.alpha.1-3]GlcNAc.beta.1-))의 형태이다(1, 6). L-셀렉틴은 순환 중인 백혈구에서 발현되며, 렌티바이러스 생산 세포 내에서 L-셀렉틴이 발현되면 CD34+ 조혈모세포의 렌티바이러스 형질도입 효율이 개선되는 것으로 확인되었다.

IV. 재조합 트랜스퍼 바이러스의 생산

본 개시는 또한 선택된 분자를 숙주세포로 전달하는 데 유용한 재조합 바이러스의 생산방법에 관한 것이다. 재조합 트랜스퍼 바이러스를 생산하기 위하여, 렌티바이러스는 바이러스 컨스트럭트, gag, pol, 외피 단백질 및 rev를 동일한 또는 다수의 벡터 내로 전달한다.

재조합 트랜스퍼 바이러스는 생체 내 및 생체 외 모두에서 전이유전자를 분열하지 않는 세포 내로 효과적으로 전달, 통합 및 장기간 발현할 수 있는 레트로바이러스 또는 렌티바이러스이다. 당해 기술분야에서 다양한 렌티바이러스 벡터가 알려져 있다. Naldini et al., (1996a, 1996b, and 1998); Zufferey et al., (1997); Dull et al., 1998, 미국특허 제 6,013,516 호 및 제 5,994,136 호를 참조하라. 이들 중 어느 것이든지 본 개시의 트랜스퍼 벡터의 생산에 적용될 수 있다. 일반적으로, 이들 벡터는 플라스미드 또는 바이러스에 기반하며, 치료용 폴리펩티드를 숙주세포 내로 암호화하는 핵산의 전달을 위한 필수적인 서열을 운반하도록 구성된다.

A. 재조합 렌티바이러스의 생산방법

재조합 렌티바이러스는 복제능력이 없으므로, 이 바이러스는 단일 세포 내에 필요한 성분들이 갖추어진 "생산자 세포주" 내에서 생산된다. 본 명세서에서, 용어 "생산자 세포주"는 패키지화 세포주와 패키지화 신호를 포함하는 트랜스퍼 벡터 컨스트럭트를 포함하는, 재조합 레트로바이러스 입자를 생산할 수 있는 세포주를 의미한다. 감염성 바이러스 입자와 바이러스 원액의 생산은 종래의 기법을 이용하여 수행될 수 있다. 바이러스 원액을 제조하는 방법은 당해 기술분야에 알려져 있으며, 예컨대 Y. Soneoka et al. (1995) Nucl. Acids Res. 23:628-633과 N. R. Landau et al. (1992) J. Virol. 66:5110-5113에 기술되어 있다. 감염성 바이러스 입자는 종래의 기법을 이용하여 패키지화 세포로부터 수득할 수 있다. 예컨대, 당해 기술분야에서 알려진 바와 같이 세포 용해 또는 세포 배양액의 상등액 수거를 통해 감염성 입자를 수득할 수 있다. 선택적으로, 필요한 경우 수득된 바이러스 입자를 정제할 수 있다. 적절한 정제기법은 당업자에게 잘 알려져 있다.

생산자 세포주의 생성에는 3 또는 4개의 개별적인 플라스미드 시스템이 이용된다. 4 플라스미드 시스템은 3 종의 보조 플라스미드와 하나의 트랜스퍼 벡터 플라스미드를 포함한다. 예를 들어, Gag-Pol 발현 카세트는 구조 단백질과 효소를 암호화한다. 또 다른 카세트는 벡터 게놈의 핵 외 반출에 필요한 부속 단백질인 Rev를 암호화한다. 세 번째 카세트는 베지큘로바이러스 또는 아레나바이러스 외피 단백질과 같은, 렌티바이러스 입자가 표적세포 내로 진입하도록 해 주는 이종의 외피 단백질을 암호화한다. 트랜스퍼 벡터 카세트는 입자 내로의 통합을 위한 신호와 전이유전자 발현을 지시하는 내부 프로모터를 운반하는 벡터 게놈 자체를 암호화한다. 트랜스퍼 벡터는 이종의 전이유전자를 운반하며, 표적세포, 예컨대 CD34+ 세포에 의해 전달되는 유일한 유전물질이다. 3 플라스미드 시스템은 gag-pol과 외피 기능을 암호화하는 2 종의 보조 플라스미드와 트랜스퍼 벡터 카세트를 포함한다. Merten et al., Mol. Ther. Methods Clin. Dev. 3: 16017, 2016을 참조하라.

상기 다성분 발현 카세트는 생산자 세포 내에서 일시적으로 또는 안정적으로 트랜스펙션된다. 일 구현예에 있어서, 필요한 성분을 갖춘 생산자 세포주는 연속적으로 그리고 구조적으로 생산된다. 생산자 세포는 HEK293 세포, HEK293T 세포, 2 93FT, 293SF-3F6, SODk1 세포, CV-1 세포, COS-1 세포, HtTA-1 세포, STAR 세포, RD-MolPack 세포, Win-Pac, CHO 세포, BHK 세포, MDCK 세포, C3H 10T1/2 세포, FLY 세포, Psi-2 세포, BOSC 23 세포, PA317 세포, WEHI 세포, COS 세포, BSC 1 세포, BSC 40 세포, BMT 10 세포, VERO 세포, W138 세포, MRCS 세포, A549 세포, HT1080 세포, B-50 세포, 3T3 세포, NIH3T3 세포, HepG2 세포, Saos-2 세포, Huh7 세포, HeLa 세포, W163 세포, 211 세포 및 211A 세포일 수 있다. 이들은 상업적으로 입수 가능한 렌티바이러스 패키지화 시스템, 예컨대 LentiSuite 키트(Systems Biosciences, Palo Alto, CA), Lenti-X 패키지화 시스템(Takara Bio, Mountain View, CA), ViraSafe 패키지화 시스템(Cell Biolabs, Inc. San Diego, CA), ViroPower 렌티바이러스 패키지화 믹스(Invitrogen) 및 Mission 렌티바이러스 패키지화 믹스(Millapore Sigma, Burlington, MA)로부터 구할 수 있다.

다른 구현예에 있어서, 생산자 세포주는 패키지화 기능을 발현하기 위한 유도성 발현 카세트를 포함한다. 예를 들어, TET-Off 시스템과 TET-On 시스템을 포함하는 생산자 세포를 생성하기 위하여 테트라사이클린 유도성 발현 시스템이 사용된다. 또한, 엑디손 유도성 시스템도 사용된다.

렌티바이러스는 Petri 접시와 T 플라스크, 멀티트레이 시스템(Cell Factories, Cell Stacks) 또는 HYPERFlask를 사용하여 성장시킨 표면 부착성 세포를 사용하여 생산한다. 최적의 컨플루언스(< 50%)에서, 전통적인 Ca 포스페이트 프로토콜 또는 보다 최근에 개발된 폴리에틸렌이민(PEI) 방법을 이용하여 세포를 트랜스펙션한다. 그 밖의 효과적인 양이온성 트랜스펙션제로는 리포펙타민(Thermo-Fisher), 퓨진(Promega) LV-MAX(Thermo-Fisher), TransIT(Mirus) 또는 293fectin(Thermo-Fisher)이 포함된다.

또한, 진탕 플라스크, 유리 생물반응기, 스테인리스강 생물반응기, 웨이브백 및 일회용 교반탱크를 사용하여 부유배양을 통해 렌티바이러스를 생산할 수도 있다. 부유배양액은 Ca 포스페이트 또는 양이온성 폴리머와 선형 폴리에틸렌이민을 사용하여 트랜스펙션한다. 또한, 전기천공에 의해 세포를 트랜스펙션할 수도 있다.

렌티바이러스의 정제는 여과/정화, 접촉 유동여과(TFF) 또는 막 기반 크로마토그래피를 이용한 농축/투석여과, 및/또는 이온교환 크로마토그래피(IEX), 친화성 크로마토그래피 및 크기배제 크로마토그래피와 같은 크로마토그래피 과정과 같은 막공정 단계를을 이용하여 수행된다. 이들 과정의 임의의 조합을 통해 렌티바이러스를 정제할 수 있다. 오염원으로 작용하는 DNA를 분해하기 위한 벤조나아제/DNase 처리를 벡터 생산 과정 도중에 또는 구 후에 수행할 수 있다.

정제는 다음의 3 단계로 수행된다. (i) 포획은 정제의 첫 단계로서 표적분자를 세포 배양액 원액 또는 그 정화액으로부터 포획하여 주요 오염원을 제거한다. (ii) 중간 정제단계는 포획 단계와 최종 정제단계 사이에서 정화된 공급액에 대해 수행하며, 그 결과 특정 불순물들(단백질, DNA 및 내독소)이 제거된다. (iii) 최종 정제는 마지막 단계로서 미량의 오염물질과 불순물을 제거하고 제형화 또는 패키지화에 적절한 형태의 활성과 안전성을 갖는 산물을 얻는 것을 목표로 한다. 오염물질들은 흔히 표적분자, 미량의 다른 불순물 또는 유출 산물을 동반한다. 중간 정제단계와 최종 정제단계(들)에서는 임의의 형태의 크로마토그래피 및 한외여과 과정이 사용된다.

렌티바이러스의 정제를 위한 표준 과정을 예로 들면 다음과 같다. i) 전면 여과(0.45 ㎛) 또는 원심분리를 수행하여 세포 및 잔해물을 제거한다. ii) Mustang Q 또는 DEAE Sepharose를 이용한 이온교환 크로마토그래피 또는 친화성 크로마토그래피(헤파린)를 이용한 포획 크로마토그래피를 수행한다. iii) 크기배제 크로마토그래피에 의한 최종 정제를 수행한다. iv) 접촉 유동여과 또는 초원심분리에 의한 농축 및 버퍼 교환을 수행한다. v) 벤조나아제를 이용한 DNA 환원을 수행한다. vi) 0.2 ㎛ 필터를 이용한 살균을 수행한다. Merten et al., Mol. Ther Methods Clin Dev. 3: 16017, 2016을 참조하라.

B. 표적세포의 형질도입을 개선하는 방법

형질도입이 개시되면, 바이러스 외피와 세포 표면의 특정 수용체들 사이의 특이적인 상호작용에 의해 바이러스 입자가 표적세포에 결합하게 된다. 그러나, 최근의 몇몇 연구에 의하면 바이러스가 결합하는 초기 단계는 특이적인 외피-수용체 상호작용을 수반하지 않고, 수용체와는 독립적으로 결합이 진행된다는 것이 밝혀졌다(Puizzato M, Marlow SA, Blair ED, Takeuchi Y. Initial binding of murine leukemia virus particles to cells does not require specific Env-receptor interaction. J. Virol. 1999;73(10):8599-8611; Sharma S, Miyanohara A, Friedmann T. Separable mechanisms of attachment and cell uptake during retrovirus infection. J. Virol. 2000;74(22):10790-10795). 이러한 초기 단계 작용의 효율과 그에 따른 렌티바이러스 형질도입의 효율은, 음전하의 세포와 이에 접근하는 외피로 둘러싸인 바이러스 사이의 강력한 정전기적 척력으로 인해 감소하게 된다(Jensen TW, Chen Y, Miller WM. Small increases in pH enhance retroviral vector transduction efficiency of NIH-3T3 cells.　Biotechnol.Prog.　2003;19(1):216-223; Swaney WP, Sorgi FL, Bahnson AB, Barranger JA. The effect of cationic liposome pretreatment and centrifugation on retrovirus-mediated gene transfer. Gene Ther. 1997;4(12):1379-1386). 이러한 문제를 해결하기 위하여 고안된 방법들로서, 바이러스와 결합한 표적세포를 낮은 속도에서 원심분리하는 방법, 고정된 단백질 상에서 세포와 바이러스를 함께 로컬라이제이션하는 방법, 그리고 형질도입을 여러 차례 수행하는 방법이 있다(Swaney et al. supra; O'Doherty U, Swiggard WJ, Malim MH. Human immunodeficiency virus type 1 spinoculation enhances infection through virus binding. J. Virol. 2000;74(21):10074-10080). 중요한 점은, 폴리브렌, DEAE-덱스트란, 프로타민 설페이트, 폴리-L-라이신 또는 양이온성 리포좀과 같이 양전하를 갖는 폴리양이온을 가하면 세포와 바이러스 사이의 척력이 감소하여 레트로바이러스 입자가 세포 표면에 결합하게 되므로 형질도입의 효율이 높아진다는 것이다(Skwaney et al. supra; Toyoshima K, Vogt PK. Enhancement and inhibition of avian sarcoma viruses by polycations and polyanions. Virology. 1969;38(3):414-426; Le Doux JM, Landazuri N, Yarmush ML, Morgan JR. Complexation of retrovirus with cationic and anionic polymers increases the efficiency of gene transfer. Hum. Gene Ther. 2001;12(13):1611-1621; Hodgson CP, Solaiman F. Virosomes: cationic liposomes enhance retroviral transduction. Nat. Biotechnol. 1996;14(3):339-342; Cornetta K, Anderson WF. Enhanced in vitro and in vivo gene delivery using cationic agent complexed retrovirus vectors. Gene Ther. 1998;5(9):1180-1186; Seitz B, Baktanian E, Gordon EM, Anderson WF, LaBree L, McDonnell PJ.).

C. 약학적 조성물과 제형

본 개시는 조혈모세포, 보다 구체적으로 CD34+ 세포와 같이 본 명세서에서 기재된 방법에 따라 생산된 렌티바이러스가 형질도입된 세포와 약학적으로 허용 가능한 담체를 포함하는 약학적 조성물과 제형을 제공한다. 본 명세서에서, "약학적으로 허용 가능한 담체"는 약학적으로 허용 가능한 세포배양 배지를 포함하는, 생리적으로 적합한 임의의 그리고 모든 용매, 분산매, 코팅, 항균제 및 항진균제, 등장화제 및 흡수 지연제 등을 포함한다.

일 구현예에 있어서, 담체를 포함하는 조성물은 비경구 투여, 예컨대 혈관 내(정맥 내 또는 동맥 내), 복막 내 또는 근육 내 투여에 적합하다. 약학적으로 허용 가능한 담체는 멸균 수용액 또는 분산액과, 주사 가능한 멸균 용액 및 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 약학적 활성물질을 위한 이러한 매질 또는 제제의 사용은 당해 기술분야에 잘 알려져 있다. 종래의 매질 또는 제제가 형질도입된 세포와 양립할 수 없는 경우를 제외하고, 본 개시의 약학적 조성물에서는 이들의 사용을 고려한다.

본 개시의 조성물은 단독으로 또는 예컨대 사이토카인, 성장인자, 호르몬, 소분자 또는 다양한 약학적 활성제제와 같은 다른 제제와 함께 투여된다. 첨가되는 제제가 원하는 유전자 치료를 전달하는 조성물의 능력에 부정적인 영향을 미치지 않는 한, 조성물 내에 포함될 수 있는 다른 성분에 관해서는 사실상 거의 제한이 없다.

본 개시의 약학적 조성물에 있어서, 약학적으로 허용 가능한 부형제 및 담체 용액의 제형은 당업자에게 잘 알려져 있으며, 적절한 용량과 본 명세서에 기재된 특정 조성물을 이용한 경구용, 비경구용, 정맥 내, 비내 및 근육 내 투여를 포함한 다양한 치료방법도 당업자에게 잘 알려져 있다.

경우에 따라, 본 개시에 개시된 조성물을 비경구적으로, 정맥 내로, 근육 내로, 또는 심지어 미국특허 제 5,543,158 호, 미국특허 제 5,641,515 호 및 미국특허 제 5,399,363 호(이들 각각은 전체가 참조로서 본 명세서에 포함된다)에 기재된 바와 같이 복막 내로 전달되는 것이 바람직할 수 있다. 자유 염기 또는 약리학적으로 허용 가능한 염 상태인 활성 화합물의 용액은 하이드록시프로필 셀룰로오스와 같은 계면활성제와 적절히 혼합된 물 내에서 제조될 수 있다. 분산액 역시 글리세롤, 액상의 폴리에틸렌 글리콜 및 이들의 혼합물과 오일 내에서 제조될 수 있다. 일반적인 저장 및 사용 조건 하에서, 이러한 제조물은 미생물의 성장을 억제하기 위한 보존제를 포함한다.

주사용으로 적합한 약학적 형태에는 멸균 수용액 또는 분산액과, 주사 가능한 멸균 용액 또는 분산액의 즉석 제조를 위한 멸균 분말이 포함된다(구체적으로, 미국특허 제 5,466,468 호 전체가 참조로서 본 명세서에 포함된다). 모든 경우에 있어서, 상기 형태는 멸균 상태여야 하며 주사가 용이할 정도로 유체 상태여야 한다. 상기 형태는 제조 및 저장 조건에서 안정적이어야 하며 박테리아 또는 곰팡이와 같은 미생물의 오염 작용으로부터 보호되어야 한다. 상기 담체는 예컨대 물, 에탄올, 폴리올(예를 들어 글리세롤, 프로필렌 글리콜 및 액상 폴리에틸렌 글리콜 등), 이들의 적절한 혼합물 및/또는 식물성 오일을 포함하는 용매 또는 분산매일 수 있다. 예컨대 레시틴과 같은 코팅을 이용하여, 분산액의 경우에는 계면활성제를 사용하여 필요한 입자 크기를 유지함으로써 적절한 유동성을 유지할 수 있다. 미생물의 작용은 다양한 항균제 및 항진균제, 예컨대 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등을 사용하여 효과적으로 예방할 수 있다. 많은 경우에 있어서, 예컨대 당 또는 염화나트륨과 같은 등장화제를 포함시키는 것이 바람직할 수 있다. 주사 가능한 조성물의 경우 예컨대 알루미늄 모노스테아레이트 및 젤라틴과 같은 흡수 지연제를 사용하여 흡수를 지연시킬 수 있다.

비경구 투여를 위한 수용액의 경우, 예를 들어, 필요하다면 적절하게 완충해야 하며 충분한 양의 식염수 또는 포도당으로 용액을 등장화해야 한다. 이러한 수용액은 특히 정맥 내, 근육 내, 피하 및 복막 내 투여에 적합하다. 이와 관련하여, 당업자는 본 개시에 비추어 사용 가능한 멸균된 수성 매질을 선택할 수 있을 것이다. 예를 들어, 1 ㎖의 등장성 NaCl 용액 내에 1 회 용량을 용해한 후 1000 ㎖의 피하 주사액에 가하거나 해당 주입 부위에 주사할 수 있다(예컨대 Remington: The Science and Practice of Pharmacy, 20th Edition. Baltimore, Md.: Lippincott Williams & Wilkins, 2000을 참조). 치료 대상에 따라 용량을 변화시키는 것이 필요한 경우도 있을 것이다. 투여에 책임이 있는 자는 어떤 경우에도 각 대상에 대하여 적절한 용량을 결정할 수 있을 것이다. 또한, 인체에 투여하는 경우, 제조물은 FDA가 요구하는 멸균성, 발열원성과 일반적인 안전성 및 정제도 기준을 만족시켜야 한다.

멸균 주사용액은 필요로 하는 다양한 상기 다른 성분과 함께 적절한 용매 중의 필요한 양의 활성 화합물을 도입하여 제조된 후, 여과 멸균한다. 통상적으로, 분산액은 다양한 멸균 활성 성분을 염기성 분산매와 위에 언급한 다른 필요한 성분들을 포함하는 멸균 용기에 도입하여 제조된다. 멸균 주사 용액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 멸균 여과 용액으로부터 활성 성분의 분말과 추가로 요구되는 임의의 성분을 얻는 진공건조 및 냉동건조 기법이다.

본 명세서에 기재된 조성물은 중성 또는 염의 형태로 제형화 될 수 있다. 약학적으로 허용되는 염은 산 첨가 염(단백질의 유리 아미노기로 형성된)을 포함하고 이는 예를 들어, 염화수소산, 인산과 같은 무기산 또는 아세트산, 옥살산, 타르타르산, 만델산 등과 같은 유기산과 함께 형성된다. 유리 카르복실기와 함께 형성된 염은 또한, 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘, 철수산화물과 같은 무기 염기, 및 이소프로필아민, 트리메틸아민, 히스티딘, 프로캐인 등과 같은 유기 염기로부터 유래할 수 있다. 제형화시, 용액은 용량 제형과 일치하는 방식으로, 그리고 치료에 효과적인 양으로 투여될 수 있다. 상기 제형은 주사 용액, 약제 방출 캡슐 등과 같은 다양한 용량 형태로 용이하게 투여된다.

본 명세서에서 "담체"는 임의의 및 모든 용매, 분산매, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장화제 및 흡수 지연제, 완충액, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약학적 활성 물질을 위한 이러한 매질 및 제제의 용도는 당업계에 잘 공지되어 있다. 임의의 통상적인 매질 또는 시약이 활성 성분과 조화되지 못하는 경우를 제외하고, 치료용 조성물 내에서 이들의 사용이 고려된다. 추가적인 활성 성분 역시 조성물에 포함될 수 있다.

표현 "약학적으로 허용되는"은 인체에 투여되었을 때 알레르기 반응 또는 유사한 부적당한 반응을 일으키지 않는 분자 물질 및 조성물을 지칭한다. 활성 성분으로서 단백질을 포함하는 수용성 조성물의 제조는 당업계에 잘 공지되어 있다. 전형적으로, 이러한 조성물은 주사 가능한 형태의 액체 용액 또는 현탁액으로 제조된다. 또한, 주사 전에 액체에 가하여 용액 현탁액을 제조할 수 있는 고체 형태로도 제조될 수 있다. 이러한 제조물은 유화될 수도 있다.

일부 구현예에 있어서, 상기 조성물은 비강 내 스프레이, 흡입 및/또는 그 밖의 에어로졸 전달용 기구에 의해 전달될 수 있다. 유전자, 폴리펩티드 및 펩티드 조성물을 직접 폐로 또는 비강 에어로졸 스프레이에 의해 전달하는 방법이 예컨대 미국특허 제 5,756,353 호와 미국특허 제 5,804,212 호(이들은 각각 전체가 참조로서 본 명세서에 포함된다)에 기재되어 있다. 마찬가지로, 비강 내 미립자 수지(Takenaga et al., 1998) 및 라이소포스파티딜-글리세롤 화합물(미국특허 제 5,725,871 호, 전체가 참조로서 본 명세서에 포함된다)을 사용한 약물의 전달도 또한 약학 분야에 잘 알려져 있다. 또한, 폴리테트라플루오로에틸렌 지지체 매트릭스 형태의 경점막 약물 송달이 미국특허 제 5,780,045 호(전체가 참조로서 본 명세서에 포함된다)에 기재되어 있다.

일부 구현예에 있어서, 상기 전달은 본 개시의 조성물을 적절한 숙주세포 내로 도입하기 위하여 리포좀, 나노캡슐, 마이크로입자, 미립구, 지질 입자, 소낭, 선택적 CPP 폴리펩타이드와의 혼합 등을 사용하여 수행될 수 있다. 특히, 본 개시의 조성물은 전달을 위해서 지질 입자, 리포좀, 소낭, 나노구체, 나노입자 등에 캡슐화하여 제형화될 수 있다. 이러한 전달 비히클의 제형화 및 사용은 공지되어 있는 통상의 기술을 이용하여 수행될 수 있다. 본 개시의 제형 및 조성물은 단독으로 또는 하나 이상의 다른 치료 양식과 함께 세포 또는 동물에게 투여하기 위하여 약학적으로 허용되거나 생리학적으로 허용되는 용액(예컨대, 배양 배지) 중에서 제형화된, 본 명세서에 기재된 임의의 수의 폴리펩티드, 폴리뉴클레오티드 및 소분자의 조합으로 이루어지는 하나 이상의 억제제 및/또는 활성화제를 포함할 수 있다. 또한, 필요한 경우에, 본 개시의 조성물은 예를 들어, 세포, 다른 단백질 또는 폴리펩티드 또는 다양한 약학적 활성 제제와 같은 다른 제제와 함께 투여될 수 있는 것으로 이해될 수 있다.

특정한 일 구현예에 있어서, 본 개시에 따른 제형 또는 조성물은 본 명세서에 기재된 임의의 수의 폴리펩티드, 폴리뉴클레오티드 및 소분자의 조합과 접촉하는 세포를 포함한다.

일부 측면에 있어서, 본 개시는 레트로바이러스(예를 들어, 렌티바이러스) 벡터를 포함하는(단, 이들로 제한되지는 않는다) 바이러스 벡터 시스템의 전달(즉, 바이러스 매개 형질도입)에 적합한 제형 또는 조성물을 제공한다.

탈체(ex vivo) 전달을 위한 예시적인 제형은 또한 칼슘 포스페이트, 전기천공, 열 쇼크 및 다양한 리포좀 제형(지질 매개 트랜스펙션제)과 같은 본 기술분야에서 공지된 다양한 트랜스펙션제의 사용을 포함할 수 있다. 이하에 더 상세하게 기재한 바와 같이, 리포좀은 수성 유체를 일부 포획하는 지질 이중층이다. DNA는 자발적으로 양이온성 리포좀의 외부 표면에 회합하고(그 전하에 의해), 이들 리포좀은 세포막과 상호작용할 것이다.

일부 측면에 있어서, 본 개시는 하나 이상의 약학적으로 허용 가능한 담체(첨가제) 및/또는 희석제(예를 들어, 약학적으로 허용 가능한 세포배양 배지)와 함께 제형화된, 치료학적 유효량의 본 명세서에 기재된 하나 이상의 폴리뉴클레오티드 또는 폴리펩티드를 포함하는 약학적으로 허용 가능한 조성물을 제공한다.

본 개시의 특정한 구현예들은 약학 기술분야에 잘 알려져 있으며, 예를 들어 Remington: The Science and Practice of Pharmacy, 20th Edition. Baltimore, MD: Lippincott Williams & Wilkins, 2000에 기재된 것과 같은 다른 제형들을 포함할 수 있다.

D. 치료 방법

재조합 렌티바이러스는 개선된 유전자 치료의 방법을 제공한다. 본 명세서에서, 용어 "유전자 치료"는 폴리뉴클레오티드를 유전자 및/또는 유전자의 발현을 변형하는 세포의 게놈 내로 도입하는 것을 의미한다. 다양한 구현예에 있어서, 본 개시의 바이러스 벡터는 단일 유전자 질환, 장애 또는 증상 또는 조혈모세포 시스템의 질환, 장애 또는 증상으로 진단되거나, 이들을 가지는 것으로 의심되는 대상에게 치유적, 예방적 또는 개선적 이득을 제공하는 폴리펩티드를 암호화하는 치료용 전이유전자를 발현하는 조혈모세포 발현 조절서열을 포함한다. 또한, 본 개시의 벡터는 특정 세포, 예컨대 적아세포의 수 또는 계통을 증가 또는 확장하기 위하여, 세포 내에서 절단된 에리트로포이에틴 수용체를 발현하는 다른 발현 조절서열을 포함한다. 상기 바이러스는 생체 내, 탈체 또는 시험관 내에서 세포를 감염시키거나 형질도입할 수 있다. 탈체 및 시험관 내의 구현예에 있어서, 형질도입된 세포는 그 후에 치료가 필요한 대상에게 투여될 수 있다. 본 개시의 벡터 시스템, 바이러스 입자 및 형질도입된 세포를 대상에서 단일 유전자 질환, 장애 또는 증상 또는 조혈모세포 시스템의 질환, 장애 또는 증상, 예컨대 이상 혈색소를 치료, 예방 및/또는 개선시키기 위해서 사용될 수 있는 것으로 고려된다.

본 명세서에서, "조혈"은 전구세포로부터 혈구가 형성되고 발달하는 것과, 줄기세포로부터 전구세포가 형성되는 것을 의미한다. 혈구는 적혈구(RBC), 망상 적혈구, 단핵세포, 호중구, 거핵구, 호산구, 호염기구, B 세포, 대식세포, 과립구, 비만세포, 판혈소 및 백혈구를 포함하나 이에 제한되지는 않는다.

본 명세서에서, 용어 "이상 혈색소" 또는 "이상 혈색소 증상"은 혈액 내에 비정상적인 헤모글로빈 분자가 존재하는 임의의 장애를 포함한다. 이상 혈색소의 예로는 헤모글로빈 C 질환, 헤모글로빈 겸상세포 질환(SCD), 겸상 적혈구성 빈혈 및 지중해 빈혈이 포함되나 이에 제한되지는 않는다. 또한, 혈액 내에 비정상적인 헤모글로빈의 존재가 함께 나타나는 이상 혈색소 증상(예컨대 겸상세포/Hb-C 질환)도 포함된다.

본 명세서에서, 용어 "겸상 적혈구성 빈혈" 또는 "겸상세포 질환"은 적혈구의 겸상화로 인한 임의의 빈혈 증상을 포함하는 것으로 정의된다. 겸상세포 질환의 징후는: 빈혈; 통증; 및/또는 신부전, 망막병증, 급성 흉부 증후군, 허혈, 음경 지속 발기 및 뇌졸중과 같은 장기 부전을 포함한다. 본 명세서에서, 용어 "겸상세포 질환"은 특히 HbS의 겸상세포 치환에 대하여 동형 접합체인 대상들에서 발생하는, 겸상 적혈구성 빈혈에 수반하는 다양한 임상적 문제를 의미한다. 본 명세서에서, 용어 겸상세포 질환과 관련하여 언급한 건강상의 징후에는 성장 및 발달 지연, 특히 폐렴구균에 의한, 심각한 감염 발생빈도의 증가, 비장 기능의 현저한 손상, 체내 박테리아의 효과적인 제거 억제, 경색의 재발, 비장 조직의 파괴가 포함된다. 또한, 용어 "겸상세포 질환"에는 주로 요추, 복부 및 대퇴골 간부에 영향을 미치며 메커니즘과 심각성 측면에서 벤즈와 유사한 급성 근골격계 통증이 포함된다. 성인의 경우, 이러한 질환은 흔히 수주 또는 수개월의 간격으로 짧은 기간 동안 지속되는 경증 또는 중증도의 증상으로 나타나며, 평균적으로 1 년에 한 번 5~7 일 동안 지속되는 매우 고통스러운 증상이 나타난다. 이러한 위기상황을 촉발하는 요인으로 알려진 것들에는 산증, 저산소증 및 탈수가 포함되는데, 이들은 모두 HbS의 세포내 중합의 가능성을 높인다(J. H. Jandl, Blood: Textbook of Hematology, 2nd Ed., Little, Brown and Company, Boston, 1996, pages 544-545). 본 명세서에서, 용어 "지중해 빈혈"은 헤모글로빈의 합성에 영향을 미치는 돌연변이로 인해 발생하는 유전성 빈혈을 포함한다. 따라서, 이 용어는 중증 또는 β 지중해 빈혈, 중증성 지중해 빈혈, 경증성 지중해 빈혈, 헤모글로빈 H 질환과 같은 α 지중해 빈혈 등의 모든 지중해 빈혈 증상으로부터 발생하는 빈혈 증상을 포함한다.

본 명세서에서, "지중해 빈혈"은 헤모글로빈의 생산 결함을 특징으로 하는 유전적 장애를 의미한다. 지중해 빈혈의 예로는 α 및 β 지중해 빈혈이 포함된다. β 지중해 빈혈은베타 글로빈 사슬의 돌연변이에 의해 발생하며, 중증성 또는 경증성의 형태로 발생할 수 있다. 중증성 β 지중해 빈혈의 경우, 태어날 때에는 정상이지만, 생후 첫 해부터 빈혈이 발생한다. 경증성 β 지중해 빈혈의 경우에는 작은 적혈구가 생산된다.

α 지중해 빈혈은 글로빈 사슬에서 하나 또는 그 이상의 유전자의 결실로 인해 발생한다. α 지중해 빈혈은 주로 HBA1 및 HBA2 유전자의 결실로 인해 발생한다. 이들 두 유전자는 모두 헤모글로빈의 성분(하위 단위체)인 α 글로빈을 암호화한다. 각 세포의 게놈에는 HBA1 유전자가 2 개, HBA2 유전자가 2 개 있다. 따라서, α 글로빈을 생산하는 대립유전자의 수는 4 개이다. 이들 대립유전자 중 일부 또는 전부가 결실되면 여러 유형의 α 지중해 빈혈이 발생한다. 가장 중증인 형태의 α 지중해 빈혈인 Hb Bart 증후군은 4 개의 대립유전자가 모두 결실되었을 때 발생한다. HbH 질환은 4 개의α 글로빈 대립유전자 중 3 개가 결실되었을 때 발생한다. 이들 두 가지의 경우, α 글로빈의 부족으로 인해 세포로부터 정상적인 헤모글로빈이 생성되지 않는다. 대신, 세포는 헤모글로빈 Bart(Hb Bart) 또는 헤모글로빈 H(HbH)라고 하는 비정상적인 형태의 헤모글로빈을 생산한다. 이러한 비정상적인 헤모글로빈 분자들은 산소를 신체 조직에 효과적으로 운반하지 못한다. Hb Bart 또는 HbH가 정상적인 헤모글로빈을 대체함에 따라 α 지중해 빈혈과 관련된 빈혈증 및 다른 심각한 건강상 문제가 야기된다.

특정한 일 구현예에 있어서, 본 개시의 유전자 치료방법은 헤모글로빈 C 질환, 헤모글로빈 겸상세포 질환(SCD), 겸상 적혈구성 빈혈, 유전성 빈혈, 지중해 빈혈, β 지중해 빈혈, 중증성 지중해 빈혈, 경증성 지중해 빈혈, α 지중해 빈혈 및 헤모글로빈 H 질환으로 구성되는 군으로부터 선택되는 이상 혈색소를 치료, 예방 또는 개선하기 위하여 사용된다.

다양한 구현예에 있어서, 상기 렌티바이러스 벡터는 유전자 치료를 필요로 하는 대상의 세포, 조직 또는 기관에 생체 내로 직접 주입하여 투여된다. 다른 다양한 구현예에 있어서, 세포를 본 개시의 벡터로 시험관 내 또는 탈체에서 형질도입하고, 선택적으로 탈체에서 증식시킨다. 이어, 형질도입된 세포를 유전자 유전자 치료를 필요로 하는 대상에게 투여한다.

다양한 구현예에 있어서, 유전자 치료방법에는 조혈모세포의 사용이 바람직한데, 이는 이들이 생체 내에서 특별한 생물학적 위치에 투여하면 적절한 세포 유형으로 분화하는 능력을 갖기 때문이다. 용어 "줄기세포"는 (1) 장기간 자가재생, 즉 원래의 세포의 적어도 하나의 동일한 복제품을 생성하는 능력, (2) 단일 세포 수준에서 다수의, 그리고 일부의 경우에는 단지 하나의, 특수화된 세포 유형으로 분화하는 능력 및 (3) 생체 내에서 조직의 기능 재생 능력을 가지는 미분화된 세포인 세포를 의마한다. 줄기세포는 발달 잠재력에 따라 전능성, 만능성, 다능성 및 단능성으로 분류된다. "자가재생"은 변화되지 않은 딸 세포를 생산하고, 특수화된 세포 유형(효능)을 생성하는 고유의 능력을 갖는 세포를 의미한다. 자가재생은 두 가지 방법으로 달성될 수 있다. 비대칭 세포분열은 부모 세포와 동일한 하나의 딸 세포와, 부모 세포와 상이하며 전구체 또는 분화된 세포인 하나의 딸 세포를 생산한다. 비대칭 세포분열은 세포의 수를 증가시키지 않는다. 대칭 세포분열은 두 개의 동일한 딸 세포를 생산한다. 세포의 "증식" 또는 "팽창"은 대칭적으로 분열하는 세포를 의미한다.

본 명세서에서, 용어 "만능성"은 신체 또는 소마(배아)의 모든 계통을 형성하는 세포의 능력을 의미한다. 예를 들어, 배아 줄기세포는 3 개의 배엽인 외배엽, 중배엽 및 내배엽 각각으로부터 세포를 형성할 수 있는 만능 줄기세포 유형이다. 본 명세서에서, 용어 "다능성"은 하나의 계통의 여러 세포 유형을 형성시키는 성체 줄기세포의 능력을 나타낸다. 예를 들어, 조혈모세포는 혈액 세포 계통의 모든 세포, 예를 들어, 림프계 세포 및 골수계 세포를 형성할 수 있다.

본 명세서에서, 용어 "전구체(progenitor)" 또는 "전구세포(progenitor cell)"는 자가재생하고, 더 성숙한 세포로 분화하는 능력을 갖는 세포를 의미한다. 전구세포는 만능 줄기세포 및 다능 줄기세포에 비해 감소된 잠재성을 가진다. 다수의 전구세포가 단일한 계통을 따라서 분화하지만, 매우 광범한 증식능력을 가질 수도 있다.

조혈모세포(HSC)는 생명체의 일생에 걸쳐 성숙한 혈액 세포 전체를 생성할 수 있는 조혈 전구세포(HPC)를 낳는다. 용어 "조혈모세포" 또는 "HSC"는 골수계 세포(예를 들어, 단핵구 및 대식세포, 호중구, 호염기구, 호산구, 적혈구, 거핵구/혈소판, 수지상 세포), 림프계 세포(예를 들어, T 세포, B 세포, NK 세포) 및 당업계에 공지된 그 밖의 다른 세포(Fei, R., et al ., 미국특허 제 5,635,387 호; McGlave, et al ., 미국특허 제 5,460,964 호; Simmons, P., et al., 미국특허 제 5,677,136 호; Tsukamoto, et al., 미국특허 제 5,750,397 호; Schwartz, et al., 미국특허 제 5,759,793 호; DiGuisto, et al., 미국특허 제 5,681,599 호; Tsukamoto, et al., 미국특허 제 5,716,827 호를 참조)를 포함하는, 생명체의 모든 혈액 세포 유형을 생성하는 다능성 줄기세포를 의미한다. 치사량의 방사선이 조사된 동물 또는 사람에게 이식되는 경우, 조혈모세포 및 전구세포는 적혈구, 호중구-대식세포, 거핵구 및 림프계 조혈세포를 증가시킬 수 있다.

바람직한 구현예들에 있어서, 상기 형질도입된 세포는 골수, 제대혈 또는 말초 혈액으로부터 분리된 조혈모세포 및/또는 전구세포이다. 특히 바람직한 구현예들에 있어서, 상기 형질도입된 세포는 골수, 제대혈 또는 말초 혈액으로부터 분리된 조혈모세포이다.

HSC는 특정한 표현형 또는 유전자형 마커에 의해 확인할 수 있다. 예를 들어, HSC는 작은 크기, 계통(lin) 마커의 부재, 로다민 123(rhodamineDULL, rholo라고도 함) 또는 Hoechst 33342와 같은 생체염료에 대한 낮은 염색도, 그리고 다수가 분화 클러스터에 속하는 다양한 항원 마커(예컨대 CD34, CD38, CD90, CD133, CD105, CD45, Ter119 및 줄기세포 인자에 대한 수용체인 C 키트)의 세포 표면상의 존재에 의해 확인될 수 있다. HSC는 대체로 계통 순응을 검출하기 위해 흔히 사용되는 마커들에 대하여 음성이며, 따라서 흔히 Lin(-) 세포로 지칭된다.

일 구현예에 있어서, 인간 HSC는 CD34+, CD59+, Thy1/CD90⁺ CD38^-, C 키트/CD117⁺, CD49f⁺ 및 Lin(-)를 특징으로 할 수 있다. 그러나, 일부 HSC는 CD34^-/CD38^-이므로 모든 줄기세포가 이들의 조합에 포함되는 것은 아니다. 또한, 일부 연구에 의하면 초기의 줄기세포는 세포 표면에 C 키트가 존재하지 않을 수 있다. 인간 HSC의 경우, CD133는 CD34+ 및 CD34- HSC들이 모두 CD133+임이 확인되었으므로 초기 마커를 표현할 수 있다. CD34+ 및 Lin(-) 세포들 역시 조혈 전구세포를 포함할 수 있음이 당업계에 알려져 있다.

상기한 조성물과 방법, 용도는 설명의 목적이며 제한적인 것은 아니다. 당업자는 본 명세서에 개시된 내용을 바탕으로 상기 조성물, 방법 및 용도를 용이하게 변경할 수 있을 것이다.

실시예

하기 실시예들은 설명의 목적으로 제공되나, 본 발명을 제한하지 않는다.

실시예 1

인간 CD34+ 세포의 보다 효율적인 형질도입을 가능하게 하는 외피 단백질의 확인 및 인간 L-셀렉틴 및/또는 아레나바이러스 외피 단백질의 발현에 의한 인간 CD34+ 세포의 개선된 형질도입 방법.

방법

발현 벡터의 구축. pHCMV VSV-G Indiana 외피 발현 벡터는 Stanford 바이러스 코어로부터 얻었고 인간 CMV(HCMV) 프로모터의 조절 하에 VSV-G Indiana 외피 단백질을 포함한다(도 18; 서열번호 44). 5' 비번역 영역의 일부, VSV-G Indiana 외피 단백질에 대한 암호화 서열 및 3' 비번역 영역의 일부를 포함하는 pHCMV VSV-G Indiana 내 Apa I/Msc I 제한효소 단편을 합성된 다른 외피 단백질(DNA 2.0, Inc.)에 대한 암호화 영역으로 교체하고, 동일한 5' 및 3' 비번역 영역을 측면에 배치하여 외피 암호화 영역만이 변경되도록 하였다. 이러한 플라스미드의 예로는 pHCMV Bas Congo 외피, pHCMV Chandipura 외피, pHCMV Curionopolis 외피, pHCMV Ekpoma-1 외피, pHCMV Ekpoma-2 외피, pHCMV Isfahan 외피, pHCMV Kamese 외피, pHCMV Kontonkan 외피, pHCMV Kwatta 외피, pHCMV Le Dantec 외피, pHCMV rabies 외피, pHCMV VSV Alagoas 외피, pHCMV VSV Arizona 외피, pHCMV VSV Carajas 외피, pHCMV VSV Maraba 외피, pHCMV VSV Morreton 외피, pHCMV VSV New Jersey 외피 및 pHCMV Machupo 외피가 포함된다.

CMV 프로모터의 조절 하에 인간 L-셀렉틴(유전자 기호 : SELL) 암호화 영역을 포함하는 pCMV6-XL5 인간 SELL인 인간 L-셀렉틴 발현 벡터를 Origene, Inc에서 구입하였다(도 19; 서열번호 45). eGFP 렌티바이러스 벡터(pCCL MNDU3 eGFP)는 Don Kohn(UCLA)으로부터 입수하였고 이 벡터의 지도를 도 20 및 서열번호 46에 나타내었다. β-글로빈 렌티바이러스 벡터(pCCL GLOBE1 βAS3)는 Fulvio Mavilio(Genethon)로부터 입수하였다(도 21 참조; 서열번호 47).

렌티바이러스의 생산. 293T 세포(American Type Culture Collection)를 10% 우태아 혈청(Hyclone)을 포함하는 12.5 ㎖의 DMEM 배지(Invitrogen) 내에 75 cm² 플라스크 당 1.2×10⁷ 세포의 밀도로 도말하였다. 세포를 도말하고 24 시간 후에, 배지를 제거하고 겐타마이신(Lonza)을 포함하는 5 ㎖의 X-VIVO 15 배지로 세포를 세척한 다음 10 mM HEPES를 포함하는 12.5 ㎖의 X-VIVO 15 배지를 가하였다. 하나의 외피 단백질을 가지는 바이러스를 생산하기 위하여, 100 ㎕의 OptiMem I 배지(Invitrogen), 10 ㎍의 렌티바이러스 벡터 플라스미드, 5 ㎍의 pRSV rev(도 22; 서열번호 48), 5 ㎍의 pMDLg/pRRE(도 23; 서열번호 49) 및 5 ㎍의 외피 발현 플라스미드를 100 ㎍의 선형 25 kDal PEI(VWR)와 혼합하고 주위 온도에서 10 분 동안 인큐베이션한 다음 혼합액을 세포에 가하여 세포를 트랜스펙션하였다. L-셀렉틴 발현 하에 바이러스를 생산하기 위하여, 5 ㎍의 pCMV6-XL5 인간 SELL(도 19)을 상기 혼합액에 가한 후 외피 발현 플라스미드의 양을 5 ㎍에서 1 ㎍으로 줄였다. 트랜스펙션이 시작된 지 24 시간 후에, 배지를 플라스크에서 제거하고 4 ℃에서 보관한 후, 겐타마이신과 10 mM HEPES를 포함하는 12.5 ㎖의 X-VIVO 15 배지로 교체하였다. 트랜스펙션이 시작된 지 48 시간 후에, 배지를 플라스크에서 제거하고 처음 수확한 배지와 합하였다. 3,000×g에서 15 분 동안 4℃에서 원심분리하여 배지로 부터 세포와 잔해물을 펠릿화하였다. 상등액을 세공 크기 0.45 μM의 멸균된 필터장치(Steri-flip; Millipore)를 통해 여과하여 남아 있는 293T 세포를 모두 제거하였r고, 이는 이들 세포 중 일부가 바이러스 생산 과정에서 형질도입되어, 형질도입된 표적세포와 혼동될 수 있기 때문이다. 크루드 바이러스(crude virus)를 최종농도 50 U/㎖의 벤조나아제(Sigma)로 30 분 동안 37 ℃에서 처리하여 트랜스펙션 후에 잔류하는 플라스미드의 양을 줄였다. 약 0.2 ㎖로 재생한 셀룰로오스막을 포함하는 Amicon Ultra-15(Millipore, 100 kDal 분자량 컷오프)를 사용하여 바이러스를 한외여과에 의해 약 100 배로 농축하였다. 바이러스를 다양한 크기의 단일 사용량으로 나누고, 사용할 때까지 -80 ℃에서 보관하였다. p24 캡시드 ELISA(Clontech, Inc.)를 사용하여 바이러스 농도를 측정하였다. 다른 외피를 포함하는 바이러스의 감염성은 세포에 따라 크게 다를 수 있으므로, 알려진 양의 바이러스 입자가 형질도입될 수 있도록 배양된 세포에 대한 감염역가 대신 "입자 수"를 측정하는 분석(p24 캡시드 ELISA)을 수행하였다.

인간 CD34 세포의 형질도입. 골수 유래 인간 CD34+ 세포를 Lonza에서 구입하였다. 형질도입 2 일 전에, 미처리한 48 웰 플레이트(VWR cat# 73521-144)를 20 ㎍/㎖의 레트로넥틴(Lonza)을 포함하는 0.25 ㎖의 PBS로 24 시간 동안 4 ℃에서 코팅하였다. PBS/레트로넥틴을 제거하고, 플레이트를 2% 소혈청 알부민을 포함하는 PBS로 30 분 이상 주위 온도에서 블로킹하였다. CD34+ 세포를 해동, 펠릿화한 후 겐타마이신, 50 ng/㎖ 인간 C 키트 리간드(R&D Systems), 20 ng/㎖ 인간 IL-3(R&D Systems), 50 ng/㎖ 인간 Flt-3 리간드(R&D Systems) 및 50 ng/㎖ 인간 트롬보포이에틴(R&D Systems)을 포함하는 X-VIVO15 배지 내에, 웰 당 0.25 ㎖로 재현탁하였다. 세포를 37 ℃에서 24 시간 동안 인큐베이션한 후, 형질도입을 위해 원하는 양의 렌티바이러스를 가하였다. 필요한 경우, 세포 농도를 1×10⁶ 세포/㎖ 미만으로 유지하기 위하여 배지를 더 가하였다.

eGFP 발현 카세트를 포함하는 렌티바이러스 벡터로 형질도입된 CD34 세포 중 eGFP+ 세포의 비율의 결정. 바이러스 형질도입이 시작된 지 3 일 후, 세포를 수거하여 96 웰 V-바닥 플레이트 내에서, 20 ℃에서 5 분 동안 300×g로 펠릭화하였다. 배지를 제거한 후, 1% FBS를 포함하는 200 ㎕의 PBS로 세포를 세척하였다. 20 ℃에서 5 분 동안 300×g로 세포를 펠릿화한 후, 1% FBS를 포함하는 PBS를 제거하였다. 2% 파라포름알데히드와 1% FBS를 포함하는 200 ㎕의 PBS 내에 세포를 재현탁하였다. Accuri 유세포 분석기(BD Biosciences)를 사용하여 eGFP+ 세포의 비율을 결정하였다.

트랜스펙션된 인간 CD34 세포 내에서 β 글로빈 미니유전자를 포함하는 통합된 렌티바이러스 벡터의 수의 결정. 바이러스 형질도입이 시작된 지 3 주 후에, 세포를 수거하여 1.5 ㎖ 마이크로 원심분리관 내에서, 20 ℃에서 5 분 동안 300×g로 펠릿화하였다. 배지를 제거하고 세포를 200 ㎕의 PBS에서 재현탁하였다. DNeasy Blood & Tissue Kit(Qiagen, Inc.)를 사용하여 제조업체의 지시에 따라 게놈 DNA를 제조하였다. 게놈 DNA에 대해 3 차례의 정량적 중합효소 연쇄반응(Q-PCR)을 수행하여 통합된 렌티바이러스의 수, (샘플 내 세포의 수를 카운트하기 위한) 단일 유전자의 수, 그리고 (렌티바이러스 게놈은 전이유전자 플라스미드 내에 완전히 포함되므로, 렌티바이러스 게놈의 정확한 정량화를 방해할 수 있는) 트랜스펙션 후 남은 플라스미드의 양을 측정하였다.

Q-PCR에 사용된 프라이머와 프로브의 서열은 다음과 같다.

통합된 렌티바이러스의 수를 정량화하기 위하여 Q-PCR의 타겟으로 바이러스 RNA 게놈 패키징 서열(psi)과 중복되는 서열을 사용하였다.

사용된 정방향 프라이머의 서열 : 5'-ACTTGAAAGCGAAAGGGAAAC-3' (서열번호 50).

사용된 역방향 프라이머의 서열 : 5'-CGCACCCATCTCTCTCCTTCT-3' (서열번호 51).

사용된 프로브의 서열 : 5'-6FAM-AGCTCTCTCGACGCAGGACTCGGC-TAMRA-3' (서열번호 52).

기준으로 사용된 DNA : pCCL-GLOBE1-βAS3 (서열번호 47).

단일 유전자의 수를 정량화하기 위하여 Q-PCR의 타겟으로 인간 RNAse P 유전자를 사용하였다. 사전 혼합된 프라이머와 프로브로 구성되는 TaqMan RNAse P 검출시약(Applied Biosystems)을 Q-PCR에 사용하였다. 기준으로 사용된 DNA는 상기 시약들과 함께 제공된 인간 DNA이다.

잔류 플라스미드를 정량화하기 위하여 Q-PCR의 타겟으로 바이러스 RNA 게놈을 암호화하는 영역 바깥의 pCCL 계 렌티바이러스 벡터 골격에서만 발견되고 바이러스 생산용으로 사용된 다른 플라스미드에서는 발견되지 않는, SV40 복제 원점(origin)의 서열을 사용하였다.

사용된 정방향 프라이머의 서열 : 5'-CTCTGAGCTATTCCAGAAGTAGTG-3' (서열번호 53).

사용된 역방향 프라이머의 서열 : 5'-CAGTGAGCGCGCGTAATA-3' (서열번호 X).

사용된 프로브의 서열 : 5'-6FAM-GACGTACCCAATTCGCCCTATAGTG-TAMRA-3' (서열번호 54).

기준으로 사용된 DNA : pCCL-GLOBE1-βAS3 (서열번호 47).

Taqman Fast 어드밴스드 마스터 믹스, 2x(Applied Biosystems)를 사용하였고, Roche LightCycler II 기기를 사용하여 Q-PCR을 수행하였다. (잔류 플라스미드의 양을 제외한) 렌티바이러스 게놈의 수를 단일 유전자의 수로 나눈 값이 형질도입된 세포 당 평균 벡터 수(VCN)이다. 일반적으로 잔류 벡터 플라스미드 DNA의 양은 렌티바이러스 게놈 수의 1% 정도로 많지 않았다.

인간 L-셀렉틴에 의한 인간 CD34+ 세포의 형질도입 개선의, 중화항체에 의한 억제. CCL-MNDU3-eGFP 게놈을 갖는 (p24 캡시드 ELISA에 의해 측정된) 2 ng의 슈도타입화된 VSV-G Indiana 렌티바이러스를 인간 L-셀렉틴 존재 또는 부존재 하에 위에서 설명한 바와 같이 생산하였다. 상기 바이러스는 10 μM 항-인간 L-셀렉틴 항체(클론 DREG56; Thermo Fisher) 존재 또는 부존재 하에 30 분 동안 37 ℃에서 20 ㎕의 부피로 인큐베이션한 다음, 상기와 같이 제조된 0.25 ㎖의 배지 내에 존재하는 사이토카인으로 자극한 인간 CD34+ 세포에 가하였다. 형질도입을 개시한 지 3 일 후에, eGFP+ 세포의 비율을 앞에서 설명한 방법에 따라 결정하였다.

결과

인간 CD34 세포의 형질도입을 가능하게 하는 것들의 스크리닝을 가능하게 하는 랍도바이러스 외피의 선택 전략. 약 6000 개의 랍도바이러스 외피 서열을 GenBank에서 검색하였다. 인간 또는 영장류로부터 유래하는 서열, 영장류 감염능력에 대한 혈청학적 증거가 있는 서열, 재조합 렌티바이러스에 결합된 적이 없는 서열, 그리고 외피 단백질 발현 벡터를 구축하기 위한 암호화 영역의 전체 서열이 알려진 서열을 선택하여 외피 서열의 수를 10으로 좁혔다. 이러한 기준을 충족하는 11 종의 외피 단백질은 다음의 랍도바이러스들로부터 유래한 것이다: VSV Arizona, Bas Congo, Curionopolis, Ekpoma-1, Ekpoma-2, Isfahan, Kamese, Kontonkan, Kwatta, Le Dantec 및 rabies. 또한, 다른 연구자들(Hu, et al., 2016)이 시험한 Chandipura rhabdovirus로부터 유래하는 외피 단백질 역시 실험 대상에 포함시켰다. 도 1은 이들 바이러스 외피 단백질의 유연관계, 이들이 속하는 랍도바이러스 아군 및 Indiana 외피 단백질과의 % 아미노산 동일성을 보여준다.

대부분의 랍도바이러스 아과로부터 유래하는 대표적인 외피 단백질들은 인간 CD34+ 세포의 형질도입을 가능하게 하지 못한다. 상기 랍도바이러스 외피 단백질들 중에서, Le Dantec을 제외한 모두가 CCL-MNDU3-eGFP 게놈을 갖는 렌티바이러스에 의해 293T 세포를 형질도입할 수 있었다(표 1). 이것은 Le Dantec 외피를 제외한 모든 발현 플라스미드가 기능성 외피 단백질을 암호화한다는 것을 보여준다. Chandipura 및 rabies에 의한 세포주의 형질도입은 이전에 보고된 바 있다. 종래에 보고된 바 없는 Isfahan 외피에 의한 293T 세포의 형질도입 수준은, 이것이 다른 배양 세포주의 형질도입에도 유용할 수 있음을 시사한다.

이와 대조적으로, CCL MNDU3 eGFP 게놈을 갖는 렌티바이러스의 경우, VSV Arizona 및 Indiana 외피 단백질만 효과적인 인간 CD34+ 세포의 형질도입을 가능하게 하였다(표 2).

[표 1]

렌티바이러스는 pCCL MNDU3 eGFP 게놈과 해당 외피 단백질을 사용하여 생산하였다. (24 웰 플레이트 상에서) 웰 당 1 ng의 p24를 사용하여 293T 세포를 형질도입하였다. GFP+ 세포의 비율은 감염 1 일 후에 측정하였다.

[표 2]

렌티바이러스는 pCCL-MNDU3-eGFP 게놈과 해당 외피 단백질을 사용하여 생산하였다. (48 웰 플레이트 상에서) 웰 당 10 ng의 p24를 사용하여 사이토카인으로 자극한 인간 CD34+ 세포를 형질도입하였다. GFP+ 세포의 비율은 감염 3 일 후에 측정하였다.

모든 신대륙 유래 베지큘로바이러스 외피 단백질은 인간 CD34+ 세포를 형질도입한다. VSV-G Indiana 이외에 다른 베지큘로바이러스 외피 단백질(VSV-G Arizona)이 인간 CD34+ 세포를 형질도입하였으므로, 인간 감염 가능성 여부에 대한 증거의 유무와 무관하게, 전체 암호화 영역이 알려진 모든 대표적인 베지큘로바이러스에 대하여 인간 CD34+ 세포의 형질도입을 시험하였다. 다음의 VSV 주로부터 유래하는 5 종의 VSV 외피 단백질을 추가적으로 시험하였다: Alagoas, Carajas, Maraba, Morreton, 및 New Jersey. 이들 외피 단백질은 VSV Indiana 외피 서열에 대한 아미노산 서열 동일성에서 큰 차이를 보인다(표 3). 이들 외피 단백질은 모두 비록 효율은 달랐지만 인간 CD34+ 세포의 형질도입이 가능하였다(도 2). Alagoas, New Jersey 및 Carajas 외피 단백질을 갖는 렌티바이러스는 VSV Indiana 외피를 갖는 렌티바이러스에 비해 인간 CD34+ 세포의 형질도입 효율이 낮은 반면, Morreton, Arizona 및 Maraba 외피 단백질을 갖는 렌티바이러스는 VSV Indiana 외피를 갖는 렌티바이러스에 비해 인간 CD34+ 세포의 형질도입 효율이 높았다.

[표 3]

이러한 결과와 문헌에 보고된 결과를 종합하면, 인간 CD34+ 세포의 형질도입을 잘 매개하지 못하는 베지큘로바이러스 외피가 3 종(Isfahan, Piry, Chandipura), 형질도입 효율이 높은 것이 8 종(VSV(Arizona), VSV(Indiana), VSV(New Jersey), Morreton, Maraba, Alagoas, Carajas, Cocal)이다. 인간 CD34+ 세포의 형질도입 매개효율이 낮은 3 종의 베지큘로바이러스 외피는 구대륙 베지큘로바이러스로부터 유래하는 것이고, 반면 인간 CD34+ 세포의 형질도입 매개효율이 높은 8 종은 신대륙 베지큘로바이러스로뷰터 유래하는 것이다(도 3).

이러한 다양한 베지큘로바이러스 외피 단백질들의 아미노산 서열을 비교하면, 31 종의 아미노산이 인간 CD34+ 세포의 형질도입 매개효율이 높은 모든 외피에서 발견되지만, 이들이 인간 CD34+ 세포의 형질도입 효율이 낮은 외피에서는 전혀 발견되지 않는다(도 4). 이러한 31 종의 아미노산은 "CD34+ 세포 형질도입 결정자"이며 향후 발견되는 베지큘로바이러스 외피가 인간 CD34+ 세포를 형질도입할 수 있을지를 예측하는 데 유용하게 사용될 수 있다. 또한, 인간 CD34 세포의 형질도입 매개효율이 낮은 베지큘로바이러스 외피를 인간 CD34 세포의 형질도입 매개효율이 높은 외피 단백질로 전환하기 위하여 이들 아미노산을 도입할 수도 있다. 계통과 기능 사이의 이러한 상관관계는 구대륙 및 신대륙 베지큘로바이러스들에 대하여 다른 수용체가 결합하기 때문일 수 있다. Cocal 및 VSV Indiana 외피 단백질은 세포 내로 진입하기 위하여 LDL-R에 결합하는 것으로 알려져 있다. VSV Arizona 외피의 형질도입은 가용성 LDL-R에 의해 억제되었는데(데이터는 제시하지 않음), 이것은 이 외피 역시 LDL 수용체에 결합함을 시사한다. 그러므로, 모든 신대륙 베지큘로바이러스는 LDL-R에 결합하여 세포 내로 진입하는 반면, 구대륙 베지큘로바이러스는 (아직 확인되지 않은) 다른 수용체에 결합하는 것일 수 있다. CD34+ 세포 형질도입 결정자를 구성하는 31 종 아미노산 중 대부분은 VSV-G Indiana의 전융합 구조체 안에 묻혀 있다. VSV-G Indiana의 전융합 구조체 내에서 CD34+ 세포 형질도입 결정자 중 가장 표면에 노출되는 아미노산들은 Asp 290, Val 291, Glu 292, Ser 305 및 Gly 365이다(도 5).

신대륙 베지큘로바이러스 외피 단백질들 사이의 유연관계를 조사한 결과는 이들이 분리된 분지들을 형성하며 이러한 분지들이 인간 CD34+ 세포의 형질도입 효율과 관련될 수 있음을 시사한다. Alagoas 및 Carajas 외피를 포함하는 분지들 상에 존재하는 외피는 다른 분지의 외피들(Maraba, Morreton, Indiana 및 Cocal)에 비해 인간 CD34+ 세포의 형질도입 효율이 낮았다. 그러므로, "CD34+ 세포 형질도입 효율 결정자 서열" 역시 존재할 수 있다.

실시예 2 - L-셀렉틴에 의한 형질도입 효율의 개선

CD34+ 세포의 형질도입을 더 개선하기 위하여, 렌티바이러스의 표면에 회합할 수 있고 CD34+ 세포의 표면에 결합할 수 있는 비외피 단백질 리간드들을 스크리닝하였다. CD34는 CD34+ 세포에서 발현되며 L-셀렉틴은 CD34에 결합하는 리간드로 알려져 있다. L-셀렉틴의 발현 하에 생산된 렌티바이러스는 CD34+ 세포의 형질도입을 개선하였다(도 6). 이러한 효과의 크기는 형질도입되는 세포 내의 VCN에 의존하였다. 예를 들어, L-셀렉틴 존재 하에 바이러스가 생산된 경우에는, 1의 VCN을 달성하기 위하여 사용된 바이러스의 양이 L-셀렉틴이 없는 경우에 비해 5 배 적었다(도 8). 이러한 구체적인 실시예에서, 2의 VCN을 달성하기 위하여 사용된 바이러스의 양은 8 배 적었다. (예컨대 1 ㎍의 인간 L-셀렉틴 발현 벡터 pCMV6-XL5 huSELL과 5 ㎍의 VSV-G Indiana 외피 발현 벡터 pHCMV를 사용하여) 293T 생산자 세포 내에 L-셀렉틴이 발현되는 경우, 바이러스 생산량이 1.0~1.5 배 감소하였다(데이터는 제시하지 않음). 따라서, 생산량은 약간 감소하더라도 형질도입 효율은 여전히 증가될 수 있다.

CD52 역시 CD34+ 세포에서 발현되며 SIGLEC10은 CD52에 대한 리간드로 알려져 있다. SIGLEC10 발현 하에 생산된 렌티바이러스는 L-셀렉틴 존재 하에 생산된 렌티바이러스에 비해 CD34+ 세포 형질도입을 개선시키지 못하였다(도 7). 또한, 293T 생산자 세포 내에 SIGLEC10이 발현되는 경우 바이러스 생산량이 급격하게 감소하였다(데이터는 제시하지 않음). 따라서, 렌티바이러스 생산 과정에서 SIGLEC10 리간드의 공동발현은 CD34+의 형질도입을 개선하지 못하는 것으로 보인다.

L-셀렉틴 존재 하에 바이러스를 생산하기 위한 최적 조건(1 ㎍의 VSV-G Indiana 플라스미드, 5 ㎍의 L-셀렉틴 플라스미드)을 흔히 사용되는 최적 바이러스 생산방법(5 ㎍의 VSV-G Indiana 플라스미드) 및 VSV-G Indiana 플라스미드의 양을 L-셀렉틴을 포함하는 최적 생산조건의 수준으로 낮춘 경우(1 ㎍의 VSV-G Indiana 플라스미드)와 비교하였다. 예상한 바와 같이, VSV-G Indiana 플라스미드의 양을 5 ㎍에서 1 ㎍으로 줄이자 인간 CD34+ 세포의 형질도입 효율이 약간 감소하였다(도 8). 그러나, 5 ㎍의 L-셀렉틴 발현 벡터를 가하자 이러한 감소가 상새되고도 남았다. 이 실험에서, L-셀렉틴 존재 하에 생산된 VSV-G Indiana 외피 바이러스의 효율은 VSV-G Indiana 외피 바이러스의 약 5 배였다.

5 ㎍의 VSV-G Indiana 발현 벡터에 5 ㎍의 L-셀렉틴 발현 벡터를 가한 효과도 평가하였다. 5 ㎍의 VSV-G Indiana 발현 벡터에 5 ㎍의 L-셀렉틴 발현 벡터를 가한 경우, 렌티바이러스 형질도입 효율이 증가하지 않았다(도 9). 또한, 5 ㎍의 L-셀렉틴 발현 벡터와 5 ㎍의 VSV-G Indiana 발현 벡터를 조합한 경우 바이러스 생산량이 3 배로 증가하였다. 이 실험에서, L-셀렉틴 존재 하에 생산된 VSV-G Indiana 외피 바이러스의 효율은 VSV-G Indiana 외피 바이러스의 약 6 배였다. 5 ㎍의 인간 L-셀렉틴 플라스미드 존재 하에 바이러스 생산을 위해 사용된 pHMCV VSV-G Indiana 플라스미드의 양을 5 ㎍에서 1 ㎍으로 줄인 경우에 CD34+ 세포의 형질도입 개선은 감소하지 않았으나 렌티바이러스의 생산은 증가하였으므로, 외피 발현 벡터의 양을 더 줄이면 렌티바이러스 생산이 더 증가할 가능성이 있다. 외피 단백질 부존재 하에 바이러스를 생산한 경우, 5 ㎍의 VSV-G 외피 발현 플라스미드(75 cm² 플라스크 당)를 사용하여 바이러스를 생산한 경우에 비해 바이러스 입자의 생산량이 적어도 2~3 배 증가하였다. 외피 발현 플라스미드의 양을 외피 발현 플라스미드를 사용하지 않을 때 관찰되는 것과 유사한 정도의 완전한 무독성 수준까지 줄일 수 있다면, 그러면서도 바이러스 생산 과정에서 인간 L-셀렉틴 발현 벡터를 포함시켜 형질도입의 개선을 유지할 수 있다면, CD34+ 세포의 형질도입이 개선될 뿐 아니라 바이러스의 생산도 개선될 수 있을 것이다.

L-셀렉틴은 또한 Maraba(표 4), Morreton(도 14) 및 Carajas(도 15) 베지큘로바이러스 외피 단백질의 형질도입 효율을 개선시켰다. 초기 실험에서, 인간 CD34+ 세포의 Maraba 외피 매개 형질도입 개선은 전형적으로 3~6 배였으며, 한 실험에서 인간 CD34+ 세포의 Morreton 외피 매개 형질도입 개선은 10 배였다.

[표 4]

실시예 3 - L-셀렉틴은 렌티바이러스 내로 통합될 수 있다

렌티바이러스 생산 세포 내에서 L-셀렉틴의 발현은 L-셀렉틴이 바이러스 내로 통합되는 과정을 포함하거나 포함하지 않는 메커니즘에 의해 렌티바이러스에 의한 CD34+ 세포의 형질도입을 개선할 수 있다. 렌티바이러스 생산 세포 내에서 L-셀렉틴의 발현이 CD34+ 세포의 형질도입을 개선하는 이유에 대한 가장 간단한 가설은 L-셀렉틴이 바이러스 내부로 통합되며 이러한 통합의 결과로 CD34+ 세포에 대한 결합이 개선된다는 것이다. 바이러스가 세포에 결합하는 과정이 형질도입의 속도 제한 단계라는 것은 잘 알려져 있다. 또한, 렌티바이러스 생산 세포 내에서 L-셀렉틴의 발현은, 예컨대 VSV-G의 분해를 줄이거나 VSV-G가 렌티바이러스 내로 통합되는 것을 촉진하여, 렌티바이러스의 감염성에 간접적으로 영향을 미치는 것일 수도 있다. 바이러스 내 VSV-G 또는 다른 외피의 양은 형질도입 효율과 상관관계가 있다고 알려져 있다.

L-셀렉틴이 렌티바이러스 내로 통합될 수 있는지를 알아보기 위하여, CCL-MNDU3-eGFP 게놈을 갖는 렌티바이러스를 인간 L-셀렉틴 존재 또는 부존재 하에 생산한 후, 각각의 바이러스를 10 μM의 인간 L-셀렉틴에 대한 중화항체의 존재 또는 부존재 하에 인큐베이션하였다. 이어, 이들 샘플을 이용하여 사이토카인으로 자극한 CD34+ 세포를 형질도입하고, 형질도입이 시작된 지 3 일 후에 eGFP+ 세포의 비율을 측정하였다. 그 결과를 도 10에 도시하였다. 첫째로, 인간 L-셀렉틴 존재 하에 생산된 렌티바이러스는 형질도입을 약 2 배, eGFP+ 세포의 비율을 16.2%에서 27.1%로 증가시켰다. 둘째로, 인간 L-셀렉틴 부존재 하에 생산된 바이러스에 L-셀렉틴 중화항체를 가한 경우에는 CD34+ 세포의 형질도입 능력에 큰 변화가 없었다(eGFP+ 세포의 비율 = 15.6%). 그러나, 인간 L-셀렉틴 존재 하에 생산된 바이러스에 L-셀렉틴 중화항체를 가한 경우, CD34+ 형질도입 개선이 감소하였고(= 27.1% - 16.2% = 10.9%) eGFP+ 세포의 비율도 27.1%에서 18.5%로 79% 감소하였다(27.1% - 18.5% = 8.6%; 8.6%/10.9% = 79% 감소). 이것은 인간 L-셀렉틴이 바이러스 생산 세포 내에서 발현되는 경우 렌티바이러스 입자 내로 통합될 수 있고, 그러한 렌티바이러스에 의한 CD34+ 세포의 형질도입을 개선하는 데 있어 중요한 역할을 한다는 것을 의미한다.

실시예 4 - L-셀렉틴을 발현하는 세포 내에서 렌티바이러스가 생산되는 경우, CD34 를 발현하지 않는 세포의 형질도입이 개선되지 않는다 .

L-셀렉틴이 렌티바이러스 내로 통합되는 것에 대한 증거를 더 제공하기 위하여, CD34를 발현하지 않는 세포(293T 세포)를 인간 L-셀렉틴의 존재 또는 부존재 하에 생산된 바이러스(CCL-MNDU3-eGFP 게놈)로 형질도입하였다. 인간 L-셀렉틴이 렌티바이러스 내로 통합되어 렌티바이러스의 세포에 대한 결합을 개선한다면, 인간 L-셀렉틴 존재 하에 생산된 바이러스는 인간 L-셀렉틴 부존재 하에 생산된 바이러스에 비해 CD34- 세포를 형질도입하지 않아야 한다. 도 11에서 보듯이, 인간 L-셀렉틴 존재 하에 생산된 바이러스는 인간 L-셀렉틴 존재 하에 생산된 바이러스보다 293T 세포(CD34-인 세포)를 더 잘 형질도입하지 않았다. L-셀렉틴 발현의 발현이 바이러스 내 VSV 외피의 양을 증가시키는 것과 같이 간접적인 방법으로 감염성을 증가시킨다면, VSV 외피 렌티바이러스에 의한 형질도입이 가능한 다양한 세포들의 감염성이 이 바이러스에 의해 증가하였어야 한다.

실시예 5 - 렌티바이러스 생산 과정에서 공동 발현되는 L-셀렉틴 단백질은 다수의 다양한 베지큘로바이러스 외피 단백질에 의해 슈도타입화된 렌티바이러스 벡터에 의한 형질도입을 개선한다.

렌티바이러스 생산 과정에서 L-셀렉틴이 공동 발현되는 경우 인간 CD34+ 세포의 VSV-G(Indiana) 매개 형질도입이 개선되었으므로, 벡터 생산 과정에서 다른 베지큘로바이러스 외피 단백질에도 L-셀렉틴의 공동 발현에 의한 이러한 형질도입 개선 효과가 나타나는지를 조사하였다. Maraba 외피로 슈도타입화한 렌티바이러스는 VSV-G Indiana 외피에 비해 개선된 CD34+ 세포 형질도입을 보이므로 Maraba 외피가 특별히 관심을 끈다(도 12). L-셀렉틴 발현 플라스미드(5 ㎍에서 1 ㎍까지) 대비 Maraba 외피 발현 플라스미드(1 ㎍에서 0.25 ㎍까지)의 양을 변화시키면서 293T 생산자 세포가 들어 있는 T-75 플라스크 내로 (렌티바이러스 보조 플라스미드와 pCCL-GLOBE1-bAS3를 사용하여) 트랜스펙션을 수행하여 Maraba 외피와 L-셀렉틴 사이의 용량 의존관계를 조사하였다. 상기한 바와 같이 각 생산조건에서 얻은 렌티바이러스를 사용하여 인간 CD34+ 세포를 1, 3, 10 및 30 ng의 p24gag로 형질도입하였다(도 12). 흥미롭게도, 293T 세포 내로 트랜스펙션한 Maraba 외피 플라스미드의 양이 감소함에 따라, 그 결과 얻어진 Maraba 슈도타입화 렌티바이러스는 VCN 분석에 의해 측정된 CD34+ 세포의 형질도입이 개선되는 효과를 보였다. 따라서, 벡터 생산 293T 세포를 트랜스펙션하기 위해 사용된 L-셀렉틴 공동 발현 플라스미드의 양이 감소함에 따라, 그 결과 얻어진 Maraba 슈도타입화 렌티바이러스의 형질도입 효율 역시 개선되었다(0.25 ㎍의 Maraba 플라스미드를 사용하여 생산된 렌티바이러스를 이용한 경우의 VCN 형질도입과 293T 세포 공동 트랜스펙션 과정에서 5 ㎍ 또는 1 ㎍의 L-셀렉틴 플라스미드를 사용한 경우를 도 12의 맨 아래 그래프에 비교하였다). 이러한 VCN 형질도입의 결과로부터, 본 실시예에 기재된 트랜스펙션 조건하에서, 렌티바이러스 생산 과정에서 Maraba 외피 발현 플라스미드의 최적 범위가 0.25 ㎍ 내지 0.5 ㎍인 반면, L-셀렉틴 발현 플라스미드의 최적 범위는 1 ㎍ 내지 2.5 ㎍임을 알 수 있다. 최대의 형질도입 개선효과를 달성하려면 벡터 생산 과정에서 트랜스펙션된 베지큘로바이러스 외피:L-셀렉틴 발현 플라스미드의 비가 1:2 내지 1:5 범위이어야 한다. 다른 이종의 바이러스 외피 단백질을 사용하여 렌티바이러스를 슈도타입화하는 경우, 생산 과정에서 바이러스의 형질도입 개선을 위한 외피:L-셀렉틴 플라스미드의 비는 다를 수 있다.

Maraba 외피와 L-셀렉틴에 의해 매개된 렌티바이러스 형질도입의 안정성을 입증하기 위하여, VSV-G Indiana 외피(전형적인 대조군) 또는 Maraba 외피와 L-셀렉틴으로 슈도타입화한 렌티바이러스를 사용하여 3 명의 다른 제공자들로부터 유래한 CD34+ 세포를 형질도입하였다(도 13). CD34+ 세포 게놈 DNA에 대한 VCN 분석 결과, 렌티바이러스를 Maraba 외피와 L-셀렉틴으로 슈도타입화한 경우, 대조군인 V-G로 슈도타입화 렌티바이러스에 비해 VCN이 적어도 2 배 증가하였다.

벡터 생산 과정에서 L-셀렉틴이 공동 발현되는 경우, Morreton(도 14) 및 Carajas(도 15)와 같은 다른 베지큘로바이러스 외피의 형질도입 역시 개선되었다. 벡터 생산 과정에서 L-셀렉틴이 공동 발현되거나 그렇지 않은 경우에 대하여, Carajas 외피로 슈도타입화된 렌티바이러스를 VSV-G Indiana 외피 또는 Alagoas 외피로 슈도타입화된 렌티바이러스들과 비교하였다(도 15). 도 2와 비슷하게, Carajas 외피 렌티바이러스는 VSV-G Indiana로 슈도타입화된 렌티바이러스와 비슷한 정도로 CD34+ 세포를 형질도입한 반면, Alagoas 외피 렌티바이러스의 CD34+ 형질도입 매개효율은 VSV-G Indiana 렌티바이러스에 비해 낮았다. 렌티바이러스 생산 과정에서 L-셀렉틴이 Carajas 외피와 공동 발현된 경우 CD34+의 형질도입이 상당히 개선되었다. Alagoas 외피 매개 CD34+ 형질도입의 경우에는 렌티바이러스 생산 과정에서 L-셀렉틴의 발현에 따른 개선효과가 관찰되지 않았다. 그러나, 이것은 렌티바이러스 생산 과정에서 Alagoas 외피의 발현 수준이 낮았거나 Alagoas 외피와 L-셀렉틴의 발현 비율이 최적이 아니기 때문일 수도 있다.

요약하건대, 이러한 결과들은 다음과 같은 사실들을 입증한다. (1) 신규한 베지큘로바이러스 외피들(Maraba, Morreton, VSV-G Arizona 및 Carajas 외피 포함)이 제1 인간 CD34+ 세포를 슈도타입화할 수 있으며, 전형적인 VSV-G Indiana 베지큘로바이러스 외피와 유사하거나 더 높은 수준으로 렌티바이러스 형질도입을 매개할 수 있다. (2) 렌티바이러스 생산자 세포 내에서 인간 L-셀렉틴 단백질의 공동 발현은 CD34+ 세포 형질도입 특성이 개선된 VSV-G 슈도타입화 렌티바이러스를 생성한다. (3) 렌티바이러스 생산자 세포 내에서 L-셀렉틴의 공동 발현은 다양한 베지큘로바이러스 외피 단백질들(Maraba, Morreton 및 Carajas 외피 포함)로 슈도타입화된 렌티바이러스의 CD34+ 세포 형질도입을 개선한다. (4) 렌티바이러스 생산자 세포 내에서 베지큘로바이러스 외피와 L-셀렉틴 발현 플라스미드의 비율은 제1 인간 CD34+ 세포의 렌티바이러스 형질도입 개선 정도를 결정하는 중요한 요인일 수 있다. (5) 이러한 형질도입의 개선은 GFP 리포터 렌티바이러스와 인간 베타 글로빈 발현 렌티바이러스에도 적용되며, 따라서 실험용으로 또는 이상혈색소 또는 다른 임상적 증상을 치료하기 위해 사용되는 렌티바이러스들에게도 적용될 수 있다.

실시예 6 - Machupo 아레나바이러스 외피 단백질로 슈도타입화된 렌티바이러스에 의한 인간 CD34+ 세포의 형질도입 .

CD34 외에 CD34+ 세포에서 발현되는 다른 세포 표면 단백질로 제1형 트랜스페린 수용체(CD71)가 있는데, 이것은 대부분의 포유동물 세포에서 발현된다. Machupo 아레나바이러스는 인간 제1형 트랜스페린 수용체를 이용하여 인간 세포를 감염시키는 병원체이다. (세포배양 배지의 공통 성분인) 트랜스페린은 Machupo 바이러스에 의한 세포 감염을 억제하지 않는다(Rpadoshitzky, S. R., et al., 2007). 또한, Machupo GP1 외피 단백질(Carvallo 주)이 인간 제1형 트랜스페린 수용체에 결합하는 것이 결정구조를 통해 확인되었다(Abraham J., et al. (2010). 이것은 외피 단백질 가공에 유용할 것으로 생각될 뿐 아니라, 트랜스페린의 인간 제1형 트랜스페린 수용체에 대한 결합과 상충하지 않는 영역에서 Machupo 외피가 인간 제1형 트랜스페린 수용체에 결합하는 Machupo GP1 외피 단백질-인간 제1형 트랜스페린 수용체 구조에서도 발견되는데, 이는 Radoshitzky에 의해 보고된 세포배양 실험결과를 뒷받침한다. 이러한 특성에 착안하여, Machupo virus 외피 단백질이 렌티바이러스를 슈도타입화하고 인간 CD34+ 세포의 형질도입을 매개하는 능력이 있는지를 시험하였다. CCL GLOBE1 βAS3 게놈을 갖는 렌티바이러스를 두 가지 다른 양의 발현 플라스미드(75 cm² 플라스크 당 1 또는 5 ㎍)를 사용하여, VSV-G Indiana 외피(양성 대조군; 75 cm² 플라스크 당 5 ㎍)와 Machupo 외피(Carvallo 주)를 이용하여 생산하였다. 또한, 75 cm² 플라스크 당 1 ㎍의 발현 플라스미드를 이용하여 인간 L-셀렉틴의 발현 하에 Machupo 외피(Carvello 주)에 대한 렌티바이러스를 생산하였다(75 cm² 플라스크 당 1 ㎍의 외피 발현 플라스미드 및 5 ㎍의 인간 L-셀렉틴 발현 플라스미드). Machupo 바이러스 외피는 바이러스 생산자 세포 내에서 VSV-G Indiana와 L-셀렉틴(SELL)이 공동 발현된 경우와 유사한 정도로 인간 CD34+ 세포의 형질도입을 매개할 수 있었다(도 16).

아레나바이러스 외피 단백질은 계통적으로 구대륙계와 신대륙계로 분류할 수 있다(도 17). 또한, 이러한 분류는 이들의 굴성 및 수용체와 상관관계가 있다. 구대륙 유래 아레나바이러스 외피 단백질은 일반적으로 α-디스토글리칸을 이용하여 세포를 감염시키는 반면, 신대륙 유래 아레나바이러스 외피 단백질은 제1형 트랜스페린 수용체를 이용하여 인간 세포를 감염시킬 수 있으며 수용체 결합을 결정하는 공통서열을 가지는 것으로 보인다(Radoshitzky, et al., 2011). 2 종의 구대륙 유래 아레나바이러스 외피 단백질(LCMV 및 Lassa 바이러스 유래)이 CD34+ 세포 형질도입에 대해 시험된 바 있으며, 그 결과 인간 CD34+ 세포의 형질도입 효율이 매우 낮은 것으로 나타났다(Sandrin, et al., 2002). 그러나, 신대륙 유래 아레나바이러스 외피 단백질(Machupo)로 슈도타입화된 렌티바이러스는 인간 CD34 세포를 잘 형질도입할 수 있다(도 16). 그러므로, 베지큘로바이러스 외피의 경우와 마찬가지로, 다른 신대륙 유래 아레나바이러스 외피 단백질들도 Machupo 바이러스 외피에 비해 높거나 낮은 CD34+ 세포 형질도입 효율을 보일 수 있으므로 시험해 볼 가치가 있을 것이다. 신대륙 유래 아레나바이러스 외피 단백질들도 여러 하위 계통으로 분류될 수 있는 것으로 보이며(도 17), 이러한 하위 집단들은 다른 하위 집단들에 비해 높거나 낮은 CD34+ 세포 형질도입 효율을 보일 수 있다. 예를 들어, Machupo, Junin, Ocozocoautla 및 Tacaribe 외피 단백질은 인간 CD34+ 세포의 형질도입을 매개할 수 있는 분기군을 구성할 수 있으나, 이들의 효율은 서로 다를 수 있다.

SEQUENCE LISTING <110> BioMarin Pharmaceutical Inc. <120> IMPROVED LENTIVIRUSES FOR TRANSDUCTION OF HEMATOPOIETIC STEM CELLS. <130> 30610/51899 PC <150> US 62/500,874 <151> 2017-05-03 <160> 57 <170> PatentIn version 3.5 <210> 1 <211> 6507 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <220> <221> misc_feature <223> plasmid with a sequence from Indiana vesiculovirus <400> 1 gagcttggcc cattgcatac gttgtatcca tatcataata tgtacattta tattggctca 60 tgtccaacat taccgccatg ttgacattga ttattgacta gttattaata gtaatcaatt 120 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 180 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 240 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 300 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 360 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 420 acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 480 tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 540 gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 600 aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 660 agagctcgtt tagtgaaccg tcagatcgcc tggagacgcc atccacgctg ttttgacctc 720 catagaagac accgggaccg atccagcctc cggtcgaccg atcctgagaa cttcagggtg 780 agtttgggga cccttgattg ttctttcttt ttcgctattg taaaattcat gttatatgga 840 gggggcaaag ttttcagggt gttgtttaga atgggaagat gtcccttgta tcaccatgga 900 ccctcatgat aattttgttt ctttcacttt ctactctgtt gacaaccatt gtctcctctt 960 attttctttt cattttctgt aactttttcg ttaaacttta gcttgcattt gtaacgaatt 1020 tttaaattca cttttgttta tttgtcagat tgtaagtact ttctctaatc actttttttt 1080 caaggcaatc agggtatatt atattgtact tcagcacagt tttagagaac aattgttata 1140 attaaatgat aaggtagaat atttctgcat ataaattctg gctggcgtgg aaatattctt 1200 attggtagaa acaactacac cctggtcatc atcctgcctt tctctttatg gttacaatga 1260 tatacactgt ttgagatgag gataaaatac tctgagtcca aaccgggccc ctctgctaac 1320 catgttcatg ccttcttctc tttcctacag ctcctgggca acgtgctggt tgttgtgctg 1380 tctcatcatt ttggcaaaga attcctcgac ggatccctcg aggaattctg acactatgaa 1440 gtgccttttg tacttagcct ttttattcat tggggtgaat tgcaagttca ccatagtttt 1500 tccacacaac caaaaaggaa actggaaaaa tgttccttct aattaccatt attgcccgtc 1560 aagctcagat ttaaattggc ataatgactt aataggcaca gccttacaag tcaaaatgcc 1620 caagagtcac aaggctattc aagcagacgg ttggatgtgt catgcttcca aatgggtcac 1680 tacttgtgat ttccgctggt atggaccgaa gtatataaca cattccatcc gatccttcac 1740 tccatctgta gaacaatgca aggaaagcat tgaacaaacg aaacaaggaa cttggctgaa 1800 tccaggcttc cctcctcaaa gttgtggata tgcaactgtg acggatgccg aagcagtgat 1860 tgtccaggtg actcctcacc atgtgctggt tgatgaatac acaggagaat gggttgattc 1920 acagttcatc aacggaaaat gcagcaatta catatgcccc actgtccata actctacaac 1980 ctggcattct gactataagg tcaaagggct atgtgattct aacctcattt ccatggacat 2040 caccttcttc tcagaggacg gagagctatc atccctggga aaggagggca cagggttcag 2100 aagtaactac tttgcttatg aaactggagg caaggcctgc aaaatgcaat actgcaagca 2160 ttggggagtc agactcccat caggtgtctg gttcgagatg gctgataagg atctctttgc 2220 tgcagccaga ttccctgaat gcccagaagg gtcaagtatc tctgctccat ctcagacctc 2280 agtggatgta agtctaattc aggacgttga gaggatcttg gattattccc tctgccaaga 2340 aacctggagc aaaatcagag cgggtcttcc aatctctcca gtggatctca gctatcttgc 2400 tcctaaaaac ccaggaaccg gtcctgcttt caccataatc aatggtaccc taaaatactt 2460 tgagaccaga tacatcagag tcgatattgc tgctccaatc ctctcaagaa tggtcggaat 2520 gatcagtgga actaccacag aaagggaact gtgggatgac tgggcaccat atgaagacgt 2580 ggaaattgga cccaatggag ttctgaggac cagttcagga tataagtttc ctttatacat 2640 gattggacat ggtatgttgg actccgatct tcatcttagc tcaaaggctc aggtgttcga 2700 acatcctcac attcaagacg ctgcttcgca acttcctgat gatgagagtt tattttttgg 2760 tgatactggg ctatccaaaa atccaatcga gcttgtagaa ggttggttca gtagttggaa 2820 aagctctatt gcctcttttt tctttatcat agggttaatc attggactat tcttggttct 2880 ccgagttggt atccatcttt gcattaaatt aaagcacacc aagaaaagac agatttatac 2940 agacatagag atgaaccgac ttggaaagta actcaaatcc tgcacaacag attcttcatg 3000 tttggaccaa atcaacttgt gataccatgc tcaaagaggc ctcaattata tttgagtttt 3060 taatttttat gaaaaaaaaa aaaaaaaacg gaattcctcg agggatccgt cgaggaattc 3120 actcctcagg tgcaggctgc ctatcagaag gtggtggctg gtgtggccaa tgccctggct 3180 cacaaatacc actgagatct ttttccctct gccaaaaatt atggggacat catgaagccc 3240 cttgagcatc tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg 3300 aattttttgt gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag 3360 aatgagtatt tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa 3420 ggttggctat aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc 3480 catagaaaag ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt 3540 tctttaacat ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc 3600 tgactactcc cagtcatagc tgtccctctt ctcttatgga gatccctcga cggatcggcc 3660 gcaattcgta atcatgtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 3720 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 3780 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 3840 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 3900 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 3960 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4020 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4080 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4140 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4200 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4260 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4320 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4380 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 4440 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 4500 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 4560 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4620 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4680 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4740 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4800 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4860 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 4920 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4980 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 5040 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 5100 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 5160 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 5220 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 5280 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 5340 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 5400 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 5460 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 5520 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 5580 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5640 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5700 cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5760 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5820 gccacctaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 5880 agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 5940 accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 6000 gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 6060 tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 6120 gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 6180 aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 6240 accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtcccattc gccattcagg 6300 ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 6360 aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 6420 cgttgtaaaa cgacggccag tgagcgcgcg taatacgact cactataggg cgaattggag 6480 ctccaccgcg gtggcggccg ctctaga 6507 <210> 2 <211> 511 <212> PRT <213> Alagoas vesiculovirus <400> 2 Met Thr Pro Ala Phe Ile Leu Cys Met Leu Leu Ala Gly Ser Ser Trp 1 5 10 15 Ala Lys Phe Thr Ile Val Phe Pro Gln Ser Gln Lys Gly Asp Trp Lys 20 25 30 Asp Val Pro Pro Asn Tyr Arg Tyr Cys Pro Ser Ser Ala Asp Gln Asn 35 40 45 Trp His Gly Asp Leu Leu Gly Val Asn Ile Arg Ala Lys Met Pro Lys 50 55 60 Val His Lys Ala Ile Lys Ala Asp Gly Trp Met Cys His Ala Ala Lys 65 70 75 80 Trp Val Thr Thr Cys Asp Tyr Arg Trp Tyr Gly Pro Gln Tyr Ile Thr 85 90 95 His Ser Ile His Ser Phe Ile Pro Thr Lys Ala Gln Cys Glu Glu Ser 100 105 110 Ile Lys Gln Thr Lys Glu Gly Val Trp Ile Asn Pro Gly Phe Pro Pro 115 120 125 Lys Asn Cys Gly Tyr Ala Ser Val Ser Asp Ala Glu Ser Ile Ile Val 130 135 140 Gln Ala Thr Ala His Ser Val Met Ile Asp Glu Tyr Ser Gly Asp Trp 145 150 155 160 Leu Asp Ser Gln Phe Pro Thr Gly Arg Cys Thr Gly Ser Thr Cys Glu 165 170 175 Thr Ile His Asn Ser Thr Leu Trp Tyr Ala Asp Tyr Gln Val Thr Gly 180 185 190 Leu Cys Asp Ser Ala Leu Val Ser Thr Glu Val Thr Phe Tyr Ser Glu 195 200 205 Asp Gly Leu Met Thr Ser Ile Gly Arg Gln Asn Thr Gly Tyr Arg Ser 210 215 220 Asn Tyr Phe Pro Tyr Glu Lys Gly Ala Ala Ala Cys Arg Met Lys Tyr 225 230 235 240 Cys Thr His Glu Gly Ile Arg Leu Pro Ser Gly Val Trp Phe Glu Met 245 250 255 Val Asp Lys Glu Leu Leu Glu Ser Val Gln Met Pro Glu Cys Pro Ala 260 265 270 Gly Leu Thr Ile Ser Ala Pro Thr Gln Thr Ser Val Asp Val Ser Leu 275 280 285 Ile Leu Asp Val Glu Arg Met Leu Asp Tyr Ser Leu Cys Gln Glu Thr 290 295 300 Trp Ser Lys Val His Ser Gly Leu Pro Ile Ser Pro Val Asp Leu Gly 305 310 315 320 Tyr Ile Ala Pro Lys Asn Pro Gly Ala Gly Pro Ala Phe Thr Ile Val 325 330 335 Asn Gly Thr Leu Lys Tyr Phe Asp Thr Arg Tyr Leu Arg Ile Asp Ile 340 345 350 Glu Gly Pro Val Leu Lys Lys Met Thr Gly Lys Val Ser Gly Thr Pro 355 360 365 Thr Lys Arg Glu Leu Trp Thr Glu Trp Phe Pro Tyr Asp Asp Val Glu 370 375 380 Ile Gly Pro Asn Gly Val Leu Lys Thr Pro Glu Gly Tyr Lys Phe Pro 385 390 395 400 Leu Tyr Met Ile Gly His Gly Leu Leu Asp Ser Asp Leu Gln Lys Thr 405 410 415 Ser Gln Ala Glu Val Phe His His Pro Gln Ile Ala Glu Ala Val Gln 420 425 430 Lys Leu Pro Asp Asp Glu Thr Leu Phe Phe Gly Asp Thr Gly Ile Ser 435 440 445 Lys Asn Pro Val Glu Val Ile Glu Gly Trp Phe Ser Asn Trp Arg Ser 450 455 460 Ser Val Met Ala Ile Val Phe Ala Ile Leu Leu Leu Val Ile Thr Val 465 470 475 480 Leu Met Val Arg Leu Cys Val Ala Phe Arg His Phe Cys Cys Gln Lys 485 490 495 Arg His Lys Ile Tyr Asn Asp Leu Glu Met Asn Gln Leu Arg Arg 500 505 510 <210> 3 <211> 1536 <212> DNA <213> Alagoas vesiculovirus <400> 3 atgactcccg catttatctt gtgcatgctc ttggcaggca gttcttgggc aaaatttact 60 attgtctttc ctcaaagtca aaagggagac tggaaagatg tccctccaaa ttatagatat 120 tgtccatcta gcgcagacca aaactggcat ggagacttgt taggagttaa tatcagagca 180 aagatgccaa aagtgcataa ggcaatcaag gctgatggct ggatgtgtca tgctgccaag 240 tgggtcacaa catgtgatta tagatggtat gggcctcaat acatcacgca ctccatccac 300 tccttcatcc ctactaaagc tcagtgtgag gaaagcataa agcagactaa ggaaggagtt 360 tggatcaatc caggatttcc cccaaagaac tgcggatatg cttcagtaag tgatgctgaa 420 tcaattatag tccaagccac tgcccactct gtgatgattg atgaatactc aggagactgg 480 cttgactctc aattcccaac tggtagatgc acgggctcca cctgcgaaac aatccacaat 540 tctacattgt ggtatgccga ttatcaagtg accggcctgt gcgactctgc tcttgtctcg 600 acagaagtca ctttttactc agaagatggt ctaatgacat caatagggag acagaacaca 660 ggttatcgaa gtaactactt cccctatgag aaaggagcag ctgcatgtcg aatgaagtac 720 tgtacacatg aaggaatccg actgccctca ggtgtgtggt ttgaaatggt tgacaaggag 780 ctgctggagt ctgttcaaat gccagaatgc ccagctggcc taaccatttc agccccgact 840 cagacctctg ttgatgtgag cttgattttg gatgtggagc ggatgttgga ctattcattg 900 tgtcaggaga cgtggagcaa ggttcatagc ggattgccaa tatctcccgt ggatcttgga 960 tatatagctc caaaaaaccc aggtgctggt cctgctttca caattgtcaa tgggactctt 1020 aaatacttcg acacaagata cttgagaatt gacatcgagg gaccagtcct taagaagatg 1080 acaggcaaag tcagtggcac cccgactaag cgtgagttgt ggactgagtg gtttccctat 1140 gatgatgtgg aaatcggacc taacggagtt cttaaaactc ctgaaggata caaatttcct 1200 ctctacatga tcggacacgg gctgctggac tcagatcttc aaaagacatc gcaagctgag 1260 gtgttccacc atccgcagat tgctgaagca gtccaaaagc taccagatga tgagacactt 1320 ttctttggag acaccgggat ttcaaaaaac cccgtggaag tcattgaggg gtggttcagc 1380 aactggcgca gttctgtcat ggcaatagtg ttcgccatct tgctgcttgt gatcacagtc 1440 ttgatggtcc gcttatgtgt agcatttcga catttctgct gccaaaaaag acacaaaata 1500 tacaatgatt tggaaatgaa tcaactacgg agataa 1536 <210> 4 <211> 517 <212> PRT <213> Arizona vesiculovirus <400> 4 Met Leu Ser Tyr Leu Ile Leu Ala Ile Ile Val Ser Pro Ile Leu Gly 1 5 10 15 Lys Ile Glu Ile Val Phe Pro Gln His Thr Thr Gly Asp Trp Lys Arg 20 25 30 Val Pro His Glu Tyr Asn Tyr Cys Pro Thr Ser Ala Asp Lys Asn Ser 35 40 45 His Gly Thr Gln Thr Gly Ile Pro Val Glu Leu Thr Met Pro Lys Gly 50 55 60 Leu Thr Thr His Gln Val Asp Gly Phe Met Cys His Ser Ala Leu Trp 65 70 75 80 Met Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile His Asn Glu Glu Pro Thr Asp Tyr Gln Cys Leu Glu Ala Ile 100 105 110 Lys Ala Tyr Asn Asp Gly Val Ser Phe Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Gly Thr Val Thr Asp Ala Glu Ala His Ile Ile Thr 130 135 140 Val Thr Pro His Ser Val Lys Val Asp Glu Tyr Thr Gly Glu Trp Ile 145 150 155 160 Asp Pro His Phe Ile Gly Gly Arg Cys Lys Gly Lys Ile Cys Glu Thr 165 170 175 Val His Asn Ser Thr Lys Trp Phe Thr Ser Ser Asp Gly Glu Ser Val 180 185 190 Cys Ser Gln Leu Phe Thr Leu Val Gly Gly Thr Phe Phe Ser Asp Ser 195 200 205 Glu Glu Ile Thr Ser Met Gly Leu Pro Glu Thr Gly Met Arg Ser Asn 210 215 220 Tyr Phe Pro Tyr Ile Ser Thr Glu Gly Ile Cys Lys Met Pro Phe Cys 225 230 235 240 Arg Lys Pro Gly Tyr Lys Leu Lys Asn Asp Leu Trp Phe Gln Ile Thr 245 250 255 Asp Pro Asp Leu Asp Lys Thr Val Arg Asp Leu Pro His Ile Lys Asp 260 265 270 Cys Asp Leu Ser Ser Ser Ile Ile Thr Pro Gly Glu His Ala Thr Asp 275 280 285 Ile Ser Leu Ile Ser Asp Val Glu Arg Ile Leu Asp Tyr Ala Leu Cys 290 295 300 Gln Asn Thr Trp Ser Lys Ile Glu Ala Gly Glu Pro Ile Thr Pro Val 305 310 315 320 Asp Leu Ser Tyr Leu Gly Pro Lys Asn Pro Gly Val Gly Pro Val Phe 325 330 335 Thr Val Ile Asn Gly Ser Leu His Tyr Phe Thr Ser Lys Tyr Leu Arg 340 345 350 Val Glu Leu Glu Ser Pro Val Ile Pro Arg Met Glu Gly Arg Val Ala 355 360 365 Gly Thr Lys Ile Val Arg Gln Leu Trp Asp Gln Trp Phe Pro Phe Gly 370 375 380 Glu Ala Glu Ile Gly Pro Asn Gly Val Leu Lys Thr Lys Gln Gly Tyr 385 390 395 400 Lys Phe Pro Leu His Ile Ile Gly Thr Gly Glu Val Asp Ser Asp Ile 405 410 415 Lys Met Glu Arg Ile Val Lys His Trp Glu His Pro His Ile Glu Ala 420 425 430 Ala Gln Thr Phe Leu Lys Lys Asp Asp Thr Glu Glu Val Ile Tyr Tyr 435 440 445 Gly Asp Thr Gly Val Ser Lys Asn Pro Val Glu Leu Val Glu Gly Trp 450 455 460 Phe Ser Gly Trp Arg Ser Ser Ile Met Gly Val Val Ala Val Ile Ile 465 470 475 480 Gly Phe Val Ile Leu Ile Phe Leu Ile Arg Leu Ile Gly Val Leu Ser 485 490 495 Ser Leu Phe Arg Gln Lys Arg Arg Pro Ile Tyr Lys Ser Asp Val Glu 500 505 510 Met Thr His Phe Arg 515 <210> 5 <211> 1668 <212> DNA <213> Arizona vesiculovirus <400> 5 atgttcatgc cttcttctct ttcctacagc tcctgggcaa cgtgctggtt gttgtgctgt 60 ctcatcattt tggcaaagaa ttcctcgacg gatccctcga ggaattctga cactatgttg 120 tcttatctaa ttcttgcaat tattgtttcg cctattttag gcaaaattga aatcgtcttc 180 cctcagcata ctactggaga ttggaagagg gttcctcatg aatacaatta ctgtcccact 240 agtgcagata aaaactcaca tgggactcag acaggaattc ctgttgagct aacaatgccc 300 aagggactaa caacacatca ggttgatggg tttatgtgtc actctgcttt atggatgacc 360 acttgtgatt tcagatggta tggacctaaa tacataaccc actctataca taatgaggag 420 cctacagatt accaatgttt ggaagccatc aaggcatata acgatggtgt tagctttaat 480 ccagggttcc ctcctcagag ctgtgggtat ggtacggtca cggacgctga agcccatatt 540 ataacagtca ctcctcactc tgttaaagta gatgagtaca ctggagagtg gattgaccca 600 catttcatcg gggggagatg caagggcaaa atttgtgaaa cagtccacaa ctccacaaaa 660 tggtttacat cttcagatgg agaaagtgtc tgtagtcaat tattcactct agttggagga 720 acttttttct ctgactcaga ggaaattact tcaatgggac taccagaaac agggatgagg 780 agtaattatt ttccttacat atccacagag ggaatatgca agatgccgtt ctgcagaaag 840 ccagggtaca aacttaagaa tgacctctgg tttcagatca cggatccaga tttggataaa 900 acagttagag atcttccgca catcaaagat tgtgatctct cctcatccat tataacacca 960 ggggaacatg caacagacat atccctgata tcagatgtgg aaagaatcct ggattatgct 1020 ctttgtcaaa acacatggag caaaattgaa gccggagaac caatcactcc tgtagatctc 1080 agctaccttg gaccaaagaa tcccggagta ggcccggttt ttaccgtcat aaatggttct 1140 ttgcattact tcacatcaaa atatctgcgt gtggaactgg aaagtcctgt tatacccaga 1200 atggaaggga gagttgcagg aactaaaatt gtgcggcaat tgtgggatca atggttccct 1260 tttggagagg ctgagattgg acccaatggt gtgttgaaga ccaagcaagg atacaaattc 1320 ccattacaca tcattggaac aggagaggta gacagtgaca tcaaaatgga gaggattgtt 1380 aaacactggg aacaccccca cattgaagcc gctcagacat ttttaaaaaa agatgataca 1440 gaagaagtca tctattatgg cgacacaggg gtatcaaaaa acccagttga gttagttgag 1500 ggctggttta gtggatggag gagctctatc atgggagtgg tggctgtgat tatcggattc 1560 gtgattttaa tatttttaat tagactgatt ggagtcctat ccagtctttt tagacaaaaa 1620 agaaggccaa tttataaatc ggatgtagag atgacccact tccgttaa 1668 <210> 6 <211> 523 <212> PRT <213> Carajas vesiculovirus <400> 6 Met Lys Met Lys Met Val Ile Ala Gly Leu Ile Leu Cys Ile Gly Ile 1 5 10 15 Leu Pro Ala Ile Gly Lys Ile Thr Ile Ser Phe Pro Gln Ser Leu Lys 20 25 30 Gly Asp Trp Arg Pro Val Pro Lys Gly Tyr Asn Tyr Cys Pro Thr Ser 35 40 45 Ala Asp Lys Asn Leu His Gly Asp Leu Ile Asp Ile Gly Leu Arg Leu 50 55 60 Arg Ala Pro Lys Ser Phe Lys Gly Ile Ser Ala Asp Gly Trp Met Cys 65 70 75 80 His Ala Ala Arg Trp Ile Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro 85 90 95 Lys Tyr Ile Thr His Ser Ile His Ser Phe Arg Pro Ser Asn Asp Gln 100 105 110 Cys Lys Glu Ala Ile Arg Leu Thr Asn Glu Gly Asn Trp Ile Asn Pro 115 120 125 Gly Phe Pro Pro Gln Ser Cys Gly Tyr Ala Ser Val Thr Asp Ser Glu 130 135 140 Ser Val Val Val Thr Val Thr Lys His Gln Val Leu Val Asp Glu Tyr 145 150 155 160 Ser Gly Ser Trp Ile Asp Ser Gln Phe Pro Gly Gly Ser Cys Thr Ser 165 170 175 Pro Ile Cys Asp Thr Val His Asn Ser Thr Leu Trp His Ala Asp His 180 185 190 Thr Leu Asp Ser Ile Cys Asp Gln Glu Phe Val Ala Met Asp Ala Val 195 200 205 Leu Phe Thr Glu Ser Gly Lys Phe Glu Glu Phe Gly Lys Pro Asn Ser 210 215 220 Gly Ile Arg Ser Asn Tyr Phe Pro Tyr Glu Ser Leu Lys Asp Val Cys 225 230 235 240 Gln Met Asp Phe Cys Lys Arg Lys Gly Phe Lys Leu Pro Ser Gly Val 245 250 255 Trp Phe Glu Ile Glu Asp Ala Glu Lys Ser His Lys Ala Gln Val Glu 260 265 270 Leu Lys Ile Lys Arg Cys Pro His Gly Ala Val Ile Ser Ala Pro Asn 275 280 285 Gln Asn Ala Ala Asp Ile Asn Leu Ile Met Asp Val Glu Arg Ile Leu 290 295 300 Asp Tyr Ser Leu Cys Gln Ala Thr Trp Ser Lys Ile Gln Asn Lys Glu 305 310 315 320 Ala Leu Thr Pro Ile Asp Ile Ser Tyr Leu Gly Pro Lys Asn Pro Gly 325 330 335 Pro Gly Pro Ala Phe Thr Ile Ile Asn Gly Thr Leu His Tyr Phe Asn 340 345 350 Thr Arg Tyr Ile Arg Val Asp Ile Ala Gly Pro Val Thr Lys Glu Ile 355 360 365 Thr Gly Phe Val Ser Gly Thr Ser Thr Ser Arg Val Leu Trp Asp Gln 370 375 380 Trp Phe Pro Tyr Gly Glu Asn Ser Ile Gly Pro Asn Gly Leu Leu Lys 385 390 395 400 Thr Ala Ser Gly Tyr Lys Tyr Pro Leu Phe Met Val Gly Thr Gly Val 405 410 415 Leu Asp Ala Asp Ile His Lys Leu Gly Glu Ala Thr Val Ile Glu His 420 425 430 Pro His Ala Lys Glu Ala Gln Lys Val Val Asp Asp Ser Glu Val Ile 435 440 445 Phe Phe Gly Asp Thr Gly Val Ser Lys Asn Pro Val Glu Val Val Glu 450 455 460 Gly Trp Phe Ser Gly Trp Arg Ser Ser Leu Met Ser Ile Phe Gly Ile 465 470 475 480 Ile Leu Leu Ile Val Cys Leu Val Leu Ile Val Arg Ile Leu Ile Ala 485 490 495 Leu Lys Tyr Cys Cys Val Arg His Lys Lys Arg Thr Ile Tyr Lys Glu 500 505 510 Asp Leu Glu Met Gly Arg Ile Pro Arg Arg Ala 515 520 <210> 7 <211> 1572 <212> DNA <213> Carajas vesiculovirus <400> 7 atgaagatga aaatggtcat agcaggatta atcctttgta tagggatttt accggctatt 60 gggaaaataa caatttcttt cccacaaagc ttgaaaggag attggaggcc tgtacctaag 120 ggatacaatt attgtcctac aagtgcggat aaaaatctcc atggtgattt gattgacata 180 ggtctcagac ttcgggcccc taagagcttc aaagggatct ccgcagatgg atggatgtgc 240 catgcggcaa gatggatcac cacctgtgat ttcagatggt atggacccaa gtacatcacc 300 cactcaattc actctttcag gccgagcaat gaccaatgca aagaagcaat ccggctgact 360 aatgaaggga attggattaa tccaggtttc cctccgcaat cttgcggata tgcttctgta 420 accgactcag aatccgttgt cgtaaccgtg accaagcacc aggtcctagt agatgagtac 480 tccggctcat ggatcgatag tcaattcccc ggaggaagtt gcacatcccc catttgcgat 540 acagtgcaca actcgacact ttggcacgcg gaccacaccc tggacagtat ctgtgaccaa 600 gaattcgtgg caatggacgc agttctgttc acagagagtg gcaaatttga agagttcgga 660 aaaccgaact ccggcatcag gagcaactat tttccttatg agagtctgaa agatgtatgt 720 cagatggatt tctgcaagag gaaaggattc aagctcccat ccggtgtctg gtttgaaatc 780 gaggatgcag agaaatctca caaggcccag gttgaattga aaataaaacg gtgccctcat 840 ggagcagtaa tctcagctcc taatcagaat gcagcagata tcaatctgat catggatgtg 900 gaacgaattc tagactactc cctttgccaa gcaacttgga gcaaaatcca aaacaaggaa 960 gcgttgaccc ccatcgatat cagttatctt ggtccgaaaa acccaggacc aggcccagcc 1020 ttcaccataa taaatggaac actgcactac ttcaatacta gatacattcg agtggatatt 1080 gcagggcctg ttaccaaaga gattacagga tttgtttcgg gaacatctac atctagggtg 1140 ctgtgggatc agtggttccc atatggagag aattccattg gacccaatgg cttgctgaaa 1200 accgccagcg gatacaaata tccattgttc atggttggta caggtgtgct ggatgcggac 1260 atccacaagc tgggagaagc aaccgtgatt gaacatccac atgccaaaga ggctcagaag 1320 gtagttgatg acagtgaggt tatatttttt ggtgacaccg gagtctccaa gaatccagtg 1380 gaggtagtcg aaggatggtt tagcggatgg agaagctctt tgatgagcat atttggcata 1440 attttgttga ttgtttgttt agtcttgatt gttcgaatcc ttatagccct taaatactgt 1500 tgtgttagac acaaaaagag aactatttac aaagaggacc ttgaaatggg tcgaattcct 1560 cggagggctt aa 1572 <210> 8 <211> 511 <212> PRT <213> Indiana vesiculovirus <400> 8 Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys 1 5 10 15 Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn 20 25 30 Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp 35 40 45 His Asn Asp Leu Ile Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser 50 55 60 His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp 65 70 75 80 Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile 100 105 110 Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Val Ile Val Gln 130 135 140 Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val 145 150 155 160 Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Tyr Ile Cys Pro Thr 165 170 175 Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu 180 185 190 Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp 195 200 205 Gly Glu Leu Ser Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser Asn 210 215 220 Tyr Phe Ala Tyr Glu Thr Gly Gly Lys Ala Cys Lys Met Gln Tyr Cys 225 230 235 240 Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala 245 250 255 Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly 260 265 270 Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile 275 280 285 Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp 290 295 300 Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr 305 310 315 320 Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile Asn 325 330 335 Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala 340 345 350 Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr 355 360 365 Glu Arg Glu Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Glu Ile 370 375 380 Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu 385 390 395 400 Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser 405 410 415 Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln 420 425 430 Leu Pro Asp Asp Glu Ser Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys 435 440 445 Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser 450 455 460 Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu 465 470 475 480 Val Leu Arg Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys 485 490 495 Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys 500 505 510 <210> 9 <211> 1536 <212> DNA <213> Indiana vesiculovirus <400> 9 atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60 gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120 ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180 atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240 gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300 ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360 ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420 gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480 gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540 acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600 gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660 ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720 aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780 tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840 acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900 caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960 cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020 tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080 ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140 gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200 tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260 ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320 tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380 tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440 gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500 tatacagaca tagagatgaa ccgacttgga aagtaa 1536 <210> 10 <211> 512 <212> PRT <213> Maraba vesiculovirus <400> 10 Met Leu Arg Leu Phe Leu Phe Cys Phe Leu Ala Leu Gly Ala His Ser 1 5 10 15 Lys Phe Thr Ile Val Phe Pro His His Gln Lys Gly Asn Trp Lys Asn 20 25 30 Val Pro Ser Thr Tyr His Tyr Cys Pro Ser Ser Ser Asp Gln Asn Trp 35 40 45 His Asn Asp Leu Thr Gly Val Ser Leu His Val Lys Ile Pro Lys Ser 50 55 60 His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ala Lys Trp 65 70 75 80 Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile His Ser Met Ser Pro Thr Leu Glu Gln Cys Lys Thr Ser Ile 100 105 110 Glu Gln Thr Lys Gln Gly Val Trp Ile Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Val Val Val Val Gln 130 135 140 Ala Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Ile 145 150 155 160 Asp Ser Gln Leu Val Gly Gly Lys Cys Ser Lys Glu Val Cys Gln Thr 165 170 175 Val His Asn Ser Thr Val Trp His Ala Asp Tyr Lys Ile Thr Gly Leu 180 185 190 Cys Glu Ser Asn Leu Ala Ser Val Asp Ile Thr Phe Phe Ser Glu Asp 195 200 205 Gly Gln Lys Thr Ser Leu Gly Lys Pro Asn Thr Gly Phe Arg Ser Asn 210 215 220 Tyr Phe Ala Tyr Glu Ser Gly Glu Lys Ala Cys Arg Met Gln Tyr Cys 225 230 235 240 Thr Gln Trp Gly Ile Arg Leu Pro Ser Gly Val Trp Phe Glu Leu Val 245 250 255 Asp Lys Asp Leu Phe Gln Ala Ala Lys Leu Pro Glu Cys Pro Arg Gly 260 265 270 Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile 275 280 285 Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp 290 295 300 Ser Lys Ile Arg Ala Lys Leu Pro Val Ser Pro Val Asp Leu Ser Tyr 305 310 315 320 Leu Ala Pro Lys Asn Pro Gly Ser Gly Pro Ala Phe Thr Ile Ile Asn 325 330 335 Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ser 340 345 350 Asn Pro Ile Ile Pro His Met Val Gly Thr Met Ser Gly Thr Thr Thr 355 360 365 Glu Arg Glu Leu Trp Asn Asp Trp Tyr Pro Tyr Glu Asp Val Glu Ile 370 375 380 Gly Pro Asn Gly Val Leu Lys Thr Pro Thr Gly Phe Lys Phe Pro Leu 385 390 395 400 Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Lys Ser Ser 405 410 415 Gln Ala Gln Val Phe Glu His Pro His Ala Lys Asp Ala Ala Ser Gln 420 425 430 Leu Pro Asp Asp Glu Thr Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys 435 440 445 Asn Pro Val Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Thr 450 455 460 Leu Ala Ser Phe Phe Leu Ile Ile Gly Leu Gly Val Ala Leu Ile Phe 465 470 475 480 Ile Ile Arg Ile Ile Val Ala Ile Arg Tyr Lys Tyr Lys Gly Arg Lys 485 490 495 Thr Gln Lys Ile Tyr Asn Asp Val Glu Met Ser Arg Leu Gly Asn Lys 500 505 510 <210> 11 <211> 1539 <212> DNA <213> Maraba vesiculovirus <400> 11 atgttgagac tttttctctt ttgtttcttg gccttaggag cccactccaa atttactata 60 gtattccctc atcatcaaaa agggaattgg aagaatgtgc cttccacata tcattattgc 120 ccttctagtt ctgaccagaa ttggcataat gatttgactg gagttagtct tcatgtgaaa 180 attcccaaaa gtcacaaagc tatacaagca gatggctgga tgtgccacgc tgctaaatgg 240 gtgactactt gtgacttcag atggtacgga cccaaataca tcacgcattc catacactct 300 atgtcaccca ccctagaaca gtgcaagacc agtattgagc agacaaagca aggagtttgg 360 attaatccag gctttccccc tcaaagctgc ggatatgcta cagtgacgga tgcagaggtg 420 gttgttgtac aagcaacacc tcatcatgtg ttggttgatg agtacacagg agaatggatt 480 gactcacaat tggtgggggg caaatgttcc aaggaggttt gtcaaacggt tcacaactcg 540 accgtgtggc atgctgatta caagattaca gggctgtgcg agtcaaatct ggcatcagtg 600 gatatcacct tcttctctga ggatggtcaa aagacgtctt tgggaaaacc gaacactgga 660 ttcaggagta attactttgc ttacgaaagt ggagagaagg catgccgtat gcagtactgc 720 acacaatggg ggatccgact accttctgga gtatggtttg aattagtgga caaagatctc 780 ttccaggcgg caaaattgcc tgaatgtcct agaggatcca gtatctcagc tccttctcag 840 acttctgtgg atgttagttt gatacaagac gtagagagga tcttagatta ctctctatgc 900 caggagacgt ggagtaagat acgagccaag cttcctgtat ctccagtaga tctgagttat 960 ctcgccccaa aaaatccagg gagcggaccg gccttcacta tcattaatgg cactttgaaa 1020 tatttcgaaa caagatacat cagagttgac ataagtaatc ccatcatccc tcacatggtg 1080 ggaacaatga gtggaaccac gactgagcgt gaattgtgga atgattggta tccatatgaa 1140 gacgtagaga ttggtccaaa tggggtgttg aaaactccca ctggtttcaa gtttccgctg 1200 tacatgattg ggcacggaat gttggattcc gatctccaca aatcctccca ggctcaagtc 1260 ttcgaacatc cacacgcaaa ggacgctgca tcacagcttc ctgatgatga gactttattt 1320 tttggtgaca caggactatc aaaaaaccca gtagagttag tagaaggctg gttcagtagc 1380 tggaagagca cattggcatc gttctttctg attataggct tgggggttgc attaatcttc 1440 atcattcgaa ttattgttgc gattcgctat aaatacaagg ggaggaagac ccaaaaaatt 1500 tacaatgatg tcgagatgag tcgattggga aataaataa 1539 <210> 12 <211> 513 <212> PRT <213> Morreton vesiculovirus <400> 12 Met Leu Val Leu Tyr Leu Leu Leu Ser Leu Leu Ala Leu Gly Ala Gln 1 5 10 15 Cys Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys 20 25 30 Asn Val Pro Ala Asn Tyr Gln Tyr Cys Pro Ser Ser Ser Asp Leu Asn 35 40 45 Trp His Asn Gly Leu Ile Gly Thr Ser Leu Gln Val Lys Met Pro Lys 50 55 60 Ser His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ala Lys 65 70 75 80 Trp Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Val Thr 85 90 95 His Ser Ile Lys Ser Met Ile Pro Thr Val Asp Gln Cys Lys Glu Ser 100 105 110 Ile Ala Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro 115 120 125 Gln Ser Cys Gly Tyr Ala Ser Val Thr Asp Ala Glu Ala Val Ile Val 130 135 140 Lys Ala Thr Pro His Gln Val Leu Val Asp Glu Tyr Thr Gly Glu Trp 145 150 155 160 Val Asp Ser Gln Phe Pro Thr Gly Lys Cys Asn Lys Asp Ile Cys Pro 165 170 175 Thr Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Thr Gly 180 185 190 Leu Cys Asp Ala Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu 195 200 205 Asp Gly Lys Leu Thr Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser 210 215 220 Asn Tyr Phe Ala Tyr Glu Asn Gly Asp Lys Ala Cys Arg Met Gln Tyr 225 230 235 240 Cys Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met 245 250 255 Ala Asp Lys Asp Ile Tyr Asn Asp Ala Lys Phe Pro Asp Cys Pro Glu 260 265 270 Gly Ser Ser Ile Ala Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu 275 280 285 Ile Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr 290 295 300 Trp Ser Lys Ile Arg Ala His Leu Pro Ile Ser Pro Val Asp Leu Ser 305 310 315 320 Tyr Leu Ser Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile 325 330 335 Asn Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile 340 345 350 Ala Gly Pro Ile Ile Pro Gln Met Arg Gly Val Ile Ser Gly Thr Thr 355 360 365 Thr Glu Arg Glu Leu Trp Thr Asp Trp Tyr Pro Tyr Glu Asp Val Glu 370 375 380 Ile Gly Pro Asn Gly Val Leu Lys Thr Ala Thr Gly Tyr Lys Phe Pro 385 390 395 400 Leu Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Ile Ser 405 410 415 Ser Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser 420 425 430 Gln Leu Pro Asp Asp Glu Thr Leu Phe Phe Gly Asp Thr Gly Leu Ser 435 440 445 Lys Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Gly Trp Lys Ser 450 455 460 Thr Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Val Ile Gly Leu Tyr 465 470 475 480 Leu Val Leu Arg Ile Gly Ile Ala Leu Cys Ile Lys Cys Arg Val Gln 485 490 495 Glu Lys Arg Pro Lys Ile Tyr Thr Asp Val Glu Met Asn Arg Leu Asp 500 505 510 Arg <210> 13 <211> 1542 <212> DNA <213> Morreton vesiculovirus <400> 13 atgctggttt tatacctgtt attgagcctt ttggctctgg gagctcaatg caagttcact 60 atagtatttc ctcacaatca aaaagggaat tggaaaaatg taccggcaaa ttatcagtat 120 tgtccttcta gttctgactt gaattggcac aatgggctga ttggcacttc tctccaagtc 180 aaaatgccca aaagccataa ggccatccaa gcggatggtt ggatgtgtca tgctgccaag 240 tgggtgacta cttgtgactt cagatggtac ggacctaaat atgtgacaca ttctataaag 300 tccatgatac ctacagtcga ccagtgtaaa gaaagtatag cccagactaa acaaggaacg 360 tggttaaatc cgggtttccc tccccaaagt tgtggatatg cttccgttac agatgcagag 420 gctgtgatag tcaaagcaac cccccaccag gttttggttg acgaatatac aggagaatgg 480 gttgactccc aatttccgac tggaaaatgc aataaagaca tttgcccaac agttcacaac 540 tcaactacct ggcactcaga ttataaggtc actggccttt gcgatgcaaa tttgatctca 600 atggacatca ctttcttctc cgaagatgga aaattaacat ccctcgggaa agaaggaaca 660 gggttcagaa gcaattactt tgcatacgaa aatggtgaca aagcatgccg catgcagtac 720 tgtaaacact ggggagttcg acttccatcc ggagtgtggt tcgaaatggc agataaagac 780 atctataatg atgcgaaatt cccggattgc cctgaaggat catccattgc ggctccctct 840 cagacttcag tcgatgttag tctcattcag gatgtagaga gaatcttgga ctactctttg 900 tgtcaggaaa cctggagcaa aattcgtgct catttgccca tttcaccagt tgacctcagc 960 tatttatccc caaaaaatcc tggaactggt cctgcattca ctatcatcaa tgggacatta 1020 aaatactttg agactcgata cataagagtc gatatcgcag gacccatcat tcctcaaatg 1080 agaggagtaa tcagcggaac cacgaccgag agagagctgt ggacggactg gtacccctac 1140 gaagatgttg aaatcggacc aaatggggtt ttgaaaactg ctacagggta taagttccct 1200 ttatacatga ttgggcacgg catgctcgac tcagatctcc acatctcatc aaaggctcag 1260 gtttttgaac atccccatat tcaggatgct gcttctcagc ttcctgatga tgagacttta 1320 ttttttggtg atactggact ctcgaaaaac cccatagagc ttgtagaagg ttggttcagc 1380 ggatggaaaa gcactattgc ttcttttttc ttcataatag ggcttgtgat cggattatat 1440 ttggttctta ggattggaat cgctttatgc atcaaatgcc gagtgcagga gaaaaggccc 1500 aaaatttaca ctgatgtgga aatgaacaga ttggatcgat ga 1542 <210> 14 <211> 517 <212> PRT <213> New Jersey vesiculovirus <400> 14 Met Leu Ser Tyr Leu Ile Leu Ala Leu Thr Ile Ser Pro Ile Leu Gly 1 5 10 15 Lys Ile Glu Ile Val Phe Pro Gln His Thr Thr Gly Asp Trp Lys Arg 20 25 30 Val Pro His Glu Tyr Asn Tyr Cys Pro Thr Ser Ala Asp Lys Asn Ser 35 40 45 His Gly Thr Gln Thr Gly Ile Pro Ile Glu Leu Thr Met Pro Lys Gly 50 55 60 Leu Thr Thr His Gln Val Glu Gly Phe Met Cys His Ala Ala Leu Trp 65 70 75 80 Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His 85 90 95 Ser Ile His Asn Glu Glu Pro Thr Asp Tyr Gln Cys Leu Glu Ala Ile 100 105 110 Lys Ala Tyr Lys Asp Gly Ala Ser Phe Asn Pro Gly Phe Pro Pro Gln 115 120 125 Ser Cys Gly Tyr Gly Ser Val Thr Asp Ala Glu Ala His Ile Ile Thr 130 135 140 Ile Thr Pro His Ser Val Lys Val Asp Glu Tyr Thr Gly Glu Trp Ile 145 150 155 160 Asp Pro His Phe Ile Gly Gly Arg Cys Lys Gly Lys Thr Cys Glu Thr 165 170 175 Val His Asn Ser Thr Lys Trp Phe Thr Ser Ser Asp Gly Glu Ser Val 180 185 190 Cys Ser Gln Leu Phe Thr Leu Val Arg Gly Thr Phe Phe Ser Asp Ser 195 200 205 Glu Glu Ile Thr Ser Ile Gly Leu Pro Glu Thr Gly Ile Arg Ser Asn 210 215 220 Tyr Phe Pro Tyr Val Ser Thr Glu Gly Ile Cys Lys Met Pro Phe Cys 225 230 235 240 Arg Lys Pro Gly Tyr Lys Leu Lys Asn Asp Leu Trp Phe Gln Ile Ala 245 250 255 Asp Pro Asp Leu Asp Gln Lys Val Lys Asp Leu Pro His Ile Lys Asp 260 265 270 Cys Asp Leu Ser Ser Ser Ile Ile Thr Pro Gly Glu His Ala Thr Asp 275 280 285 Ile Ser Leu Ile Ser Asp Val Glu Arg Ile Leu Asp Tyr Ala Leu Cys 290 295 300 Gln Asn Thr Trp Ser Lys Ile Glu Ala Gly Glu Pro Ile Thr Pro Val 305 310 315 320 Asp Ile Ser Tyr Leu Gly Pro Lys Asn Pro Gly Val Gly Pro Val Phe 325 330 335 Thr Ile Ile Asn Gly Ser Leu His Tyr Phe Thr Ser Lys Tyr Leu Arg 340 345 350 Val Glu Leu Glu Asn Pro Val Ile Pro Arg Met Glu Gly Lys Val Ala 355 360 365 Gly Thr Arg Ile Val Arg Gln Leu Trp Asp Gln Trp Phe Pro Phe Gly 370 375 380 Glu Ala Glu Ile Gly Pro Asn Gly Val Leu Lys Thr Lys Gln Gly Tyr 385 390 395 400 Lys Phe Pro Leu His Ile Val Gly Thr Gly Glu Val Asp Asn Asp Ile 405 410 415 Lys Met Glu Arg Ile Val Lys His Trp Glu His Pro His Ile Glu Ala 420 425 430 Ala Gln Thr Phe Leu Lys Lys Asp Asp Thr Glu Glu Val Ile Tyr Tyr 435 440 445 Gly Asp Thr Gly Val Ser Lys Asn Pro Val Glu Leu Val Glu Gly Trp 450 455 460 Phe Ser Gly Trp Arg Ser Ser Ile Met Gly Val Leu Ala Val Ile Ile 465 470 475 480 Gly Phe Val Ile Leu Ile Phe Leu Ile Arg Leu Ile Gly Leu Met Ser 485 490 495 Asn Phe Cys Lys Pro Arg Arg Gly Pro Ile Tyr Lys Ser Asp Val Glu 500 505 510 Met Ala His Phe Arg 515 <210> 15 <211> 1554 <212> DNA <213> New Jersey vesiculovirus <400> 15 atgttgtctt acctcatcct tgcacttacc atctcgccca tactgggcaa aattgaaatt 60 gtctttcccc aacataccac aggggattgg aaaagagtgc cacatgagta caattattgc 120 cctaccagtg cggacaaaaa ctcccacgga actcaaacag ggattcctat tgagttgaca 180 atgcctaaag gactaacaac ccatcaagta gagggattta tgtgtcatgc agctttatgg 240 gtgaccactt gtgattttag atggtatgga ccaaaatata taactcattc catacataat 300 gaggaaccga cagactatca gtgcctggag gccattaaag catataaaga tggagctagc 360 ttcaatcctg ggtttcctcc tcaaagctgt ggatatggtt cagtgacgga tgcagaggca 420 cacataatca caattactcc tcattctgtt aaagtggatg agtatactgg agaatggatt 480 gaccctcatt ttataggagg aaggtgcaaa gggaaaacct gtgaaacagt tcataattca 540 accaagtggt ttacatcttc agatggggaa agtgtatgca gccaattatt caccttggtt 600 agaggaactt ttttctctga ctcagaggag attacctcaa taggattacc agaaaccgga 660 atcaggagca attacttccc ctatgtgtct acagaaggaa tttgcaaaat gccattctgc 720 agaaagccag ggtataagct taagaatgac ctctggttcc aaattgcaga cccagacttg 780 gatcaaaaag tgaaggatct accacacata aaagactgtg acctttcttc ctctatcatc 840 accccagggg aacatgcaac agacatatct ctaatatcag atgtggaacg gatacttgat 900 tatgctcttt gtcaaaatac ctggagcaag attgaagcag gagaaccaat tactcctgta 960 gacatcagct atctaggacc taaaaaccct ggcgttgggc cggttttcac aatcatcaac 1020 ggctcactac attactttac ctccaagtat ctacgagttg agttagaaaa tcctgttata 1080 cccagaatgg aagggaaagt tgcggggacc cgaattgttc gtcaactgtg ggaccaatgg 1140 ttcccttttg gagaggcaga gattggacct aatggtgttc tgaaaaccaa gcaaggatat 1200 aaattcccat tgcacatcgt tgggactggg gaagtcgaca atgacatcaa aatggaaagg 1260 attgtaaagc attgggagca cccacacata gaagctgctc agacgttctt aaaaaaagat 1320 gacacagagg aggtaatcta ttatggggac actggagtat ccaaaaatcc cgttgaatta 1380 gtagagggat ggttcagcgg ttggagaagc tcaatcatgg gagtgttggc tgtgatcata 1440 ggttttgtaa tcttaatatt tttaattaga ttgattggac tgatgtccaa tttctgtaaa 1500 ccaagaagag ggccaatcta caaatccgac gtagaaatgg ctcacttccg gtaa 1554 <210> 16 <211> 629 <212> PRT <213> Bas-congo virus <400> 16 Met Thr Arg Leu Ser His Ala Ile Thr Lys Leu Leu Leu Leu Phe Cys 1 5 10 15 Leu Thr Ala Ile His Ala Ile Val Ile Asn Tyr Pro Thr Ala Cys His 20 25 30 Thr Tyr Gln Glu Val Leu Tyr Gln Gly Leu Glu Cys Pro Glu Pro Ala 35 40 45 Ile Ser Tyr Lys Leu Asp Asn Asn Glu Thr Val Ala Tyr Gly Gln Ile 50 55 60 Cys Arg Pro Gln Leu Ala Ser Lys Asp Ile Leu Glu Gly Tyr Leu Cys 65 70 75 80 Tyr Lys Asp Thr Tyr Ile Ser Ser Cys Glu Glu Thr Trp Tyr Phe Thr 85 90 95 Ser Gln Val Lys Gln Thr Ile Val His Glu His Val Ser Asp Ala Glu 100 105 110 Cys Ile Glu Ser Leu Ala Tyr Tyr Lys Ser Gly Ile Val Glu Thr Pro 115 120 125 Met Phe Leu Asn Val Asp Cys Tyr Trp Asn Ala Ile Asn Ser Ile Lys 130 135 140 Lys Ser Tyr Leu Ile Ile Val Tyr His Pro Val Pro Phe Asp Pro Tyr 145 150 155 160 Thr Asn Ser Ile Lys Asp Ala Val Val Lys Asn Ser Glu Asp Val Asn 165 170 175 Ser Trp Ile Arg Asp Thr His Tyr Pro Phe Thr Lys Trp Ile Arg Asp 180 185 190 Phe Asn Gly Thr Ala Glu Glu Lys Cys Asp Ala Gln His Trp Glu Cys 195 200 205 Phe Lys Val Asn Leu Tyr Lys Gly Trp Ile Tyr Ser Pro Pro His Thr 210 215 220 Lys Asn Thr Ile Gly Ser Ser Thr Gln Thr Gly Leu Ile Leu Glu Ser 225 230 235 240 Asp Ile Tyr Ser His Thr Leu Ile Arg Asp Leu Cys Arg Phe Gln Phe 245 250 255 Cys Gly Ile His Gly Phe Val Phe Gln Asp Gln Ser Trp Trp Asp Leu 260 265 270 Gln Leu Asn Val Ser Leu Ser Ser Leu Ile Ser Thr Glu His Leu Ser 275 280 285 Gly Ala Pro Asp Gly His Cys Lys Lys Val Asn Glu Ile Gly His Ala 290 295 300 Glu Leu Glu Pro Asn Trp Glu Lys Ile Leu Ser Val Asp Asp Tyr Asp 305 310 315 320 Ile Arg His Gln Leu Cys Leu Asp Thr Leu Ala Ser Val Leu Gly Gly 325 330 335 Gly Phe Leu Thr Ala Arg Asp Leu Leu Lys Phe Ala Pro Met Arg Pro 340 345 350 Gly Leu Gly Pro Ala Tyr Phe Leu Phe Asn Pro Asn Lys Arg Glu Arg 355 360 365 Ala Val His Val Trp Thr Ala Gly Ala Thr Thr Ser Ser Ile Leu Trp 370 375 380 Lys Ser Thr Cys Lys Tyr Glu Leu Ile Asp Ile Pro Gln Leu Asn Asp 385 390 395 400 Thr Gly Ile Ile Thr Tyr Glu Lys Leu Asp Asn Ile Ile Gly Lys Ile 405 410 415 Leu Arg Asn Asp Val Gly Val Ser Phe Lys Asp Leu Gly Phe Thr Glu 420 425 430 Asn Glu Leu Thr Asp Asp Asp Val Ser Gln Ser Gln Leu Asn Ser Ser 435 440 445 Leu Gly Ile Tyr His Arg Asn Thr Ser Met Lys Gly Ile Pro Trp Lys 450 455 460 Arg His Arg Ala Ser Thr Pro Lys Leu Lys Met Gly Pro Asn Gly Ile 465 470 475 480 Leu His Asp Leu Asn Ala Lys Ile Ile His Leu Pro Gln Ala Ser Ser 485 490 495 Ser Val Phe Lys Leu Pro Pro His Leu Tyr Glu Gly His Arg Val Val 500 505 510 Phe Phe Asn His Ile Thr Lys Lys Lys Ile Tyr Glu Asp Leu Ser Lys 515 520 525 Arg Glu Gly Asn Asp Pro Tyr Asn Val Asp Ile Gly Asp Leu Ile Gly 530 535 540 Arg His Leu Asn Arg Thr Thr Ile Pro Asp Gln Leu His Asp Trp Val 545 550 555 560 Ser Gly Ile Lys Arg His Ile Phe Ser Val Phe Glu Gln Phe Gly Ser 565 570 575 Leu Ile Lys Val Val Val Phe Ile Ile Met Leu Val Leu Cys Ile Lys 580 585 590 Ile Ile Asn Leu Ile Tyr Arg Phe Tyr Lys Val Arg Lys Ser Asn His 595 600 605 Lys Lys Leu Ala Ser Arg Lys Glu Lys Leu His Leu Ser Asp Pro Phe 610 615 620 Ser Val Asn Ser Lys 625 <210> 17 <211> 1890 <212> DNA <213> Bas-congo virus <400> 17 atgacccgcc tgtcccacgc catcacaaaa cttcttctgc tcttttgtct cactgcaata 60 cacgctattg taatcaatta cccaacagct tgccatacat atcaagaagt tctttaccaa 120 ggattagaat gtcctgaacc tgcaatatcc tacaagttgg ataacaatga gacagttgct 180 tatgggcaaa tttgcagacc acagttagca tcaaaggaca tattagaagg ttatctctgt 240 tacaaagaca cttacatatc atcttgtgaa gaaacatggt atttcacatc ccaggtaaag 300 cagacaatag ttcatgaaca tgttagcgat gctgaatgca ttgaatcctt ggcttactac 360 aaaagtggta ttgttgaaac ccccatgttt ctaaatgtag actgctattg gaacgcaata 420 aatagtatca aaaagtcgta cttgattatt gtatatcatc ctgttccatt tgatccctac 480 accaattcta ttaaagatgc agtggtcaaa aactcggaag atgttaactc atggatacga 540 gacactcatt acccctttac taaatggatt agagatttta atggtacagc tgaagaaaaa 600 tgtgacgctc agcattggga gtgtttcaag gtcaatctat ataaaggttg gatatactct 660 cccccacata ctaagaacac cattggctca tctacccaaa ctggactcat cctcgaaagt 720 gacatctact cacacactct gattagagat ctatgcagat tccaattttg tggaattcac 780 gggtttgttt tccaggatca atcatggtgg gatcttcaac tcaatgtgtc tttatcatct 840 ttaatctcta ctgaacatct ctccggagct cctgatggtc attgcaaaaa agtgaacgaa 900 ataggccatg ctgaattaga accgaattgg gaaaagatat tatcagtgga tgactatgac 960 atcaggcatc agctctgtct agacacatta gcatctgttt tgggaggagg ctttttgacg 1020 gcgcgagacc tgttaaaatt tgctcccatg agaccaggat taggtccagc ttactttcta 1080 ttcaacccca ataagagaga aagagccgtg catgtttgga cagcaggggc caccacatct 1140 tccatactct ggaaaagtac atgtaaatac gaacttattg atattcctca actgaacgac 1200 acaggaataa tcacttatga aaaattagat aacatcattg ggaaaatcct cagaaatgat 1260 gtgggagttt cattcaagga tcttggattc accgaaaatg agctaacaga tgatgatgtc 1320 tctcagtctc agcttaattc ttcacttggc atttatcata gaaacacatc aatgaagggg 1380 ataccatgga aaaggcatag agcatcaact cctaaattga agatggggcc taatgggata 1440 ttacatgatt tgaatgcaaa gattatacac cttccacaag cttcttcttc tgtattcaag 1500 ttacccccac acctgtatga aggacacagg gtggtgtttt ttaatcatat aacaaagaag 1560 aagatatacg aagatttatc aaaaagagaa gggaacgacc catataatgt cgacataggt 1620 gacctgatcg gaaggcatct aaatagaaca acaataccag accagttgca cgactgggtg 1680 tctgggatca aaagacacat cttttctgtt tttgaacaat tcggtagtct gatcaaagtt 1740 gttgtcttta taataatgct agtgttgtgt ataaaaatca ttaatctgat atatcggttt 1800 tacaaggtga ggaaatctaa tcacaaaaaa ctagcttcac ggaaagagaa acttcaccta 1860 tcagatccgt tctctgtaaa ttctaaatga 1890 <210> 18 <211> 530 <212> PRT <213> Chandipura virus <400> 18 Met Thr Ser Ser Val Thr Ile Ser Val Ile Leu Leu Ile Ser Phe Ile 1 5 10 15 Ala Pro Ser Tyr Ser Ser Leu Ser Ile Ala Phe Pro Glu Asn Thr Lys 20 25 30 Leu Asp Trp Lys Pro Val Thr Lys Asn Thr Arg Tyr Cys Pro Met Gly 35 40 45 Gly Glu Trp Phe Leu Glu Pro Gly Leu Gln Glu Glu Ser Phe Leu Ser 50 55 60 Ser Thr Pro Ile Gly Ala Thr Pro Ser Lys Ser Asp Gly Phe Leu Cys 65 70 75 80 His Ala Ala Lys Trp Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro 85 90 95 Lys Tyr Ile Thr His Ser Ile His Asn Ile Lys Pro Thr Arg Ser Asp 100 105 110 Cys Asp Thr Ala Leu Ala Ser Tyr Lys Ser Gly Thr Leu Val Ser Pro 115 120 125 Gly Phe Pro Pro Glu Ser Cys Gly Tyr Ala Ser Val Thr Asp Ser Glu 130 135 140 Phe Leu Val Ile Met Ile Thr Pro His His Val Gly Val Asp Asp Tyr 145 150 155 160 Arg Gly His Trp Val Asp Pro Leu Phe Val Gly Gly Glu Cys Asp Gln 165 170 175 Ser Tyr Cys Asp Thr Ile His Asn Ser Ser Val Trp Ile Pro Ala Asp 180 185 190 Gln Thr Lys Lys Asn Ile Cys Gly Gln Ser Phe Thr Pro Leu Thr Val 195 200 205 Thr Val Ala Tyr Asp Lys Thr Lys Glu Ile Ala Ala Gly Ala Ile Val 210 215 220 Phe Lys Ser Lys Tyr His Ser His Met Glu Gly Ala Arg Thr Cys Arg 225 230 235 240 Leu Ser Tyr Cys Gly Arg Asn Gly Ile Lys Phe Pro Asn Gly Glu Trp 245 250 255 Val Ser Leu Asp Val Lys Thr Lys Ile Gln Glu Lys Pro Leu Leu Pro 260 265 270 Leu Phe Lys Glu Cys Pro Ala Gly Thr Glu Val Arg Ser Thr Leu Gln 275 280 285 Ser Asp Gly Ala Gln Val Leu Thr Ser Glu Ile Gln Arg Ile Leu Asp 290 295 300 Tyr Ser Leu Cys Gln Asn Thr Trp Asp Lys Val Glu Arg Lys Glu Pro 305 310 315 320 Leu Ser Pro Leu Asp Leu Ser Tyr Leu Ala Ser Lys Ser Pro Gly Lys 325 330 335 Gly Leu Ala Tyr Thr Val Ile Asn Gly Thr Leu Ser Phe Ala His Thr 340 345 350 Arg Tyr Val Arg Met Trp Ile Asp Gly Pro Val Leu Lys Glu Met Lys 355 360 365 Gly Lys Arg Glu Ser Pro Ser Gly Ile Ser Ser Asp Ile Trp Thr Gln 370 375 380 Trp Phe Lys Tyr Gly Asp Met Glu Ile Gly Pro Asn Gly Leu Leu Lys 385 390 395 400 Thr Ala Gly Gly Tyr Lys Phe Pro Trp His Leu Ile Gly Met Gly Ile 405 410 415 Val Asp Asn Glu Leu His Glu Leu Ser Glu Ala Asn Pro Leu Asp His 420 425 430 Pro Gln Leu Pro His Ala Gln Ser Ile Ala Asp Asp Ser Glu Glu Ile 435 440 445 Phe Phe Gly Asp Thr Gly Val Ser Lys Asn Pro Val Glu Leu Val Thr 450 455 460 Gly Trp Phe Thr Ser Trp Lys Glu Ser Leu Ala Ala Gly Val Val Leu 465 470 475 480 Ile Leu Val Val Val Leu Ile Tyr Gly Val Leu Arg Cys Phe Pro Val 485 490 495 Leu Cys Thr Thr Cys Arg Lys Pro Lys Trp Lys Lys Gly Val Glu Arg 500 505 510 Ser Asp Ser Phe Glu Met Arg Ile Phe Lys Pro Asn Asn Met Arg Ala 515 520 525 Arg Val 530 <210> 19 <211> 1593 <212> DNA <213> Chandipura virus <400> 19 atgacttctt cagtgacaat tagtgtgatc cttcttatct cctttattgc cccatcatac 60 tcatctttga gtatagcatt tccagaaaac accaaattag attggaagcc agtcacaaaa 120 aacactagat actgccctat gggtggggaa tggtttctag aaccagggtt acaagaagaa 180 tctttcttga gctctacacc cattggtgcg accccctcca agtcagatgg atttctctgt 240 catgcagcca agtgggtgac aacatgtgat ttcagatggt atggacccaa atatattacg 300 cattcaattc ataatatcaa acctacccga tcagattgtg atacagcgct tgcatcatac 360 aaatccggga cattagtgag ccctggtttt cccccagagt cttgtggtta tgcttctgtg 420 actgactccg agttcctggt gatcatgatt acccctcatc acgtgggtgt ggatgactac 480 agaggacatt gggtagatcc tctttttgtt ggaggagaat gcgaccagtc ttattgtgat 540 actatccaca actcctcagt ttggattcct gctgatcaga ctaagaagaa catttgcggc 600 cagtccttta ccccactgac tgtgacggtt gcttatgata aaaccaaaga aattgctgca 660 ggcgcaatag tctttaagag caaatatcac tctcacatgg aaggtgctcg aacttgcaga 720 ttgagttatt gcggtcggaa cggaattaaa ttccccaatg gagagtgggt cagcctggat 780 gttaaaacta agatccaaga gaaaccttta cttcccttgt ttaaagagtg tcctgctggg 840 acagaggtga gatctactct tcaatccgat ggggctcaag tcttgacctc ggagattcag 900 aggattttgg attattcctt gtgtcagaac acgtgggaca aggtagaacg caaagagcct 960 ttgtctccat tggatctcag ctatttggca tctaaatccc cggggaaagg tctggcatat 1020 acagtgataa atgggacatt gtcatttgcc cataccagat acgtgaggat gtggattgat 1080 ggcccggtgt tgaaagaaat gaaaggcaaa agggaatctc ctagtgggat ctcgagtgat 1140 atttggaccc aatggttcaa atatggggat atggagatag gcccaaacgg cctcttaaag 1200 acagcaggag ggtacaaatt cccctggcat ctgatcggta tgggaattgt ggacaatgaa 1260 ctacacgagc tcagtgaggc aaacccttta gaccatccac agctacctca tgctcagtct 1320 attgccgacg attcggagga gatcttcttt ggagacactg gggtttccaa gaatccagta 1380 gaactagtta cagggtggtt cactagctgg aaagagagct tagctgccgg tgttgttttg 1440 atattggtag ttgtcctgat ttatggtgtc ctccgttgtt tcccggtgtt gtgtactacc 1500 tgcagaaagc ccaaatggaa gaaaggggta gagaggtccg atagctttga gatgcggatt 1560 ttcaagccca acaacatgag agccagagta tga 1593 <210> 20 <211> 820 <212> PRT <213> Curionopolis virus <400> 20 Met Asp Leu Val Arg Phe Ser Ile Ala Leu Ser Val Phe Leu Cys Tyr 1 5 10 15 Gly Thr Pro Pro Ser Gln Gly Gln Ala Ile Val Ser Ile Lys Asp Ser 20 25 30 Cys Glu Ala Lys Ser Ala Pro Trp Ile Pro Cys Glu Lys Phe Asp Tyr 35 40 45 Val Lys Asn Ala Thr Gly Ser Gly Ile Lys Cys Trp Ile Phe Cys Ser 50 55 60 Arg Ser Gly Phe Tyr Ser Lys Thr Gly Arg Phe Ile Arg Cys Ile Gln 65 70 75 80 Gly Asp Pro Glu Ala Lys Tyr Ile Lys Ser Cys Arg Arg Gln Ile Glu 85 90 95 Lys Arg Gly Lys Glu Lys Met Arg Glu Gly Thr Arg Gly Lys Arg Lys 100 105 110 Thr Ser Glu Pro Lys Glu Glu Gly Val Arg Ala Lys Thr Asp Phe Thr 115 120 125 Pro Asp Glu Ser Arg Arg Leu Asn Asn Leu Thr Lys Val Phe Arg Lys 130 135 140 Val Glu Asp Lys Asp Leu Asn Asp Phe Lys Lys Phe Ile Leu Glu Lys 145 150 155 160 Gly Leu Glu Thr Lys Ile Lys Leu Ala Asn Asp Gly Lys Ile Ser Phe 165 170 175 Arg Asp Pro Asp Cys Gly Glu Asn Lys Asp Tyr Pro Cys His Arg Ile 180 185 190 His Gln Ile Ile Glu Gly Val Asn Glu Asn Ile Asp Tyr Ile Asn Glu 195 200 205 Ile Leu Ser Leu Lys Lys Met Lys Glu Glu Leu Arg Leu Arg Glu Arg 210 215 220 Glu Ser Glu Glu Gly Glu Phe Pro Gly Leu Leu Asn Thr Thr Asn Arg 225 230 235 240 Arg Gly Phe Leu Leu His Tyr Pro Val Glu Leu Gly Asn Trp Ser Arg 245 250 255 Leu Glu Asp Pro Ser Gln Ile Lys Cys Pro Ser His His Lys Asp Met 260 265 270 Leu Ser Asn Pro Arg Arg Leu Gly Lys Tyr Asn Leu Asp Ile Ile Val 275 280 285 Arg Arg Pro Arg Ile Gly Thr Phe Glu Thr Val Val Pro Gly Tyr Ile 290 295 300 Cys Gln Gly Met Gln Trp Thr Ser Thr Cys Asn Glu Met Trp Tyr Phe 305 310 315 320 Val Thr Tyr His Asp Arg Ala Val His Tyr Ile Thr Pro Asn Lys Leu 325 330 335 Lys Cys Leu Gln Asn Ile Arg Ala His Lys Arg Gly Glu His Ile Lys 340 345 350 Pro Tyr Tyr Pro Leu Glu Glu Cys Asn Trp Asn Ser Glu Thr Thr Lys 355 360 365 Thr Val Asp Tyr Phe Met Ile Thr Pro Tyr Ser Pro Glu Val Asp Pro 370 375 380 Phe Thr Leu Glu Phe Lys Ser Glu Ile Phe Pro Asp Arg Thr Ser Cys 385 390 395 400 Arg Pro Gly Asp Glu Ile Cys Val Thr Asp Asp Asp Ser Lys Val Trp 405 410 415 Phe Pro Asp Glu Asp Asp Lys Leu Ile Ala Arg Gly His Cys Pro Asp 420 425 430 Glu Thr Trp Asp Glu Ser His Leu Thr Ile His Pro Glu Glu Met Pro 435 440 445 Glu Asn Trp Glu Asp Pro Gln Ser Pro Trp Val Ser Asp Tyr Ile Leu 450 455 460 Lys Gly Val Leu Phe Gly Glu Lys Arg Val Lys Lys Ser Cys Leu Leu 465 470 475 480 Glu Phe Cys Gly Thr Ser Gly Leu Leu Phe Glu Asp Gly Glu Trp Trp 485 490 495 Glu Leu Asn Val Phe Ser Arg Glu Lys Gly Arg Glu Ser Leu Thr Lys 500 505 510 Ile Phe Ile Glu Gln Glu Glu Ile Arg Arg Cys Asn Gly Thr Glu Thr 515 520 525 Arg Val Gly Val Ala Gly Lys Glu Thr Asp Glu Lys Ala Leu Leu Asn 530 535 540 Ala Val Leu Ser Lys Asn Ala Tyr Glu Arg Cys Lys Ser Ala Arg Tyr 545 550 555 560 Arg Leu Ile Glu Asn Lys Tyr Leu Arg Leu Asp Asp Leu Ser Tyr Ile 565 570 575 Asn Pro Arg Glu Ser Val Thr Trp Trp Ala Tyr Arg Val Arg Ala Gly 580 585 590 Asp Asp Glu Arg Thr Phe Lys Leu Glu Lys Thr Thr Gly Glu Tyr Arg 595 600 605 Tyr Leu Gln Val Pro Pro Ser Leu Glu Gln His Val Thr Asp Cys Asp 610 615 620 Gly Gln Glu Asn Cys Ser Val Ser Ile Gly Tyr Tyr Arg Gly Glu Leu 625 630 635 640 Ile Asn Ser Ser Asp Trp Thr Arg Thr Gly His Asp Asp Val Tyr Val 645 650 655 Gly Val Asn Gly Leu Leu Arg Lys Asp Thr Gly Asn Lys Thr Ile Val 660 665 670 Leu Tyr Pro Pro Leu Met Lys Glu Tyr Gln Glu Ile Phe Ser Asp Ser 675 680 685 Gly Glu Ser Asp Asp Glu Ala Phe Ile Tyr Lys Pro Asp Ile His Glu 690 695 700 Lys Lys Gly Lys Pro Lys Glu Ala Glu Asp Glu Lys Asp Glu Lys Ser 705 710 715 720 Lys Lys Asn Lys Thr Pro Ile Asp Asp Ile Lys Asp Trp Trp Ser Asn 725 730 735 Ile Lys Gly Glu Trp His Leu Ile Lys Gly Ile Leu Ile Gly Leu Phe 740 745 750 Thr Phe Ala Leu Leu Ile Gly Val Val Lys Leu Gly Val Phe Ile Lys 755 760 765 Ser Ser Phe Arg Lys Arg Arg Asp Asp Ser Ile Pro Glu Gly Lys Asp 770 775 780 Glu Glu Ile Gly Ile Lys Met Gln Ser Arg Arg Ser Arg Gln Asn Ile 785 790 795 800 Tyr Glu Glu Ile Asn Glu Val Ser Pro Thr Met Thr Arg Arg Gly Arg 805 810 815 Asn Ile Phe Asn 820 <210> 21 <211> 2463 <212> DNA <213> Curionopolis virus <400> 21 atggatcttg ttcgattttc aattgcgttg tcagtcttcc tatgctacgg aaccccccca 60 tctcagggcc aagcaatcgt ttcgatcaaa gatagttgcg aagctaagtc agctccctgg 120 atcccttgtg agaaatttga ttatgtcaaa aatgctacgg ggtcaggaat caaatgctgg 180 attttttgtt ctagatcagg tttttactca aaaacaggga ggtttattag atgcatccaa 240 ggagatccgg aagcaaagta cataaaatcc tgtcgaaggc agatagagaa aagagggaaa 300 gaaaagatga gagaaggaac taggggaaaa agaaaaacgt cggaaccaaa agaagaagga 360 gtaagagcta aaacagattt tactcctgat gagagcagaa ggctgaacaa cttgaccaaa 420 gtattcagga aagtagaaga taaggacctc aatgatttca aaaagttcat attggaaaaa 480 ggattggaaa cgaagattaa gctagcaaat gatgggaaga tctctttcag agaccctgac 540 tgcggagaaa acaaagacta cccatgccac aggatccatc aaatcataga aggggtcaat 600 gaaaacatag actatataaa tgagatccta agcttaaaaa agatgaagga agaattgagg 660 ttgagagaaa gagaatcaga agaaggggag tttccaggcc ttctcaacac gactaatcga 720 agagggttcc ttcttcacta ccccgtggaa ctaggaaatt ggtcaagact cgaagatcct 780 agtcaaatca aatgcccgtc tcatcacaag gatatgctta gcaatcccag aagactgggg 840 aagtacaact tagacattat agtgaggagg cctagaatcg gaacttttga aacagtagtg 900 cctggttata tatgccaggg aatgcaatgg acatctactt gcaatgagat gtggtatttt 960 gtcacttacc atgacagagc agtgcactac ataacaccaa acaagctcaa atgtttacaa 1020 aacatcagag ctcacaaaag aggagaacac ataaaacctt attatcctct agaggaatgc 1080 aactggaatt cagaaacaac aaaaacagtg gattacttca tgatcacacc atactctcct 1140 gaagtagacc cattcactct agaatttaaa agtgagatct tcccagacag gacgtcctgt 1200 cgtcccggag acgagatctg tgttaccgat gatgacagca aagtctggtt cccagacgaa 1260 gatgacaagc tgatcgcaag gggacactgt cctgatgaaa cgtgggatga atctcatctc 1320 actatacatc cggaagagat gccggaaaat tgggaagatc ctcagtctcc ctgggtgagt 1380 gactacatac taaagggggt cttatttgga gaaaagagag tcaaaaagag ctgtctatta 1440 gagttttgtg gaacatctgg actcttgttt gaagatgggg aatggtggga gttaaatgtt 1500 ttcagcagag aaaaaggaag agaatcactg acgaagattt tcatagagca ggaggagatt 1560 cgacgatgca acggaacaga aacccgtgtc ggagtggctg ggaaagaaac tgatgaaaaa 1620 gctttgttga acgcagtgct gagcaaaaat gcctatgaga ggtgcaagtc tgctagatac 1680 agacttatag aaaacaagta cctcagatta gatgacctca gctacataaa tccaagagaa 1740 tctgttacat ggtgggccta cagagtgaga gcaggagacg acgagagaac gttcaaattg 1800 gaaaaaacga ccggagaata tcgttatctc caggttcccc cttcattgga gcaacatgta 1860 acagactgtg atgggcaaga aaattgctct gtcagtatcg gatactatag gggagaactg 1920 ataaactcat ctgattggac gagaacagga catgatgatg tctatgttgg ggttaatggg 1980 cttctacgga aagatacagg aaacaagaca atagttctat accctccact catgaaagag 2040 tatcaggaaa tattttcaga tagtggggaa tcagatgatg aggcatttat ttataaacca 2100 gacatacatg agaagaaggg gaagccaaag gaggcagaag atgaaaaaga tgaaaagtca 2160 aaaaagaaca agactcccat tgatgacata aaagattggt ggagcaacat caagggggaa 2220 tggcatctaa tcaaaggaat tctcatcgga ctgtttacat tcgcgcttct gatcggagtc 2280 gtcaaactcg gggttttcat caaatcttcc tttagaaaga ggagagatga ctccataccc 2340 gaggggaaag atgaagaaat aggaatcaag atgcagtcca ggaggtctag acagaatatt 2400 tatgaagaga tcaatgaagt gtcacccact atgacgagaa gaggaagaaa catattcaat 2460 taa 2463 <210> 22 <211> 685 <212> PRT <213> Ekpoma-1 virus <400> 22 Met Lys Lys Thr Thr Arg Arg Ser Ser Ser Glu Thr Met Ile Leu Leu 1 5 10 15 Ile His Leu Pro Val Ile Leu Thr Thr Leu Thr Lys Leu Ile Ser Gly 20 25 30 Asp Leu Ile Asn Phe Pro Phe His Cys Thr Asn Leu Glu Asn Ile Lys 35 40 45 Tyr Ser Asn Leu Ser Cys Pro Thr Val Trp Glu Thr Phe Lys Ile Lys 50 55 60 Thr Gly Asp Lys Val Glu Arg Gly Ser Met Cys Arg Pro Ser Leu His 65 70 75 80 Thr His Asp Leu Glu Glu Gly Tyr Leu Cys Tyr Lys Asp Thr Trp Thr 85 90 95 Thr Thr Cys Asp Glu Ser Trp Tyr Phe Ser Thr Glu Val Lys Tyr Lys 100 105 110 Ile Ile His Glu Glu Val His Asp Ile Asp Cys Leu Asp Ala Leu Ile 115 120 125 Glu Tyr Lys Val Gly Lys Leu Lys Ala Pro Phe Phe Pro Val Ala Thr 130 135 140 Cys Tyr Trp Ala Ser Ser Thr Thr Glu Ser Ile Thr Phe Met Met Ile 145 150 155 160 Lys Pro His Asn Ala Pro Leu Asp Pro Tyr Ser Asn Arg Ile Val Asp 165 170 175 Pro Ile Ile Gln Ala Asp Ser Gly Asp Asn Leu Lys Ile Tyr Arg Thr 180 185 190 Thr Phe Pro Lys Thr Arg Trp Ile Arg Glu Val Asn Thr Thr Leu Glu 195 200 205 Glu Arg Cys Asn Val Ala Thr Trp Glu Cys His Asp Met Thr Leu Tyr 210 215 220 Ser Gly Trp Leu Thr His Pro Ser Gly Ala Phe Lys Thr Ser Leu Arg 225 230 235 240 Thr Gly Leu Val Val Asp Ser Gln Ile Met Gly His Ile Leu Leu Arg 245 250 255 Asp Thr Cys Lys Met Asp Phe Cys Gly Arg Arg Gly Phe Arg Phe Pro 260 265 270 Asp Gly Gly Trp Trp Arg Leu Thr Thr Glu Asn Glu Val Ser Leu Gln 275 280 285 Asp Phe Glu Leu Asn Asp Thr Val Val Pro Lys Cys Asp Asp Arg Ser 290 295 300 Arg Asn His Val Gly Tyr Thr Asp Leu Asp Tyr Asn Pro Glu Lys Ile 305 310 315 320 Ala Leu Glu Gln Lys Ser Leu Leu Lys Thr Thr Met Cys Arg Glu Lys 325 330 335 Leu Ala Glu Leu Gly Gln Gly Lys Gly Met Ser Leu Tyr Asp Thr Thr 340 345 350 Tyr Leu Ile Pro Asn Ala Pro Gly Arg Tyr Pro Ala Tyr Tyr Ile Tyr 355 360 365 Pro Val Gly Leu Asn Lys Thr Leu Glu Thr Gln Ile Leu Lys Glu Lys 370 375 380 Thr Ile Ser Asn Pro Leu Thr Ala Lys Arg Lys Glu His Met Pro Ile 385 390 395 400 Met Leu Tyr Met Ala Gln Cys His Tyr Thr Leu Ile Glu Phe Pro Asn 405 410 415 Leu Asp Ser Thr Gly Thr Leu Arg Tyr Thr Ser Leu Glu Asp Pro Val 420 425 430 Gly Thr Ile Leu Glu Ser Gly Lys Asn Val Ser Leu Ala Asp Leu Gly 435 440 445 Phe Glu Asp Ile Asn Leu Asp Asn Thr Thr Cys Lys Gly Asn Asp Ser 450 455 460 Asp Cys Phe Asn Thr Thr Thr Pro Lys Glu Pro Leu Leu Asp Arg Lys 465 470 475 480 Phe Asn Met Thr Asn His Thr Leu Pro Trp Arg Arg Tyr Ser Lys Arg 485 490 495 Glu Leu His His Arg Val Thr Tyr Asn Gly Ile Thr His Ser Pro Val 500 505 510 Gly His Trp Val Gln Ile Pro Tyr Gly Ala Ser Leu Thr Ala Asn Leu 515 520 525 Pro Glu His Leu Ile Glu Lys His Ser Thr His Phe Phe Asp His Val 530 535 540 Thr Lys Gln Ser Ile Phe Glu Arg Glu Leu Gln Asn Gly Glu Ile Ser 545 550 555 560 Ile Asp Asp Leu Glu Gln Leu Ile Gly Arg Lys Thr Asn His Thr Asp 565 570 575 Leu Pro Lys Lys Val Arg Asn Trp Val Gln Asn Ala Lys Glu Ser Val 580 585 590 Val Gly Ile Phe Arg Glu Phe Gly His Thr Ile Arg Leu Gly Leu Ser 595 600 605 Ile Val Ser Phe Leu Ile Gly Leu Ile Ile Ser Phe Lys Val Trp Lys 610 615 620 Lys Cys Arg Lys Asn Lys Lys Glu Thr Gln Gln Gln Ser Arg Ser Ser 625 630 635 640 Pro Ile Tyr Arg Pro Gln Asn Ile Tyr Glu Leu Glu Glu Gly Pro Ile 645 650 655 Ser Pro Pro Pro Leu Ala Arg Gln Arg Glu His Asp Asn Ser Asn Ile 660 665 670 Phe Arg Lys Thr Asp Pro Arg Asn Pro Phe Tyr Ser Arg 675 680 685 <210> 23 <211> 2058 <212> DNA <213> Ekpoma-1 virus <400> 23 atgaaaaaaa ctacaaggcg ttcgtcatct gaaaccatga ttctactaat tcatctccct 60 gtaatcttaa ctactctcac taaattaata tccggagatc ttatcaattt ccctttccac 120 tgcactaatc tagaaaacat aaaatactct aatctgtctt gtcccacagt atgggaaaca 180 ttcaagataa aaacaggaga taaggtggaa agaggatcaa tgtgccgtcc ttcgctacac 240 acgcatgatc tagaagaagg atatttgtgc tataaggaca catggactac aacatgtgat 300 gagtcatggt atttctcaac agaggtcaaa tacaagatca ttcatgaaga agtacatgac 360 atagattgct tggatgcctt aatagaatac aaggtcggga agttgaaggc ccctttcttt 420 cctgtcgcta catgttattg ggcttctagc actactgagt caatcacctt catgatgatt 480 aaacctcata atgctccctt ggacccttac tcgaacagaa tagttgaccc aataatacag 540 gcagatagcg gagacaattt aaagatatat aggacaacat tccccaagac ccgatggatt 600 agggaggtaa acacaacact cgaagaaaga tgcaatgtcg caacctggga atgtcatgat 660 atgacattat attcaggctg gttgacacac ccttcaggtg catttaagac aagcctgagg 720 acaggcctgg tagtcgacag tcaaatcatg ggacatattt tactaagaga tacttgcaaa 780 atggattttt gcgggagaag gggatttaga tttccggatg gaggatggtg gagattgact 840 acagagaatg aagtgtcatt gcaggatttt gaactgaacg acaccgtcgt accaaagtgt 900 gacgacagaa gtagaaacca tgtcggatat accgatttgg actacaatcc agaaaagatt 960 gcgttggagc aaaaatctct attgaaaaca acaatgtgta gagagaagct ggcggaacta 1020 ggccaaggca aaggaatgag cctatatgac accacatacc taatccccaa cgctccaggt 1080 cggtacccag cttactatat ataccctgtt ggtcttaaca agactctgga aacccagatt 1140 ctaaaggaaa agaccatctc gaatcctctg actgcaaaga gaaaagaaca catgccgatc 1200 atgctttaca tggctcaatg tcactatacc ctaattgagt ttccaaacct tgacagtaca 1260 ggaacattga gatacactag ccttgaagac cccgtcggaa caatactgga gtcagggaag 1320 aatgttagcc tcgcagatct gggatttgaa gatatcaacc ttgacaacac aacgtgcaaa 1380 ggaaatgact cagactgctt caacacgacc actccaaaag aaccgctcct agataggaaa 1440 ttcaacatga caaatcacac cctcccatgg agaagatact ccaaaagaga attacatcac 1500 agagtcacgt ataatggaat aactcatagt ccagtgggtc attgggttca aatcccatat 1560 ggagcaagcc taacggcgaa cctccctgaa catttaatag agaaacattc cactcacttt 1620 tttgatcatg tgactaaaca atctatattt gaaagagagt tacagaatgg agaaatatca 1680 attgacgact tagaacaact aattgggagg aaaacaaatc atactgattt gcctaagaaa 1740 gtaagaaact gggttcaaaa tgcaaaggag agtgtcgtag ggatttttcg agaatttgga 1800 catactatcc ggctaggact ctctattgta tcattcttga ttggattaat catatcattc 1860 aaagtctgga aaaaatgcag aaagaacaag aaagagacac aacagcaatc aagatcttct 1920 cctatttata gacctcaaaa catctacgag ttggaagaag gtcctataag tccgcctcct 1980 ctcgccaggc aaagagaaca cgacaacagc aatatcttca ggaagacaga cccaagaaat 2040 cccttttatt cgaggtaa 2058 <210> 24 <211> 630 <212> PRT <213> Ekpoma-2 virus <400> 24 Met Gln Thr Met Lys Lys Thr His Leu Leu Ala Phe Thr Ile Phe Gly 1 5 10 15 Gln Ile Leu Leu Ala Ser Ser Leu Val Val Asn Leu Pro Leu Arg Cys 20 25 30 Asn Gly Arg Lys Asp Leu Leu Val Asn Ser Leu Lys Cys Pro Leu Pro 35 40 45 Ser Thr Glu Val Lys Val Asp Gly Lys Val Lys Val Tyr Glu Gly Asp 50 55 60 Ile Cys Arg Pro Gln Ile Asn Ala Lys Asp Val Glu Ala Gly Tyr Leu 65 70 75 80 Cys His Lys Asp Ile Tyr Lys Ala Ile Cys Asp Glu Thr Trp Tyr Phe 85 90 95 Ser Ala Thr Val Lys His Glu Ile Glu His Ala Pro Ile Ser Asp Ile 100 105 110 Glu Cys Ile Glu Gly Leu Thr Glu Leu Lys Leu Gly Ile Val Pro Asn 115 120 125 Pro Gln Phe Pro Ser Val Asp Cys Tyr Trp Asn Ala Arg Thr Glu Glu 130 135 140 Lys Arg Thr Tyr Ile Ile Leu Thr Gln His Asp Pro Ala Leu Asp Pro 145 150 155 160 Tyr Ser Asn Lys Ile Lys Asp Asn Val Val Asp Pro Asp Cys Asp Phe 165 170 175 Asn Leu Cys Lys Thr Asn Phe Ile Asn Thr Lys Trp Ile Arg Asp Lys 180 185 190 Asn Thr Thr Glu Ile Glu Arg Cys Asp Ala Lys Asn Trp Asp Cys His 195 200 205 Pro Tyr Lys Ile Tyr Gln Gly Trp Ile Ser Lys Ser Glu Met Ile Gly 210 215 220 Trp Gly Asp Pro Thr Gln Ser Tyr Ser Tyr Thr Gly Leu Val Leu Asp 225 230 235 240 Ser His Ile Tyr Gly His Ile Pro Met Ser Lys Leu Cys His Lys Thr 245 250 255 Phe Cys Gly Lys Glu Gly Tyr Leu Phe Pro Asp Lys Ser Trp Trp Gln 260 265 270 Ile Arg Ser Lys Thr Pro Ala Ser Pro Leu Phe Arg Glu Leu Thr Leu 275 280 285 Asn Gly Ser Arg Ser Ala Phe Pro Asp Cys Glu Thr Ile Lys Thr Tyr 290 295 300 Gly Tyr Ala Glu Val Glu Glu Asp Glu Ser Ser Glu Ile Ile Arg Glu 305 310 315 320 Ser Ala Glu Ile Arg His Glu Met Cys Leu Glu Thr Leu Ser Thr Leu 325 330 335 Ala Ser Gly Tyr Glu Ala Ser Phe Arg Asp Leu Met Lys Phe Ile Pro 340 345 350 Gln Arg Pro Gly Pro Gly Lys Ala Tyr Ser Leu Asn Ser Asn Gly Lys 355 360 365 Pro Ser Tyr Tyr Asn Tyr His Trp Ala Gly His Pro Ala Ser Ser Ala 370 375 380 Ser Ile Gln Glu Gln Asp Cys Tyr Tyr Tyr Leu Val Asp Ile Pro Lys 385 390 395 400 Ile Gln Asp Asp Gly Ile Leu Asn Ile Thr Gly Ile Gly Asn Thr Asp 405 410 415 Val Cys Gly Lys Leu Leu Val Asn Gly Ser Ser Met Thr Leu Asn Ser 420 425 430 Leu Gly Phe Lys Ile Asp His His Tyr Asp Asp His Ile Val Glu Thr 435 440 445 Gly Thr Asp Val His Asp Glu Met Asn Ile Lys Glu Arg Met Val Trp 450 455 460 Ile Lys Pro Asp Lys Ile His Pro Leu Leu Trp Val Gly Pro Asn Gly 465 470 475 480 Ile Val Ile Asp His Gln His Lys Gln Ile His Phe Pro Val Phe Ser 485 490 495 Arg Gly Val Asp Arg Ile Pro His Tyr Trp Thr Gln Lys His Arg Val 500 505 510 Val Lys Tyr Arg His Ala Thr Gln Leu Lys Ile Tyr Lys Gln Tyr Leu 515 520 525 Asp Asn Pro Glu Lys Ser Asn Pro Tyr Asp Phe Asn Ala Trp Thr Gly 530 535 540 Arg His Val Asn Arg Thr Glu Ile Pro Val Ala Ile Ser Asn Trp Phe 545 550 555 560 Ser Gly Val Lys Asp Thr Val Phe Asp Lys Ile Ser Lys Ile Gly Ser 565 570 575 Trp Leu Lys Trp Ser Phe Tyr Leu Cys Phe Ile Phe Val Leu Phe Lys 580 585 590 Gly Gly Leu Leu Val Trp Asn Lys Tyr Lys Thr Leu Arg His Gln Thr 595 600 605 Lys Arg Thr Pro Lys Gly Lys Asn Ser Gln Asp Pro Glu Lys Leu Asp 610 615 620 Ile Phe Gly Gln Thr Val 625 630 <210> 25 <211> 1893 <212> DNA <213> Ekpoma-2 virus <400> 25 atgcagacca tgaaaaaaac tcacttactt gcttttacaa tttttggaca gattctactg 60 gcttccagtc tagtagttaa ccttcctttg cgttgcaatg gaagaaagga tttgttagta 120 aattcattaa aatgccccct tccaagcact gaagtaaagg ttgatggaaa ggtaaaagtg 180 tatgaaggag acatatgcag accccagata aacgctaaag atgtagaagc gggttatctc 240 tgccacaaag atatttataa ggctatttgt gatgagactt ggtatttctc agcaacagtt 300 aaacatgaga tagaacatgc tccaatatca gatatagagt gtatagaagg attaactgag 360 ttaaagcttg gaatagtccc taacccacaa tttccaagcg ttgactgtta ctggaatgct 420 agaactgaag agaagagaac gtacatcatc ctaacccaac atgatcccgc cctagaccca 480 tactcaaaca aaatcaagga caatgtggtg gatccagatt gtgactttaa tctgtgcaag 540 accaacttca tcaatacaaa atggattaga gacaaaaaca cgactgagat agagagatgc 600 gacgcaaaaa actgggattg tcatccctac aaaatatatc aaggctggat cagcaaatca 660 gagatgatcg gctggggtga ccccacccag tcttactcat acacaggatt ggttttagat 720 tcacatatct acggacacat tccaatgtcc aaactatgcc acaaaacatt ttgcggaaaa 780 gaaggttacc tattccctga caaatcctgg tggcagatca gatcaaagac tccagcaagt 840 ccattattca gggaattaac cttgaatgga agcagatctg catttcctga ctgtgagacc 900 atcaaaacct acgggtatgc tgaagtagaa gaggatgaat cctcagaaat aatccgagaa 960 agtgcagaaa tcaggcacga aatgtgtcta gagactctct caacgttagc atctggatac 1020 gaagcatcct ttagggatct aatgaaattt attccacaga gacctggacc aggtaaagca 1080 tacagcctaa attcgaatgg caaaccgtcc tattacaatt accactgggc tggacaccca 1140 gcatcaagtg ccagcatcca ggaacaagat tgctattatt acctggtgga tatcccaaaa 1200 attcaagatg atggaattct gaatataaca ggcataggaa acactgatgt ttgtggtaaa 1260 ttgttggtta atgggtcatc aatgacttta aatagtctcg gtttcaaaat tgatcatcat 1320 tatgatgatc atattgttga aacagggacg gatgtccatg atgaaatgaa catcaaagag 1380 aggatggtat ggatcaagcc agacaagatt catccgctcc tatgggttgg accaaatggg 1440 atagtcattg atcaccagca caagcaaatc cactttccgg tgttttctag aggtgttgac 1500 aggattcctc actattggac tcagaagcac agagtggtaa aatacagaca tgcaactcaa 1560 ctaaaaatat acaaacagta tctagacaac cccgagaaaa gcaatcccta cgatttcaat 1620 gcatggactg gcagacatgt aaatcggacc gaaattcccg ttgcaatctc caactggttc 1680 tctggtgtca aggatactgt gtttgacaaa ataagcaaga ttggcagttg gctgaaatgg 1740 tcattttatt tgtgttttat atttgtacta ttcaaaggag gtcttctagt ctggaacaaa 1800 tacaagacac tacgtcatca aacaaaaaga actccaaaag gaaaaaatag tcaagatccc 1860 gagaaactag atatttttgg gcaaaccgtg taa 1893 <210> 26 <211> 523 <212> PRT <213> Isfahan virus <400> 26 Met Thr Ser Val Leu Phe Met Val Gly Val Leu Leu Gly Ala Phe Gly 1 5 10 15 Ser Thr His Cys Ser Ile Gln Ile Val Phe Pro Ser Glu Thr Lys Leu 20 25 30 Val Trp Lys Pro Val Leu Lys Gly Thr Arg Tyr Cys Pro Gln Ser Ala 35 40 45 Glu Leu Asn Leu Glu Pro Asp Leu Lys Thr Met Ala Phe Asp Ser Lys 50 55 60 Val Pro Ile Gly Ile Thr Pro Ser Asn Ser Asp Gly Tyr Leu Cys His 65 70 75 80 Ala Ala Lys Trp Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys 85 90 95 Tyr Ile Thr His Ser Val His Ser Leu Arg Pro Thr Val Ser Asp Cys 100 105 110 Lys Ala Ala Val Glu Ala Tyr Asn Ala Gly Thr Leu Met Tyr Pro Gly 115 120 125 Phe Pro Pro Glu Ser Cys Gly Tyr Ala Ser Ile Thr Asp Ser Glu Phe 130 135 140 Tyr Val Met Leu Val Thr Pro His Pro Val Gly Val Asp Asp Tyr Arg 145 150 155 160 Gly His Trp Val Asp Pro Leu Phe Pro Thr Ser Glu Cys Asn Ser Asn 165 170 175 Phe Cys Glu Thr Val His Asn Ala Thr Met Trp Ile Pro Lys Asp Leu 180 185 190 Lys Thr His Asp Val Cys Ser Gln Asp Phe Gln Thr Ile Arg Val Ser 195 200 205 Val Met Tyr Pro Gln Thr Lys Pro Thr Lys Gly Ala Asp Leu Thr Leu 210 215 220 Lys Ser Lys Phe His Ala His Met Lys Gly Asp Arg Val Cys Lys Met 225 230 235 240 Lys Phe Cys Asn Lys Asn Gly Leu Arg Leu Gly Asn Gly Glu Trp Ile 245 250 255 Glu Val Gly Asp Glu Val Met Leu Asp Asn Ser Lys Leu Leu Ser Leu 260 265 270 Phe Pro Asp Cys Leu Val Gly Ser Val Val Lys Ser Thr Leu Leu Ser 275 280 285 Glu Gly Val Gln Thr Ala Leu Trp Glu Thr Asp Arg Leu Leu Asp Tyr 290 295 300 Ser Leu Cys Gln Asn Thr Trp Glu Lys Ile Asp Arg Lys Glu Pro Leu 305 310 315 320 Ser Ala Val Asp Leu Ser Tyr Leu Ala Pro Arg Ser Pro Gly Lys Gly 325 330 335 Met Ala Tyr Ile Val Ala Asn Gly Ser Leu Met Ser Ala Pro Ala Arg 340 345 350 Tyr Ile Arg Val Trp Ile Asp Ser Pro Ile Leu Lys Glu Ile Lys Gly 355 360 365 Lys Lys Glu Ser Ala Ser Gly Ile Asp Thr Val Leu Trp Glu Gln Trp 370 375 380 Leu Pro Phe Asn Gly Met Glu Leu Gly Pro Asn Gly Leu Ile Lys Thr 385 390 395 400 Lys Ser Gly Tyr Lys Phe Pro Leu Tyr Leu Leu Gly Met Gly Ile Val 405 410 415 Asp Gln Asp Leu Gln Glu Leu Ser Ser Val Asn Pro Val Asp His Pro 420 425 430 His Val Pro Ile Ala Gln Ala Phe Val Ser Glu Gly Glu Glu Val Phe 435 440 445 Phe Gly Asp Thr Gly Val Ser Lys Asn Pro Ile Glu Leu Ile Ser Gly 450 455 460 Trp Phe Ser Asp Trp Lys Glu Thr Ala Ala Ala Leu Gly Phe Ala Ala 465 470 475 480 Ile Ser Val Ile Leu Ile Ile Gly Leu Met Arg Leu Leu Pro Leu Leu 485 490 495 Cys Arg Arg Arg Lys Gln Lys Lys Val Ile Tyr Lys Asp Val Glu Leu 500 505 510 Asn Ser Phe Asp Pro Arg Gln Ala Phe His Arg 515 520 <210> 27 <211> 1572 <212> DNA <213> Isfahan virus <400> 27 atgacttcag tcttattcat ggttggtgtg ctcttggggg cctttggttc aacccattgt 60 agtattcaaa tcgttttccc cagtgaaaca aaactcgtat ggaagccagt attaaaaggg 120 accaggtact gtccacaaag tgcagaatta aatctggaac ccgacttgaa aactatggct 180 tttgacagca aagttccaat tggcataacg ccttccaact cggatggcta cctgtgtcat 240 gctgccaaat gggtcacaac atgtgatttt cgatggtatg gaccgaagta cataactcac 300 tctgtccaca gcttgagacc aacagtttct gattgtaaag cggccgtaga agcttacaat 360 gctggtactc tcatgtaccc gggttttcct cctgaatctt gtggatatgc atctatcacg 420 gattctgaat tttatgtcat gctagtaact ccgcatcctg ttggagtgga tgattacaga 480 ggacactggg tggatccatt gtttcctact agcgagtgca attccaattt ttgtgagact 540 gttcacaatg ccactatgtg gatcccgaaa gatcttaaaa ctcatgatgt ttgttctcag 600 gacttccaga cgattagggt ttccgtgatg tatcctcaaa ccaaacccac caagggggca 660 gacttgacac tgaaaagtaa gttccatgct cacatgaaag gtgacagagt ctgcaagatg 720 aaattctgca acaaaaatgg gttgcgactg ggaaacggag aatggattga agttggggat 780 gaggtcatgc tcgataactc gaaactcttg agtttattcc cagattgttt ggttggttct 840 gtggtaaaat ccactttgct ctcggaagga gttcaaacag cactgtggga gaccgacaga 900 ctattagatt actcattgtg ccagaacaca tgggaaaaaa tcgatcgaaa agagccgctg 960 tctgctgtgg acctgagcta tcttgcacct agatcacccg gaaaggggat ggcatacatc 1020 gttgccaatg gatctttgat gtctgctcct gctagataca tcagagtttg gattgacagt 1080 cccatactta aggagataaa aggaaagaaa gagtcagcct ccggaattga cactgtcctt 1140 tgggaacaat ggctcccctt caatggaatg gagttaggac ctaatggatt gatcaagacg 1200 aagtcaggtt acaaatttcc gctatatctt cttggaatgg gcattgtaga tcaagatctt 1260 caagagttgt cctcagtgaa ccctgtagac cacccacatg taccaattgc ccaggctttc 1320 gtttcagagg gagaagaagt cttctttggg gatacaggag tctctaaaaa cccaatcgag 1380 ctgatatctg gctggttctc agattggaaa gaaacagcag ccgcattagg gttcgctgca 1440 atatctgtga tcttaattat tggactaatg aggctgttgc cactattatg caggaggaga 1500 aagcaaaaaa aagttatcta caaagacgta gaattaaatt cttttgatcc tagacaagct 1560 tttcacagat ga 1572 <210> 28 <211> 611 <212> PRT <213> Kamese virus <400> 28 Met Ser Tyr Leu Leu Val Ile Ile Leu Ile Thr Ile Asn Arg Leu Tyr 1 5 10 15 Ala Phe Ser Arg Asp Ala Asp His Trp Tyr Val Arg Val Pro His Asp 20 25 30 Gln Ser Trp Phe Asp Asn Val Ile Thr Phe Pro Ile Asp Cys Lys Glu 35 40 45 Pro Trp Gln Gln Ile Thr Ser Gln Asn Leu Asn Cys Pro Ser Phe Asn 50 55 60 Asn Ile Ser Ala Glu Ala Lys Ala Ser Phe Asn Leu Gly Thr Val Phe 65 70 75 80 His Pro Leu Ala Ser Ser Arg Leu Thr Val Asp Gly Tyr Leu Cys His 85 90 95 Lys Gln Ser Trp Ile Ser Gln Cys Val Glu Thr Trp Tyr Phe Ser Thr 100 105 110 Thr Glu Thr Asn Thr Ile Ser Asn Leu Pro Ile Thr Lys Ser Glu Cys 115 120 125 Glu Glu Ala Ile Thr Met Tyr Glu Met Gly Glu Tyr Thr Asn Pro Phe 130 135 140 Phe Pro Pro Phe Tyr Cys Ser Trp Cys Ser Thr Gln Thr Asp Gln Lys 145 150 155 160 Thr Phe Val Ile Val Glu Pro His Ser Val Arg Glu Asp Val Tyr Asn 165 170 175 Gly Thr Phe Val Asp Pro Leu Phe Val Asp Gly Tyr Cys Ser Ala Asp 180 185 190 Tyr Cys Arg Thr Ile His Pro Asp Val Leu Trp Val Pro Arg Gly Gln 195 200 205 Ser Met Arg Lys Asp Val Cys Asn Lys Gly Leu Trp Glu Ser Gly Thr 210 215 220 Val Phe Gly Val Leu Glu Glu Arg Asp Glu Asp Leu Tyr Tyr Ser Ile 225 230 235 240 Glu Glu Gln Leu Ile Arg Ser Ser Ile Tyr Gly Val Arg Arg Leu Glu 245 250 255 Gly Ala Cys Tyr Arg Gly Val Cys Asn Gln Phe Gly Ile Arg Phe Gln 260 265 270 Ser Gly Glu Trp Trp Gly Leu Ala Gly Arg Asp Val Val Ile Trp Ile 275 280 285 Lys Arg Ile Leu Lys Gln Cys Ala Arg Gly Gln Trp Ile Ser Leu Ser 290 295 300 His Asp Asn His Asp Glu Arg Met Ala Glu Thr Gln Glu Leu Met Arg 305 310 315 320 Thr Met Leu Cys Glu Asn Val Lys Ser Arg Ile Leu Ser Asn Asp Pro 325 330 335 Val Ser Pro Asn Asp Leu Asn Tyr Leu Leu Pro Thr Asn Pro Gly Val 340 345 350 Gly Met Ala Tyr Arg Ile Phe Lys Arg Ile Leu Leu Lys Gly Asn His 355 360 365 Gly Gly Pro Thr Ser Glu Leu Tyr Met Glu Gln Arg His Cys Met Tyr 370 375 380 Arg Ile Leu His Asn Val Ser Arg Val Ile Asn Gln Thr Ser Gly Thr 385 390 395 400 Trp Thr Ile Gly Gln Met Phe Asn Gly Ala Pro Ile Ser Ile Asn Glu 405 410 415 Ser Val Phe Glu Arg Pro Ser Tyr Leu Asn Asn Ser Ala Arg Glu Ser 420 425 430 Gly Asp Gly Trp Phe Leu Leu Ser Tyr Asn Gly Leu Ile Lys Tyr Gly 435 440 445 Asn Val Leu Tyr Thr Pro Ser Ala Val Glu Ser Ser Val Glu Gly Leu 450 455 460 Gly Phe Phe His Asp Arg Thr Ser Leu Leu Leu Leu Asp Ser Pro Lys 465 470 475 480 Ser Val Ala Val Ser Ser Gln Met Glu Leu Val Asn Asn Ile Tyr Thr 485 490 495 Ser Ile Phe His Ser Asn Thr Thr Ser Val Phe Ser Lys Val Glu Gly 500 505 510 Ala Ile Arg Ala Ala Lys Asn Ala Val Ala Ser Tyr Phe Ser Gln Leu 515 520 525 Thr Asn Val Ala Trp Trp Val Gly Thr Gly Cys Ile Gly Ile Val Ala 530 535 540 Leu Leu Ile Trp Arg Lys Cys His Cys Tyr Asp Leu Leu Cys Lys Lys 545 550 555 560 Thr Ser Arg Ser Ala Asp Glu Ile Ser Ser Lys His Ile Tyr Asp Thr 565 570 575 Ile Glu Met Lys Pro Arg Thr Arg Val Gln Asn Lys Ala Ser Thr Pro 580 585 590 Lys Leu Pro Pro Lys Arg Ala His Gly Lys Asp Leu Ala His Asn Tyr 595 600 605 Phe Gln Tyr 610 <210> 29 <211> 1836 <212> DNA <213> Kamese virus <400> 29 atgagttacc tattggttat tattttgatc accataaata ggctttatgc tttctccaga 60 gatgcagatc actggtatgt tcgggtgccc catgaccagt catggtttga taatgttata 120 acgttcccga ttgattgtaa agaaccttgg caacaaatca cctcccaaaa tttaaattgc 180 ccctcattca ataacatcag tgcagaagcg aaagcttcgt tcaacctggg gactgtgttt 240 catcctcttg caagcagtcg attaactgtt gatggctatc tctgtcataa acagtcatgg 300 atctcccaat gtgtggaaac atggtatttt tcaacaacag aaacaaacac catttcaaat 360 cttccaataa caaaaagtga gtgtgaggag gccattacaa tgtatgagat gggagaatac 420 actaatcctt ttttccctcc attctattgt tcctggtgtt ccactcagac cgatcagaaa 480 acatttgtaa ttgtggaacc gcactcagtt agagaagatg tgtataatgg tacatttgtt 540 gatcctttgt ttgttgacgg atattgttct gcagactatt gccgcactat acaccctgat 600 gtgttatggg tacctagagg tcaatctatg cgcaaagatg tttgcaataa aggtttatgg 660 gaatctggca ctgtgtttgg cgtcctggag gaaagagatg aggatttgta ttatagtatt 720 gaggagcagc tgatcagaag ctcaatttat ggggtaagaa gattagaagg agcttgttac 780 aggggggtgt gcaaccaatt cggtataaga tttcagtcag gagaatggtg ggggttggct 840 gggagagatg tggtcatctg gatcaagaga attctaaaac aatgcgcaag aggtcaatgg 900 attagtttga gtcatgacaa ccatgatgag cgcatggcgg aaacacaaga attgatgcgg 960 actatgctgt gtgagaatgt aaagagtaga attctgagca atgacccggt ctccccgaat 1020 gatttaaatt atctcctccc aactaatcca ggtgttggta tggcatatcg aattttcaaa 1080 cggatcttac tgaaaggcaa tcatggaggg cctacctcag aactgtatat ggagcaacgg 1140 cattgcatgt acaggatact acacaatgtc agcagagtaa taaaccaaac ctcagggacc 1200 tggactattg ggcagatgtt caatggagca ccaattagta ttaatgagag tgtatttgag 1260 agacccagtt atttaaataa ctctgccaga gaaagtggag acggatggtt cttactctcc 1320 tacaatgggc ttattaagta tgggaacgtc ctttacactc ccagtgctgt tgaatccagt 1380 gtggaaggcc taggtttttt ccatgacaga accagtctac tcttgctaga ttctcctaaa 1440 tctgtcgcag tatcaagtca gatggagttg gtgaataata tatacacctc tattttccat 1500 tcaaacacaa catctgtttt ctctaaggtg gaaggtgcta ttagagctgc caagaatgct 1560 gttgcaagtt acttctctca gctgaccaat gttgcttggt gggtaggaac cggttgtata 1620 gggattgtag ccctattgat atggagaaaa tgtcactgtt atgatcttct gtgcaaaaaa 1680 acatccagat ctgccgatga aatatcttcc aaacacattt atgataccat agaaatgaaa 1740 ccccgaaccc gtgttcaaaa taaagcttca actcctaaat taccacctaa gagggctcat 1800 gggaaagact tagcccataa ttactttcaa tactga 1836 <210> 30 <211> 611 <212> PRT <213> Kotonkan virus <400> 30 Met Ser Tyr Leu Leu Val Ile Ile Leu Ile Thr Ile Asn Arg Leu Tyr 1 5 10 15 Ala Phe Ser Arg Asp Ala Asp His Trp Tyr Val Arg Val Pro His Asp 20 25 30 Gln Ser Trp Phe Asp Asn Val Ile Thr Phe Pro Ile Asp Cys Lys Glu 35 40 45 Pro Trp Gln Gln Ile Thr Ser Gln Asn Leu Asn Cys Pro Ser Phe Asn 50 55 60 Asn Ile Ser Ala Glu Ala Lys Ala Ser Phe Asn Leu Gly Thr Val Phe 65 70 75 80 His Pro Leu Ala Ser Ser Arg Leu Thr Val Asp Gly Tyr Leu Cys His 85 90 95 Lys Gln Ser Trp Ile Ser Gln Cys Val Glu Thr Trp Tyr Phe Ser Thr 100 105 110 Thr Glu Thr Asn Thr Ile Ser Asn Leu Pro Ile Thr Lys Ser Glu Cys 115 120 125 Glu Glu Ala Ile Thr Met Tyr Glu Met Gly Glu Tyr Thr Asn Pro Phe 130 135 140 Phe Pro Pro Phe Tyr Cys Ser Trp Cys Ser Thr Gln Thr Asp Gln Lys 145 150 155 160 Thr Phe Val Ile Val Glu Pro His Ser Val Arg Glu Asp Val Tyr Asn 165 170 175 Gly Thr Phe Val Asp Pro Leu Phe Val Asp Gly Tyr Cys Ser Ala Asp 180 185 190 Tyr Cys Arg Thr Ile His Pro Asp Val Leu Trp Val Pro Arg Gly Gln 195 200 205 Ser Met Arg Lys Asp Val Cys Asn Lys Gly Leu Trp Glu Ser Gly Thr 210 215 220 Val Phe Gly Val Leu Glu Glu Arg Asp Glu Asp Leu Tyr Tyr Ser Ile 225 230 235 240 Glu Glu Gln Leu Ile Arg Ser Ser Ile Tyr Gly Val Arg Arg Leu Glu 245 250 255 Gly Ala Cys Tyr Arg Gly Val Cys Asn Gln Phe Gly Ile Arg Phe Gln 260 265 270 Ser Gly Glu Trp Trp Gly Leu Ala Gly Arg Asp Val Val Ile Trp Ile 275 280 285 Lys Arg Ile Leu Lys Gln Cys Ala Arg Gly Gln Trp Ile Ser Leu Ser 290 295 300 His Asp Asn His Asp Glu Arg Met Ala Glu Thr Gln Glu Leu Met Arg 305 310 315 320 Thr Met Leu Cys Glu Asn Val Lys Ser Arg Ile Leu Ser Asn Asp Pro 325 330 335 Val Ser Pro Asn Asp Leu Asn Tyr Leu Leu Pro Thr Asn Pro Gly Val 340 345 350 Gly Met Ala Tyr Arg Ile Phe Lys Arg Ile Leu Leu Lys Gly Asn His 355 360 365 Gly Gly Pro Thr Ser Glu Leu Tyr Met Glu Gln Arg His Cys Met Tyr 370 375 380 Arg Ile Leu His Asn Val Ser Arg Val Ile Asn Gln Thr Ser Gly Thr 385 390 395 400 Trp Thr Ile Gly Gln Met Phe Asn Gly Ala Pro Ile Ser Ile Asn Glu 405 410 415 Ser Val Phe Glu Arg Pro Ser Tyr Leu Asn Asn Ser Ala Arg Glu Ser 420 425 430 Gly Asp Gly Trp Phe Leu Leu Ser Tyr Asn Gly Leu Ile Lys Tyr Gly 435 440 445 Asn Val Leu Tyr Thr Pro Ser Ala Val Glu Ser Ser Val Glu Gly Leu 450 455 460 Gly Phe Phe His Asp Arg Thr Ser Leu Leu Leu Leu Asp Ser Pro Lys 465 470 475 480 Ser Val Ala Val Ser Ser Gln Met Glu Leu Val Asn Asn Ile Tyr Thr 485 490 495 Ser Ile Phe His Ser Asn Thr Thr Ser Val Phe Ser Lys Val Glu Gly 500 505 510 Ala Ile Arg Ala Ala Lys Asn Ala Val Ala Ser Tyr Phe Ser Gln Leu 515 520 525 Thr Asn Val Ala Trp Trp Val Gly Thr Gly Cys Ile Gly Ile Val Ala 530 535 540 Leu Leu Ile Trp Arg Lys Cys His Cys Tyr Asp Leu Leu Cys Lys Lys 545 550 555 560 Thr Ser Arg Ser Ala Asp Glu Ile Ser Ser Lys His Ile Tyr Asp Thr 565 570 575 Ile Glu Met Lys Pro Arg Thr Arg Val Gln Asn Lys Ala Ser Thr Pro 580 585 590 Lys Leu Pro Pro Lys Arg Ala His Gly Lys Asp Leu Ala His Asn Tyr 595 600 605 Phe Gln Tyr 610 <210> 31 <211> 1920 <212> DNA <213> Kotonkan virus <400> 31 atgaagagtc tctattattc attgttcttg ttattcaatg ctaaaaatat tataacctac 60 agaattgcaa atttgccctt caattgtgaa aacgaacatt ctatacctgt tgaagccata 120 gactgccctg tgaggagaaa tgagcttaaa gtagagaacc taaaacaagg tggagaacat 180 agagtatgta aacctaaact cagcacggat gatcatgttc aggggaaatt atgccgtata 240 caacaatgga aaacaaagtg tacagaaaca tggtacttta caacttacat tgaatatgag 300 gtggtagatg taatgcccaa caaaatagaa tgtgcaaaag agtgggagag gacaaaggct 360 ggatttccca taatcccctt cttcccacca gctgtctgtt attggaatgc agagaatgta 420 atatctgaaa cttttgtaac cttagttgat cacccagtgt tacaagatcc ttataacagc 480 gaagtaattg accccatatt ctatggcact cgatgttcac cgattaatag ttttgattct 540 cactggtttt gcaagtcagt taataacctg ataatgtgga tgtcagacaa agatcaattg 600 aggagtccgc attgtgatat taaaacatgg gactgtattg ttgtgaaggc atatgttgca 660 tgggacgaag atcataatac acacaattat ctaagaaaca caaaggtttg ggaatcacca 720 gatatcggga gagtgggtct ctatgatgca tgtaaaaaga ggttttgtgg ggttgatggg 780 atcagattga ataatggaga atggtggttt ttagaaagag aggaaaatta ttacggattt 840 gactacagag gaatgaggaa ctgcagggcc gaagaaacta taggtgttag aacacatgta 900 gatcgaacat tgtttgaaga aattgacata aaattagaaa tagaacatag taaatgtata 960 gatgttttaa taaagttaag aagtgggatt acaatatctc catttgaact aggttacttg 1020 gcgccatcat cttatggaaa gggctatgca tatcgctttg agcaggaaac taaaaacata 1080 tatcaatgtt tccctaagat tgagaaagta ccacagataa aatatataac tgatgattta 1140 aagaattgca aagataataa aactagatat gcccgcacta taacacaaac caaaattggc 1200 aattataagc gagcattatg caattacaaa aatgtattca taccagagac taaacaagat 1260 caacaggcag gatatgacat caaaatgtgg acatttgctg gtaccaatga cagcataaaa 1320 gaacatatag agaacaatag ctggtcacca tttaaatcgc aatcggggaa taattatacc 1380 atagggtgga acggaatgat aaaactaaat acgggaagat atttgataaa cacatatgcg 1440 ttgcttgatg gcttaataca tgaagctcaa ttatctgcat tagaagtgaa atcttttcag 1500 catcctgtat accagaattt tgatgatttt gcaaagtggt taaatggatc atcaatatac 1560 gaggaaagag aacttcttga tgacagtcat ctagaaagga ctgatgtaat taagtcagca 1620 ggagagaaga tcaaaggaat ttatcataat atagtgggtt ggttttcagg agtaacaagc 1680 atagtaaggt ggatactctg gggggtaggt gcaattgtaa ctgtatatgt gatcttgaaa 1740 attaggagag tgataaagaa caaacatgat gaaaaagata ataagtcaga aataaaacaa 1800 ttctttgaga ggttagggaa aataaagaca cacaagggag ataacaattc tgtaccgaat 1860 attaaaggaa agagagacaa gaaagaagat gagtatgaga tgataaactt ctatagttaa 1920 <210> 32 <211> 534 <212> PRT <213> Kwatta virus <400> 32 Met Asp Lys Leu Ile Ile Leu Thr Ala Cys Leu Leu Gly Val Val Ile 1 5 10 15 Ala Ser His Asp Tyr Tyr Tyr Phe Pro Val Val Gln Ser Lys Ser Phe 20 25 30 Lys Lys Leu Pro Val Gly Gln Leu Arg Cys Pro Pro His Ser Ser Glu 35 40 45 Lys Pro Leu Ser His Lys Lys Ile Trp Gly Gly Tyr Val Leu Thr Gln 50 55 60 Asn Ile Gln Thr Met Pro Gly Thr Phe Val Val Lys Gln Arg Trp Gly 65 70 75 80 Thr Thr Cys Thr Met Asn Phe Trp Gly Val Lys Thr Ile Arg His His 85 90 95 Ile Ile Asp Glu Gln Ile Leu Asp Ala Arg Phe Thr Asn Ile Thr Leu 100 105 110 Lys Pro Val Phe Pro Asp Glu Asp Cys Ser Trp Met Thr Thr Ala Thr 115 120 125 Arg Glu Ile Thr Tyr Tyr Val Gly Thr Lys Gly Glu Leu Glu Tyr Asp 130 135 140 Ile Ser Thr Gly Lys Thr Ser Asp Pro Val Phe Gly Ala Phe Ser Cys 145 150 155 160 Thr Glu Lys Leu Cys Tyr Val Asp His Arg Val Val Phe Ile Pro Asp 165 170 175 Val Ala Ile Ala Ala Thr Ser Lys Gly Phe Lys Phe Val Val Phe Glu 180 185 190 Ile Ser Thr Asp Pro Asp Gly Val Ile Arg Glu Asn Ser Val Ile Gln 195 200 205 Ser Arg Asp Phe Pro Arg Met Ser Leu Arg Lys Ala Cys Val Thr Glu 210 215 220 Glu Ser Val Leu Gly Gln Arg Arg Leu Ala Phe Ile Leu Arg Asn Gly 225 230 235 240 Phe Phe Leu Val Leu Glu Met Gly Val Lys Ser Gly Ser His Met Leu 245 250 255 Lys Lys Ser Thr Glu Thr Leu Gly Ser Glu Leu Ile Leu Arg Ala Ser 260 265 270 Leu Arg Leu Ser Asn Asp Lys Phe Lys Gly Arg Asp Leu Ser Met Leu 275 280 285 Tyr Thr Gln Glu Lys Ile Ser Gly Ala Gly Ser Ile Asp Asn Leu Leu 290 295 300 Asn Gly Phe Arg Val Cys Asp Ala Ser Asp Arg Ser Arg Ile Lys Gln 305 310 315 320 Val Gly Leu Gly Phe Asn Ser Leu Glu Gln Asp Glu Arg Ile Met Ser 325 330 335 Arg Val Asp Ser Leu Phe Cys Arg Val Thr Leu Asp Arg Ile Arg Lys 340 345 350 Cys Lys Lys Leu Thr Ser Val Glu Leu Gly Met Phe Ala Gln Asn Tyr 355 360 365 Gly Gly Pro Gly Pro Val Tyr Arg Ile Lys Asn Asp Thr Leu Glu Val 370 375 380 Ala Gln Gly Ile Tyr Lys Arg Ile Phe Trp Asp Pro Asp Thr Lys Asn 385 390 395 400 Arg Leu Gly Tyr Tyr Val Asn Glu Thr Thr Glu Lys Glu Val Asn Cys 405 410 415 Pro Glu Trp Ile Lys Ile Ser Glu Gly Phe Glu Ser Cys Ile Asn Gly 420 425 430 Ile Ile Arg Tyr Lys Asn Val Thr Ser His Pro Leu Ser Pro Val Asn 435 440 445 Asp Leu Glu Gln Glu Glu Ala Leu Phe Lys Glu His Phe Leu Glu Asp 450 455 460 Val Tyr His Val Pro Thr Gln His Leu Asn Pro Trp Ala Gly Trp Asn 465 470 475 480 Pro Leu His Pro Pro Glu Ile Asp Arg His Phe Leu Gly Leu Lys Leu 485 490 495 Pro Asn Ile Phe Gly Phe Met His Asn Phe Glu Ile Tyr Leu Val Thr 500 505 510 Phe Ile Val Gly Leu Ile Ser Leu Pro Leu Ile Ile Phe Cys Cys Arg 515 520 525 Arg Lys Ser Ser Arg Tyr 530 <210> 33 <211> 1605 <212> DNA <213> Kwatta virus <400> 33 atggacaagc tcatcatcct cacagcatgt ttgctaggag tcgtgattgc ctcacatgat 60 tactattatt ttcctgtggt gcaatcaaag tcattcaaga aactgccggt tggacaattg 120 agatgtcctc ctcattccag cgagaagcct ttgtctcata agaaaatctg ggggggttat 180 gtattaacac agaacataca gacgatgccc ggaacttttg tcgtgaaaca aaggtggggc 240 acaacatgta caatgaattt ctggggagtc aaaacaattc gacatcatat tatagatgag 300 caaatactag atgccagatt cacaaacatc accctaaagc ctgtgttccc tgatgaagat 360 tgctcttgga tgacaaccgc cacacgagaa atcacttact atgtggggac aaaaggagag 420 ctcgaatatg acatttcaac tggaaaaaca tcagacccag tcttcggcgc tttttcatgc 480 actgagaaac tgtgctatgt tgatcacaga gtggtgttta tacctgatgt ggccatagca 540 gcaaccagca aaggattcaa atttgttgtc tttgagatct ctaccgatcc ggatggtgta 600 ataagggaaa actctgtaat tcagtcacgt gacttcccca gaatgtcatt gaggaaagca 660 tgtgtcacag aagagagtgt cttaggacag cgaagattgg ctttcatctt gaggaatggg 720 ttctttttag tgctggaaat gggagtaaag agtgggagtc acatgcttaa aaaatcaact 780 gaaacattag gcagtgaatt gattctgagg gcctcccttc gattgagcaa tgacaaattc 840 aaaggtagag atctgtccat gttgtacaca caggagaaga tttcaggggc tggttccata 900 gacaatttac tcaatgggtt cagggtctgt gatgctagtg acagatctag gataaaacag 960 gtcggtcttg gattcaattc gctagagcaa gatgaacgca tcatgtctcg agtagactcc 1020 ttattttgtc gagtaactct tgacaggatt cggaaatgta agaagctcac tagtgttgaa 1080 ttgggtatgt tcgctcagaa ttatggtggt cccggtcctg tgtacagaat aaagaatgac 1140 acattagagg tagctcaagg tatttacaag aggatttttt gggatccaga cacgaaaaac 1200 cgcttaggtt attatgtgaa tgagacaacc gagaaggagg ttaactgtcc ggaatggatc 1260 aaaattagtg aaggatttga gagctgcatc aatggaatca ttaggtacaa gaatgtgaca 1320 tcgcaccctc tgtcaccagt taatgatctg gaacaggagg aggcgttgtt caaagaacac 1380 ttcttggaag atgtctatca tgtccctaca cagcatctca atccctgggc gggttggaac 1440 cccctgcatc ctcctgagat agatcgtcat ttcttaggac tcaagctgcc aaacatattt 1500 ggatttatgc ataattttga gatctactta gtgacattca tagttggatt gattagtttg 1560 cctttgatca tcttttgttg tagaagaaag tcatctagat attaa 1605 <210> 34 <211> 573 <212> PRT <213> Le dantec virus <400> 34 Met Trp Ile Ile Thr Ala Leu Ile Cys Ser Phe Ser Ile Asn Pro Thr 1 5 10 15 Cys Leu Tyr Pro His Gly His Glu Asp Ser Pro Thr Val Arg His Gly 20 25 30 Ile Ser Arg Val Leu Ser Gly Asp Ala Glu Arg Asn Asp Asp Glu His 35 40 45 Tyr His Ser Pro Pro Leu Val Leu Pro Leu Gln Asn Glu Arg Thr Trp 50 55 60 Lys Pro Ala Asn Leu Ser Ser Leu Lys Cys Pro Glu Ala Ser His Leu 65 70 75 80 Gly Pro Asp Glu His Arg Val Met Glu Lys Trp Leu Val His Arg Pro 85 90 95 Lys Ser Ser Val Leu Thr Lys Val Glu Gly Ser Leu Cys His Lys Ser 100 105 110 Arg Trp Leu Thr Arg Cys Glu Tyr Thr Trp Tyr Phe Ser Lys Thr Val 115 120 125 Ser Arg Lys Ile Glu Pro Met Pro Pro Thr Lys Gln Glu Cys Glu Glu 130 135 140 Ala Ile Lys Arg Lys Glu Glu Gly Leu Leu Glu Ser Leu Gly Phe Pro 145 150 155 160 Pro Pro Ala Cys Tyr Trp Ala Arg Thr Asn Asp Glu Glu Asn Val Gln 165 170 175 Val Asp Val Thr Asp His Pro Met Thr Tyr Asp Pro Tyr Ser Asp Gly 180 185 190 Val Val Asp Asn Ile Leu Val Gly Gly Lys Cys Asn Gln Arg Glu Cys 195 200 205 Glu Thr Val His Asp Ser Thr Ile Trp Leu Glu Thr Gln Lys Glu Lys 210 215 220 Arg Pro Ser Gln Cys Glu Met Asp Val Glu Glu Gln Leu Glu Leu Val 225 230 235 240 Ser Gly Ile Lys Arg Val Gly Gly Ser Lys Ser Lys Ala Gln Arg Ser 245 250 255 Val Phe Val Val Gly Thr Asn Tyr Pro Phe Met Asp Ala Thr Gly Ala 260 265 270 Cys Arg Leu Lys Tyr Cys Ser Lys Ser Gly Met Leu Leu Ser Asn Gly 275 280 285 Leu Trp Phe His Ile Thr Arg Lys Ile Ser Pro Glu Ser Asn Glu Asn 290 295 300 Ser Lys Phe Trp Leu Thr Leu Ser Asp Cys Ser Ser Asp Lys Gln Val 305 310 315 320 Gly Val Leu Gly Glu Glu Tyr Glu Ile Gly Lys Leu Gln Ala Thr Met 325 330 335 Glu Asp Ile Met Trp Asp Leu Asp Cys Phe Arg Thr Leu Glu Asp Leu 340 345 350 Ser His His Lys Lys Val Ser Met Leu Asp Leu Phe Arg Leu Ser Arg 355 360 365 Leu Thr Pro Gly Thr Gly Pro Ala Tyr Lys Leu Val Lys Gly Asn Leu 370 375 380 Met Val Lys Glu Val Gln Tyr Val Lys Ala Gln Arg Asp Gln Gly Glu 385 390 395 400 Leu Ala Asn Pro Leu Cys Val Ala Phe Met Thr Glu Ser Lys Asn Ala 405 410 415 Asp Arg Cys Ile Arg Tyr Asp Glu Tyr Asp Lys Glu Gly Pro Tyr Lys 420 425 430 Gly Gln Val Met Asn Gly Ile Leu Ile Asn Glu Gly Met Val Val Phe 435 440 445 Pro His Glu Arg Phe His Leu Arg Gln Trp Asp Pro Glu Phe Ile Ile 450 455 460 Lys His Glu Ile Lys Gln Val His His Pro Val Leu Gly Asn Tyr Ser 465 470 475 480 Ser Gln Ile His Asp Ser Leu His Glu Ser Leu Ile Lys Asp His Ser 485 490 495 Ala Asn Leu Gly Asp Val Met Gly Asn Trp Val Gln Val Ala Thr Ser 500 505 510 Lys Phe Ser Trp Phe Phe Lys Glu Ile Glu Lys Phe Ile Ile Gly Gly 515 520 525 Ala Leu Leu Leu Ile Phe Ile Leu Ile Ala Leu Met Val Cys Arg Gly 530 535 540 Gly Cys Cys Lys Val Arg Arg Lys Ala Gly Gly Glu Lys Gly Gly Asp 545 550 555 560 Ser Ser Gly Asp Glu Met Asn Val Ser Glu Ser Ile Phe 565 570 <210> 35 <211> 1730 <212> DNA <213> Le dantec virus <400> 35 atgtggataa tcaccgcact catttgttcc ttcagcataa atccaacttg cctttatcct 60 catggtcatg aggattctcc tactgtaaga catgggattt cccgtgtttt gtctggagac 120 gctgaacgaa atgatgatga gcattaccac agccctccct tggttttgcc tttgcaaaat 180 gaaagaactt ggaaacccgc taatttgtca agcttgaaat gccctgaagc ttcccactta 240 ggtcctgatg aacatagggt gatggagaaa tggttagttc atagaccaaa gtcatctgtc 300 ttaactaaag ttgaaggttc tttatgtcat aaatcaagat ggttgactag atgtgagtac 360 acatggtatt tttcgaaaac tgtttccagg aagattgagc cgatgcctcc tactaaacaa 420 gagtgtgaag aagcgatcaa acggaaagaa gagggattgt tggagagttt aggtttccct 480 ccaccagctt gttactgggc cagaacaaat gacgaagaaa atgtacaagt agatgtaact 540 gaccacccca tgacatatga tccttacagt gatggagttg ttgacaacat actagtaggt 600 gggaaatgca atcaaagaga atgtgagaca gttcatgact ctactatatg gttggaaact 660 cagaaagaaa agagaccatc acaatgtgaa atggacgtgg aagaacagtt agaattagtc 720 agtgggatta aacgagtagg tggttcaaaa tcaaaagcac agcgtagtgt cttcgttgtt 780 ggcacaaatt acccttttat ggatgctaca ggggcctgta gattaaaata ttgcagtaag 840 tcagggatgc ttcttagcaa tggattatgg tttcatatta cacgcaagat ctcaccagag 900 tcgaatgaaa acagtaagtt ttggttgacg ctatctgatt gttcatctga taaacaagtt 960 ggggttttag gagaggaata tgagattggg aaactccaag caacaatgga ggatatcatg 1020 tgggacttag attgttttag gacgttagag gatttatccc atcacaaaaa ggtcagcatg 1080 ttagatttgt ttagactttc tagattaaca ccaggcacag gtccagctta caagttagtt 1140 aagggaaatc ttatggttaa ggaagtacag tatgtgaaag ctcagagaga tcaaggagaa 1200 ttagcaaatc ctctatgtgt tgcttttatg acggagtcaa aaaatgcaga cagatgtatt 1260 cgttatgatg agtatgacaa agaaggtccc tataaaggcc aggtaatgaa tggaatattg 1320 attaatgagg ggatggttgt cttccctcat gagagatttc acctgaggca atgggatcca 1380 gaattcatta tcaagcatga gataaaacaa gttcatcacc ctgtattagg aaattattca 1440 agtcagattc atgattctct acatgaaagc cttattaaag atcacagtgc aaatttggga 1500 gatgtaatgg gcaactgggt tcaagtagct acatctaaat tttcttggtt cttcaaagaa 1560 atagaaaagt tcatcattgg aggagcactg ttgttgatat ttattttaat tgcactaatg 1620 gtgtgtagag gtggatgctg taaagtaaga agaaaggcag gtggggaaaa gggaggagac 1680 tcttcaggag atgaaatgaa tgtaagcgaa agcatctttt aaaaccatga 1730 <210> 36 <211> 524 <212> PRT <213> Rabies virus <400> 36 Met Val Pro Gln Val Leu Leu Phe Val Leu Leu Leu Gly Phe Ser Leu 1 5 10 15 Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Glu Leu Gly Pro 20 25 30 Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val 35 40 45 Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu 50 55 60 Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys 65 70 75 80 Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr 85 90 95 Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala 100 105 110 Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu 115 120 125 Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val 130 135 140 Arg Thr Thr Ile Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp 145 150 155 160 Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Gly 165 170 175 Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His 180 185 190 Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Arg Thr Pro Cys 195 200 205 Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Glu Ser Asn Gly Asn Lys 210 215 220 Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly 225 230 235 240 Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp 245 250 255 Gly Thr Trp Val Ala Thr Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro 260 265 270 Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu 275 280 285 His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp 290 295 300 Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu 305 310 315 320 Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile 325 330 335 Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg 340 345 350 Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly 355 360 365 Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Leu Ile Leu 370 375 380 Gly Pro Asp Asp His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu 385 390 395 400 Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His 405 410 415 Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu 420 425 430 Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly 435 440 445 Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala 450 455 460 Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys 465 470 475 480 Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr 485 490 495 Gly Gly Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser 500 505 510 Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Leu 515 520 <210> 37 <211> 1575 <212> DNA <213> Rabies virus <400> 37 atggttcctc aggttctttt gtttgtactc cttctgggtt tttcgttgtg tttcgggaag 60 ttccccattt acacgatacc agacgaactt ggtccctgga gccctattga catacaccat 120 ctcagctgtc caaataacct ggttgtggag gatgaaggat gtaccaacct gtccgagttc 180 tcctacatgg aactcaaagt gggatacatc tcagccatca aagtgaacgg gttcacttgc 240 acaggtgttg tgacagaggc agagacctac accaactttg ttggctatgt cacaaccaca 300 ttcaagagaa agcatttccg ccccacccca gacgcatgta gagccgcgta taactggaag 360 atggccggtg accccagata tgaagagtcc ctacacaatc cataccccga ctaccactgg 420 cttcgaactg taagaaccac catagagtcc ctcattatca tatccccaag tgtgacagat 480 ttggacccat atgacaaatc ccttcactcg agggtcttcc ctggcggaaa gtgctcagga 540 ataacggtgt cctctaccta ctgctcaact aaccatgatt acaccatttg gatgcccgag 600 aatccgagac caaggacacc ttgtgacatt tttaccaata gcagagggaa gagagaatcc 660 aacgggaaca agacttgcgg ctttgtggat gaaagaggcc tgtataagtc tctaaaagga 720 gcatgcaggc tcaagttatg tggagttctt ggacttagac ttatggatgg aacatgggtc 780 gcgacgcaaa catcagatga gaccaaatgg tgccctccag atcagttggt gaatttgcac 840 gactttcgct cagacgagat tgagcatctc gttgtggagg agttagtcaa gaaaagagag 900 gaatgtctgg atgcattaga gtccatcatg accaccaagt cagtaagttt cagacgtctc 960 agtcacctga gaaaacttgt cccagggttt ggaaaagcat ataccatatt caacaaaacc 1020 ttgatggagg ctgatgctca ctacaagtca gtccggacct ggaatgagat catcccctca 1080 aaagggtgtt tgaaagttgg aggaaggtgc catcctcatg taaacggggt gtttttcaat 1140 ggtttaatat tagggcctga cgaccatgtc ctaatcccag agatgcaatc atccctcctc 1200 cagcaacata tggagttgct ggaatcttca gttatccccc tgatgcaccc cctggcagac 1260 ccttctacag ttttcaaaga aggtgatgag gctgaggatt ttgttgaagt tcacctcccc 1320 gatgtgtaca aacagatctc aggggttgac ctgggtctcc cgaactgggg aaagtatgta 1380 ttgatgactg caggggccat gattggcctg gtgttgatat tttccctaat gacatggtgc 1440 agaagagcca atcgaccaga atcgaaacaa cgcagttttg gagggacagg ggggaatgtg 1500 tcagtcactt cccaaagcgg aaaagtcata ccttcatggg aatcatataa gagtggaggt 1560 gagaccagac tgtga 1575 <210> 38 <211> 5670 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <220> <221> misc_feature <223> plasmid with gene for human L-Selectin <220> <221> misc_feature <222> (985)..(1004) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2163)..(2174) <223> n is a, c, g, t or u <220> <221> misc_feature <222> (2202)..(2202) <223> n is a, c, g, t or u <400> 38 aacaaaatat taacgcttac aatttccatt cgccattcag gctgcgcaac tgttgggaag 60 ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 120 ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 180 gtgccaagct gatctataca ttgaatcaat attggcaatt agccatatta gtcattggtt 240 atatagcata aatcaatatt ggctattggc cattgcatac gttgtatcta tatcataata 300 tgtacattta tattggctca tgtccaatat gaccgccatg ttgacattga ttattgacta 360 gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 420 ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 480 cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 540 gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 600 gtccgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 660 tgaccttacg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 720 tggtgatgcg gttttggcag tacaccaatg ggcgtggata gcggtttgac tcacggggat 780 ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 840 actttccaaa atgtcgtaat aaccccgccc cgttgacgca aatgggcggt aggcgtgtac 900 ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagaatttt gtaatacgac 960 tcactatagg gcggccgcga attcnnnnnn nnnnnnnnnn nnnnatgggc tgcagaagaa 1020 ctagagaagg accaagcaaa gccatgatat ttccatggaa atgtcagagc acccagaggg 1080 acttatggaa catcttcaag ttgtgggggt ggacaatgct ctgttgtgat ttcctggcac 1140 atcatggaac cgactgctgg acttaccatt attctgaaaa acccatgaac tggcaaaggg 1200 ctagaagatt ctgccgagac aattacacag atttagttgc catacaaaac aaggcggaaa 1260 ttgagtatct ggagaagact ctgcctttca gtcgttctta ctactggata ggaatccgga 1320 agataggagg aatatggacg tgggtgggaa ccaacaaatc tcttactgaa gaagcagaga 1380 actggggaga tggtgagccc aacaacaaga agaacaagga ggactgcgtg gagatctata 1440 tcaagagaaa caaagatgca ggcaaatgga acgatgacgc ctgccacaaa ctaaaggcag 1500 ccctctgtta cacagcttct tgccagccct ggtcatgcag tggccatgga gaatgtgtag 1560 aaatcatcaa taattacacc tgcaactgtg atgtggggta ctatgggccc cagtgtcagt 1620 ttgtgattca gtgtgagcct ttggaggccc cagagctggg taccatggac tgtactcacc 1680 ctttgggaaa cttcagcttc agctcacagt gtgccttcag ctgctctgaa ggaacaaact 1740 taactgggat tgaagaaacc acctgtggac catttggaaa ctggtcatct ccagaaccaa 1800 cctgtcaagt gattcagtgt gagcctctat cagcaccaga tttggggatc atgaactgta 1860 gccatcccct ggccagcttc agctttacct ctgcatgtac cttcatctgc tcagaaggaa 1920 ctgagttaat tgggaagaag aaaaccattt gtgaatcatc tggaatctgg tcaaatccta 1980 gtccaatatg tcaaaaattg gacaaaagtt tctcaatgat taaggagggt gattataacc 2040 ccctcttcat tccagtggca gtcatggtta ctgcattctc tgggttggca tttatcattt 2100 ggctggcaag gagattaaaa aaaggcaaga aatccaagag aagtatgaat gacccatatt 2160 aannnnnnnn nnnnagatct ggtaccgata tcaagcttgt cngactctag attgcggccg 2220 cggtcatagc tgtttcctga acagatcccg ggtggcatcc ctgtgacccc tccccagtgc 2280 ctctcctggc cctggaagtt gccactccag tgcccaccag ccttgtccta ataaaattaa 2340 gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 2400 tatggagcaa ggggcaagtt gggaagacaa cctgtagggc ctgcggggtc tattgggaac 2460 caagctggag tgcagtggca caatcttggc tcactgcaat ctccgcctcc tgggttcaag 2520 cgattctcct gcctcagcct cccgagttgt tgggattcca ggcatgcatg accaggctca 2580 gctaattttt gtttttttgg tagagacggg gtttcaccat attggccagg ctggtctcca 2640 actcctaatc tcaggtgatc tacccacctt ggcctcccaa attgctggga ttacaggcgt 2700 gaaccactgc tcccttccct gtccttctga ttttaaaata actataccag caggaggacg 2760 tccagacaca gcataggcta cctggccatg cccaaccggt gggacatttg agttgcttgc 2820 ttggcactgt cctctcatgc gttgggtcca ctcagtagat gcctgttgaa ttgggtacgc 2880 ggccagcttg gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag 2940 caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc 3000 caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag 3060 tcccgcccct aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc 3120 cccatggctg actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc 3180 tattccagaa gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcctcg 3240 actgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 3300 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 3360 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 3420 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 3480 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 3540 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 3600 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 3660 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 3720 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 3780 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 3840 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 3900 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 3960 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4020 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4080 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4140 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4200 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4260 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 4320 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4380 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 4440 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 4500 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 4560 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 4620 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 4680 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 4740 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 4800 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 4860 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 4920 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 4980 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5040 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5100 cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5160 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5220 gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 5280 cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 5340 tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 5400 ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 5460 tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 5520 taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 5580 tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 5640 aaaatttaac gcgaatttta acaaaatatt 5670 <210> 39 <211> 385 <212> PRT <213> Homo sapiens <400> 39 Met Gly Cys Arg Arg Thr Arg Glu Gly Pro Ser Lys Ala Met Ile Phe 1 5 10 15 Pro Trp Lys Cys Gln Ser Thr Gln Arg Asp Leu Trp Asn Ile Phe Lys 20 25 30 Leu Trp Gly Trp Thr Met Leu Cys Cys Asp Phe Leu Ala His His Gly 35 40 45 Thr Asp Cys Trp Thr Tyr His Tyr Ser Glu Lys Pro Met Asn Trp Gln 50 55 60 Arg Ala Arg Arg Phe Cys Arg Asp Asn Tyr Thr Asp Leu Val Ala Ile 65 70 75 80 Gln Asn Lys Ala Glu Ile Glu Tyr Leu Glu Lys Thr Leu Pro Phe Ser 85 90 95 Arg Ser Tyr Tyr Trp Ile Gly Ile Arg Lys Ile Gly Gly Ile Trp Thr 100 105 110 Trp Val Gly Thr Asn Lys Ser Leu Thr Glu Glu Ala Glu Asn Trp Gly 115 120 125 Asp Gly Glu Pro Asn Asn Lys Lys Asn Lys Glu Asp Cys Val Glu Ile 130 135 140 Tyr Ile Lys Arg Asn Lys Asp Ala Gly Lys Trp Asn Asp Asp Ala Cys 145 150 155 160 His Lys Leu Lys Ala Ala Leu Cys Tyr Thr Ala Ser Cys Gln Pro Trp 165 170 175 Ser Cys Ser Gly His Gly Glu Cys Val Glu Ile Ile Asn Asn Tyr Thr 180 185 190 Cys Asn Cys Asp Val Gly Tyr Tyr Gly Pro Gln Cys Gln Phe Val Ile 195 200 205 Gln Cys Glu Pro Leu Glu Ala Pro Glu Leu Gly Thr Met Asp Cys Thr 210 215 220 His Pro Leu Gly Asn Phe Ser Phe Ser Ser Gln Cys Ala Phe Ser Cys 225 230 235 240 Ser Glu Gly Thr Asn Leu Thr Gly Ile Glu Glu Thr Thr Cys Gly Pro 245 250 255 Phe Gly Asn Trp Ser Ser Pro Glu Pro Thr Cys Gln Val Ile Gln Cys 260 265 270 Glu Pro Leu Ser Ala Pro Asp Leu Gly Ile Met Asn Cys Ser His Pro 275 280 285 Leu Ala Ser Phe Ser Phe Thr Ser Ala Cys Thr Phe Ile Cys Ser Glu 290 295 300 Gly Thr Glu Leu Ile Gly Lys Lys Lys Thr Ile Cys Glu Ser Ser Gly 305 310 315 320 Ile Trp Ser Asn Pro Ser Pro Ile Cys Gln Lys Leu Asp Lys Ser Phe 325 330 335 Ser Met Ile Lys Glu Gly Asp Tyr Asn Pro Leu Phe Ile Pro Val Ala 340 345 350 Val Met Val Thr Ala Phe Ser Gly Leu Ala Phe Ile Ile Trp Leu Ala 355 360 365 Arg Arg Leu Lys Lys Gly Lys Lys Ser Lys Arg Ser Met Asn Asp Pro 370 375 380 Tyr 385 <210> 40 <211> 1158 <212> DNA <213> Homo sapiens <400> 40 atgggctgca gaagaactag agaaggacca agcaaagcca tgatatttcc atggaaatgt 60 cagagcaccc agagggactt atggaacatc ttcaagttgt gggggtggac aatgctctgt 120 tgtgatttcc tggcacatca tggaaccgac tgctggactt accattattc tgaaaaaccc 180 atgaactggc aaagggctag aagattctgc cgagacaatt acacagattt agttgccata 240 caaaacaagg cggaaattga gtatctggag aagactctgc ctttcagtcg ttcttactac 300 tggataggaa tccggaagat aggaggaata tggacgtggg tgggaaccaa caaatctctt 360 actgaagaag cagagaactg gggagatggt gagcccaaca acaagaagaa caaggaggac 420 tgcgtggaga tctatatcaa gagaaacaaa gatgcaggca aatggaacga tgacgcctgc 480 cacaaactaa aggcagccct ctgttacaca gcttcttgcc agccctggtc atgcagtggc 540 catggagaat gtgtagaaat catcaataat tacacctgca actgtgatgt ggggtactat 600 gggccccagt gtcagtttgt gattcagtgt gagcctttgg aggccccaga gctgggtacc 660 atggactgta ctcacccttt gggaaacttc agcttcagct cacagtgtgc cttcagctgc 720 tctgaaggaa caaacttaac tgggattgaa gaaaccacct gtggaccatt tggaaactgg 780 tcatctccag aaccaacctg tcaagtgatt cagtgtgagc ctctatcagc accagatttg 840 gggatcatga actgtagcca tcccctggcc agcttcagct ttacctctgc atgtaccttc 900 atctgctcag aaggaactga gttaattggg aagaagaaaa ccatttgtga atcatctgga 960 atctggtcaa atcctagtcc aatatgtcaa aaattggaca aaagtttctc aatgattaag 1020 gagggtgatt ataaccccct cttcattcca gtggcagtca tggttactgc attctctggg 1080 ttggcattta tcatttggct ggcaaggaga ttaaaaaaag gcaagaaatc caagagaagt 1140 atgaatgacc catattaa 1158 <210> 41 <211> 496 <212> PRT <213> Machupo arenavirus <400> 41 Met Gly Gln Leu Ile Ser Phe Phe Gln Glu Ile Pro Val Phe Leu Gln 1 5 10 15 Glu Ala Leu Asn Ile Ala Leu Val Ala Val Ser Leu Ile Ala Val Ile 20 25 30 Lys Gly Ile Ile Asn Leu Tyr Lys Ser Gly Leu Phe Gln Phe Ile Phe 35 40 45 Phe Leu Leu Leu Ala Gly Arg Ser Cys Ser Asp Gly Thr Phe Lys Ile 50 55 60 Gly Leu His Thr Glu Phe Gln Ser Val Thr Leu Thr Met Gln Arg Leu 65 70 75 80 Leu Ala Asn His Ser Asn Glu Leu Pro Ser Leu Cys Met Leu Asn Asn 85 90 95 Ser Phe Tyr Tyr Met Arg Gly Gly Val Asn Thr Phe Leu Ile Arg Val 100 105 110 Ser Asp Ile Ser Val Leu Met Lys Glu Tyr Asp Val Ser Ile Tyr Glu 115 120 125 Pro Glu Asp Leu Gly Asn Cys Leu Asn Lys Ser Asp Ser Ser Trp Ala 130 135 140 Ile His Trp Phe Ser Asn Ala Leu Gly His Asp Trp Leu Met Asp Pro 145 150 155 160 Pro Met Leu Cys Arg Asn Lys Thr Lys Lys Glu Gly Ser Asn Ile Gln 165 170 175 Phe Asn Ile Ser Lys Ala Asp Asp Ala Arg Val Tyr Gly Lys Lys Ile 180 185 190 Arg Asn Gly Met Arg His Leu Phe Arg Gly Phe His Asp Pro Cys Glu 195 200 205 Glu Gly Lys Val Cys Tyr Leu Thr Ile Asn Gln Cys Gly Asp Pro Ser 210 215 220 Ser Phe Asp Tyr Cys Gly Val Asn His Leu Ser Lys Cys Gln Phe Asp 225 230 235 240 His Val Asn Thr Leu His Phe Leu Val Arg Ser Lys Thr His Leu Asn 245 250 255 Phe Glu Arg Ser Leu Lys Ala Phe Phe Ser Trp Ser Leu Thr Asp Ser 260 265 270 Ser Gly Lys Asp Met Pro Gly Gly Tyr Cys Leu Glu Glu Trp Met Leu 275 280 285 Ile Ala Ala Lys Met Lys Cys Phe Gly Asn Thr Ala Val Ala Lys Cys 290 295 300 Asn Gln Asn His Asp Ser Glu Phe Cys Asp Met Leu Arg Leu Phe Asp 305 310 315 320 Tyr Asn Lys Asn Ala Ile Lys Thr Leu Asn Asp Glu Ser Lys Lys Glu 325 330 335 Ile Asn Leu Leu Ser Gln Thr Val Asn Ala Leu Ile Ser Asp Asn Leu 340 345 350 Leu Met Lys Asn Lys Ile Lys Glu Leu Met Ser Ile Pro Tyr Cys Asn 355 360 365 Tyr Thr Lys Phe Trp Tyr Val Asn His Thr Leu Thr Gly Gln His Thr 370 375 380 Leu Pro Arg Cys Trp Leu Ile Arg Asn Gly Ser Tyr Leu Asn Thr Ser 385 390 395 400 Glu Phe Arg Asn Asp Trp Ile Leu Glu Ser Asp His Leu Ile Ser Glu 405 410 415 Met Leu Ser Lys Glu Tyr Ala Glu Arg Gln Gly Lys Thr Pro Ile Thr 420 425 430 Leu Val Asp Ile Cys Phe Trp Ser Thr Ile Phe Phe Thr Ala Ser Leu 435 440 445 Phe Leu His Leu Val Gly Ile Pro Thr His Arg His Leu Lys Gly Glu 450 455 460 Ala Cys Pro Leu Pro His Lys Leu Asp Ser Phe Gly Gly Cys Arg Cys 465 470 475 480 Gly Lys Tyr Pro Arg Leu Lys Lys Pro Thr Ile Trp His Lys Arg His 485 490 495 <210> 42 <211> 1491 <212> DNA <213> Machupo arenavirus <400> 42 atggggcagc ttatcagctt ctttcaggag attcctgttt ttctacagga agctctgaac 60 atcgctttag tggctgttag tctcatagct gtcatcaaag gcatcattaa cctttacaaa 120 agtggtctct tccagttcat cttctttctc ctcctagcag ggaggtcctg ctcggatggc 180 acattcaaaa taggcctaca cactgagttc cagtcagtca cccttaccat gcagagactt 240 ttagctaacc attcaaatga gctcccatct ctctgcatgc ttaacaatag tttttattat 300 atgaggggag gtgtgaacac cttcctgatt cgtgtttctg atatttcagt cctcatgaag 360 gagtatgatg tatcaatcta tgaaccagaa gaccttggaa attgtcttaa caagtctgac 420 tcaagctggg ctattcattg gttctcaaat gctttgggac atgactggct tatggatcct 480 ccaatgctat gtagaaacaa gacaaagaag gagggatcta acattcaatt caacatcagc 540 aaagctgatg atgccagagt gtatggaaag aagataagaa atggtatgag gcatctcttc 600 aggggcttcc atgacccgtg tgaggaaggg aaagtgtgct acctgaccat caatcagtgt 660 ggtgacccca gttcctttga ctactgtggc gtgaatcatc tttccaaatg tcagtttgac 720 catgtgaaca cccttcattt ccttgtgaga agtaagacac atctcaactt tgagaggtct 780 ttgaaagcat ttttctcatg gtctctgaca gactcctcag gaaaggacat gccaggaggt 840 tattgtctag aggaatggat gttgatagca gccaaaatga aatgtttcgg aaacactgct 900 gttgctaaat gtaatcaaaa tcatgactca gagttctgtg atatgctgag gctattcgac 960 tataacaaga atgcaataaa gaccctcaat gatgaatcaa agaaagaaat caatcttcta 1020 agccagacag tgaatgcctt aatctcagat aatttgttaa tgaagaataa aattaaagag 1080 ctaatgagca tcccttattg taattacaca aagttttggt atgtcaatca taccctgaca 1140 gggcagcaca ctcttccaag atgttggttg ataaggaatg gaagttatct taacacttct 1200 gaattcagga atgactggat tttagagagt gatcacctca tctcagagat gttaagtaag 1260 gaatatgctg aaaggcaagg caaaacccca atcacattag ttgatatttg tttctggagc 1320 acaattttct tcacagcatc attgttcctt catctagtcg gaatacccac ccatcgacac 1380 ctcaaaggcg aagcctgtcc tttgcctcat aagctggaca gcttcggagg ttgtagatgt 1440 ggcaaatatc ccagattgaa gaaacccacc atctggcaca aaagacatta a 1491 <210> 43 <211> 511 <212> PRT <213> Cocal virus <400> 43 Met Asn Phe Leu Leu Leu Thr Phe Ile Val Leu Pro Leu Cys Ser His 1 5 10 15 Ala Lys Phe Ser Ile Val Phe Pro Gln Ser Gln Lys Gly Asn Trp Lys 20 25 30 Asn Val Pro Ser Ser Tyr His Tyr Cys Pro Ser Ser Ser Asp Gln Asn 35 40 45 Trp His Asn Asp Leu Leu Gly Ile Thr Met Lys Val Lys Met Pro Lys 50 55 60 Thr His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ala Lys 65 70 75 80 Trp Ile Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr 85 90 95 His Ser Ile His Ser Ile Gln Pro Thr Ser Glu Gln Cys Lys Glu Ser 100 105 110 Ile Lys Gln Thr Lys Gln Gly Thr Trp Met Ser Pro Gly Phe Pro Pro 115 120 125 Gln Asn Cys Gly Tyr Ala Thr Val Thr Asp Ser Val Ala Val Val Val 130 135 140 Gln Ala Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp 145 150 155 160 Ile Asp Ser Gln Phe Pro Asn Gly Lys Cys Glu Thr Glu Glu Cys Glu 165 170 175 Thr Val His Asn Ser Thr Val Trp Tyr Ser Asp Tyr Lys Val Thr Gly 180 185 190 Leu Cys Asp Ala Thr Leu Val Asp Thr Glu Ile Thr Phe Phe Ser Glu 195 200 205 Asp Gly Lys Lys Glu Ser Ile Gly Lys Pro Asn Thr Gly Tyr Arg Ser 210 215 220 Asn Tyr Phe Ala Tyr Glu Lys Gly Asp Lys Val Cys Lys Met Asn Tyr 225 230 235 240 Cys Lys His Ala Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Phe 245 250 255 Val Asp Gln Asp Val Tyr Ala Ala Ala Lys Leu Pro Glu Cys Pro Val 260 265 270 Gly Ala Thr Ile Ser Ala Pro Thr Gln Thr Ser Val Asp Val Ser Leu 275 280 285 Ile Leu Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr 290 295 300 Trp Ser Lys Ile Arg Ser Lys Gln Pro Val Ser Pro Val Asp Leu Ser 305 310 315 320 Tyr Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile 325 330 335 Asn Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Ile Asp Ile 340 345 350 Asp Asn Pro Ile Ile Ser Lys Met Val Gly Lys Ile Ser Gly Ser Gln 355 360 365 Thr Glu Arg Glu Leu Trp Thr Glu Trp Phe Pro Tyr Glu Gly Val Glu 370 375 380 Ile Gly Pro Asn Gly Ile Leu Lys Thr Pro Thr Gly Tyr Lys Phe Pro 385 390 395 400 Leu Phe Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Lys Thr 405 410 415 Ser Gln Ala Glu Val Phe Glu His Pro His Leu Ala Glu Ala Pro Lys 420 425 430 Gln Leu Pro Glu Glu Glu Thr Leu Phe Phe Gly Asp Thr Gly Ile Ser 435 440 445 Lys Asn Pro Val Glu Leu Ile Glu Gly Trp Phe Ser Ser Trp Lys Ser 450 455 460 Thr Val Val Thr Phe Phe Phe Ala Ile Gly Val Phe Ile Leu Leu Tyr 465 470 475 480 Val Val Ala Arg Ile Val Ala Val Arg Tyr Arg Tyr Gln Gly Ser Asn 485 490 495 Asn Lys Arg Ile Tyr Asn Asp Ile Glu Met Ser Arg Phe Arg Lys 500 505 510 <210> 44 <211> 6507 <212> DNA <213> Artificial Sequence <220> <223> Synethic Plasmid <220> <221> misc_feature <223> plasmid with a sequence from Indiana vesiculovirus <400> 44 gagcttggcc cattgcatac gttgtatcca tatcataata tgtacattta tattggctca 60 tgtccaacat taccgccatg ttgacattga ttattgacta gttattaata gtaatcaatt 120 acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 180 ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 240 cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 300 actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 360 aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 420 acttggcagt acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag 480 tacatcaatg ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt 540 gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac 600 aactccgccc cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc 660 agagctcgtt tagtgaaccg tcagatcgcc tggagacgcc atccacgctg ttttgacctc 720 catagaagac accgggaccg atccagcctc cggtcgaccg atcctgagaa cttcagggtg 780 agtttgggga cccttgattg ttctttcttt ttcgctattg taaaattcat gttatatgga 840 gggggcaaag ttttcagggt gttgtttaga atgggaagat gtcccttgta tcaccatgga 900 ccctcatgat aattttgttt ctttcacttt ctactctgtt gacaaccatt gtctcctctt 960 attttctttt cattttctgt aactttttcg ttaaacttta gcttgcattt gtaacgaatt 1020 tttaaattca cttttgttta tttgtcagat tgtaagtact ttctctaatc actttttttt 1080 caaggcaatc agggtatatt atattgtact tcagcacagt tttagagaac aattgttata 1140 attaaatgat aaggtagaat atttctgcat ataaattctg gctggcgtgg aaatattctt 1200 attggtagaa acaactacac cctggtcatc atcctgcctt tctctttatg gttacaatga 1260 tatacactgt ttgagatgag gataaaatac tctgagtcca aaccgggccc ctctgctaac 1320 catgttcatg ccttcttctc tttcctacag ctcctgggca acgtgctggt tgttgtgctg 1380 tctcatcatt ttggcaaaga attcctcgac ggatccctcg aggaattctg acactatgaa 1440 gtgccttttg tacttagcct ttttattcat tggggtgaat tgcaagttca ccatagtttt 1500 tccacacaac caaaaaggaa actggaaaaa tgttccttct aattaccatt attgcccgtc 1560 aagctcagat ttaaattggc ataatgactt aataggcaca gccttacaag tcaaaatgcc 1620 caagagtcac aaggctattc aagcagacgg ttggatgtgt catgcttcca aatgggtcac 1680 tacttgtgat ttccgctggt atggaccgaa gtatataaca cattccatcc gatccttcac 1740 tccatctgta gaacaatgca aggaaagcat tgaacaaacg aaacaaggaa cttggctgaa 1800 tccaggcttc cctcctcaaa gttgtggata tgcaactgtg acggatgccg aagcagtgat 1860 tgtccaggtg actcctcacc atgtgctggt tgatgaatac acaggagaat gggttgattc 1920 acagttcatc aacggaaaat gcagcaatta catatgcccc actgtccata actctacaac 1980 ctggcattct gactataagg tcaaagggct atgtgattct aacctcattt ccatggacat 2040 caccttcttc tcagaggacg gagagctatc atccctggga aaggagggca cagggttcag 2100 aagtaactac tttgcttatg aaactggagg caaggcctgc aaaatgcaat actgcaagca 2160 ttggggagtc agactcccat caggtgtctg gttcgagatg gctgataagg atctctttgc 2220 tgcagccaga ttccctgaat gcccagaagg gtcaagtatc tctgctccat ctcagacctc 2280 agtggatgta agtctaattc aggacgttga gaggatcttg gattattccc tctgccaaga 2340 aacctggagc aaaatcagag cgggtcttcc aatctctcca gtggatctca gctatcttgc 2400 tcctaaaaac ccaggaaccg gtcctgcttt caccataatc aatggtaccc taaaatactt 2460 tgagaccaga tacatcagag tcgatattgc tgctccaatc ctctcaagaa tggtcggaat 2520 gatcagtgga actaccacag aaagggaact gtgggatgac tgggcaccat atgaagacgt 2580 ggaaattgga cccaatggag ttctgaggac cagttcagga tataagtttc ctttatacat 2640 gattggacat ggtatgttgg actccgatct tcatcttagc tcaaaggctc aggtgttcga 2700 acatcctcac attcaagacg ctgcttcgca acttcctgat gatgagagtt tattttttgg 2760 tgatactggg ctatccaaaa atccaatcga gcttgtagaa ggttggttca gtagttggaa 2820 aagctctatt gcctcttttt tctttatcat agggttaatc attggactat tcttggttct 2880 ccgagttggt atccatcttt gcattaaatt aaagcacacc aagaaaagac agatttatac 2940 agacatagag atgaaccgac ttggaaagta actcaaatcc tgcacaacag attcttcatg 3000 tttggaccaa atcaacttgt gataccatgc tcaaagaggc ctcaattata tttgagtttt 3060 taatttttat gaaaaaaaaa aaaaaaaacg gaattcctcg agggatccgt cgaggaattc 3120 actcctcagg tgcaggctgc ctatcagaag gtggtggctg gtgtggccaa tgccctggct 3180 cacaaatacc actgagatct ttttccctct gccaaaaatt atggggacat catgaagccc 3240 cttgagcatc tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg 3300 aattttttgt gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag 3360 aatgagtatt tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa 3420 ggttggctat aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc 3480 catagaaaag ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt 3540 tctttaacat ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc 3600 tgactactcc cagtcatagc tgtccctctt ctcttatgga gatccctcga cggatcggcc 3660 gcaattcgta atcatgtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc 3720 acacaacata cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta 3780 actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 3840 gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc 3900 cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc 3960 tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat 4020 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 4080 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 4140 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 4200 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 4260 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 4320 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 4380 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 4440 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 4500 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 4560 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 4620 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 4680 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 4740 gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc 4800 aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 4860 acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 4920 gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 4980 cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 5040 cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 5100 tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 5160 cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 5220 gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 5280 cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 5340 ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 5400 gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 5460 taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 5520 gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 5580 acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 5640 aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 5700 cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 5760 atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 5820 gccacctaaa ttgtaagcgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc 5880 agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag 5940 accgagatag ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg 6000 gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca 6060 tcaccctaat caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa 6120 gggagccccc gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg 6180 aagaaagcga aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta 6240 accaccacac ccgccgcgct taatgcgccg ctacagggcg cgtcccattc gccattcagg 6300 ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 6360 aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 6420 cgttgtaaaa cgacggccag tgagcgcgcg taatacgact cactataggg cgaattggag 6480 ctccaccgcg gtggcggccg ctctaga 6507 <210> 45 <211> 6805 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <400> 45 aacaaaatat taacgcttac aatttccatt cgccattcag gctgcgcaac tgttgggaag 60 ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 120 ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 180 gtgccaagct gatctataca ttgaatcaat attggcaatt agccatatta gtcattggtt 240 atatagcata aatcaatatt ggctattggc cattgcatac gttgtatcta tatcataata 300 tgtacattta tattggctca tgtccaatat gaccgccatg ttgacattga ttattgacta 360 gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 420 ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 480 cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 540 gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 600 gtccgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 660 tgaccttacg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 720 tggtgatgcg gttttggcag tacaccaatg ggcgtggata gcggtttgac tcacggggat 780 ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 840 actttccaaa atgtcgtaat aaccccgccc cgttgacgca aatgggcggt aggcgtgtac 900 ggtgggaggt ctatataagc agagctcgtt tagtgaaccg tcagaatttt gtaatacgac 960 tcactatagg gcggccgcga attcggcacg aggcagcaca gcacactccc tttgggcaag 1020 gacctgagac ccttgtgcta agtcaagagg ctcaatgggc tgcagaagaa ctagagaagg 1080 accaagcaaa gccatgatat ttccatggaa atgtcagagc acccagaggg acttatggaa 1140 catcttcaag ttgtgggggt ggacaatgct ctgttgtgat ttcctggcac atcatggaac 1200 cgactgctgg acttaccatt attctgaaaa acccatgaac tggcaaaggg ctagaagatt 1260 ctgccgagac aattacacag atttagttgc catacaaaac aaggcggaaa ttgagtatct 1320 ggagaagact ctgcctttca gtcgttctta ctactggata ggaatccgga agataggagg 1380 aatatggacg tgggtgggaa ccaacaaatc tcttactgaa gaagcagaga actggggaga 1440 tggtgagccc aacaacaaga agaacaagga ggactgcgtg gagatctata tcaagagaaa 1500 caaagatgca ggcaaatgga acgatgacgc ctgccacaaa ctaaaggcag ccctctgtta 1560 cacagcttct tgccagccct ggtcatgcag tggccatgga gaatgtgtag aaatcatcaa 1620 taattacacc tgcaactgtg atgtggggta ctatgggccc cagtgtcagt ttgtgattca 1680 gtgtgagcct ttggaggccc cagagctggg taccatggac tgtactcacc ctttgggaaa 1740 cttcagcttc agctcacagt gtgccttcag ctgctctgaa ggaacaaact taactgggat 1800 tgaagaaacc acctgtggac catttggaaa ctggtcatct ccagaaccaa cctgtcaagt 1860 gattcagtgt gagcctctat cagcaccaga tttggggatc atgaactgta gccatcccct 1920 ggccagcttc agctttacct ctgcatgtac cttcatctgc tcagaaggaa ctgagttaat 1980 tgggaagaag aaaaccattt gtgaatcatc tggaatctgg tcaaatccta gtccaatatg 2040 tcaaaaattg gacaaaagtt tctcaatgat taaggagggt gattataacc ccctcttcat 2100 tccagtggca gtcatggtta ctgcattctc tgggttggca tttatcattt ggctggcaag 2160 gagattaaaa aaaggcaaga aatccaagag aagtatgaat gacccatatt aaatcgccct 2220 tggtgaaaga aaattcttgg aatactaaaa atcatgagat cctttaaatc cttccatgaa 2280 acgttttgtg tggtggcacc tcctacgtca aacatgaagt gtgtttcctt cagtgcatct 2340 gggaagattt ctacctgacc aacagttcct tcagcttcca tttcgcccct catttatccc 2400 tcaaccccca gcccacaggt gtttatacag ctcagctttt tgtcttttct gaggagaaac 2460 aaataagacc ataaagggaa aggattcatg tggaatataa agatggctga ctttgctctt 2520 tcttgactct tgttttcagt ttcaattcag tgctgtactt gatgacagac acttctaaat 2580 gaagtgcaaa tttgatacat atgtgaatat ggactcagtt ttcttgcaga tcaaatttca 2640 cgtcgtcttc tgtatactgt ggaggtacac tcttatagaa agttcaaaaa gtctacgctc 2700 tcctttcttt ctaactccag tgaagtaatg gggtcctgct caagttgaaa gagtcctatt 2760 tgcactgtag cctcgccgtc tgtgaattgg accatcctat ttaactggct tcagcctccc 2820 caccttcttc agccacctct ctttttcagt tggctgactt ccacacctag catctcatga 2880 gtgccaagca aaaggagaga agagagaaat agcctgcgct gttttttagt ttgggggttt 2940 tgctgtttcc ttttatgaga cccattccta tttcttatag tcaatgtttc ttttatcacg 3000 atattattag taagaaaaca tcactgaaat gctagctgca agtgacatct ctttgatgtc 3060 atatggaaga gttaaaacag gtggagaaat tccttgattc acaatgaaat gctctccttt 3120 cccctgcccc cagacctttt atccacttac ctagattcta catattcttt aaatttcatc 3180 tcaggcctcc ctcaacccca ccacttcttt tataactagt cctttactaa tccaacccat 3240 gatgagctcc tcttcctggc ttcttactga aaggttaccc tgtaacatgc aattttgcat 3300 ttgaataaag cctgcttttt aagtgttaaa aaaaaaaaaa aaaaactcga ctctagattg 3360 cggccgcggt catagctgtt tcctgaacag atcccgggtg gcatccctgt gacccctccc 3420 cagtgcctct cctggccctg gaagttgcca ctccagtgcc caccagcctt gtcctaataa 3480 aattaagttg catcattttg tctgactagg tgtccttcta taatattatg gggtggaggg 3540 gggtggtatg gagcaagggg caagttggga agacaacctg tagggcctgc ggggtctatt 3600 gggaaccaag ctggagtgca gtggcacaat cttggctcac tgcaatctcc gcctcctggg 3660 ttcaagcgat tctcctgcct cagcctcccg agttgttggg attccaggca tgcatgacca 3720 ggctcagcta atttttgttt ttttggtaga gacggggttt caccatattg gccaggctgg 3780 tctccaactc ctaatctcag gtgatctacc caccttggcc tcccaaattg ctgggattac 3840 aggcgtgaac cactgctccc ttccctgtcc ttctgatttt aaaataacta taccagcagg 3900 aggacgtcca gacacagcat aggctacctg gccatgccca accggtggga catttgagtt 3960 gcttgcttgg cactgtcctc tcatgcgttg ggtccactca gtagatgcct gttgaattgg 4020 gtacgcggcc agcttggctg tggaatgtgt gtcagttagg gtgtggaaag tccccaggct 4080 ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 4140 agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 4200 ccatagtccc gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt 4260 ctccgcccca tggctgacta atttttttta tttatgcaga ggccgaggcc gcctcggcct 4320 ctgagctatt ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc 4380 tcctcgactg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 4440 ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 4500 atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 4560 gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 4620 gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 4680 gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 4740 gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 4800 aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 4860 ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 4920 taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 4980 tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 5040 gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 5100 taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 5160 tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 5220 tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 5280 ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 5340 taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 5400 tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 5460 cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 5520 gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 5580 cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 5640 ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 5700 aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 5760 atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 5820 tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 5880 gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 5940 aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 6000 acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 6060 ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 6120 tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 6180 aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 6240 catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 6300 atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 6360 aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 6420 gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 6480 ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 6540 agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 6600 ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 6660 gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 6720 ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 6780 ttaacaaaaa tttaacgcga atttt 6805 <210> 46 <211> 7411 <212> DNA <213> Artificial Sequence <220> <223> Synethetic plasmid <400> 46 caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 60 attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 120 aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 180 tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 240 agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 300 gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 360 cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 420 agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 480 taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 540 tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 600 taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 660 acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 720 ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 780 cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 840 agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 900 tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 960 agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1020 tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 1080 ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 1140 tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 1200 aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 1260 tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 1320 agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 1380 taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 1440 caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 1500 agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 1560 aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 1620 gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 1680 tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 1740 gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 1800 ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 1860 ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 1920 aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 1980 aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 2040 atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 2100 tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 2160 acgccaagcg cgcaattaac cctcactaaa gggaacaaaa gctggagctg caagcttggc 2220 cattgcatac gttgtatcca tatcataata tgtacattta tattggctca tgtccaacat 2280 taccgccatg ttgacattga ttattgacta gttattaata gtaatcaatt acggggtcat 2340 tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat ggcccgcctg 2400 gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 2460 cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact 2520 tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 2580 aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 2640 acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg 2700 ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg 2760 ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc 2820 cattgacgca aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt 2880 tagtgaaccg gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact 2940 agggaaccca ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc 3000 ccgtctgttg tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa 3060 aatctctagc agtggcgccc gaacagggac ctgaaagcga aagggaaacc agaggagctc 3120 tctcgacgca ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg 3180 gtgagtacgc caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc 3240 gtcagtatta agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg 3300 ggaaagaaaa aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc 3360 gcagttaatc ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta 3420 caaccatccc ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc 3480 ctctattgtg tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata 3540 gaggaagagc aaaacaaaag taagaccacc gcacagcaag cggccgctga tcttcagacc 3600 tggaggagga gatatgaggg acaattggag aagtgaatta tataaatata aagtagtaaa 3660 aattgaacca ttaggagtag cacccaccaa ggcaaagaga agagtggtgc agagagaaaa 3720 aagagcagtg ggaataggag ctttgttcct tgggttcttg ggagcagcag gaagcactat 3780 gggcgcagcc tcaatgacgc tgacggtaca ggccagacaa ttattgtctg gtatagtgca 3840 gcagcagaac aatttgctga gggctattga ggcgcaacag catctgttgc aactcacagt 3900 ctggggcatc aagcagctcc aggcaagaat cctggctgtg gaaagatacc taaaggatca 3960 acagctcctg gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg 4020 gaatgctagt tggagtaata aatctctgga acagattgga atcacacgac ctggatggag 4080 tgggacagag aaattaacaa ttacacaagc ttaatacact ccttaattga agaatcgcaa 4140 aaccagcaag aaaagaatga acaagaatta ttggaattag ataaatgggc aagtttgtgg 4200 aattggttta acataacaaa ttggctgtgg tatataaaat tattcataat gatagtagga 4260 ggcttggtag gtttaagaat agtttttgct gtactttcta tagtgaatag agttaggcag 4320 ggatattcac cattatcgtt tcagacccac ctcccaaccc cgaggggacc cgacaggccc 4380 gaaggaatag aagaagaagg tggagagaga gacagagaca gatccattcg attagtgaac 4440 ggatctcgac ggtatcgatc tcgacacaaa tggcagtatt catccacaat tttaaaagaa 4500 aaggggggat tggggggtac agtgcagggg aaagaatagt agacataata gcaacagaca 4560 tacaaactaa agaattacaa aaacaaatta caaaaattca aaattttcgg gtttattaca 4620 gggacagcag agatccagtt tgggtcgagg atatcggatc tagatcgatt agtccaattt 4680 gttaaagaca ggatatcagt ggtccaggct ctagttttga ctcaacaata tcaccagctg 4740 aagcctatag agtacgagcc atagataaaa taaaagattt tatttagtct ccagaaaaag 4800 gggggaatga aagaccccac ctgtaggttt ggcaagctag gatcaaggtc aggaacagag 4860 aaacaggaga atatgggcca aacaggatat ctgtggtaag cagttcctgc cccgctcagg 4920 gccaagaaca gttggaacag gagaatatgg gccaaacagg atatctgtgg taagcagttc 4980 ctgccccgct cagggccaag aacagatggt ccccagatgc ggtcccgccc tcagcagttt 5040 ctagagaacc atcagatgtt tccagggtgc cccaaggacc tgaaatgacc ctgtgcctta 5100 tttgaactaa ccaatcagtt cgcttctcgc ttctgttcgc gcgcttctgc tccccgagct 5160 caataaaaga gcccacaacc cctcactcgg cgcgatcgat gaattcgagc tcggtacccg 5220 gggatcccgg gtgatcagtc gagctcaagc ttcgaattct gcagtcgacg gtaccgcggg 5280 cccgggatcc accggtcgcc accatggtga gcaagggcga ggagctgttc accggggtgg 5340 tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 5400 agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca 5460 agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca 5520 gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 5580 acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 5640 tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 5700 aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 5760 tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg 5820 aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 5880 ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca 5940 acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 6000 gcatggacga gctgtacaag taaagcggcc aactcgacgg gcccgcggaa ttcgagctcg 6060 gtacctttaa gaccaatgac ttacaaggca gctgtagatc ttagccactt tttaaaagaa 6120 aaggggggac tggaagggct aattcactcc caacgaagac aagatctgct ttttgcttgt 6180 actgggtctc tctggttaga ccagatctga gcctgggagc tctctggcta actagggaac 6240 ccactgctta agcctcaata aagcttgcct tgagtgcttc aagtagtgtg tgcccgtctg 6300 ttgtgtgact ctggtaacta gagatccctc agaccctttt agtcagtgtg gaaaatctct 6360 agcagtagta gttcatgtca tcttattatt cagtatttat aacttgcaaa gaaatgaata 6420 tcagagagtg agaggaactt gtttattgca gcttataatg gttacaaata aagcaatagc 6480 atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 6540 ctcatcaatg tatcttatca tgtctggctc tagctatccc gcccctaact ccgcccatcc 6600 cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta 6660 tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag tgaggaggct 6720 tttttggagg cctaggcttt tgcgtcgaga cgtacccaat tcgccctata gtgagtcgta 6780 ttacgcgcgc tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac 6840 ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc 6900 ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gcgacgcgcc 6960 ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 7020 tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 7080 cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 7140 acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 7200 ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 7260 gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 7320 tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 7380 ttttaacaaa atattaacgt ttacaatttc c 7411 <210> 47 <211> 10195 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <400> 47 ccattgcata cgttgtatcc atatcataat atgtacattt atattggctc atgtccaaca 60 ttaccgccat gttgacattg attattgact agttattaat agtaatcaat tacggggtca 120 ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct 180 ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta 240 acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 300 ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 360 aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag 420 tacatctacg tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat 480 gggcgtggat agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat 540 gggagtttgt tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc 600 ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctcgt 660 ttagtgaacc ggggtctctc tggttagacc agatctgagc ctgggagctc tctggctaac 720 tagggaaccc actgcttaag cctcaataaa gcttgccttg agtgcttcaa gtagtgtgtg 780 cccgtctgtt gtgtgactct ggtaactaga gatccctcag acccttttag tcagtgtgga 840 aaatctctag cagtggcgcc cgaacaggga cttgaaagcg aaagggaaac cagaggagct 900 ctctcgacgc aggactcggc ttgctgaagc gcgcacggca agaggcgagg ggcggcgact 960 ggtgagtacg ccaaaaattt tgactagcgg aggctagaag gagagagatg ggtgcgagag 1020 cgtcagtatt aagcggggga gaattagatc gcgatgggaa aaaattcggt taaggccagg 1080 gggaaagaaa aaatataaat taaaacatat agtatgggca agcagggagc tagaacgatt 1140 cgcagttaat cctggcctgt tagaaacatc agaaggctgt agacaaatac tgggacagct 1200 acaaccatcc cttcagacag gatcagaaga acttagatca ttatataata cagtagcaac 1260 cctctattgt gtgcatcaaa ggatagagat aaaagacacc aaggaagctt tagacaagat 1320 agaggaagag caaaacaaaa gtaagaccac cgcacagcaa gcggccgctg atcttcagac 1380 ctggaggagg agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa 1440 aaattgaacc attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa 1500 aaagagcagt gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta 1560 tgggcgcagc gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc 1620 agcagcagaa caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag 1680 tctggggcat caagcagctc caggcaagaa tcctggctgt ggaaagatac ctaaaggatc 1740 aacagctcct ggggatttgg ggttgctctg gaaaactcat ttgcaccact gctgtgcctt 1800 ggaatgctag ttggagtaat aaatctctgg aacagatttg gaatcacacg acctggatgg 1860 agtgggacag agaaattaac aattacacaa gcttaataca ctccttaatt gaagaatcgc 1920 aaaaccagca agaaaagaat gaacaagaat tattggaatt agataaatgg gcaagtttgt 1980 ggaattggtt taacataaca aattggctgt ggtatataaa attattcata atgatagtag 2040 gaggcttggt aggtttaaga atagtttttg ctgtactttc tatagtgaat agagttaggc 2100 agggatattc accattatcg tttcagaccc acctcccaac cccgagggga cccgacaggc 2160 ccgaaggaat agaagaagaa ggtggagaga gagacagaga cagatccatt cgattagtga 2220 acggatctcg acggtatcgg ttaactttta aaagaaaagg ggggattggg gggtacagtg 2280 caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa ttacaaaaac 2340 aaattacaaa attcaaaatt ttatcggtac gtaccatgag gacagctaaa acaataagta 2400 atgtaaaata cagcatagca aaactttaac ctccaaatca agcctctact tgaatccttt 2460 tctgagggat gaataaggca taggcatcag gggctgttgc caatgtgcat tagctgtttg 2520 cagcctcacc ttctttcatg gagtttaaga tatagtgtat tttcccaagg tttgaactag 2580 ctcttcattt ctttatgttt taaatgcact gacctcccac attccctttt tagtaaaata 2640 ttcagaaata atttaaatac atcattgcaa tgaaaataaa tgttttttat taggcagaat 2700 ccagatgctc aaggcccttc ataatatccc ccagtttagt agttggactt agggaacaaa 2760 ggaaccttta atagaaattg gacagcaaga aagcgagctt agtgatactt gtgggccagg 2820 gcattagcca caccagccac cactttctga taggcagcct gcactggtgg ggtgaattct 2880 ttgccaaagt gatgggccag cacacagacc agcacgttgc ccaggagctg tgggaggaag 2940 ataagaggta tgaacatgat tagcaaaagg gcctagcttg gactcagaat aatccagcct 3000 tatcccaacc ataaaataaa agcagaatgg tagctggatt gtagctgcta ttagcaatat 3060 gaaacctctt acatcagtta caatttatat gcagaaatac cctgttactt ctccccttcc 3120 tatgacatga acttaaccat agaaaagaag gggaaagaaa acatcaaggg tcccatagac 3180 tcaccctgaa gttctcagga tccacgtgca gcttgtcaca gtgcagctca ctcagctggg 3240 caaaggtgcc cttgaggttg tccaggtgag ccaggccatc actaaaggca ccgagcactt 3300 tcttgccatg agccttcacc ttagggttgc ccataacagc atcaggagtg gacagatccc 3360 caaaggactc aaagaacctc tgggtccaag ggtagaccac cagcagccta agggtgggaa 3420 aatagaccaa taggcagaga gagtcagtgc ctatcagaaa cccaagagtc ttctctgtct 3480 ccacatgccc agtttctatt ggtctcctta aacctgtctt gtaaccttga taccaacctg 3540 cccagggcct caccaccaac ggcatccacg ttcaccttgt cccacagggc agtaacggca 3600 gacttctcct caggagtcag gtgcaccatg gtgtctgttt gaggttgcta gtgaacacag 3660 ttgtgtcaga agcaaatgta agcaatagat ggctctgccc tgacttttat gcccagccct 3720 ggctcctgcc ctccctgctc ctgggagtag attggccaac cctagggtgt ggctccacag 3780 ggtgaggtct aagtgatgac agccgtacct gtccttggct cttctggcac tggcttagga 3840 gttggacttc aaaccctcag ccctccctct aagatatatc tcttggcccc ataccatcag 3900 tacaaattgc tactaaaaac atcctccttt gcaagtgtat ttacacggta tcgataagct 3960 tgatatcgaa ttcctgcagc ccccttttgc cacctagctg tccaggggtg ccttaaaatg 4020 gcaaacaagg tttgttttct tttcctgttt tcatgccttc ctcttccata tccttgtttc 4080 atattaatac atgtgtatag atcctaaaaa tctatacaca tgtattaata aagcctgatt 4140 ctgccgcttc taggtataga ggccacctgc aagataaata tttgattcac aataactaat 4200 cattctatgg caattgataa caacaaatat atatatatat atatatacgt atatgtgtat 4260 atatatatat atatattcag gaaataatat attctagaat atgtcacatt ctgtctcagg 4320 catccatttt ctttatgatg ccgtttgagg tggagtttta gtcaggtggt cagcttctcc 4380 ttttttttgc catctgccct gtaagcatcc tgctggggac ccagatagga gtcatcactc 4440 taggctgaga acatctgggc acacacccta agcctcagca tgactcatca tgactcagca 4500 ttgctgtgct tgagccagaa ggtttgctta gaaggttaca cagaaccaga aggcgggggt 4560 ggggcactga ccccgacagg ggcctggcca gaactgctca tgcttggact atgggaggtc 4620 actaatggag acacacagaa atgtaacagg aactaaggaa aaactgaagc ttatttaatc 4680 agagatgagg atgctggaag ggatagaggg agctgagctt gtaaaaagta tagtaatcat 4740 tcagcaaatg gttttgaagc acctgctgga tgctaaacac tattttcagt gcttgaatca 4800 taaataagaa taaaacatgt atcttattcc ccacaagagt ccaagtaaaa aataacagtt 4860 aattataatg tgctctgtcc cccaggctgg agtgcagtgg cacgatctca gctcactgca 4920 acctccgcct cccgggttca agcaattctc ctgcctcagc caccctaata gctgggatta 4980 caggtgcaca ccaccatgcc aggctaattt ttgtactttt tgtagaggca gggtatcacc 5040 atgttgtcca agatggtctt gaactcctga gctccaagca gtccacccac ctcagcctcc 5100 caaagtgctg ggattacagg tgtgagacac catgcccaga ttttccatat ttaatagagg 5160 tatttatggg atgggggaaa agaatgtttc tctcactgtg gattatttta gagagtggag 5220 aatggtcaag atttttttaa aaattaagaa aacataagtt ggaccttgag aaatgaaaat 5280 ttattttttt gttggaggat acccattctc tatctcccat cagggcaagc tgtaaggaac 5340 tggctaagac acagtgagac agagtgactt agtcttagag gccccactgg tacgacggtc 5400 accaagcttt cattaaaaaa agtctaacca gctgcattcg actttgactg cagcagctgg 5460 ttagaaggtt ctactggagg agggtcccag cccattgcta aattaacatc aggctctgag 5520 actggcagta tatctctaac agtggttgat gctatcttct ggaacttgcc tgctacattg 5580 agaccactga cccatacata ggaagcccat agctctgtcc tgaactgtta ggccactggt 5640 ccagagagtg tgcatctcct ttgatcctca taataaccct atgagataga cacaattatt 5700 actcttactt tatagatgat gatcctgaaa acataggagt caaggcactt gcccctagct 5760 gggggtatag gggagcagtc ccatgtagta gtagaatgaa aaatgctgct atgctgtgcc 5820 tcccccacct ttcccatgtc tgccctctac tcatggtcta tctctcctgg ctcctgggag 5880 tcatggactc cacccagcac caccaacctg acctaaccac ctatctgagc ctgccagcct 5940 ataacccatc tgggccctga tagctggtgg ccagccctga ccccacccca ccctccctgg 6000 aacctctgat agacacatct ggcacaccag ctcgcaaagt caccgtgagg gtcttgtgtt 6060 tgctgagtca aaattccttg aaatccaagt ccttagagac tcctgctccc aaatttacag 6120 tcatagactt cttcatggct gtctccttta tccacagaat gattcctttg cttcattgcc 6180 ccatccatct gatcctcctc atcagtgcag cacagggccc atgagcagta gctgcagagt 6240 ctcacatagg tctggcactg cctctgacat gtccgacctt aggcaaatgc ttgactcttc 6300 tgagctcagt cttgtcatgg caaaataaag ataataatag tgttttttta tggagttagc 6360 gtgaggatgg aaaacaatag caaaattgat tagactataa aaggtctcaa caaatagtag 6420 tagattttat catccattaa tccttccctc tcctctctta ctcatcccat cacgtatgcc 6480 tcttaatttt cccttaccta taataagagt tattcctctt attatattct tcttatagtg 6540 attctggata ttaaagtggg aatgaggggc aggccactaa cgaagaagat gtttctcaaa 6600 gaagcggggg atccactagt tctagagcgg ccaaatggcg gccgtacctt taagaccaat 6660 gacttacaag gcagctgtag atcttagcca ctttttaaaa gaaaaggggg gactggaagg 6720 gctaattcac tcccaacgaa gacaagatct gctttttgct tgtactgggt ctctctggtt 6780 agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 6840 ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 6900 ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagta gtagttcatg 6960 tcatcttatt attcagtatt tataacttgc aaagaaatga atatcagaga gtgagaggaa 7020 cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa 7080 taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta 7140 tcatgtctgg ctctagctat cccgccccta actccgccca tcccgcccct aactccgccc 7200 agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag 7260 gccgcctcgg cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggg 7320 acgtacccaa ttcgccctat agtgagtcgt attacgcgcg ctcactggcc gtcgttttac 7380 aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc 7440 ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 7500 gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 7560 tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 7620 tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 7680 tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 7740 gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 7800 agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 7860 cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 7920 agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg 7980 tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc 8040 aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 8100 gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 8160 ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 8220 gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 8280 tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 8340 attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 8400 tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 8460 agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 8520 aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 8580 tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 8640 cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 8700 tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 8760 tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 8820 tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 8880 tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 8940 aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 9000 gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 9060 tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 9120 aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 9180 aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 9240 tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc 9300 gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 9360 cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 9420 acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 9480 cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 9540 cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 9600 aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 9660 gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 9720 atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 9780 tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga 9840 gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga 9900 agcggaagag cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg 9960 cagctggcac gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt 10020 gagttagctc actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt 10080 gtgtggaatt gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc 10140 caagcgcgca attaaccctc actaaaggga acaaaagctg gagctgcaag cttgg 10195 <210> 48 <211> 4174 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <400> 48 agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60 acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120 tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180 ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaattcgatg 240 tacgggccag atatacgcgt atctgagggg actaggtgtg tttaggcgaa aagcggggct 300 tcggttgtac gcggttagga gtcccctcag gattagtagt ttcgcttttg catagggagg 360 gggaaatgta gtcttatgca atacacttgt agtcttgcaa catggtaacg atgagttagc 420 aacatgcctt acaaggagag aaaaagcacc gtgcatgccg attggtggaa gtaaggtggt 480 acgatcgtgc cttattagga aggcaacaga caggtctgac atggattgga cgaaccactg 540 aattccgcat tgcagagata attgtattta agtgcctagc tcgatacaat aaacgccatt 600 tgaccattca ccacattggt gtgcacctcc aagctcgagc tcgtttagtg aaccgtcaga 660 tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 720 gcctcccctc gaagctagtc gattaggcat ctcctatggc aggaagaagc ggagacagcg 780 acgaagacct cctcaaggca gtcagactca tcaagtttct ctatcaaagc aacccacctc 840 ccaatcccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg agagagagac 900 agagacagat ccattcgatt agtgaacgga tccttagcac ttatctggga cgatctgcgg 960 agcctgtgcc tcttcagcta ccaccgcttg agagacttac tcttgattgt aacgaggatt 1020 gtggaacttc tgggacgcag ggggtgggaa gccctcaaat attggtggaa tctcctacaa 1080 tattggagtc aggagctaaa gaatagtgct gttagcttgc tcaatgccac agctatagca 1140 gtagctgagg ggacagatag ggttatagaa gtagtacaag aagcttggca ctggccgtcg 1200 ttttacatga tctgagcctg ggagatctct ggctaactag ggaacccact gcttaagcct 1260 caataaagct tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt 1320 aactagagat caggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 1380 tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 1440 cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 1500 ttcacaccgc atacgtcaaa gcaaccatag tacgcgccct gtagcggcgc attaagcgcg 1560 gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct 1620 cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta 1680 aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa 1740 cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct 1800 ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc 1860 aaccctatct cgggctattc ttttgattta taagggattt tgccgatttc ggcctattgg 1920 ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgttt 1980 acaattttat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc 2040 cgacacccgc caacacccgc tgacgcgccc tgacgggctt gtctgctccc ggcatccgct 2100 tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc agaggttttc accgtcatca 2160 ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat ttttataggt taatgtcatg 2220 ataataatgg tttcttagac gtcaggtggc acttttcggg gaaatgtgcg cggaacccct 2280 atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 2340 taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 2400 cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 2460 aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 2520 aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 2580 tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc 2640 ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 2700 catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 2760 aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 2820 ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 2880 gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc 2940 aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 3000 gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 3060 gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 3120 gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 3180 gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 3240 gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 3300 atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 3360 ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 3420 ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 3480 ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 3540 ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 3600 ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 3660 tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 3720 tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 3780 tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 3840 tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 3900 gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 3960 tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 4020 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 4080 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 4140 gagcgcagcg agtcagtgag cgaggaagcg gaag 4174 <210> 49 <211> 8895 <212> DNA <213> Artificial Sequence <220> <223> Synthetic plasmid <400> 49 ggatcccctg agggggcccc catgggctag aggatccggc ctcggcctct gcataaataa 60 aaaaaattag tcagccatga gcttggccca ttgcatacgt tgtatccata tcataatatg 120 tacatttata ttggctcatg tccaacatta ccgccatgtt gacattgatt attgactagt 180 tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 240 acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 300 tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 360 gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 420 acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 480 accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 540 gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 600 ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 660 tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 720 tgggaggtct atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat 780 ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctccc ctcgaagctt 840 acatgtggta ccgagctcgg atcctgagaa cttcagggtg agtctatggg acccttgatg 900 ttttctttcc ccttcttttc tatggttaag ttcatgtcat aggaagggga gaagtaacag 960 ggtacacata ttgaccaaat cagggtaatt ttgcatttgt aattttaaaa aatgctttct 1020 tcttttaata tacttttttg tttatcttat ttctaatact ttccctaatc tctttctttc 1080 agggcaataa tgatacaatg tatcatgcct ctttgcacca ttctaaagaa taacagtgat 1140 aatttctggg ttaaggcaat agcaatattt ctgcatataa atatttctgc atataaattg 1200 taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta ccattctgct 1260 tttattttat ggttgggata aggctggatt attctgagtc caagctaggc ccttttgcta 1320 atcatgttca tacctcttat cttcctccca cagctcctgg gcaacgtgct ggtctgtgtg 1380 ctggcccatc actttggcaa agcacgtgag atctgaattc gagatctgcc gccgccatgg 1440 gtgcgagagc gtcagtatta agcgggggag aattagatcg atgggaaaaa attcggttaa 1500 ggccaggggg aaagaaaaaa tataaattaa aacatatagt atgggcaagc agggagctag 1560 aacgattcgc agttaatcct ggcctgttag aaacatcaga aggctgtaga caaatactgg 1620 gacagctaca accatccctt cagacaggat cagaagaact tagatcatta tataatacag 1680 tagcaaccct ctattgtgtg catcaaagga tagagataaa agacaccaag gaagctttag 1740 acaagataga ggaagagcaa aacaaaagta agaaaaaagc acagcaagca gcagctgaca 1800 caggacacag caatcaggtc agccaaaatt accctatagt gcagaacatc caggggcaaa 1860 tggtacatca ggccatatca cctagaactt taaatgcatg ggtaaaagta gtagaagaga 1920 aggctttcag cccagaagtg atacccatgt tttcagcatt atcagaagga gccaccccac 1980 aagatttaaa caccatgcta aacacagtgg ggggacatca agcagccatg caaatgttaa 2040 aagagaccat caatgaggaa gctgcagaat gggatagagt gcatccagtg catgcagggc 2100 ctattgcacc aggccagatg agagaaccaa ggggaagtga catagcagga actactagta 2160 ctagtaccct tcaggaacaa ataggatgga tgacacataa tccacctatc ccagtaggag 2220 aaatctataa aagatggata atcctgggat taaataaaat agtaagaatg tatagcccta 2280 ccagcattct ggacataaga caaggaccaa aggaaccctt tagagactat gtagaccgat 2340 tctataaaac tctaagagcc gagcaagctt cacaagaggt aaaaaattgg atgacagaaa 2400 ccttgttggt ccaaaatgcg aacccagatt gtaagactat tttaaaagca ttgggaccag 2460 gagcgacact agaagaaatg atgacagcat gtcagggagt ggggggaccc ggccataaag 2520 caagagtttt ggctgaagca atgagccaag taacaaatcc agctaccata atgatacaga 2580 aaggcaattt taggaaccaa agaaagactg ttaagtgttt caattgtggc aaagaagggc 2640 acatagccaa aaattgcagg gcccctagga aaaagggctg ttggaaatgt ggaaaggaag 2700 gacaccaaat gaaagattgt actgagagac aggctaattt tttagggaag atctggcctt 2760 cccacaaggg aaggccaggg aattttcttc agagcagacc agagccaaca gccccaccag 2820 aagagagctt caggtttggg gaagagacaa caactccctc tcagaagcag gagccgatag 2880 acaaggaact gtatccttta gcttccctca gatcactctt tggcagcgac ccctcgtcac 2940 aataaagata ggggggcaat taaaggaagc tctattagat acaggagcag atgatacagt 3000 attagaagaa atgaatttgc caggaagatg gaaaccaaaa atgatagggg gaattggagg 3060 ttttatcaaa gtaggacagt atgatcagat actcatagaa atctgcggac ataaagctat 3120 aggtacagta ttagtaggac ctacacctgt caacataatt ggaagaaatc tgttgactca 3180 gattggctgc actttaaatt ttcccattag tcctattgag actgtaccag taaaattaaa 3240 gccaggaatg gatggcccaa aagttaaaca atggccattg acagaagaaa aaataaaagc 3300 attagtagaa atttgtacag aaatggaaaa ggaaggaaaa atttcaaaaa ttgggcctga 3360 aaatccatac aatactccag tatttgccat aaagaaaaaa gacagtacta aatggagaaa 3420 attagtagat ttcagagaac ttaataagag aactcaagat ttctgggaag ttcaattagg 3480 aataccacat cctgcagggt taaaacagaa aaaatcagta acagtactgg atgtgggcga 3540 tgcatatttt tcagttccct tagataaaga cttcaggaag tatactgcat ttaccatacc 3600 tagtataaac aatgagacac cagggattag atatcagtac aatgtgcttc cacagggatg 3660 gaaaggatca ccagcaatat tccagtgtag catgacaaaa atcttagagc cttttagaaa 3720 acaaaatcca gacatagtca tctatcaata catggatgat ttgtatgtag gatctgactt 3780 agaaataggg cagcatagaa caaaaataga ggaactgaga caacatctgt tgaggtgggg 3840 atttaccaca ccagacaaaa aacatcagaa agaacctcca ttcctttgga tgggttatga 3900 actccatcct gataaatgga cagtacagcc tatagtgctg ccagaaaagg acagctggac 3960 tgtcaatgac atacagaaat tagtgggaaa attgaattgg gcaagtcaga tttatgcagg 4020 gattaaagta aggcaattat gtaaacttct taggggaacc aaagcactaa cagaagtagt 4080 accactaaca gaagaagcag agctagaact ggcagaaaac agggagattc taaaagaacc 4140 ggtacatgga gtgtattatg acccatcaaa agacttaata gcagaaatac agaagcaggg 4200 gcaaggccaa tggacatatc aaatttatca agagccattt aaaaatctga aaacaggaaa 4260 atatgcaaga atgaagggtg cccacactaa tgatgtgaaa caattaacag aggcagtaca 4320 aaaaatagcc acagaaagca tagtaatatg gggaaagact cctaaattta aattacccat 4380 acaaaaggaa acatgggaag catggtggac agagtattgg caagccacct ggattcctga 4440 gtgggagttt gtcaataccc ctcccttagt gaagttatgg taccagttag agaaagaacc 4500 cataatagga gcagaaactt tctatgtaga tggggcagcc aatagggaaa ctaaattagg 4560 aaaagcagga tatgtaactg acagaggaag acaaaaagtt gtccccctaa cggacacaac 4620 aaatcagaag actgagttac aagcaattca tctagctttg caggattcgg gattagaagt 4680 aaacatagtg acagactcac aatatgcatt gggaatcatt caagcacaac cagataagag 4740 tgaatcagag ttagtcagtc aaataataga gcagttaata aaaaaggaaa aagtctacct 4800 ggcatgggta ccagcacaca aaggaattgg aggaaatgaa caagtagatg ggttggtcag 4860 tgctggaatc aggaaagtac tatttttaga tggaatagat aaggcccaag aagaacatga 4920 gaaatatcac agtaattgga gagcaatggc tagtgatttt aacctaccac ctgtagtagc 4980 aaaagaaata gtagccagct gtgataaatg tcagctaaaa ggggaagcca tgcatggaca 5040 agtagactgt agcccaggaa tatggcagct agattgtaca catttagaag gaaaagttat 5100 cttggtagca gttcatgtag ccagtggata tatagaagca gaagtaattc cagcagagac 5160 agggcaagaa acagcatact tcctcttaaa attagcagga agatggccag taaaaacagt 5220 acatacagac aatggcagca atttcaccag tactacagtt aaggccgcct gttggtgggc 5280 ggggatcaag caggaatttg gcattcccta caatccccaa agtcaaggag taatagaatc 5340 tatgaataaa gaattaaaga aaattatagg acaggtaaga gatcaggctg aacatcttaa 5400 gacagcagta caaatggcag tattcatcca caattttaaa agaaaagggg ggattggggg 5460 gtacagtgca ggggaaagaa tagtagacat aatagcaaca gacatacaaa ctaaagaatt 5520 acaaaaacaa attacaaaaa ttcaaaattt tcgggtttat tacagggaca gcagagatcc 5580 agtttggaaa ggaccagcaa agctcctctg gaaaggtgaa ggggcagtag taatacaaga 5640 taatagtgac ataaaagtag tgccaagaag aaaagcaaag atcatcaggg attatggaaa 5700 acagatggca ggtgatgatt gtgtggcaag tagacaggat gaggattaac acatggaatt 5760 ccggagcggc cgcaggagct ttgttccttg ggttcttggg agcagcagga agcactatgg 5820 gcgcagcctc aatgacgctg acggtacagg ccagacaatt attgtctggt atagtgcagc 5880 agcagaacaa tttgctgagg gctattgagg cgcaacagca tctgttgcaa ctcacagtct 5940 ggggcatcaa gcagctccag gcaagaatcc tggctgtgga aagataccta aaggatcaac 6000 agctcctggg gatttggggt tgctctggaa aactcatttg caccactgct gtgccttgga 6060 atgctagttg gagtaataaa tctctggaac agatttggaa tcacacgacc tggatggagt 6120 gggacagaga aattaacaat tacacaagct tccgcggaat tcaccccacc agtgcaggct 6180 gcctatcaga aagtggtggc tggtgtggct aatgccctgg cccacaagtt tcactaagct 6240 cgcttccttg ctgtccaatt tctattaaag gttccttggt tccctaagtc caactactaa 6300 actgggggat attatgaagg gccttgagca tctggattct gcctaataaa aaacatttat 6360 tttcattgca atgatgtatt taaattattt ctgaatattt tactaaaaag ggaatgtggg 6420 aggtcagtgc atttaaaaca taaagaaatg aagagctagt tcaaaccttg ggaaaataca 6480 ctatatctta aactccatga aagaaggtga ggctgcaaac agctaatgca cattggcaac 6540 agccctgatg cctatgcctt attcatccct cagaaaagga ttcaagtaga ggcttgattt 6600 ggaggttaaa gtttggctat gctgtatttt acattactta ttgttttagc tgtcctcatg 6660 aatgtctttt cactacccat ttgcttatcc tgcatctctc agccttgact ccactcagtt 6720 ctcttgctta gagataccac ctttcccctg aagtgttcct tccatgtttt acggcgagat 6780 ggtttctcct cgcctggcca ctcagcctta gttgtctctg ttgtcttata gaggtctact 6840 tgaagaagga aaaacagggg gcatggtttg actgtcctgt gagcccttct tccctgcctc 6900 ccccactcac agtgacccgg aatccctcga catggcagtc tagcactagt gcggccgcag 6960 atctgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 7020 agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 7080 catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 7140 tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 7200 gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 7260 ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 7320 cgtggcgctt tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 7380 caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 7440 ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 7500 taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 7560 taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac 7620 cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 7680 tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 7740 gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 7800 catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 7860 atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 7920 ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 7980 gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 8040 agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 8100 gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 8160 agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 8220 catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 8280 aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 8340 gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 8400 taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 8460 caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 8520 ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 8580 ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 8640 tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 8700 aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 8760 actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 8820 catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa 8880 agtgccacct gacgt 8895 <210> 50 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Forward Primer <400> 50 acttgaaagc gaaagggaaa c 21 <210> 51 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Reverse Primer <400> 51 cgcacccatc tctctccttc t 21 <210> 52 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Probe <220> <221> misc_feature <222> (1)..(1) <223> 6FAM <220> <221> misc_feature <222> (24)..(24) <223> TAMRA <400> 52 agctctctcg acgcaggact cggc 24 <210> 53 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Forward Primer <400> 53 ctctgagcta ttccagaagt agtg 24 <210> 54 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Reverse Primer <400> 54 cagtgagcgc gcgtaata 18 <210> 55 <211> 25 <212> DNA <213> Artificial Seuqnce <220> <223> Synthetic Polynucleotide <220> <221> misc_feature <223> Probe <220> <221> misc_feature <222> (1)..(1) <223> 6FAM <220> <221> misc_feature <222> (25)..(25) <223> TAMRA <400> 55 gacgtaccca attcgcccta tagtg 25 <210> 56 <211> 1539 <212> DNA <213> Cocal virus <400> 56 atgaatttcc tactcttgac atttattgtg ttgccgttgt gcagccacgc caagttctcc 60 attgtattcc ctcaaagcca aaaaggcaat tggaagaatg taccatcatc ttaccattac 120 tgcccttcaa gttcggatca aaactggcac aatgatttgc ttggaatcac aatgaaagtc 180 aaaatgccca aaacacacaa agctattcaa gcagacgggt ggatgtgtca tgctgccaaa 240 tggatcacta cctgtgactt tcgctggtac ggacccaaat acatcactca ctccattcat 300 tccatccagc ctacttcaga gcagtgtaaa gaaagcatca agcaaacaaa acaaggtact 360 tggatgagtc ctggcttccc tccacagaac tgcgggtatg caacagtaac agactctgtc 420 gctgttgtcg tccaagccac tcctcatcat gtcttggttg atgaatatac tggagaatgg 480 atcgactctc aattccccaa cgggaaatgt gaaaccgaag agtgcgagac cgtccacaac 540 tctaccgtat ggtactctga ctacaaagta actggattat gtgacgcaac tctggtagac 600 acagagatca ccttcttctc tgaagatggc aaaaaagaat ctatcgggaa gcccaacaca 660 ggctatagga gcaactactt cgcttatgag aaaggggaca aagtatgtaa aatgaactac 720 tgcaagcatg cgggtgtgag gttgccttcc ggggtttggt ttgagtttgt ggatcaggat 780 gtctacgccg ccgccaaact tccagaatgc cccgttggtg ccactatctc cgctccgaca 840 cagacctctg ttgacgtaag tctcattcta gatgtagaga gaattttaga ttactctctg 900 tgtcaagaga catggagcaa gatccggtcc aaacagccag tatcccctgt tgaccttagt 960 tacttggccc ccaagaatcc tgggaccgga ccggcattca caatcatcaa tggcactctg 1020 aagtactttg agaccagata cattcggatt gatatagaca atccaatcat ctccaagatg 1080 gtggggaaaa taagtggcag tcaaacagaa cgagaattgt ggacagagtg gttcccctac 1140 gagggtgtcg agatagggcc aaatgggatt ctcaaaaccc ctacaggata caaattccca 1200 ctcttcatga taggacacgg gatgctagat tccgacttgc acaagacgtc ccaagcagag 1260 gtctttgaac atcctcacct tgcagaagca ccaaagcagt tgccggagga ggagacttta 1320 ttttttggtg acacaggaat ctccaaaaat ccggtcgaac tgattgaagg gtggtttagt 1380 agttggaaga gcactgtagt cacctttttc tttgccatag gagtatttat actactgtat 1440 gtagtggcca gaattgtgat cgcagtgaga tacagatatc aaggctcaaa taacaaaaga 1500 atttacaatg atattgagat gagcagattt agaaaatga 1539 <210> 57 <211> 529 <212> PRT <213> Piry virus <400> 57 Met Asp Leu Phe Pro Ile Leu Val Val Val Leu Met Thr Asp Thr Val 1 5 10 15 Leu Gly Lys Phe Gln Ile Val Phe Pro Asp Gln Asn Glu Leu Glu Trp 20 25 30 Arg Pro Val Val Gly Asp Ser Arg His Cys Pro Gln Ser Ser Glu Met 35 40 45 Gln Phe Asp Gly Ser Arg Ser Gln Thr Ile Leu Thr Gly Lys Ala Pro 50 55 60 Val Gly Ile Thr Pro Ser Lys Ser Asp Gly Phe Ile Cys His Ala Ala 65 70 75 80 Lys Trp Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile 85 90 95 Thr His Ser Ile His His Leu Arg Pro Thr Thr Ser Asp Cys Glu Thr 100 105 110 Ala Leu Gln Arg Tyr Lys Asp Gly Ser Leu Ile Asn Leu Gly Phe Pro 115 120 125 Pro Glu Ser Cys Gly Tyr Ala Thr Val Thr Asp Ser Glu Ala Met Leu 130 135 140 Val Gln Val Thr Pro His His Val Gly Val Asp Asp Tyr Arg Gly His 145 150 155 160 Trp Ile Asp Pro Leu Phe Pro Gly Gly Glu Cys Ser Thr Asn Phe Cys 165 170 175 Asp Thr Val His Asn Ser Ser Val Trp Ile Pro Lys Ser Gln Lys Thr 180 185 190 Asp Ile Cys Ala Gln Ser Phe Lys Asn Ile Lys Met Thr Ala Ser Tyr 195 200 205 Pro Ser Glu Gly Ala Leu Val Ser Asp Arg Phe Ala Phe His Ser Ala 210 215 220 Tyr His Pro Asn Met Pro Gly Ser Thr Val Cys Ile Met Asp Phe Cys 225 230 235 240 Glu Gln Lys Gly Leu Arg Phe Thr Asn Gly Glu Trp Met Gly Leu Asn 245 250 255 Val Glu Gln Ser Ile Arg Glu Lys Lys Ile Ser Ala Ile Phe Pro Asn 260 265 270 Cys Val Ala Gly Thr Glu Ile Arg Ala Thr Leu Glu Ser Glu Gly Ala 275 280 285 Arg Thr Leu Thr Trp Glu Thr Gln Arg Met Leu Asp Tyr Ser Leu Cys 290 295 300 Gln Asn Thr Trp Asp Lys Val Ser Arg Lys Glu Pro Leu Ser Pro Leu 305 310 315 320 Asp Leu Ser Tyr Leu Ser Pro Arg Ala Pro Gly Lys Gly Met Ala Tyr 325 330 335 Thr Val Ile Asn Gly Thr Leu His Ser Ala His Ala Lys Tyr Ile Arg 340 345 350 Thr Trp Ile Asp Tyr Gly Glu Met Lys Glu Ile Lys Gly Gly Arg Gly 355 360 365 Glu Tyr Ser Lys Ala Pro Glu Leu Leu Trp Ser Gln Trp Phe Asp Phe 370 375 380 Gly Pro Phe Lys Ile Gly Pro Asn Gly Leu Leu His Thr Gly Lys Thr 385 390 395 400 Phe Lys Phe Pro Leu Tyr Leu Ile Gly Ala Gly Ile Ile Asp Glu Asp 405 410 415 Leu His Glu Leu Asp Glu Ala Ala Pro Ile Asp His Pro Gln Met Pro 420 425 430 Asp Ala Lys Ser Val Leu Pro Glu Asp Glu Glu Ile Phe Phe Gly Asp 435 440 445 Thr Gly Val Ser Lys Asn Pro Ile Glu Leu Ile Gln Gly Trp Phe Ser 450 455 460 Asn Trp Arg Glu Ser Val Met Ala Ile Val Gly Ile Val Leu Leu Ile 465 470 475 480 Val Val Thr Phe Leu Ala Ile Lys Thr Val Arg Val Leu Asn Cys Leu 485 490 495 Trp Arg Pro Arg Lys Lys Arg Ile Val Arg Gln Glu Val Asp Val Glu 500 505 510 Ser Arg Leu Asn His Phe Glu Met Arg Gly Phe Pro Glu Tyr Val Lys 515 520 525 Arg

Claims

조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스로서, 상기 재조합 렌티바이러스는 i) 이종 전이유전자, ii) 바이러스 외피 단백질 및 iii) CD34+ 세포 결합용 리간드인 단백질을 포함하는 재조합 렌티바이러스.
제 1 항에 있어서, 상기 바이러스 외피 단백질은 베지큘로바이러스 외피 단백질인 재조합 렌티바이러스.
제 2 항에 있어서, 상기 베지큘로바이러스 외피 단백질은 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 군으로부터 선택되는 베지큘로바이러스 종으로부터 유래하는 재조합 렌티바이러스.
제 1 항에 있어서, 상기 바이러스 외피 단백질은 아레나바이러스 외피 단백질인 재조합 렌티바이러스.
제 4 항에 있어서, 상기 아레나바이러스 외피 단백질은 마츄포(Machupo) 바이러로부터 유래하는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열을 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열로 본질적으로 구성되는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열로 구성되는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 또는 제 6 항 내지 제 9 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 하나를 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 3 항 또는 제 6 항 내지 제 9 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개 전부를 포함하는 재조합 렌티바이러스.
제 4 항 또는 제 5 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 41의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 재조합 렌티바이러스.
제 4 항 또는 제 5 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 41의 아미노산 서열을 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 13 항 중 어느 한 항에 있어서, 상기 조혈모세포는 인간 세포인 재조합 렌티바이러스.
제 1 항 내지 제 13 항 중 어느 한 항에 있어서, 상기 조혈모세포는 인간 CD34+ 세포인 재조합 렌티바이러스.
제 1 항 내지 제 15 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러스는 벡터를 더 포함하며, 상기 벡터는 프로모터에 작동 가능하게 연결된 상기 이종 전이유전자를 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 16 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러스가 자체 활성화(SIN) LTR을 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 17 항 중 어느 한 항에 있어서, 상기 이종 전이유전자가 인간 단백질을 암호화하는 재조합 렌티바이러스.
제 1 항 내지 제 18 항 중 어느 한 항에 있어서, 상기 이종 전이유전자가 인간 헤모글로빈 단백질을 암호화하는 재조합 렌티바이러스.
제 1 항 내지 제 19 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질은 상기 재조합 렌티바이러스의 표면에 존재하는 재조합 렌티바이러스.
제 1 항 내지 제 20 항 중 어느 한 항에 있어서,상기 인간 CD34+ 세포 결합용 리간드인 상기 단백질은 L-셀렉틴인 재조합 렌티바이러스.
제 1 항 내지 제 21 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질은 서열번호 39의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 재조합 렌티바이러스.
제 1 항 내지 제 21 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질은 서열번호 39의 아미노산 서열을 포함하는 재조합 렌티바이러스.
제 1 항 내지 제 21 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질은 서열번호 39의 아미노산 서열로 본질적으로 구성되는 재조합 렌티바이러스.
제 1 항 내지 제 21 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질은 서열번호 39의 아미노산 서열로 구성되는 재조합 렌티바이러스.
제 1 항 내지 제 25 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러스는 상기 외피 단백질을 발현하는 벡터와 L-셀렉틴을 발현하는 상기 벡터의 농도비가 1:2 내지 1:5 범위인 세포에 의해 생산되는 재조합 렌티바이러스.
제 1 항 내지 제 25 항 중 어느 한 항에 있어서, 상기 외피 단백질과 L-셀렉틴의 농도비가 1:2 내지 1:5 범위인 재조합 렌티바이러스.
(i) 이종 전이유전자; (ii) 바이러스 외피 단백질; 및 (iii) CD34+ 세포 결합용 리간드인 단백질;을 포함하는 재조합 렌티바이러스를 상기 조혈모세포에 형질도입하는 단계를 포함하는 조혈모세포 내로 이종 전이유전자를 도입하는 방법.
제 28 항에 있어서, 상기 바이러스 외피 단백질은 베지큘로바이러스 외피 단백질인 방법.
제 29 항에 있어서, 상기 베지큘로바이러스 외피 단백질은 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 군으로부터 선택되는 베지큘로바이러스 종으로부터 유래하는 것인 방법.
제 28 항에 있어서, 상기 바이러스 외피 단백질은 아레나바이러스 외피 단백질인 방법.
제 31 항에 있어서, 상기 아레나바이러스 외피 단백질은 마츄포(Machupo) 바이러스로부터 유래하는 것인 방법.
제 28 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 방법.
제 28 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질이 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열을 포함하는 방법.
제 28 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열로 본질적으로 구성되는 방법.
제 28 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질의 아미노산 서열은 서열번호 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 또는 43의 아미노산 서열로 구성되는 방법.
제 28 항 내지 제 30 항 또는 제 33 항 내지 제 36 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 하나를 포함하는 방법.
제 28 항 내지 제 30 항 또는 제 33 항 내지 제 36 항 중 어느 한 항에 있어서, 상기 바이러스 외피 단백질은 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 또는 31 개 전부를 포함하는 방법.
제 31 항 또는 제 32 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 41의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 방법.
제 31 항 또는 제 32 항에 있어서, 상기 바이러스 외피 단백질은 서열번호 41의 아미노산 서열을 포함하는 방법.
제 28 항 내지 제 40 항 중 어느 한 항에 있어서, 상기 조혈모세포가 인간 세포인 방법.
제 28 항 내지 제 41 항 중 어느 한 항에 있어서, 상기 조혈모세포가 인간 CD34+ 세포인 방법.
제 28 항 내지 제 42 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러는 벡터를 포함하며, 상기 벡터는 프로모터에 작동 가능하게 연결된 상기 이종 전이유전자를 포함하는 방법.
제 28 항 내지 제 43 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러스가 자체 활성화(SIN) LTR을 포함하는 방법.
제 28 항 내지 제 44 항 중 어느 한 항에 있어서, 상기 이종 전이유전자가 인간 헤모글로빈 단백질을 암호화하는 방법.
제 28 항 내지 제 45 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 상기 재조합 렌티바이러스의 표면에 존재하는 방법.
제 28 항 내지 제 46 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 L-셀렉틴인 방법.
제 28 항 내지 제 47 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 서열번호 39의 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하며, 상기 서열 비교는 두 서열의 전체 길이에 걸쳐 수행되는 방법.
제 28 항 내지 제 47 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 서열번호 39의 아미노산 서열을 포함하는 방법.
제 28 항 내지 제 47 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 서열번호 39의 아미노산 서열로 본질적으로 구성되는 방법.
제 28 항 내지 제 47 항 중 어느 한 항에 있어서, 상기 인간 CD34+ 세포 결합용 리간드인 단백질이 서열번호 39의 아미노산 서열로 구성되는 방법.
제 28 항 내지 제 51 항 중 어느 한 항에 있어서, 상기 재조합 렌티바이러스는 상기 외피 단백질을 발현하는 벡터와 L-셀렉틴을 발현하는 상기 벡터의 농도비가 1:2 내지 1:5 범위인 세포에 의해 생산되는 방법.
제 28 항 내지 제 52 항 중 어느 한 항에 있어서, 상기 외피 단백질과 L-셀렉틴의 농도비가 1:2 내지 1:5 범위인 방법.
제 28 항 내지 제 53 항 중 어느 한 항에 있어서, 상기 형질도입 단계가 부착성 조혈모세포 상에서 수행되는 방법.
제 28 항 내지 제 53 항 중 어느 한 항에 있어서, 상기 형질도입 단계가 부유 상태의 조혈모세포 상에서 수행되는 방법.
조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스로서, 상기 재조합 렌티바이러스는 이종 전이유전자; 및 수포성 구내염 바이러스 G(VSV-G), 모레톤(Morreton), 마라바(Maraba), 코칼(Cocal), 알라고아(Alagoa) 및 카라자스(Carajas)로 구성되는 군으로부터 선택되는 베지큘로바이러스 종으로부터 유래하는 바이러스 외피 단백질;을 포함하는 재조합 렌티바이러스.
조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스로서, 상기 재조합 렌티바이러스는 이종 전이유전자; 및 도 4에 표시된 CD34 세포 형질도입 결정자 내 이들의 각 위치의 31 개 아미노산 중 적어도 하나를 포함하는 바이러스 외피 단백질;을 포함하는 재조합 렌티바이러스.
조혈모세포를 형질도입할 수 있는 재조합 렌티바이러스로서, 상기 재조합 렌티바이러스는 이종 전이유전자; 및 제1형 트랜스페린 수용체(TfnR1)를 사용하여 세포를 감염시킬 수 있는 아레나바이러스 종으로부터 유래하는 바이러스 외피 단백질;을 포함하는 재조합 렌티바이러스.
제 58 항에 있어서, 상기 아레나바이러스 외피 단백질은 마츄포(Machupo) 바이러스로부터 유래하는 재조합 렌티바이러스.
제 1 항 내지 제 27 항 또는 제 56 항 내지 제 59 항 중 어느 한 항에 따른 재조합 렌티바이러스; 및 약학적으로 허용되는 담체;를 포함하는 조성물.
제 1 항 내지 제 27 항 또는 제 56 항 내지 제 59 항 중 어느 한 항에 따른 재조합 렌티바이러스 또는 제 60 항에 따른 조성물로 형질도입된 조혈모세포를 투여하는 단계를 포함하는 이상혈색소 증상의 치료방법.
제 61 항에 있어서, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈인 방법.
이상혈색소 증상을 치료하기 위한 약제의 제조를 위한, 제 1 항 내지 제 27 항 또는 제 56 항 내지 제 59 항 중 어느 한 항에 따른 재조합 렌티바이러스 또는 제 60 항에 따른 조성물로 형질도입된 조혈모세포의 용도.
제 63 항에 있어서, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈인 용도.
없음
제 1 항 내지 제 27 항 또는 제 56 항 내지 제 59 항 중 어느 한 항에 따른 재조합 렌티바이러스로 형질도입된 조혈모세포를 포함하는 이상혈색소 증상 치료용 조성물.
제 66 항에 있어서, 상기 이상혈색소 증상은 겸상 적혈구성 빈혈 또는 지중해 빈혈인 조성물.