KR20220153011A

KR20220153011A - 난발현 단백질(dte-p)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법

Info

Publication number: KR20220153011A
Application number: KR1020227030489A
Authority: KR
Inventors: 카잘 아로라; 프라부다 쿠마르 쿤두; 루치르 라스토기; 누푸르 메흐로트라 아로라
Original assignee: 프레마스 바이오테크 프라이빗 리미티드
Priority date: 2020-02-03
Filing date: 2021-02-03
Publication date: 2022-11-17
Also published as: JP2023522534A; IL295259A; EP4100038A4; US20230097374A1; WO2021156890A3; CA3169961A1; EP4100038A2; WO2021156890A2

Abstract

본 발명은 다양한 기원 및 패밀리의 전장 또는 절단된 표적 "난발현" 단백질(DTE-P)의 향상된 발현을 위한 다용도 효모-기반 재조합 발현 플랫폼을 제공한다. 상기 시스템을 통한 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트가 또한 제공된다. 본 발명의 재조합 발현 플랫폼은 강하고 확장가능하고 백신 개발, 약물 발견, 대사, 진단제, 치료제 및 건강관리와 같은 분야에서 적용될 수 있다.

Description

난발현 단백질(DTE-P)의 발현을 위한 재조합 발현 플랫폼, 구축물 및 방법

본 발명은 재조합 단백질 발현의 분야에 광범위하게 있다. 더욱 구체적으로, 본 발명은 재조합 발현 플랫폼에서 난발현 단백질의 발현; 상기 시스템을 통해 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트에 관한 것이다.

단백질의 성공적인 재조합 발현은 약물 발견 및 바이오-치료제 및 백신의 생산을 돕기 위한 생명공학 산업의 핵심 요건이다. 이는 성공적인 발현뿐만 아니라, 표적 단백질의 높은 품질 및 대규모 생산을 수반한다. 숙주 세포, 예컨대 E. coli, 효모, 포유동물 및 곤충 세포-기반 발현 시스템은 일반적으로 재조합 방식으로 이러한 단백질의 잘 접힌 활성 형태의 성공적인 발현을 달성하도록 선택된다. 그러나, 이들의 고유한 성질, 예컨대 소수성, 높은 시스테인-프롤린 잔기, 반복적 아미노산, 단백질 반감기, mRNA 전환, 안정적인 RNA 생산 등으로 인해 효율적으로 발현되지 않는 수많은 단백질이 있다. 숙주 세포의 적합성도 소망하는 발현을 달성하는데 중요한 역할을 한다. 따라서, 요구되는 양 및 비용으로 산업에서의 공급을 위한 상업적 확장성 및 비용-효율적인 생산과 함께 이러한 단백질의 발현을 위해 강하고 일관된 플랫폼 및 숙주 시스템이 요구된다.

다양한 적용을 위해 중요한 많은 단백질은 난발현 범주 하에 분류되고 산업적 규모 생산을 위한 이들 단백질의 발현 및 제조에 도전이 될 수 있다. 이는 서열 복잡성 또는 제조 스케일 업(scale up), 생산물 회수 또는 정제와 같은 문제로 인해 발현을 저하시키거나 발현하지 않는 것으로 여겨질 수 있다. 또한, 다양한 숙주 시스템 및 방법론 및 번거로운 최적화를 적용하는 것은 이를 매우 예측하기 어렵고, 힘들고, 비용 및 시간이 많이 소요되는 문제가 되게 한다.

다양한 벡터 및 숙주를 사용하는 일부 어려운 단백질의 발현이 선행 기술에서 보고된다. 인도 특허 출원 번호 제1017/DEL/2009호 및 제1018/DEL/2009호는 하나의 이러한 단백질, 즉 인간 시토크롬 P450 환원효소의 이종 과잉-발현을 개시한다. 그러나, 이들 문서는 구체적으로 다른 구축물을 갖는 시토크롬 P450의 발현에 초점을 맞추고 있다.

다른 특허 문서 CN1757745A호는 메탄올 효모 시스템을 사용하는 외인성 단백질의 고효율 발현의 방법에 관한 것이다.

US7910364B2호는 난발현 단백질에 대한 급속 절단가능 수모(sumo) 융합 단백질 발현 시스템을 개시한다.

Saccardo et al., 2016은 난발현 단백질의 발현에 대처하기 위한 일반 기술 및 도구를 조명하였다.

Thoring et al., 2017은 CHO 세포 용해물을 기초로 하는 연속 교환 무-세포 시스템에서 난발현 단백질의 고-수율 생산을 보고하였다.

그러나 여전히, 전세계적으로 연구자들의 과제로 남아 있는 수많은 난발현 단백질이 있다. 또한, 향상된 품질 및 확장가능한 양으로 과잉-발현 및 정제를 위한 상업적 확장성 측면에서 많은 성공이 달성되지 않았다. 또한, 확장성뿐 아니라, 발현되는 표적 단백질의 품질을 갖는, 다양한 기원 및 패밀리에 걸쳐 난발현 재조합 단백질의 발현을 위한 안정적이고, 일관되고 강한 플랫폼을 갖기에는 당업계에 큰 허점이 있다.

예를 들어, 알려진 새로운 약물 표적 수용체 및 백신 표적의 50% 이상이 막 단백질로서 인식된다. 또한, 모든 도메인을 포함하는 이들의 전장의 막 단백질의 과잉-발현은 용이한 과제가 아니라는 것이 잘 이해된다. 이종 시스템에서 막관통 도메인/들을 갖는 단백질의 재조합 발현은 또한 단백질의 응집, 침전, 부정확한 단백질 폴딩(folding)을 야기하는 이들의 높은 소수성 성질 및 서열 복잡성으로 인해 가용화 및 재폴딩이 매우 어렵다(Lundstrom et al. 2006). 이들 단백질은 보통 불용성 발현을 피하기 위해 E. coli 숙주 시스템을 사용하여 막관통 도메인의 결실을 갖는 변형된 단백질로서 발현된다. 이 접근법의 단점은 이것이 전장 서열 발현의 결여, 및 결과적으로 분석을 위한 전장 단백질의 결여를 야기한다는 것이다. 진핵생물 숙주 시스템은 이들의 생화학적 및 구조적 특징화 요건에 대해 무손상 및 전장으로서, 이들의 자연 형태로의 이들의 발현을 위해 추천된다. 이용가능한 문헌에 따르면, 막 단백질 생산을 위한 범용적인 해법은 없으며, 이는 상당한 장애물로 계속 남아있다(Elizabeth Massey-Gendel et al. 2009).

막에서의 초기 폴리펩티드 쇄의 발현 및 친밀한 상호작용 및 삽입은 약물 표적 또는 백신 후보로서의 이의 분석에 대해 특정 단백질을 연구하기 위한 하나의 중요한 파라미터이다.

다중 전장 막관통 단백질을 발현시키기 위한 안정적인 다용도 발현 시스템을 제공하는 것이 당업계에 필요하다. 예로서, 본 발명자들은 전장 및 기능적 활성 뉴라미니다아제(NA), 막관통 DTE-P의 발현을 입증하였다. 막 고정된 단백질로서 뉴라미니다아제를 발현시키는 것의 어려움 이외에, 이의 서열은 또한 높은 수의 시스테인 잔기 및 소수성을 갖는 것으로 밝혀졌으며, 이는 E. coli와 같은 발현 시스템에서 불용성 발현 및 응집을 향한 이의 경향을 추가로 기재한다. 높은 프롤린 잔기의 존재는 또한 안정적인 생산물 생성을 위한 나선 파괴인자인 불안정성을 추가한다. 전장 NA 발현의 재조합 발현에 대한 제한된 문헌은 효모 숙주 발현 시스템에서 이용가능하다. 현재, 인플루엔자 바이러스 및 아형에 대한 면역 반응을 유도하는 범용적인 효과적 백신을 개발할 미충족된 필요성이 있다. 전장 NA 발현은 입체구조 에피토프를 포함하여 면역 반응을 분석하기 위해 가장 중요하다. 이러한 기능을 수행하기 위해, 뉴라미니다아제를 효율적으로 발현하는 것이 요구된다.

유사하게는, 난발현으로 여겨지는 구조 단백질의 발현은 이종 발현 시스템에서 완전히 가용성이고, 잘 폴딩되고, 활성인 형태로 나타나지 않는다. 이들의 주요 특징은 포함체를 응집하고 형성하는 경향이다. 구조 단백질의 패밀리에 속하는 바이러스 표면 당단백질 및 다른 캡시드 단백질은 백신에 대한 기능적 표적으로 오랫동안 인식되어 왔다. 캡시드 단백질과 같은 백신 후보는 중증 바이러스 질환에 대한 보호를 유도하기 위한 매력적인 전략일 수 있다.

본 출원에 기재된 다용도 플랫폼은 난발현 구조 단백질 중 일부를 발현할 수 있다. 본 발명자들은 청구된 플랫폼이 His- 태그가 부가된 347 개 아미노산 길이의 글리코실화된 단백질인 캡시드 당단백질 바이러스 단백질 VP7의 안정적이고 향상된 발현을 허용한다는 것을 입증하였다. 서열은 높은 소수성과 함께 많은 수의 시스테인 및 프롤린 잔기를 함유하고 있으며, 따라서 난발현 단백질이다. 단백질은 과잉발현될 때, 불용성 발현 및 응집을 향한 경향을 갖는다는 특징이 기재되며, 이는 진핵생물 시스템을 사용하는 이의 발현을 추천한다. 또한, 구조 파괴인자인 많은 수의 프롤린 잔기는 단백질을 불안정적인 범주로 만든다. 단백질에 대한 중화 항체는 혈청형 특이적 및 교차-반응성 보호 둘 다를 제공할 수 있고, 따라서 인간 건강관리 기류에서 백신 개발을 위해 중요한 것으로 고려된다.

본 발명자들은 또한 본 발명의 플랫폼이 지방산 효소와 같은 효소 단백질을 발현할 수 있다는 것을 입증하였다. 다중불포화 지방산(PUFA)으로 알려진 일부 지방산 및 유도체는 매우 필수적이고 염증 반응, 지질 대사 조절을 포함한 기능을 가지며, 또한 시그널링 경로에서 기능을 갖는다(Hoshino et al., 1984). 이러한 지방산 효소의 핵심 대표인 불포화효소는 단일 통과로부터 다중-통과로 변화하며, 식물, 진균 및 동물의 세포질 그물막에 국소화될 가능성이 있는 막관통 단백질이다.

불포화효소의 연구에 대한 진행은 이들 효소의 막 단백질 추출 및 결정화의 복잡성으로 인해 제한되었다. 결과적으로, 막-결합된 지방산 불포화효소의 구조 및 발현 조절에 대한 지식은 여전히 부족하며, 막관통 도메인이 지방산 불포화효소 효율에 임의의 역할을 갖는지 여부는 알려지지 않은채 남아있다(Wyatt et al., 1983). 불포화효소는 이의 막 성질, 높은 시스테인 및 프롤린 함량에 의해 기재된 바와 같이 높은 소수성을 갖는다. 상기 속성은 이를 난발현 범주로 유지하고, 세균 숙주 시스템에서 발현되는 경우, 불용성 발현에 대한 경향을 기재한다. 따라서, 이들 난발현 효소 단백질을 발현하기 위한, 특히 이들을 상업적 규모로 생산하기 위한 신뢰성 있고 효율적인 시스템을 갖는 것이 가장 중요하다. 본 발명자들은 본 발명의 플랫폼을 통해 불포화효소의 4-다중-통과 막 단백질 서열의 발현을 성공적으로 입증하였다.

또한, 지방산 신장은 지질 대사 적용에 관련된 지방산 생산의 대체 경로로서 작용하는 매우 중요한 단계이다. 신장효소 단백질은 또한 높은 소수성, 높은 시스테인 및 프롤린 함량을 갖는다. 이들 속성은 이들이 발현하기 어렵게 만든다. 게다가, 세균 숙주 시스템에서 발현되는 경우, 불용성 발현에 대한 경향이 있다.

이온 펌프, 이온 채널 및 수송체와 같은 많은 중요한 단백질이 막에 여러번 걸쳐 있다. 이들 다중-통과 막관통 단백질에서 각각의 막에 걸친 α 나선은 토포제닉 서열(topogenic sequence)로서 작용하는 것으로 생각된다. 본질적으로, 막관통 단백질은 세포, 세포 내외의 페리 분자(ferry molecule) 사이의 소통을 매개하고, 약물에 대한 공통의 표적이다. 초기 폴리펩티드 쇄의 발현 및 막에서의 친밀한 상호작용 및 삽입은 약물 표적 또는 백신 후보로서의 이의 분석에 대해 특정 단백질을 연구하기 위한 하나의 중요한 파라미터이다. 그러나, 이러한 상이한 환경에 걸쳐있는 동안 어떻게 큰, 다중-통과 막관통 단백질 디자인이 형상과 기능으로 폴딩될 수 있는지를 예측하는 것은 어려웠다.

이종 시스템에서 막관통 도메인/들을 갖는 단백질의 재조합 발현은 또한 단백질의 응집, 침전 및 부정확한 단백질 폴딩을 야기하는 이들의 높은 소수성 성질 및 서열 복잡성으로 인해 매우 도전적이며, 가용화 및 재폴딩이 어렵다. 잘 정돈된 다중-통과 막관통 단백질을 스크래치(scratch)로부터 생산하기 위해서는, 몇몇 생물물리학적 요구가 동시에 균형을 이루어야 한다. 알파-나선형 구조 상에 소수성 견본을 배치하는 것은 막-회합을 생성하기에 충분하지만, 소수성 나선의 패킹 및 배향은 제어하기 어렵다. 이에 의해, 원핵세포에서 이러한 다중 막관통 단백질의 발현 및 그 다음에, 이들을 정확한 입체구조로 생성하기 위해 이들을 재폴딩하는 것은 용이한 과제가 아니다.

본 발명자들은 본 발명의 다용도 플랫폼을 통해 이온 채널 수용체, 다중-통과 막 단백질 Nav1.7의 발현을 성공적으로 입증하였다. Nav1.7은 전압성 나트륨 채널(voltage-gated sodium channel)로서 여기성 막의 전압-의존성 나트륨 이온 투과성을 매개하고 통증 시그널링에 관여한다. Nav1.7은 인간에서 통증 치료에 대한 검증되고 유망한 약물 표적이다.

Nav1.7은 24 개의 트랜스 막 도메인을 갖는 글리코실화된 1988 개 아미노산 길이의 다중-통과 막 단백질이고, 세포/원형질막에 국소화된다. 이 채널의 주요 서브유닛은 알파 서브유닛인 >200 kDa의 단백질이다. 서열은 각각 5개의 소수성 세그먼트(S1, S2, S3, S5, S6) 및 하나의 양으로 하전된 세그먼트(S4)를 갖는 4 개의 내부 반복부를 함유한다.

단백질은 올리고머 입체구조, 매우 큰 크기, 높은 홀수의 시스테인, 프롤린 잔기 및 높은 소수성을 함유한다. 관찰된 파라미터는 단백질의 과잉 발현이 원핵생물에서 불용성 발현 및 응집을 산출할 수 있다는 것을 나타낸다. 높은 크기 및 프롤린 잔기(나선 파괴인자) 둘 다는 추가로 열화를 야기할 수 있다. 이 단백질의 불안정성 지수는 이 단백질을 불안정적인 단백질로 분류한다.

일부 배양 모델에서, 수용체 발현이 저하되거나 조절 장애가 발생하여, 배양액에서 시간에 걸쳐 Nav1.7의 발현에 어려움을 생성한다는 것이 밝혀졌다. 본 발명의 발명자들은 본 발명의 재조합 발현 플랫폼에 의해 Nav1.7의 전장 막-고정된 알파 서브유닛의 발현을 성공적으로 입증하였다.

DTE-P의 다른 중요한 범주는 약물 표적 분자(GPI 고정된 단백질)이다. 주요 약물 표적 부류는 항신생물제, G 단백질-결합된 수용체(GPCR), 이온 채널, 키나아제 및 프로테아제에 속한다(Kubic et al, 2019). 주로 원핵생물 및 진핵생물 기원의 세포 유기체를 기초로 하여 광범위한 단백질 발현 시스템이 현재 이용가능하다. 원핵생물 시스템의 제한은 정확한 단백질 폴딩, 조립 및 활성을 위해 번역후 변형, 보조인자 및 샤페론을 요구하는 복잡한 포유동물 표적 단백질이 생산될 필요가 있을 때 발생한다.

하나의 이러한 약물 표적 단백질이 보체 활성화를 조절하기 위해 막 공격 복합체의 형성의 억제제로서 작용하는 글리코실포스파티딜이노시톨-고정된(GPI 고정된) 막 단백질인 CD59 단백질이다. 최근의 연구는 CD59가 몇몇 암 세포주 및 종양 조직에서 고도로 발현된다는 것을 나타내었다. CD59는 또한 종양 미세환경에서 다양한 면역 세포의 기능, 침윤 및 표현형을 조절한다. (Zhao et al, 2018). CD59는 유방암의 유전자 요법에서 유망한 표적으로서 고려되고 있다. (Xu et al).

이들 문제를 극복하기 위해, 효모 시스템(피치아 파스토리스(Pichia pastoris), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 클루이베로마이세스 락티스(Kluyveromyces lactis)) 및 포유동물 시스템(HEK293, 중국 햄스터 난소 세포(CHO 세포))을 포함하는 진핵생물 세포-기반 발현 시스템이 당업계에서 제안되었다. 포유동물 시스템은 드물게만 성공적인 것으로서 보고된다. 단백질 생산 목적을 위한 진핵생물 안정적 세포주의 생성은 높은 생산 시간 외에도 느린 세포 성장, 및 낮은 단백질 수율에 의해 비용이 많이 드는 단백질 생산 공정을 야기하는 것으로 인해 상당히 힘든 것으로 밝혀졌다. (Kubic et al, 2019).

상기 단락에서 논의된 바와 같이, 다양한 DTE-P의 발현 및 생산을 위해 유연하고 적응가능한 효율적인 재조합 발현 시스템/플랫폼을 갖는 것은 시간이 필요하다. 바람직한 특징은 최적의 발현, 빠르고 시간 절약적인 표준화된 방법론 및 확장성 용이를 요구하며, 비용 효율성으로 많은 집단을 만족시킬 수 있는 분석, 진단 및 치료적 용도를 위해 많은 양의 물질을 생산하는 능력을 갖는다.

따라서, 본 발명은 다양한 기원 및 패밀리로부터의 표적 DTE-P 단백질을 확장가능하고 상업적인 수준으로 발현할 수 있는 프로테아제 결핍 효모 세포 숙주 시스템을 갖는 재조합 발현 벡터를 포함하는 다용도 재조합 단백질 발현 플랫폼을 제시함으로써 이러한 요구를 해결한다. 청구된 재조합 발현 플랫폼 및 방법은 선행 기술의 단점을 극복하고, 이에 비해 상당한 기술적 진보를 제공한다.

본 발명의 목적

본 발명의 주된 목적은 다양한 기원 및 패밀리의 전장 또는 절단된 표적 "난발현" 단백질(DTE-P)의 향상된 발현을 위한 다용도 효모-기반 재조합 발현 플랫폼을 제공하는 것이다.

본 발명의 또 다른 목적은 본 발명의 재조합 발현 플랫폼을 사용한 DTE-P의 향상된 발현을 위한 방법을 제공하는 것이다.

본 발명의 또 다른 목적은 표적 DTE-P 생산을 위한 본 발명의 재조합 발현 플랫폼을 포함하는 키트를 제공하는 것이다.

본 발명의 다른 중요한 목적은 모든 기능을 그대로 갖는 소망하는 DTE-P의 향상된 발현 및 확장성을 위한 다용도 재조합 효모-기반 플랫폼, 방법 및 키트를 제공하는 것이다.

첨부된 도면은 본 발명의 실시양태 중 일부를 나타내며, 설명과 함께 본 발명을 설명한다. 이들 도면은 제한의 방식이 아닌 예시의 방식에 의해 제공되었다.
도 1은 유도성 GAL 프로모터를 사용한 재조합 단백질의 발현을 위한 pYRI100 효모 통합 벡터를 나타낸다.
도 2는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRI200 효모 통합 벡터를 나타낸다.
도 3은 유도성 GAL 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE100 효모 에피솜 벡터를 나타낸다.
도 4는 ADH2 구성적 프로모터를 사용한 재조합 단백질 발현을 위한 pYRE200 효모 에피솜 벡터를 나타낸다.
도 5는 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 6은 대규모의 뉴라미니다아제의 웨스턴 블롯 분석을 나타낸다.
도 7은 뉴라미니다아제의 유세포 분석 결과를 나타낸다.
도 8은 뉴라미니다아제에 대한 IgM 반응을 나타낸다.
도 9는 뉴라미니다아제에 대한 IgG 반응을 나타낸다.
도 10 뉴라미니다아제의 활성 분석.
도 11은 VP7의 발현의 면역블롯 분석을 나타낸다.
도 12는 정제된 VP7 단백질의 SDS PAGE 분석을 나타낸다.
도 13은 지방산 불포화효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 14는 지방산 신장효소 단백질의 발현을 확인한 면역블롯 분석을 나타낸다.
도 15는 스케일 업 배양액으로부터 정제된 지방산 신장효소 단백질의 SDS PAGE 및 면역블롯 분석을 나타낸다.
도 16은 Nav1.7의 발현을 나타내는 면역블롯 분석을 도시한다.
도 17은 NaV1.7의 표면 발현을 나타내는 공초점 현미경을 나타낸다.
도 18은 CD59 단백질의 과잉발현을 확인하기 위한 항-His 항체 및 항-CD59 항체를 사용한 면역블롯 분석을 나타낸다.
도 19는 CD59 단백질의 정제를 나타낸다.

요약

본 발명은 재조합 발현 플랫폼에서 난발현 단백질(DTE-P)의 발현에 관한 것이며,

i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모-기반 발현 벡터로부터 선택되는 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Leu 또는 Ura3로부터 선택된 영양요구성 선택 마커; CYCT1 종결인자; 내성 마커 암피실린; pUC ori; 2 미크론 기원; 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질을 코딩하는 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;

ii. PRB1, PEP4, 우라실, 리신, 아데닌 및 류신 영양요구성 마커를 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포

를 포함하고, 다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,

다용도 재조합 발현 플랫폼을 개시한다.

상기 시스템을 통해 이러한 DTE-P를 발현하는데 관여하는 구축물, 방법 및 키트가 또한 기재된다.

상세한 설명

본 발명의 하나 이상의 실시양태의 상세내용이 예를 들어, 본 발명을 수행하기 위해 본 발명자들에 의해 고려되는 최고의 방식의 특정 상세내용을 포함하여 아래에 첨부된 설명에 기재된다. 본 발명이 이들 특정 상세내용에 제한되지 않고 실시될 수 있다는 것은 통상의 기술자에게 명확할 것이다.

정의:

"포함하다(comprise)", "포함한다", "포함하는", "함유하다", "함유한다", "함유하는", "포함하다(include)", "포함한다" 및 "포함하는"의 사용은 제한인 것으로 의도되지 않는다. 상술한 일반적인 설명 및 이 상세한 설명 둘 다는 예시적이고 설명적일 뿐이며 제한적이지 않다는 것이 이해되어야 한다.

용어 "난발현 단백질(DTEP)"은 이종 발현 시스템에서 완전히 가용성이고, 잘 폴딩된 활성 형태로 나타나기 어렵거나 불가능한 단백질을 정의한다.

용어 "발현 플랫폼"은 연구 또는 산업적 용도를 위해 많은 양의 단백질, 당 또는 다른 화합물을 생산하기 위한 시스템을 정의한다.

용어 "발현 벡터"는 세포에서 유전자 발현을 위해 설계된 플라스미드 또는 바이러스를 정의한다.

용어 "숙주 세포"는 재조합 단백질의 생성을 위해 사용되는 숙주 세포를 의미한다.

용어 "원핵생물 단백질"은 원핵생물 세포/유기체에서 발견되는 단백질을 포함한다.

용어 "진핵생물 단백질"은 진핵생물 세포/유기체에서 발견되는 단백질을 포함한다.

용어 "바이러스 단백질"은 효소 단백질을 포함한 바이러스에 의해 생성되는 단백질뿐 아니라 캡시드, 바이러스 외피와 같은 구조 단백질을 포함한다.

용어 "포유동물 단백질"은 포유동물에서 생산되는 단백질을 포함한다.

용어 "식물 단백질"은 식물에서 생산되는 단백질을 포함한다.

용어 "조류 단백질"은 모든 클래스의 조류에서 발견되는 단백질을 포함한다.

용어 "고도의 소수성 단백질'은 수성 환경에 존재하지 않을 수 있어, 발현 및 정제하기 어려운 측쇄를 갖는 단백질을 포함한다.

용어 "다중 막관통을 갖는 단백질"은 이중층을 한번 또는 여러번 횡단할 가능성이 있는 비극성 아미노산 잔기를 우세하게 갖는 단백질을 포함한다.

용어 "막관통 단백질"은 세포막 전체에 걸쳐 있는 통합 막 단백질의 유형을 포함한다.

용어 "구조 단백질"은 반복적인 통상적 아미노산 서열을 갖는 단백질을 포함하고 프레임워크에 기여하며 살아있는 유기체 또는 세포에 기계적 강도를 제공한다.

용어 "이온 채널 수용체"는 보통 원형질막에 위치하는 다량체 단백질을 포함한다.

달리 정의되지 않는 경우, 본원에 사용되는 과학적 및 기술적 용어는 통상의 기술자에 의해 공통적으로 이해되는 의미를 가질 것이다. 또한, 문맥상 달리 요구되지 않는 경우, 단수 용어는 복수를 포함할 것이고, 복수 용어는 단수를 포함할 것이다. 일반적으로, 본원에 기재된 세포 및 조직 배양, 분자 생물학, 및 단백질 및 올리고- 또는 폴리뉴클레오티드 화학 및 하이브리드화와 관련하여 이의 기술에서 이용되는 명명법은 당업계에 잘 알려져 있고 일반적으로 사용된다.

본 발명은 다양한 패밀리 및 기원의 난발현 단백질(DTE-P)의 향상된 발현을 위한 재조합 효모-기반 발현 플랫폼을 개시한다. 개시된 플랫폼은 재조합 효모 숙주-기반 시스템을 사용한다. 플랫폼은 설계된 업스트림 조절 서열과 함께 통합 및 에피솜 둘 다의 벡터의 어레이; 조작된 프로테아제 결핍 효모 숙주(프로테아제 결핍 균주) 및 상이한 기원 및 패밀리로부터의 서열 최적화된 단백질의 강하고 향상된 발현을 위한 코돈 조화를 포함한다. 다중 조작된 발현 균주는 표적 단백질 및 이의 고유한 특성에 따라 선택될 수 있다.

본 발명은 추가로 식물, 인간, 동물, 세균, 진균 또는 바이러스 기원의, 다양한 수준의 복잡성, 상이한 공급원, 범주 및 패밀리를 갖는 DTE-P를 포함하는 몇몇 표적 단백질의 발현을 위한 단일 재조합 발현 플랫폼의 용도를 추가로 개시한다.

주요 실시양태에서, 본 발명은

i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 하나 이상의 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Ura3 또는 Leu로부터 선택된 영양요구성 선택 마커; 종결인자 CYCT1; 암피실린 내성 마커; 복제 부위 pUC ori의 기원; 2 미크론 기원; 하나 이상의 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질에 대한 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;

ii. 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포

를 포함하고,

다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,

다용도 재조합 발현 플랫폼을 제공한다.

또 다른 실시양태에서, 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포는 사카로마이세스 세레비지애 기원의 것이다.

또 다른 실시양태에서, 상기 난발현 단백질은 다양한 기원 및 패밀리로부터의 것이고, 비제한적으로, 바이러스, 원핵생물, 진핵생물, 포유동물, 인간, 식물, 바이러스 패밀리, 조류 단백질, 독소, 고도의 소수성 단백질, 다중 막관통 도메인을 갖는 단백질, 막관통 단백질, 구조 단백질, 비-구조 단백질, 이온 채널 패밀리와 같은 약물 표적 수용체, G-단백질 결합된 수용체(GPCR), GPI 고정된 단백질, 효소, TNFR 패밀리, 원형질막 및 소포체에서 발견되는 것, 골지 구획 및 세포질 국소화된 단백질로부터 선택된다.

또 다른 실시양태에서, 상기 난발현 단백질은 바이러스 단백질이고, 상기 바이러스 단백질은 바이러스 효소 단백질일 수 있으며, 결국 상기 바이러스 효소 단백질은 막 결합된 단일 통과 막 단백질, 예컨대 뉴라미니다아제일 수 있다.

또 다른 실시양태에서, 본 발명은 전장 뉴라미니다아제를 코딩하는 서열번호 1을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 막 결합된 뉴라미니다아제의 발현을 위한 서열번호 7을 갖는 핵산 구축물을 제안한다.

또 다른 실시양태에서, 본 발명은

i. 핵산 구축물을 제조하는 단계;

ii. 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;

iii. 뉴라미니다아제의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계

를 포함하는, 재조합 발현 플랫폼에 의해 막 결합된 뉴라미니다아제를 생산하는 방법을 개시한다.

또 다른 실시양태에서, 상기 뉴라미니다아제 단백질은 면역원성 반응을 유도하고 기능적으로 활성이다.

또 다른 실시양태에서, 상기 난발현 단백질은 고도의 소수성 바이러스 단백질일 수 있고, 상기 고도의 소수성 바이러스 단백질은 VP7과 같은 캡시드 단백질일 수 있는 구조 단백질이다. 상기 고도의 소수성 바이러스 구조, 캡시드 단백질 VP 7은 백신 후보이다.

또 다른 실시양태에서, 본 발명은 전장 VP7을 코딩하는 핵산 서열 서열번호 2, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 바이러스 구조 캡시드 단백질 VP7의 발현을 위한 서열 8을 갖는 핵산 구축물을 개시한다.

또 다른 실시양태에서, 본 발명은

i) 핵산 구축물을 제조하는 단계;

ii) 상기 구축물을 프로테아제 결핍 효모 숙주 세포에서 형질전환시키는 단계;

iii) VP7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계

를 포함하는, 재조합 발현 플랫폼에 의해 고도의 소수성 바이러스 구조 캡시드 단백질 VP7을 생산하는 방법을 제공한다.

또 다른 실시양태에서, 상기 난발현 단백질은 다중-통과 막관통 단백질일 수 있고, 상기 다중-통과 막관통 단백질은 이온 채널 수용체 패밀리로부터의 것이고, 이러한 다중-통과 막관통 단백질은 이온 채널 수용체 패밀리로부터의 것이고, 상기 단백질은 Nav 1.7 단백질일 수 있고, 이는 약물 표적 수용체 단백질일 수 있다.

또 다른 실시양태에서, 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 3, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 막관통 이온 채널 수용체 단백질 Nav1.7의 발현을 위한 서열번호 9를 갖는 핵산 구축물.

또 다른 실시양태에서, 본 발명은

i) 핵산 구축물을 제조하는 단계;

iii) Nav1.7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계;

iv) 공초점 현미경을 사용하는 발현된 Nav1.7의 표면 국소화의 단계

를 포함하는, 본 발명에 따른 재조합 발현 플랫폼에 의해 막관통 Nav1.7 단백질을 생산하는 방법을 제안한다.

또 다른 실시양태에서, 상기 난발현 단백질은 막관통 단백질인 효소 단백질일 수 있다. 이러한 막관통 단백질은 지질 생합성 사이클로부터의 것이고 지방산 불포화효소이며, 진균 기원으로부터의 것일 수 있다.

또 다른 실시양태에서, 본 발명은 전장 Nav1.7을 코딩하는 핵산 서열 서열번호 4, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 지방산 불포화효소의 발현을 위한 서열 번호 10을 갖는 핵산 구축물을 제안한다.

또 다른 실시양태에서, 본 발명은

i) 핵산 구축물을 제조하는 단계;

iii) 지방산 불포화효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계

를 포함하는, 재조합 발현 플랫폼에 의해 지방산 불포화효소 단백질을 생산하는 방법을 제안한다.

또 다른 실시양태에서, 상기 난발현 단백질은 효소 단백질이고 지질 생합성 사이클로부터의 막관통 단백질이다. 지질 생합성으로부터의 상기 막관통 단백질은 지방산 신장효소이다.

또 다른 실시양태에서, 본 발명은 전장 신장효소를 코딩하는 서열번호 5를 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 지방산 신장효소의 발현을 위한 서열번호 11을 갖는 핵산 구축물을 제안한다.

또 다른 실시양태에서, 본 발명은

i) 핵산 구축물을 제조하는 단계;

iii) 지방산 신장효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계

를 포함하는, 재조합 발현 플랫폼에 의해 지방산 신장효소 단백질을 생산하는 방법을 개시한다.

또 다른 실시양태에서, 상기 난발현 단백질은 글리코실포스파티딜이노시톨-고정된(GPI 고정) 단백질일 수 있고 약물 표적 단백질일 수 있으며, 상기 약물 표적 단백질은 인간 기원의 CD59이다.

또 다른 실시양태에서, 본 발명은 전장 신장효소를 코딩하는 서열번호 6을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, GPI 고정 단백질 CD59의 발현을 위한 서열번호 12를 갖는 핵산 구축물을 제안한다.

또 다른 실시양태에서, 본 발명은

i) 핵산 구축물을 제조하는 단계;

iii) CD59의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계

를 포함하는, 재조합 발현 플랫폼에 의해 GPI 고정 CD59 단백질을 생산하는 방법을 제안한다.

또 다른 실시양태에서, 상기 플랫폼은 확장가능하고 산업적 규모로 다양한 기원 및 패밀리로부터 단백질을 생산할 수 있다.

또 다른 실시양태에서, 본 발명은 재조합 발현 플랫폼을 포함하는 키트로서,

i) 상기 난발현 표적 단백질을 코딩하는 핵산 구축물;

ii) 조작된 프로테아제 결핍 효모 숙주 세포;

iii) 상기 키트를 작동하기 위한 사용설명서

를 포함하는, 키트를 제공하였다.

본 발명에서 개발되고 사용되는 대표적인 S. Cerevisiae 발현 벡터는 아래와 같이 지정된다:

a. Gal 프로모터와 함께 Leu 영양요구성 선택 마커, CYCT1 종결인자, 내성 마커, pUC ori를 포함하는 pYRI100 효모 통합 벡터.

b. ADH2 프로모터와 함께 Leu 영양요구성 선택 마커, CYCT1 종결인자, 내성 마커, pUC ori를 포함하는 pYRI200 효모 통합 벡터.

c. pYRE100 효모 에피솜 벡터는 Gal 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 선택을 위한 내성 마커, pUC ori를 포함한다.

d. pYRE200 효모 에피솜 벡터는 ADH2 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 선택을 위한 내성 마커, pUC ori를 포함한다.

실시예

본 발명은 예시로서 이하에서 추가로 설명되며, 더욱 구체적으로, 본 발명을 작동시키는 최고의 방식을 설명하기 위해 다음의 단락들이 제공되며, 이 섹션의 어떤 것도 청구범위의 제한으로서 취해지지 않아야 한다.

실시예 1: 뉴라미니다아제(NA)의 발현:

본 실시예는 재조합 발현 플랫폼을 사용한 발현을 위한 연구 실시예로서 인플루엔자 A 바이러스(A/Hatay/2004/(H5N1)를 사용한다. 변이체를 또한 플랫폼 적응성, 시간 절약 및 비용 효율적인 접근법을 나타내는 동일한 방법론을 사용하여 성공적으로 발현시켰다. NA의 전장 아미노산 서열(449aa)을 이용하였다.

실시예 1.2: 클로닝 및 구축물 제조

발현 단백질이 C-말단 His 태그를 갖도록 종래의 클로닝 방법론을 사용하여 발현 플라스미드 pYRE100(도 3) 내로 유전자를 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용한 발현 연구를 위해 재조합 발현 플랫폼의 S. cerevisiae 숙주에서 구축물을 형질전환시켰다(도 5).

실시예 1.2: S. cerevisiae 프로테아제 결핍 숙주 균주에서의 형질전환:

특징화된 재조합 구축물을 발현 연구를 위해 완결시켰다. 구축물을 리튬 아세테이트/SS-DNA/PEG 매개된 프로토콜을 사용하여 프로테아제 결핍 효모 균주에서 형질전환시키고, 형질전환체를 대조군(pYRE100 벡터 백본으로 형질전환된 프로테아제 결핍 균주)과 함께 YNB 글루코오스 - URA 플레이트 상에서 선택하였다. 일부 단리된 건강한 형질전환된 집락을 10 mL의 YNB 글루코오스 - URA 배지에 접종하고, 유도된 후 24 시간(후기 대수기 A600~5.0 OD/mL에서의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서 항-His 항체를 사용하여 면역블롯 분석에 의해 발현에 대해 분석하였다.

항 His 항체를 사용한 면역 블롯 분석은 유도된 배양액의 3 개의 집락(레인 2, 3 및 5)에서 단백질의 글리코실화로 인해 ~52 kda의 큰 크기의 특이적 밴드를 나타내었다. 그러나, 대조군 샘플에서는 밴드가 관찰되지 않았다(도 5).

결과:

본원에 개시된 S. cerevisiae 균주 및 벡터 조합을 뉴라미니다아제와 같은 유의미한 바이러스 백신 후보를 발현시키기 위해 사용한다. 발현된 단백질은 또한 마이크로솜 제제에서 정제될 때 막 고정되는 것으로 밝혀졌다. 현재 연구는 개발된 발현 플랫폼의 견고성을 입증하며, 이는 NA가 대부분 막 고정 도메인 없이 발현되었기 때문이다. 따라서, 발현된 플랫폼은 바이러스 백신 후보의 대규모 생산을 위한 강한 발현 시스템을 개발하기 위해 스케일 업될 수 있다. 클론을 100X의 부피 규모까지 추가로 스케일 업하였다. 막 분획로부터, 실시예에 언급된 프로토콜을 사용하여 마이크로솜을 제조하였다. 항-His 면역블롯을 사용하여 발현을 분석하였다. 관심 밴드를 세포 용해물 및 제조된 마이크로솜 분획 둘 다에서 관찰하였다. 발현을 세포 용해물 및 대조군의 마이크로솜에 대해 확인하였다(도 6).

또한, 단백질의 원형질막 국소화를 유세포 분석 연구를 사용하여 확인하였다(도 7).

실시예 1.3: 유세포 분석 연구를 사용한 발현된 NA 분석의 원형질막 국소화

샘플 제조

1 OD_600nm와 동등한 원형질막 국소화된 NA를 발현하는 효모 세포를 채취하고, 투과성부여(permeabilization) 세포 샘플 분석의 유무에 대해 Triton X100(0.25%)이 있거나 없이 15 분 동안 파라포름알데하이드(4% v/v)로 고정시켰다. 임의의 유전자 삽입이 없는 S.cerevisiae 세포를 대조군으로 사용하였다. 세포를 재현탁시키고, 세척하고, 재현탁시키고, 1X PBS에서 제조된 1% BSA에서 1 시간 동안 25℃에서 항온처리하였다.

세포를 추가로 세척하고, 재현탁시키고 1 시간 동안 25℃에서 일차 항체의 1:50 희석액과 함께 항온처리한 후, 3 회 세척 후 이차 항체 항온처리를 1X PBS에서만 항온처리하였다. 4000 rpm에서 1 분 동안 원심분리. 세포를 이차 항체(1:100 μL)에 재현탁시키고, 25℃에서 30 분 동안 항온처리하였다. 세포를 4℃에서 1.5 분 동안 4000 rpm에서 원심분리에 의해 1X PBS로 세척하였다. 세포를 1 X PBS 중의 2% FBS에 재현탁시키고, FACS 기구 ACEA Novo Cyte 유세포 분석기(모델: 3005)에서 판독하였다. 6X His 태그 특이적 항체를 일차 항체로서 사용하고 항-마우스 Alexa flour 488 표지된 이차 항체를 연구를 위해 사용하였다.

결과

유세포 분석 데이터는 투과성부여된 샘플 및 비-투과성부여된 샘플 둘 다에 대해 NA 발현 세포의 이동을 나타내었다. 비-투과성부여된 세포의 11.13%는 표면에서 NA의 발현을 나타내었으나, 투과성부여된 세포에서는 더 많은(14.38%) 것으로 밝혀졌다. 결과는 단백질이 세포 표면에 국소화된다는 것을 제시한다(도 7).

실시예 1.4: 동물 연구

S. cerevisiae 플랫폼을 사용하여 발현된 재조합 뉴라미니다아제(인간)에 대한 마우스에서의 면역원성 반응의 분석.

NA 단백질을 마이크로솜으로서 풍부화하고, 면역원성 반응을 연구하기 위해 마우스에 근육내로 주사하였다. 면역화를 위해, BALB/c 마우스에 0, 14 및 28 일차에 (100 ㎍의 NA 마이크로솜을 갖는 50 μL)의 용량 부피로 NA 마이크로솜 제형을 근육내로(i.m) 주사하였다. 마우스를 마취제 투여 후 안구뒤/꼬리 정맥에서 출혈시켰다. 총 IgG, 및 IgM 반응을 면역-전, 21- 및 35-일 혈청을 이용한 ELISA를 사용하여 측정하였다.

다음은 면역 반응을 확인하기 위한 숙주 상세내용이다.

시험 시스템: 마우스; 무스 무스쿨루스(Mus musculus)

균주: Balb/c

성별: 수컷

연령: 6-8 주

면역 평가를 위한 혈액 샘플의 수집

NA 마이크로솜에 대해 생성된 면역 반응을 평가하기 위해, 마취제 투여 후 안구뒤 출혈에 의해 마우스로부터 혈액 샘플을 수집하였다. 대조군 혈청 샘플을 면역화의 개시 하루 전에 수집하였다. 면역화 후, 혈액 샘플을 21 일차 및 35 일차에 2 차 면역화 후에 수집하였다. 수집된 혈액 샘플을 혈청 제조를 위해 사용하였다. 혈청을 샘플로부터 수집하고 IgM 및 IgG 반응(도 8 및 도 9)(체액 면역 반응)을 측정하기 위해 사용하였다.

체액 면역 반응의 평가:

ELISA를 사용하여 NA 마이크로솜에 대한 항체 반응을 측정하기 위해 혈청 샘플을 사용하였다. 천연 S.cerevisiae 균주로부터의 마이크로솜 제제를 대조군으로서 사용하였다. ELISA 플레이트를 4℃에서 밤새 마이크로솜 제제로 코팅하였다. 플레이트를 1% BSA로 차단하였다. 이어서, 혈청 샘플을 적절히 희석하고 이중으로 적용하고 37℃에서 1 시간 동안 항온처리하였다. 이어서, 플레이트를 세척하였다(0.01% 의 Tween 20을 함유하는 PBS). 이어서, 꽃양배추 퍼옥시다아제 항온처리와 콘쥬게이트된(conjugated) 이차 항-마우스 항체로 IgG 및 IgM(37℃에서 1 시간)을 추정하였다. 플레이트를 발색을 위해 TMB 기질 용액을 사용하여 발달시켰다. 반응을 2N H2S04로 정지시키고, 450 nm에서 흡광도를 결정하였다.

21 및 35 일차의 총 IgG 수준: 면역 반응을 결정하기 위한 혈청 연구

면역 반응을 평가하기 위해, NA 및 대조군 마이크로솜을 ELISA를 위해 100 ng/웰의 농도로 코팅하였다. 혈청 샘플을 각각 IgM 및 IgG 반응의 결정을 위해 1:1000 및 1:2500으로 희석하였다(도 8 및 도 9).

이들 결과는 NA 마이크로솜 제제가 주사된 마우스가 대조군 효모 세포 마이크로솜과 비교하여 특이적 IgM 및 IgG 반응을 나타내었다는 것을 나타낸다. 따라서, 마이크로솜 제제 내의 NA 단백질은 면역원성이고, 마우스에서 면역 반응을 유도한다는 것을 제시한다. 따라서, 효모 플랫폼으로부터의 NA 단백질은 백신 후보로서 잠재적으로 사용될 수 있다.

실시예 1.5: 마이크로솜 제조를 위한 배양액:

단리된 건강한 패칭된(patched) 집락을 예비 종균(pre seed)으로서 100 mL의 YNB 글루코오스 - URA 배지에 접종하고, 숙주-벡터 대조군으로서 pYRE100으로 형질전환된 숙주 균주 프로테아제 결핍 균주와 함께 28℃에서 24 시간 동안 진탕 항온처리기에서 배양하였다.

스케일 업 배양액을 접종원 OD600으로서 ~0.25 OD/mL를 갖는 1 리터의 YNB 글루코오스 - URA 배지에서 재접종에 의해 제조하고, 24 시간 동안 28℃에서 진탕 항온처리기에서 배양하였다. 배양액을 수집하고, 세포 펠릿을 YNB - URA 최소 배지에서 2%의 최종 농도로 갈락토오스로 유도하였다. 모든 배양액을 유도 후 24 시간에 수집하였다. 수집된 세포 펠릿을 마이크로솜 제조를 위해 사용하였다. 제조된 마이크로솜을 NA의 발현에 대해 분석하였다. 프로테아제 결핍 균주로부터의 마이크로솜을 대조군으로서 사용하였다.

결과는 마이크로솜에서 항 His 항체를 사용하여 탐지된 발현된 NA 단백질의 존재를 도시한다(레인 3; 도 6). 그러나, 대조군 마이크로솜에서는 밴드가 관찰되지 않았다.

실시예 1.6 뉴라미니다아제(NA)의 활성 분석:

1%의 총 세포 단백질이 NA 마이크로솜을 형성한다고 가정하여, 5 nM, 10 nM, 25 nM 및 50 nM의 마이크로솜 농도를 활성 분석을 위해 사용하였다. 10 μL의 각각의 농도 샘플을 동등한 부피의 분석 완충액(32.5 mM 2-(N-모르폴리노) 에탄 설폰산(MES), pH 6.5, 4mM CaCl2 함유)과 혼합하였다. 30 μL의 833 μΜ MUNANA 기질의 첨가에 의해 효소 반응을 개시한 후, 37℃에서 30 분 항온처리하였다. 반응을 정지액(25% 에탄올 중 100 μΜ 글리신, pH-10.7) 150 μL의 첨가에 의해 종결시켰다. 방출된 형광 생성물, 4-메틸움벨리페론(4-MU)의 양을 각각 355 및 460 nm의 여기 및 방출 파장을 갖는 Spectra MAX Gemini EM(Molecular Devices) 형광계에서 측정하였다. 블랭크 대조군 반응은 기질만을 함유하였다.

모든 반응을 96-웰 평바닥 불투명 폴리스티렌 플레이트(Corning Costar, Corning, NY, USA)에서 삼중으로 수행하였다. 유리 4-MU의 양에 대한 상대 형광 강도를 플롯팅함으로써 표준 곡선을 생성하였다. NA의 하나의 단위를 37℃에서 분당 생산된 4-MU의 1 마이크로몰로서 정의하였다. 표준으로서 소혈청 알부민을 이용한 브레드포드법(Bradford's method)을 사용하여 마이크로솜 농도를 결정하였다(Bradford, 1976).

결과:

결과는 NA가 활성이고 50 nM 농도에서 포화된다는 것을 나타내었다(도 10). 대조군에 대해, NA가 없는 기질을 실험에서 사용하였다.

실시예 2: 바이러스 구조 캡시드 단백질의 발현

실시예 2.1: VP7의 발현

잠재적 백신 표적인 바이러스 캡시드 단백질 VP7 당단백질을 효모 숙주 발현 플랫폼을 사용하여 재조합적으로 발현시켰다. 발현을 위한 유전자를 코돈 편향시키고(codon biased) 효모 숙주에서의 발현을 위해 최적화하였다. 단백질을 10X His 태그와 함께 발현시켰다. 유전자를 종래의 클로닝 방법론을 사용하여 pYRE100 발현 벡터 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 특징화된 구축물을 발현 연구를 위해 프로테아제 결핍 S. cerevisiae 숙주 균주에서 형질전환시켰다. His 태깅된 rVP7의 발현을 면역블롯 분석에서 항-His 항체를 사용하여 확인하였다. 발현된 플랫폼을 25X로 스케일 업하였다. 발현된 단백질을 Ni NTA 크로마토그래피를 사용하여 정제하고 표준에 대해 정량화하였다.

특징화된 재조합 구축물을 다른 실시예에서 언급된 바와 같이 효모 숙주에서 형질전환시켰다. 일부 단리된 건강한 형질전환된 집락을 YNB 글루코오스 - URA 배지에 접종하고, 475 mL의 배양액으로의 스케일 업을 제조하고, 유도된 후 12 및 24 시간(후기 대수기의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서의 발현에 대해 분석하였다. 세포를 수집하고, 샘플을 세포 펠릿에서의 발현 분석을 위해 1XSDS 환원 염료에서 제조하였다. 단백질을 항-His 항체 면역블롯을 사용하여 특징화되었다. 일차 항체로서 항-His 태그를 사용하여 면역블롯을 개발한 후, HRP 콘쥬게이트된 항-마우스 이차 항체에서 항온처리하였다.

결과:

밴드를 24 시간에 38 kda의 정확한 크기의 항-His 항체로 골라냈고(2 개의 클론- 5 및 6), 클론 6은 12 시간 유도 샘플에서도 희미한 밴드를 나타낸 반면, 백본(BB) 및 유도 전(BI) 샘플에서는 밴드가 관찰되지 않았다(도 11). 상기 효모 발현 플랫폼을 사용하여, 재조합 10X His 태그된 VP7 캡시드 단백질을 효과적으로 발현시켰다. 단백질을 Ni NTA 친화도 크로마토그래피를 사용하여 정제하였으며 스케일 업 실시예에 기재하였다. 현재 언급된 플랫폼 및 유사한 발현 및 정제 방법론의 사용은 플랫폼 사용자 친화적이고, 비용 효과적이고 시간 절약적인 접근법을 추가로 나타내었다.

실시예 2.2: 구조 단백질 VP7의 스케일 업

단백질을 10X His 태그로 발현시켰다. VP7 단백질의 무시가능한 발현은 작은 규모(20 mL)로 존재하였다(수율은 60 내지 100 ng/mL의 범위이었음). 클론을 25X 또는 500 mL 규모로 추가로 스케일 업하였다. 발현된 단백질을 친화도 크로마토그래피, 예를 들어 Ni NTA 크로마토그래피를 사용하여 정제하였다. 발현을 환원 SDS PAGE 상에서 분석하였다.

결과:

관심 밴드를 정제 후에 관찰하였다. 수율을 표준으로서 BSA에 대해 측정하였다(도 12). 단백질을 >90% 순도로 정제하였다. 얻어진 수율은 알려진 표준 BSA에 대해 측정된 기준 밀도측정 분석에서 0.08 mg/mL로부터 증가된 8 mg/L이었다.

용적측정으로 25X의 선형 범위를 초과하는 확장가능 과정은 증가된 수율을 나타내는 것으로 밝혀졌으며, 이는 다양한 적용을 위해 요구되는 대량 생산에서 향상된 생산 및 적합성을 향한 플랫폼 능력을 추가로 설명하고 확인시켜준다.

실시예 3: 효소 단백질(지방산 단백질)의 발현

지방산 불포화효소 및 신장효소 둘 다의 효소 유전자 서열을 코돈 편향시키고 S. cerevisiae 숙주에서의 발현을 위해 최적화하였다. 유전자를 C 말단에서 10X his 태그에 융합시켰다.

종래의 클로닝 방법론을 사용하여 유전자를 독점 발현 플라스미드 pYRE100 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용한 발현 연구를 위해 구축물을 S. cerevisiae 숙주에서 형질전환시켰다.

실시예 3.1: 발현을 위한 과정:

특징화된 각각의 재조합 구축물을 다른 실시예에 대해 기재된 유사한 방법론을 사용하여 형질전환시켰다. 각각의 2 개의 클론을 풍부한 YPD 배지에서 독점 프로테아제 결핍 효모 발현 숙주에서 발현시켰다. 발현을 에피솜 벡터 백본으로 형질전환된 효모인 대조군에 대해 확인하였다.

475 mL에서의 양측 단백질 및 양측 클론의 스케일 업 배양액을 풍부 YPD 배지에서 생산하고, 2% 갈락토오스를 사용하여 유도하였다. 24 시간 유도된 세포를 펠릿화하였다. 세포를 완충액에 재현탁시키고, 800 bar에서 5 회 통과 동안 균질화하였다. 용액을 4000 rpm에서 원심분리하였다. 상청액을 펠렛을 건드리지 않고 수집하고, 펠렛을 동일한 부피(상청액의 것)의 우레아 완충액(8 M 우레아, 20 mM Tris, pH 8)에 가용화시켰다. 양측 단백질은 발현되었고 자연적으로 ER 막에 국소화될 가능성이 있다. 발현을 면역블롯팅 분석을 통해 분석하였다. 일차 항체로서 항-His 항체 및 HRP 콘쥬게이트된 항-마우스 이차 항체를 사용하여 면역 블롯을 발생시켰다.

발현을 클론 중 하나에 대한 지방산 불포화효소의 상청액 분획에 대해 ~41 kda의 예상된 크기에서 관찰하였다(도 13). 지방산 신장효소는 클론 중 하나에 대해 ~40 kda(33.4 kda의 예상된 크기)에서 펠렛에서 발현을 나타내었다(도 14). 더 높은 크기는 효모 숙주에서 번역후 변형(글리코실화)으로 인한 것일 수 있다.

실시예 3.2: 지방산 불포화효소의 스케일 업:

상기 플랫폼을 사용하여 10X 부피 규모까지의 추가 스케일-업을 수행하였다. 스케일-업된 배치(batch)를 500 mL 규모 분석에서 사용된 것과 동일하게 YPD(효모 추출물, 펩톤, 및 덱스트로오스) 배지 및 갈락토오스에 의한 유도와 함께 발효조 수준으로 설정하였다. 과정은 10X 스케일 업 및 지방산 불포화효소의 생산을 나타내었다.

세포 밀도(OD₆₀₀)가 3.0~4.0이 되도록 30℃에서 15~20 시간 동안 진탕 항온처리기에서 예비 종균 배양액 0.5 mL를 제조하였다. 초기 발효 과정을 500 mL의 종균 배양액을 이용한 배지의 접종으로 시작하였다. OD₆₀₀이 7-8에 도달하였을 때, 발효조의 온도를 25℃로 유지시키고 배양액을 1 L 5 X YPG(효모추출물, 펩톤, 갈락토오스) 용액의 첨가에 의해 유도하였다. DO 및 pH를 20% 및 5.6 내지 6.0으로 유지하였다.

펠릿을 균질화를 통해 용해시키고, 가용화시키고, Ni NTA 친화도 크로마토그래피를 사용하여 정제하였다. 정제된 단백질을 SDS PAGE 및 항-His 태그 면역블롯팅을 통해 특징화하였다(도 15). 일차 항체로서 항-His 항체 및 HRP 콘쥬게이트된 항-마우스 이차 항체를 사용하여 면역블롯을 발생시켰다.

2.85 mg 단백질의 총 단백질 양을 5 리터 스케일 업으로부터 정제하였다. 이는 공정 개발을 통한 추가 수율 향상의 범위를 명확하게 입증한다.

실시예 4: 이온 채널 수용체 단백질의 발현

프로테아제 결핍 S. cerevisiae 숙주 균주 및 에피솜 발현 벡터 조합을 사용하여 유망한 약물 표적 후보인 원형질막에 국소화된 Nav_1.7 다중통과 막관통 단백질을 발현시키기 위해 본원의 효모 플랫폼을 사용한다.

발현된 플랫폼은 10 배로 스케일 업하였고, 단백질의 수율 및 국소화에서 일관성을 나타내었다. 막 분획을 정제하고 단백질 특이적 항체 및 공초점 현미경을 사용하여 전장 단백질로서 분석하였다. 이들 정제된 막 분획을 96 웰 및 384 웰 포맷에서 화합물 스크리닝을 위한 스크리닝 분석을 개발하는데 문헌에서 사용하여 왔다. 스케일 업은 분석 설정 및 스크리닝 데이터에서 배치 대 배치 변화를 제거하는 매우 유의미한 이점을 제공하며, 이는 전체 화합물 라이브러리 또는 다수의 화합물이 재조합 단백질의 동일한 배치를 사용하여 스크리닝될 수 있기 때문이다.

이 채널의 주요 서브유닛은 알파 서브유닛인 >200 kDa의 단백질이다. 서브유닛은 24 개의 막관통 다중통과 도메인을 갖는 내부 상동성의 4 개의 큰 도메인으로 구성된다. 발현을 위한 유전자를 코돈 편향시키고 효모 숙주에서의 발현을 위해 최적화하였다. 유전자를 종래의 클로닝 방법론을 사용하여 독점 발현 플라스미드 pYRE100 내로 클로닝하였다. 클로닝된 유전자를 제한 분해를 통해 분석하였다. 항-His 항체 면역블롯 분석을 사용하여 재조합 발현 플랫폼의 S. cerevisiae 프로테아제 결핍 숙주에서 구축물을 형질전환시켰다.

실시예 4.1: Nav1.7의 발현을 위한 과정

특징화된 재조합 구축물을 실시예 1에서 언급한 바와 같이 효모 숙주에서 형질전환시켰다. 일부 단리된 건강한 형질전환된 집락을 20 mL의 YNB 글루코오스 - URA 배지에 접종하고, 유도된 후 24 시간(후기 대수기 A600~3.0 OD/mL에서의 유도; 최종 농도 2% 갈락토오스) 시점 샘플에서의 발현에 대해 Nav1.7 단백질 특이적 항체를 사용하여 면역블롯 분석에 의해 분석하였다. 선택된 클론을 40 mL 규모로 추가로 발현시키고, 마이크로솜을 제조하고, 공초점 현미경을 사용하여 국소화 연구를 수행하였다. Nav1.7 단백질 특이적 항체를 일차 항체로서 사용한 후, HRP 콘쥬게이트된 항-마우스 이차 항체에서 항온처리하여 면역블롯을 발생시켰다.

결과:

특이적 항체를 사용한 면역 블롯 분석은 막 제제에서 단백질의 글리코실화 및 올리고머 성질로 인한 것일 수 있는 226 kda 이상의 크기의 광 밴드를 나타내었다(레인 2). 또한, 최소의 열화가 관찰된다. 그러나, 대조군에서는 밴드가 관찰되지 않았다(도 16). 매우 높은 영향 및 가치 약물 표적인 복합 및 다중통과 막 단백질은 본 출원에 기재된 방법론과 함께 벡터 및 균주의 조합을 사용하여 발현될 수 있다는 것이 입증된다. 이는 이온 채널 수용체 패밀리, GPCR, 키나아제, 포스파타아제 등과 같은 다른 표적 단백질을 연구하는 것을 허용한다.

실시예 4.2: Nav1.7의 막 국소화에 대한 공초점 현미경 분석

공초점 현미경은 세포 표면에서 Nav1.7의 국소화를 확인하였다(도 17). 정제된 단백질(막 및 마이크로솜)은 Nav1.7 억제제를 스크리닝하기 위해 사용될 수 있으며, 따라서 치료 목적을 위해 유리할 수 있다.

실시예 5: 약물 표적 분자(GPI 고정된 단백질)의 발현: 단백질을 6X His 태그로 발현시켰다.

실시예 5.1: 발현을 위한 과정:

효모 선택 플레이트로부터 단일 집락을 채취하고, 적절한 아미노산을 갖는 5 mL 선택(글루코오스) 배지-SD에 넣고, 22-24 시간 동안 진탕하면서 30℃에서 항온처리하였다. 배양액을 실온에서 15 분 동안 3500 rpm으로 회전시켰다. 상청액을 붓고 펠릿을 멸균수로 세척하였다. 이를 다시 4℃에서 15 분 동안 3500 rpm으로 회전시켰다. 펠릿을 유도를 위해 효모 펩톤(갈락토오스) 배지-YPG(5 mL)에 재현탁하고, 8 시간 동안 진탕하면서 30℃에서 항온처리하였다. 배양액을 4℃에서 15 분 동안 3500 rpm으로 회전시키고 펠렛을 용해시키고 단백질 발현에 대해 분석하였다. 클론을 항 His 항체 및 항-CD 59 항체 둘 다를 사용하여 분석하여, 특이적 단백질 발현을 확인하였다(도 18). 단백질을 추가로 가용화시키고, NI-NTA 컬럼을 사용하여 정제하고, 90% 초과의 순도 수준으로 얻었다. 이는 CD59 단백질에 결합하는 화합물에 대한 스크리닝 분석을 확립하는데 도움을 준 접근법이다.

결과:

GPI 고정을 갖는 당단백질인 CD-59의 발현을 5 mL의 소규모로 확인하였으며, 항 His 항체를 사용하여 확인된 바와 같이 8 시간 유도 샘플에서 최적의 발현을 나타내는 것으로 밝혀졌다. 이들 연구를 소규모로 수행하였고, 클론을 200X 또는 1 리터 규모로 추가로 스케일 업하였다. 발현된 단백질을 친화도 크로마토그래피, 예를 들어 Ni NTA 크로마토그래피를 사용하여 정제하고 환원 SDS PAGE 상에서 분석하였다. 관심 밴드를 정제 후에 관찰하였다. 수율을 표준으로서 BSA에 대해 측정하였다(도 19).

실시예 6: 500 mL 규모의 스케일 업 과정

2% 글루코오스 및 각각의 선택 마커를 함유하는 합성 최소 배지를 250 mL로 제조하고 발현 벡터 pYRE100 및 pYRI100과 혼합하거나 둘 다를 (최종 유전자형에 따른) 발현을 위한 다중단백질 성분의 경우에 진탕기에서 항온처리하였으며, 선택된 파라미터는 (16 시간) 동안 OD₆₀₀ = 1.5-2.0에서 30 ± 1℃, 250 ± 10 rpm이었다.

30 ± 1℃, 250 ± 10 rpm에서 1 L 진탕 플라스크 내 2 x 200 mL YPD 배지를 사용하여 대규모 성장을 수행하고 배양액을 항온처리하여, OD600 = 4 -5(24 시간)로 성장시킨 후, 요구되는 바와 같은 12 시간/24 시간/36 시간 동안의 OD600으로 각각 30 ± 1℃, 250 ± 10 rpm의 1 L 진탕 플라스크에서 2 x 250 mL로 2% 갈락토오스로 유도하였다. 미리 칭량된 원심분리 병에서 전체 배양액을 1000 g(3000/4000 rpm)에서 10분 동안 4℃에서 원심분리하고, 세포 펠렛을 칭량하고 SDS PAGE, 면역블롯 및 유세포 분석을 사용하여 단백질 특이적 조건 및 요건에 따라 분석 및 특징화/분석을 위해 단백질을 정제하기 위한 추가 가공까지 -80℃에서 저장하였다.

아래 표 2는 본 발명의 플랫폼을 통한 대표적인 단백질의 발현 규모의 개요를 제공한다.

본 발현 플랫폼의 중요한 특징 중 일부는 다음과 같다:

매우 낮은 발현 단백질의 높은 발현을 위해 조작됨.

싱이한 기원의 단백질에서 광범위한 적용가능성을 위해 조작됨.

프로테아제 결핍이 되도록 조작됨.

향상된 발현을 위해 설계된 업스트림 조절 서열을 갖는 발현 벡터의 어레이.

다양한 표적 단백질 및 이의 고유 특성에 대한 다중-조작된 발현 균주.

코돈 조화와 함께 다중 단백질 동시-발현.

단백질의 증가된 발현을 위한 추가 균주 최적화 및 조작의 가능성.

조작된 균주는 500 L 발효 규모까지 스케일 업될 수 있음.

본 발명은 다음과 같은 이점을 제공한다:

입체구조적으로 활성인 단백질 발현의 발현을 위한 다용도의, 강한, 확장가능 플랫폼을 제공함.

상이한 패밀리 및 다양한 기원으로부터의 매우 다양한 단백질에 대해 이용될 수 있음.

본 기술은 백신 개발, 약물 발견, 대사, 진단제, 치료제 및 건강관리와 같은 분야에서 적용될 수 있음.

SEQUENCE LISTING <110> PREMAS <120> Recombinant expression platform, constructs and methods for expression of Difficult to Express Proteins (DTE-Ps) <130> IP52081 <140> 202011002479 <141> 2020-01-20 <160> 12 <170> PatentIn version 3.5 <210> 1 <211> 1350 <212> DNA <213> Virus <400> 1 atgaatccaa atcagaagat aataaccatt ggatcaatct gtatggtaac tggaatagtt 60 agcttaatgt tacaaattgg gaacatgatc tcaatatggg tcagtcattc aattcacaca 120 gggaatcaac accaagctga accaatcagc aataccaatt ttcttactga gaaagctgtg 180 gcttcagtaa aattagcggg caattcatct ctttgcccca ttaacggatg ggctgtatac 240 agtaaggaca acagtataag gatcggctcc aagggggatg tgtttgttat aagagagccg 300 ttcatctcat gctcccactt ggaatgcaga actttctttt tgactcaggg agccttgctg 360 aatgacaagc actccaatgg gactgtcaaa gacagaagcc ctcacagaac attaatgagt 420 tgtcctgtgg gtgtggctcc ctccccatat aactcaaggt ttgagtctgt tgcttggtca 480 gcaagtgctt gccatgatgg caccagttgg ttgacaattg gaatttctgg cccagacaat 540 ggggctgtgg ctgtattgaa atacaatggc ataataacag acactatcaa gagttggagg 600 aacaacatat tgagaactca agagtctgaa tgtgcatgtg taaatggctc ttgctttact 660 gtaatgactg acggaccaag taatggtcaa gcatcacata agatcttcaa aatggaaaaa 720 gggaaagtgg ttaaatcagt cgaattggat gctcctaatt atcactatga ggaatgctcc 780 tgttatcctg atgccggcga aatcacgtgt gtgtgcaggg ataattggca tggctcaaat 840 cggccatggg tatctttcaa tcaaaatttg gagtatcaaa taggatatat atgcagtgga 900 gttttcggag acaatccacg ccccaatgat ggaacaggta gttgcggtcc ggtgtcctct 960 aacggggcat atggggtaaa aggattttca tttagatacg gcaatggtgt ctggatcggg 1020 agaaccaaaa gcactaattc caggagcggc tttgaaatga tttgggatcc aaatgggtgg 1080 actgaaacgg acagtagctt ttcagtgaaa caagatatcg tagcaataac tgattggtca 1140 ggatatagcg ggagttttgt ccagcatcca gaactgacag gactagattg cataagacct 1200 tgtttctggg ttgagttgat cagagggcgg cccaaagaga gcacaatttg gactagtggg 1260 agcagcatat ctttttgtgg tgtaaatagt gacactgtgg gttggtcttg gccagacggt 1320 gctgagttgc cattcaccat tgacaagtag 1350 <210> 2 <211> 996 <212> DNA <213> Virus <400> 2 atggtttgta caactttgta cacagtttgc gctattcttt gcatcttatt agtatataca 60 ttatttctta gaaaaatgtt ccatctatta actgatgcat tagctgtttt actaatcata 120 tctgtatgtg ctggatattc taatggtcaa ttgtttacta atgatatttc gtatgccgga 180 aatattgaag gtgtgataaa tacgacaaat ccttttaatg ttgagtcatt atgtatttat 240 tttccaaacg ccgcaattgg ttcaccaggt ccaggtaagg ctgatggctt attgaatgat 300 aataattatg cacagacact ggcgacatta tttgaaacaa aaggattccc gaaaggatct 360 gtgatcttta aaacatatac aaaaacatcg gacttcataa attcagtaga gatgacttgt 420 tcatataatt tagtcattat tcctgatgaa ccaaagaatt cagaagcaat tgaacaaata 480 gctgaatggg tattaaatgt ttggcaatgt gatgacatga atttggatat ttatacctat 540 gaacagataa ataaagataa tctgtgggca gcatttggtg aagactgtga cgtatctgtt 600 tgtccattag atacaacaat gaatgggata ggttgttcac cagctagtac agaaacatac 660 gaagtggtgt ctaatgatac tcaattggca cttatcgacg tygttgataa cgtcaaacac 720 agaattcaaa tgaatcaatt gaagtgtaaa ttgaaaaatt gcgttaaggg cgaaccacga 780 ttgaacactg caattataag aatttccaca tcatcaagct tcgacaattc gttatcacct 840 ctaaataatg gacagacaac acgaacgttc aagattaatg caaaaaaatg gtggaagatt 900 ttttatacta tagttgatta cattaataca ttggtacaaa caatgacgcc tagacatcgg 960 gctatatatc ctgaaggttg gatgctgaga tatgcg 996 <210> 3 <211> 5967 <212> DNA <213> Virus <400> 3 atggcaatgt tgcctccccc aggacctcag agctttgtcc atttcacaaa acagtctctt 60 gccctcattg aacaacgcat tgctgaaaga aaatcaaagg aacccaaaga agaaaagaaa 120 gatgatgatg aagaagcccc aaagccaagc agtgacttgg aagctggcaa acagctgccc 180 ttcatctatg gggacattcc tcccggcatg gtgtcagagc ccctggagga cttggacccc 240 tactatgcag acaaaaagac tttcatagta ttgaacaaag ggaaaacaat cttccgtttc 300 aatgccacac ctgctttata tatgctttct cctttcagtc ctctaagaag aatatctatt 360 aagattttag tacactcctt attcagcatg ctcatcatgt gcactattct gacaaactgc 420 atatttatga ccatgaataa cccaccggac tggaccaaaa atgtcgagta cacttttact 480 ggaatatata cttttgaatc acttgtaaaa atccttgcaa gaggcttctg tgtaggagaa 540 ttcacttttc ttcgtgaccc gtggaactgg ctggattttg tcgtcattgt ttttgcgtat 600 ttaacagaat ttgtaaacct aggcaatgtt tcagctcttc gaactttcag agtattgaga 660 gctttgaaaa ctatttctgt aatcccaggc ctgaagacaa ttgtaggggc tttgatccag 720 tcagtgaaga agctttctga tgtcatgatc ctgactgtgt tctgtctgag tgtgtttgca 780 ctaattggac tacagctgtt catgggaaac ctgaagcata aatgttttcg aaattcactt 840 gaaaataatg aaacattaga aagcataatg aataccctag agagtgaaga agactttaga 900 aaatattttt attacttgga aggatccaaa gatgctctcc tttgtggttt cagcacagat 960 tcaggtcagt gtccagaggg gtacacctgt gtgaaaattg gcagaaaccc tgattatggc 1020 tacacgagct ttgacacttt cagctgggcc ttcttagcct tgtttaggct aatgacccaa 1080 gattactggg aaaaccttta ccaacagacg ctgcgtgctg ctggcaaaac ctacatgatc 1140 ttctttgtcg tagtgatttt cctgggctcc ttttatctaa taaacttgat cctggctgtg 1200 gttgccatgg catatgaaga acagaaccag gcaaacattg aagaagctaa acagaaagaa 1260 ttagaatttc aacagatgtt agaccgtctt aaaaaagagc aagaagaagc tgaggcaatt 1320 gcagcggcag cggctgaata tacaagtatt aggagaagca gaattatggg cctctcagag 1380 agttcttctg aaacatccaa actgagctct aaaagtgcta aagaaagaag aaacagaaga 1440 aagaaaaaga atcaaaagaa gctctccagt ggagaggaaa agggagatgc tgagaaattg 1500 tcgaaatcag aatcagagga cagcatcaga agaaaaagtt tccaccttgg tgtcgaaggg 1560 cataggcgag cacatgaaaa gaggttgtct acccccaatc agtcaccact cagcattcgt 1620 ggctccttgt tttctgcaag gcgaagcagc agaacaagtc tttttagttt caaaggcaga 1680 ggaagagata taggatctga gactgaattt gccgatgatg agcacagcat ttttggagac 1740 aatgagagca gaaggggctc actgtttgtg ccccacagac cccaggagcg acgcagcagt 1800 aacatcagcc aagccagtag gtccccacca atgctgccgg tgaacgggaa aatgcacagt 1860 gctgtggact gcaacggtgt ggtctccctg gttgatggac gctcagccct catgctcccc 1920 aatggacagc ttctgccaga ggtgataata gataaggcaa cttctgatga cagcggcacg 1980 accaatcaaa tacacaagaa aaggcgttgt agttcctatc tcctttcaga ggatatgctg 2040 aatgatccca acctcagaca gagagcaatg agtagagcaa gcatattaac aaacactgtg 2100 gaagaacttg aagagtccag acaaaaatgt ccaccttggt ggtacagatt tgcacacaaa 2160 ttcttgatct ggaattgctc tccatattgg ataaaattca aaaagtgtat ctattttatt 2220 gtaatggatc cttttgtaga tcttgcaatt accatttgca tagttttaaa cacattattt 2280 atggctatgg aacaccaccc aatgactgag gaattcaaaa atgtacttgc tataggaaat 2340 ttggtcttta ctggaatctt tgcagctgaa atggtattaa aactgattgc catggatcca 2400 tatgagtatt tccaagtagg ctggaatatt tttgacagcc ttattgtgac tttaagttta 2460 gtggagctct ttctagcaga tgtggaagga ttgtcagttc tgcgatcatt cagactgctc 2520 cgagtcttca agttggcaaa atcctggcca acattgaaca tgctgattaa gatcattggt 2580 aactcagtag gggctctagg taacctcacc ttagtgttgg ccatcatcgt cttcattttt 2640 gctgtggtcg gcatgcagct ctttggtaag agctacaaag aatgtgtctg caagatcaat 2700 gatgactgta cgctcccacg gtggcacatg aacgacttct tccactcctt cctgattgtg 2760 ttccgcgtgc tgtgtggaga gtggatagag accatgtggg actgtatgga ggtcgctggt 2820 caagctatgt gccttattgt ttacatgatg gtcatggtca ttggaaacct ggtggtccta 2880 aacctatttc tggccttatt attgagctca tttagttcag acaatcttac agcaattgaa 2940 gaagaccctg atgcaaacaa cctccagatt gcagtgacta gaattaaaaa gggaataaat 3000 tatgtgaaac aaaccttacg tgaatttatt ctaaaagcat tttccaaaaa gccaaagatt 3060 tccagggaga taagacaagc agaagatctg aatactaaga aggaaaacta tatttctaac 3120 catacacttg ctgaaatgag caaaggtcac aatttcctca aggaaaaaga taaaatcagt 3180 ggttttggaa gcagcgtgga caaacacttg atggaagaca gtgatggtca atcatttatt 3240 cacaatccca gcctcacagt gacagtgcca attgcacctg gggaatccga tttggaaaat 3300 atgaatgctg aggaacttag cagtgattcg gatagtgaat acagcaaagt gagattaaac 3360 cggtcaagct cctcagagtg cagcacagtt gataaccctt tgcctggaga aggagaagaa 3420 gcagaggctg aacctatgaa ttccgatgag ccagaggcct gtttcacaga tggttgtgta 3480 tggaggttct catgctgcca agttaacata gagtcaggga aaggaaaaat ctggtggaac 3540 atcaggaaaa cctgctacaa gattgttgaa cacagttggt ttgaaagctt cattgtcctc 3600 atgatcctgc tcagcagtgg tgccctggct tttgaagata tttatattga aaggaaaaag 3660 accattaaga ttatcctgga gtatgcagac aagatcttca cttacatctt cattctggaa 3720 atgcttctaa aatggatagc atatggttat aaaacatatt tcaccaatgc ctggtgttgg 3780 ctggatttcc taattgttga tgtttctttg gttactttag tggcaaacac tcttggctac 3840 tcagatcttg gccccattaa atcccttcgg acactgagag ctttaagacc tctaagagcc 3900 ttatctagat ttgaaggaat gagggtcgtt gtgaatgcac tcataggagc aattccttcc 3960 atcatgaatg tgctacttgt gtgtcttata ttctggctga tattcagcat catgggagta 4020 aatttgtttg ctggcaagtt ctatgagtgt attaacacca cagatgggtc acggtttcct 4080 gcaagtcaag ttccaaatcg ttccgaatgt tttgccctta tgaatgttag tcaaaatgtg 4140 cgatggaaaa acctgaaagt gaactttgat aatgtcggac ttggttacct atctctgctt 4200 caagttgcaa cttttaaggg atggacgatt attatgtatg cagcagtgga ttctgttaat 4260 gtagacaagc agcccaaata tgaatatagc ctctacatgt atatttattt tgtcgtcttt 4320 atcatctttg ggtcattctt cactttgaac ttgttcattg gtgtcatcat agataatttc 4380 aaccaacaga aaaagaagct tggaggtcaa gacatcttta tgacagaaga acagaagaaa 4440 tactataatg caatgaaaaa gctggggtcc aagaagccac aaaagccaat tcctcgacca 4500 gggaacaaaa tccaaggatg tatatttgac ctagtgacaa atcaagcctt tgatattagt 4560 atcatggttc ttatctgtct caacatggta accatgatgg tagaaaagga gggtcaaagt 4620 caacatatga ctgaagtttt atattggata aatgtggttt ttataatcct tttcactgga 4680 gaatgtgtgc taaaactgat ctccctcaga cactactact tcactgtagg atggaatatt 4740 tttgattttg tggttgtgat tatctccatt gtaggtatgt ttctagctga tttgattgaa 4800 acgtattttg tgtcccctac cctgttccga gtgatccgtc ttgccaggat tggccgaatc 4860 ctacgtctag tcaaaggagc aaaggggatc cgcacgctgc tctttgcttt gatgatgtcc 4920 cttcctgcgt tgtttaacat cggcctcctg ctcttcctgg tcatgttcat ctacgccatc 4980 tttggaatgt ccaactttgc ctatgttaaa aaggaagatg gaattaatga catgttcaat 5040 tttgagacct ttggcaacag tatgatttgc ctgttccaaa ttacaacctc tgctggctgg 5100 gatggattgc tagcacctat tcttaacagt aagccacccg actgtgaccc aaaaaaagtt 5160 catcctggaa gttcagttga aggagactgt ggtaacccat ctgttggaat attctacttt 5220 gttagttata tcatcatatc cttcctggtt gtggtgaaca tgtacattgc agtcatactg 5280 gagaatttta gtgttgccac tgaagaaagt actgaacctc tgagtgagga tgactttgag 5340 atgttctatg aggtttggga gaagtttgat cccgatgcga cccagtttat agagttctct 5400 aaactctctg attttgcagc tgccctggat cctcctcttc tcatagcaaa acccaacaaa 5460 gtccagctca ttgccatgga tctgcccatg gttagtggtg accggatcca ttgtcttgac 5520 atcttatttg cttttacaaa gcgtgttttg ggtgagagtg gggagatgga ttctcttcgt 5580 tcacagatgg aagaaaggtt catgtctgca aatccttcca aagtgtccta tgaacccatc 5640 acaaccacac taaaacggaa acaagaggat gtgtctgcta ctgtcattca gcgtgcttat 5700 agacgttacc gcttaaggca aaatgtcaaa aatatatcaa gtatatacat aaaagatgga 5760 gacagagatg atgatttact caataaaaaa gatatggctt ttgataatgt taatgagaac 5820 tcaagtccag aaaaaacaga tgccacttca tccaccacct ctccaccttc atatgatagt 5880 gtaacaaagc cagacaaaga gaaatatgaa caagacagaa cagaaaagga agacaaaggg 5940 aaagacagca aggaaagcaa aaaatag 5967 <210> 4 <211> 1086 <212> DNA <213> Fungi <400> 4 atggctacaa aggaggctta cgttttccca actctcaccg agatcaagag atctctccca 60 aaggattgct tcgaggcttc tgtgcctttg tctctctact acactgtgag atgcttggtt 120 attgctgtgg ctttgacctt cggattgaac tacgctagag ctttgccaga ggttgagtct 180 ttctgggctt tggatgctgc tttgtgcact ggatatatcc tcctccaggg aattgtgttc 240 tggggattct tcactgttgg acacgatgct ggacacggag ctttctctag ataccacctc 300 ttgaacttcg ttgtgggaac cttcatgcac tctctcatct tgaccccatt cgagtcttgg 360 aagttgaccc acagacacca ccacaagaac accggaaaca tcgatagaga tgaggtgttc 420 tacccacaga gaaaggctga tgatcaccca ttgtccagga acttgatctt ggctttggga 480 gctgcttggc ttgcttattt ggtggaggga ttcccaccaa gaaaggtgaa ccacttcaac 540 ccattcgagc cactttttgt gagacaagtg tccgctgtgg ttatctcttt gctcgctcac 600 ttcttcgttg ctggactctc tatctacttg tctctccagt tgggacttaa gaccatggct 660 atctactact acggaccagt tttcgtgttc ggatctatgt tggtgattac caccttcttg 720 caccacaacg atgaggagac tccatggtat gctgattctg agtggactta cgtgaaggga 780 aacttgtcct ctgtggatag atcttacggt gctctcatcg ataacctctc ccacaacatc 840 ggaactcacc agatccacca cctcttccca attatcccac actacaagct caagaaggct 900 actgctgctt tccaccaagc tttcccagag cttgtgagaa agtccgatga gccaatcatc 960 aaggctttct tcagagtggg aaggttgtat gctaactacg gagtggttga tcaagaggct 1020 aagctcttca ctttgaagga ggctaaggct gctactgaag ctgctgctaa gaccaagtct 1080 acctga 1086 <210> 5 <211> 873 <212> DNA <213> Plant <400> 5 atggaagttg ttgagaggtt ctacggagag ttggatggaa aggtttccca aggagtgaac 60 gctttgttgg gatctttcgg agttgagttg actgataccc caactactaa gggattgcca 120 ctcgttgatt ctccaactcc aattgtgttg ggagtgtctg tttacttgac catcgtgatc 180 ggaggattgc tttggatcaa ggctagagat ctcaagccaa gagcttctga gccattcttg 240 ttgcaagctt tggtgttggt gcacaacttg ttctgcttcg ctttgtctct ttacatgtgc 300 gtgggtatcg cttaccaagc tatcacctgg agatattcct tgtggggaaa cgcttataac 360 ccaaagcaca aggagatggc tatcctcgtt tacctcttct acatgtccaa gtacgtggag 420 ttcatggata ccgtgatcat gatcctcaag agatccacca gacagatttc tttcctccac 480 gtgtaccacc actcttctat ctcccttatc tggtgggcta ttgctcacca cgctccagga 540 ggagaggctt attggagtgc tgctctcaac tctggagtgc acgtgttgat gtacgcttac 600 tacttcttgg ctgcttgctt gagatcttcc ccaaagctca agaacaagta cctcttctgg 660 ggaagatacc tcacccaatt ccagatgttc cagttcatgc tcaacttggt gcaagcttac 720 tacgatatga aaaccaacgc tccatatcca caatggctca tcaagatcct cttctactac 780 atgatctccc tcttgttcct cttcggaaac ttctacgtgc aaaagtacat caagccatcc 840 gatggaaagc aaaagggagc taagaccgag tga 873 <210> 6 <211> 405 <212> DNA <213> Human <400> 6 atgggaatcc aaggagggtc tgtcctgttc gggctgctgc tcgtcctggc tgtcttctgc 60 cattcaggtc atagccatca ccatcaccat cacctgcagt gctacaactg tcctaaccca 120 actgctgact gcaaaacagc cgtcaattgt tcatctgatt ttgatgcgtg tctcattacc 180 aaagctgggt tacaagtgta taacaagtgt tggaagtttg agcattgcaa tttcaacgac 240 gtcacaaccc gcttgaggga aaatgagcta acgtactact gctgcaagaa ggacctgtgt 300 aactttaacg aacagcttga aaatggtggg acatccttat cagagaaaac agttcttctg 360 ctggtgactc catttctggc agcagcctgg agccttcatc cctaa 405 <210> 7 <211> 6657 <212> DNA <213> Virus <400> 7 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt catgaatcca 5100 aatcagaaga taataaccat tggatcaatc tgtatggtaa ctggaatagt tagcttaatg 5160 ttacaaattg ggaacatgat ctcaatatgg gtcagtcatt caattcacac agggaatcaa 5220 caccaagctg aaccaatcag caataccaat tttcttactg agaaagctgt ggcttcagta 5280 aaattagcgg gcaattcatc tctttgcccc attaacggat gggctgtata cagtaaggac 5340 aacagtataa ggatcggctc caagggggat gtgtttgtta taagagagcc gttcatctca 5400 tgctcccact tggaatgcag aactttcttt ttgactcagg gagccttgct gaatgacaag 5460 cactccaatg ggactgtcaa agacagaagc cctcacagaa cattaatgag ttgtcctgtg 5520 ggtgtggctc cctccccata taactcaagg tttgagtctg ttgcttggtc agcaagtgct 5580 tgccatgatg gcaccagttg gttgacaatt ggaatttctg gcccagacaa tggggctgtg 5640 gctgtattga aatacaatgg cataataaca gacactatca agagttggag gaacaacata 5700 ttgagaactc aagagtctga atgtgcatgt gtaaatggct cttgctttac tgtaatgact 5760 gacggaccaa gtaatggtca agcatcacat aagatcttca aaatggaaaa agggaaagtg 5820 gttaaatcag tcgaattgga tgctcctaat tatcactatg aggaatgctc ctgttatcct 5880 gatgccggcg aaatcacgtg tgtgtgcagg gataattggc atggctcaaa tcggccatgg 5940 gtatctttca atcaaaattt ggagtatcaa ataggatata tatgcagtgg agttttcgga 6000 gacaatccac gccccaatga tggaacaggt agttgcggtc cggtgtcctc taacggggca 6060 tatggggtaa aaggattttc atttagatac ggcaatggtg tctggatcgg gagaaccaaa 6120 agcactaatt ccaggagcgg ctttgaaatg atttgggatc caaatgggtg gactgaaacg 6180 gacagtagct tttcagtgaa acaagatatc gtagcaataa ctgattggtc aggatatagc 6240 gggagttttg tccagcatcc agaactgaca ggactagatt gcataagacc ttgtttctgg 6300 gttgagttga tcagagggcg gcccaaagag agcacaattt ggactagtgg gagcagcata 6360 tctttttgtg gtgtaaatag tgacactgtg ggttggtctt ggccagacgg tgctgagttg 6420 ccattcacca ttgacaagct cgagcatcat caccatcacc attaaagatc tctgcaggat 6480 atcatcatgt aattagttat gtcacgctta cattcacgcc ctccccccac atccgctcta 6540 accgaaaagg aaggagttag acaacctgaa gtctaggtcc ctatttattt ttttatagtt 6600 atgttagtat taagaacgtt atttatattt caaatttttc ttttttttct gtacaga 6657 <210> 8 <211> 6444 <212> DNA <213> Virus <400> 8 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100 cttacataca aaatggtttg tacaactttg tacacagttt gcgctattct ttgcatctta 5160 ttagtatata cattatttct tagaaaaatg ttccatctat taactgatgc attagctgtt 5220 ttactaatca tatctgtatg tgctggatat tctaatggtc aattgtttac taatgatatt 5280 tcgtatgccg gaaatattga aggtgtgata aatacgacaa atccttttaa tgttgagtca 5340 ttatgtattt attttccaaa cgccgcaatt ggttcaccag gtccaggtaa ggctgatggc 5400 ttattgaatg ataataatta tgcacagaca ctggcgacat tatttgaaac aaaaggattc 5460 ccgaaaggat ctgtgatctt taaaacatat acaaaaacat cggacttcat aaattcagta 5520 gagatgactt gttcatataa tttagtcatt attcctgatg aaccaaagaa ttcagaagca 5580 attgaacaaa tagctgaatg ggtattaaat gtttggcaat gtgatgacat gaatttggat 5640 atttatacct atgaacagat aaataaagat aatctgtggg cagcatttgg tgaagactgt 5700 gacgtatctg tttgtccatt agatacaaca atgaatggga taggttgttc accagctagt 5760 acagaaacat acgaagtggt gtctaatgat actcaattgg cacttatcga cgtygttgat 5820 aacgtcaaac acagaattca aatgaatcaa ttgaagtgta aattgaaaaa ttgcgttaag 5880 ggcgaaccac gattgaacac tgcaattata agaatttcca catcatcaag cttcgacaat 5940 tcgttatcac ctctaaataa tggacagaca acacgaacgt tcaagattaa tgcaaaaaaa 6000 tggtggaaga ttttttatac tatagttgat tacattaata cattggtaca aacaatgacg 6060 cctagacatc gggctatata tcctgaaggt tggatgctga gatatgcggg tggtggtggt 6120 tctcatcatc accaccacca tcatcaccat cattaataag gtaccccaca attgtggggc 6180 ccgggcgcta gctgtacacc acaattgtgg tctagagcta agcagctcga gcatcatcac 6240 catcaccatt aaagatctct gcaggatatc atcatgtaat tagttatgtc acgcttacat 6300 tcacgccctc cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc 6360 taggtcccta tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa 6420 atttttcttt tttttctgta caga 6444 <210> 9 <211> 11310 <212> DNA <213> Virus <400> 9 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaca 5100 tacaaaatgg caatgttgcc tcccccagga cctcagagct ttgtccattt cacaaaacag 5160 tctcttgccc tcattgaaca acgcattgct gaaagaaaat caaaggaacc caaagaagaa 5220 aagaaagatg atgatgaaga agccccaaag ccaagcagtg acttggaagc tggcaaacag 5280 ctgcccttca tctatgggga cattcctccc ggcatggtgt cagagcccct ggaggacttg 5340 gacccctact atgcagacaa aaagactttc atagtattga acaaagggaa aacaatcttc 5400 cgtttcaatg ccacacctgc tttatatatg ctttctcctt tcagtcctct aagaagaata 5460 tctattaaga ttttagtaca ctccttattc agcatgctca tcatgtgcac tattctgaca 5520 aactgcatat ttatgaccat gaataaccca ccggactgga ccaaaaatgt cgagtacact 5580 tttactggaa tatatacttt tgaatcactt gtaaaaatcc ttgcaagagg cttctgtgta 5640 ggagaattca cttttcttcg tgacccgtgg aactggctgg attttgtcgt cattgttttt 5700 gcgtatttaa cagaatttgt aaacctaggc aatgtttcag ctcttcgaac tttcagagta 5760 ttgagagctt tgaaaactat ttctgtaatc ccaggcctga agacaattgt aggggctttg 5820 atccagtcag tgaagaagct ttctgatgtc atgatcctga ctgtgttctg tctgagtgtg 5880 tttgcactaa ttggactaca gctgttcatg ggaaacctga agcataaatg ttttcgaaat 5940 tcacttgaaa ataatgaaac attagaaagc ataatgaata ccctagagag tgaagaagac 6000 tttagaaaat atttttatta cttggaagga tccaaagatg ctctcctttg tggtttcagc 6060 acagattcag gtcagtgtcc agaggggtac acctgtgtga aaattggcag aaaccctgat 6120 tatggctaca cgagctttga cactttcagc tgggccttct tagccttgtt taggctaatg 6180 acccaagatt actgggaaaa cctttaccaa cagacgctgc gtgctgctgg caaaacctac 6240 atgatcttct ttgtcgtagt gattttcctg ggctcctttt atctaataaa cttgatcctg 6300 gctgtggttg ccatggcata tgaagaacag aaccaggcaa acattgaaga agctaaacag 6360 aaagaattag aatttcaaca gatgttagac cgtcttaaaa aagagcaaga agaagctgag 6420 gcaattgcag cggcagcggc tgaatataca agtattagga gaagcagaat tatgggcctc 6480 tcagagagtt cttctgaaac atccaaactg agctctaaaa gtgctaaaga aagaagaaac 6540 agaagaaaga aaaagaatca aaagaagctc tccagtggag aggaaaaggg agatgctgag 6600 aaattgtcga aatcagaatc agaggacagc atcagaagaa aaagtttcca ccttggtgtc 6660 gaagggcata ggcgagcaca tgaaaagagg ttgtctaccc ccaatcagtc accactcagc 6720 attcgtggct ccttgttttc tgcaaggcga agcagcagaa caagtctttt tagtttcaaa 6780 ggcagaggaa gagatatagg atctgagact gaatttgccg atgatgagca cagcattttt 6840 ggagacaatg agagcagaag gggctcactg tttgtgcccc acagacccca ggagcgacgc 6900 agcagtaaca tcagccaagc cagtaggtcc ccaccaatgc tgccggtgaa cgggaaaatg 6960 cacagtgctg tggactgcaa cggtgtggtc tccctggttg atggacgctc agccctcatg 7020 ctccccaatg gacagcttct gccagaggtg ataatagata aggcaacttc tgatgacagc 7080 ggcacgacca atcaaataca caagaaaagg cgttgtagtt cctatctcct ttcagaggat 7140 atgctgaatg atcccaacct cagacagaga gcaatgagta gagcaagcat attaacaaac 7200 actgtggaag aacttgaaga gtccagacaa aaatgtccac cttggtggta cagatttgca 7260 cacaaattct tgatctggaa ttgctctcca tattggataa aattcaaaaa gtgtatctat 7320 tttattgtaa tggatccttt tgtagatctt gcaattacca tttgcatagt tttaaacaca 7380 ttatttatgg ctatggaaca ccacccaatg actgaggaat tcaaaaatgt acttgctata 7440 ggaaatttgg tctttactgg aatctttgca gctgaaatgg tattaaaact gattgccatg 7500 gatccatatg agtatttcca agtaggctgg aatatttttg acagccttat tgtgacttta 7560 agtttagtgg agctctttct agcagatgtg gaaggattgt cagttctgcg atcattcaga 7620 ctgctccgag tcttcaagtt ggcaaaatcc tggccaacat tgaacatgct gattaagatc 7680 attggtaact cagtaggggc tctaggtaac ctcaccttag tgttggccat catcgtcttc 7740 atttttgctg tggtcggcat gcagctcttt ggtaagagct acaaagaatg tgtctgcaag 7800 atcaatgatg actgtacgct cccacggtgg cacatgaacg acttcttcca ctccttcctg 7860 attgtgttcc gcgtgctgtg tggagagtgg atagagacca tgtgggactg tatggaggtc 7920 gctggtcaag ctatgtgcct tattgtttac atgatggtca tggtcattgg aaacctggtg 7980 gtcctaaacc tatttctggc cttattattg agctcattta gttcagacaa tcttacagca 8040 attgaagaag accctgatgc aaacaacctc cagattgcag tgactagaat taaaaaggga 8100 ataaattatg tgaaacaaac cttacgtgaa tttattctaa aagcattttc caaaaagcca 8160 aagatttcca gggagataag acaagcagaa gatctgaata ctaagaagga aaactatatt 8220 tctaaccata cacttgctga aatgagcaaa ggtcacaatt tcctcaagga aaaagataaa 8280 atcagtggtt ttggaagcag cgtggacaaa cacttgatgg aagacagtga tggtcaatca 8340 tttattcaca atcccagcct cacagtgaca gtgccaattg cacctgggga atccgatttg 8400 gaaaatatga atgctgagga acttagcagt gattcggata gtgaatacag caaagtgaga 8460 ttaaaccggt caagctcctc agagtgcagc acagttgata accctttgcc tggagaagga 8520 gaagaagcag aggctgaacc tatgaattcc gatgagccag aggcctgttt cacagatggt 8580 tgtgtatgga ggttctcatg ctgccaagtt aacatagagt cagggaaagg aaaaatctgg 8640 tggaacatca ggaaaacctg ctacaagatt gttgaacaca gttggtttga aagcttcatt 8700 gtcctcatga tcctgctcag cagtggtgcc ctggcttttg aagatattta tattgaaagg 8760 aaaaagacca ttaagattat cctggagtat gcagacaaga tcttcactta catcttcatt 8820 ctggaaatgc ttctaaaatg gatagcatat ggttataaaa catatttcac caatgcctgg 8880 tgttggctgg atttcctaat tgttgatgtt tctttggtta ctttagtggc aaacactctt 8940 ggctactcag atcttggccc cattaaatcc cttcggacac tgagagcttt aagacctcta 9000 agagccttat ctagatttga aggaatgagg gtcgttgtga atgcactcat aggagcaatt 9060 ccttccatca tgaatgtgct acttgtgtgt cttatattct ggctgatatt cagcatcatg 9120 ggagtaaatt tgtttgctgg caagttctat gagtgtatta acaccacaga tgggtcacgg 9180 tttcctgcaa gtcaagttcc aaatcgttcc gaatgttttg cccttatgaa tgttagtcaa 9240 aatgtgcgat ggaaaaacct gaaagtgaac tttgataatg tcggacttgg ttacctatct 9300 ctgcttcaag ttgcaacttt taagggatgg acgattatta tgtatgcagc agtggattct 9360 gttaatgtag acaagcagcc caaatatgaa tatagcctct acatgtatat ttattttgtc 9420 gtctttatca tctttgggtc attcttcact ttgaacttgt tcattggtgt catcatagat 9480 aatttcaacc aacagaaaaa gaagcttgga ggtcaagaca tctttatgac agaagaacag 9540 aagaaatact ataatgcaat gaaaaagctg gggtccaaga agccacaaaa gccaattcct 9600 cgaccaggga acaaaatcca aggatgtata tttgacctag tgacaaatca agcctttgat 9660 attagtatca tggttcttat ctgtctcaac atggtaacca tgatggtaga aaaggagggt 9720 caaagtcaac atatgactga agttttatat tggataaatg tggtttttat aatccttttc 9780 actggagaat gtgtgctaaa actgatctcc ctcagacact actacttcac tgtaggatgg 9840 aatatttttg attttgtggt tgtgattatc tccattgtag gtatgtttct agctgatttg 9900 attgaaacgt attttgtgtc ccctaccctg ttccgagtga tccgtcttgc caggattggc 9960 cgaatcctac gtctagtcaa aggagcaaag gggatccgca cgctgctctt tgctttgatg 10020 atgtcccttc ctgcgttgtt taacatcggc ctcctgctct tcctggtcat gttcatctac 10080 gccatctttg gaatgtccaa ctttgcctat gttaaaaagg aagatggaat taatgacatg 10140 ttcaattttg agacctttgg caacagtatg atttgcctgt tccaaattac aacctctgct 10200 ggctgggatg gattgctagc acctattctt aacagtaagc cacccgactg tgacccaaaa 10260 aaagttcatc ctggaagttc agttgaagga gactgtggta acccatctgt tggaatattc 10320 tactttgtta gttatatcat catatccttc ctggttgtgg tgaacatgta cattgcagtc 10380 atactggaga attttagtgt tgccactgaa gaaagtactg aacctctgag tgaggatgac 10440 tttgagatgt tctatgaggt ttgggagaag tttgatcccg atgcgaccca gtttatagag 10500 ttctctaaac tctctgattt tgcagctgcc ctggatcctc ctcttctcat agcaaaaccc 10560 aacaaagtcc agctcattgc catggatctg cccatggtta gtggtgaccg gatccattgt 10620 cttgacatct tatttgcttt tacaaagcgt gttttgggtg agagtgggga gatggattct 10680 cttcgttcac agatggaaga aaggttcatg tctgcaaatc cttccaaagt gtcctatgaa 10740 cccatcacaa ccacactaaa acggaaacaa gaggatgtgt ctgctactgt cattcagcgt 10800 gcttatagac gttaccgctt aaggcaaaat gtcaaaaata tatcaagtat atacataaaa 10860 gatggagaca gagatgatga tttactcaat aaaaaagata tggcttttga taatgttaat 10920 gagaactcaa gtccagaaaa aacagatgcc acttcatcca ccacctctcc accttcatat 10980 gatagtgtaa caaagccaga caaagagaaa tatgaacaag acagaacaga aaaggaagac 11040 aaagggaaag acagcaagga aagcaaaaaa tagtaatcta gagctaagca gctcgagcat 11100 catcaccatc accattaaag atctctgcag gatatcatca tgtaattagt tatgtcacgc 11160 ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 11220 gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 11280 tttcaaattt ttcttttttt tctgtacaga 11310 <210> 10 <211> 6531 <212> DNA <213> Fungi <400> 10 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100 cttacataca aaatggctac aaaggaggct tacgttttcc caactctcac cgagatcaag 5160 agatctctcc caaaggattg cttcgaggct tctgtgcctt tgtctctcta ctacactgtg 5220 agatgcttgg ttattgctgt ggctttgacc ttcggattga actacgctag agctttgcca 5280 gaggttgagt ctttctgggc tttggatgct gctttgtgca ctggatatat cctcctccag 5340 ggaattgtgt tctggggatt cttcactgtt ggacacgatg ctggacacgg agctttctct 5400 agataccacc tcttgaactt cgttgtggga accttcatgc actctctcat cttgacccca 5460 ttcgagtctt ggaagttgac ccacagacac caccacaaga acaccggaaa catcgataga 5520 gatgaggtgt tctacccaca gagaaaggct gatgatcacc cattgtccag gaacttgatc 5580 ttggctttgg gagctgcttg gcttgcttat ttggtggagg gattcccacc aagaaaggtg 5640 aaccacttca acccattcga gccacttttt gtgagacaag tgtccgctgt ggttatctct 5700 ttgctcgctc acttcttcgt tgctggactc tctatctact tgtctctcca gttgggactt 5760 aagaccatgg ctatctacta ctacggacca gttttcgtgt tcggatctat gttggtgatt 5820 accaccttct tgcaccacaa cgatgaggag actccatggt atgctgattc tgagtggact 5880 tacgtgaagg gaaacttgtc ctctgtggat agatcttacg gtgctctcat cgataacctc 5940 tcccacaaca tcggaactca ccagatccac cacctcttcc caattatccc acactacaag 6000 ctcaagaagg ctactgctgc tttccaccaa gctttcccag agcttgtgag aaagtccgat 6060 gagccaatca tcaaggcttt cttcagagtg ggaaggttgt atgctaacta cggagtggtt 6120 gatcaagagg ctaagctctt cactttgaag gaggctaagg ctgctactga agctgctgct 6180 aagaccaagt ctaccggtgg tggtggttct catcatcacc accaccatca tcaccatcat 6240 taataaggta ccccacaatt gtggggcccg ggcgctagct gtacaccaca attgtggtct 6300 agagctaagc agctcgagca tcatcaccat caccattaaa gatctctgca ggatatcatc 6360 atgtaattag ttatgtcacg cttacattca cgccctcccc ccacatccgc tctaaccgaa 6420 aaggaaggag ttagacaacc tgaagtctag gtccctattt atttttttat agttatgtta 6480 gtattaagaa cgttatttat atttcaaatt tttctttttt ttctgtacag a 6531 <210> 11 <211> 6318 <212> DNA <213> Plant <400> 11 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100 cttacataca aaatggaagt tgttgagagg ttctacggag agttggatgg aaaggtttcc 5160 caaggagtga acgctttgtt gggatctttc ggagttgagt tgactgatac cccaactact 5220 aagggattgc cactcgttga ttctccaact ccaattgtgt tgggagtgtc tgtttacttg 5280 accatcgtga tcggaggatt gctttggatc aaggctagag atctcaagcc aagagcttct 5340 gagccattct tgttgcaagc tttggtgttg gtgcacaact tgttctgctt cgctttgtct 5400 ctttacatgt gcgtgggtat cgcttaccaa gctatcacct ggagatattc cttgtgggga 5460 aacgcttata acccaaagca caaggagatg gctatcctcg tttacctctt ctacatgtcc 5520 aagtacgtgg agttcatgga taccgtgatc atgatcctca agagatccac cagacagatt 5580 tctttcctcc acgtgtacca ccactcttct atctccctta tctggtgggc tattgctcac 5640 cacgctccag gaggagaggc ttattggagt gctgctctca actctggagt gcacgtgttg 5700 atgtacgctt actacttctt ggctgcttgc ttgagatctt ccccaaagct caagaacaag 5760 tacctcttct ggggaagata cctcacccaa ttccagatgt tccagttcat gctcaacttg 5820 gtgcaagctt actacgatat gaaaaccaac gctccatatc cacaatggct catcaagatc 5880 ctcttctact acatgatctc cctcttgttc ctcttcggaa acttctacgt gcaaaagtac 5940 atcaagccat ccgatggaaa gcaaaaggga gctaagaccg agggtggtgg tggttctcat 6000 catcaccacc accatcatca ccatcattaa taaggtaccc cacaattgtg gggcccgggc 6060 gctagctgta caccacaatt gtggtctaga gctaagcagc tcgagcatca tcaccatcac 6120 cattaaagat ctctgcagga tatcatcatg taattagtta tgtcacgctt acattcacgc 6180 cctcccccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 6240 cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt tcaaattttt 6300 cttttttttc tgtacaga 6318 <210> 12 <211> 5805 <212> DNA <213> Human <400> 12 cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt gggacgctcg 60 aaggctttaa tttgcaagct gcggccctgc attaatgaat cggccaacgc gcggggagag 120 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 180 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 240 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaagccc aggaaccgta 300 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 360 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 420 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 480 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 540 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 600 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 660 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 720 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 780 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 840 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 900 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 960 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 1020 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 1080 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 1140 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagcgctta ccatctggcc 1200 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 1260 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 1320 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 1380 acgttgttgg cattgctaca ggcatcgtgg tgtcactctc gtcgtttggt atggcttcat 1440 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 1500 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 1560 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 1620 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 1680 gctcttgccc ggcgtcaata cgggataata gtgtatcaca tagcagaact ttaaaagtgc 1740 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 1800 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 1860 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 1920 cacggaaatg ttgaatactc atactcttcc tttttcaatg ggtaataact gatataatta 1980 aattgaagct ctaatttgtg agtttagtat acatgcattt acttataata cagtttttta 2040 gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct gcttttctgt aacgttcacc 2100 ctctacctta gcatcccttc cctttgcaaa tagtcctctt ccaacaataa taatgtcaga 2160 tcctgtagag accacatcat ccacggttct atactgttga cccaatgcgt ctcccttgtc 2220 atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa ccttcatctc ttccacccat 2280 gtctctttga gcaataaagc cgataacaaa atctttgtcg ctcttcgcaa tgtcaacagt 2340 acccttagta tattctccag tagataggga gcccttgcat gacaattctg ctaacatcaa 2400 aaggcctcta ggttcctttg ttacttcttc tgccgcctgc ttcaaaccgc taacaatacc 2460 tgggcccacc acaccgtgtg cattcgtaat gtctgcccat tctgctattc tgtatacacc 2520 cgcagagtac tgcaatttga ctgtattacc aatgtcagca aattttctgt cttcgaagag 2580 taaaaaattg tacttggcgg ataatgcctt tagcggctta actgtgccct ccatggaaaa 2640 atcagtcaag atatccacat gtgtttttag taaacaaatt ttgggaccta atgcttcaac 2700 taactccagt aattccttgg tggtacgaac atccaatgaa gcacacaagt ttgtttgctt 2760 ttcgtgcatg atattaaata gcttggcagc aacaggacta ggatgagtag cagcacgttc 2820 cttatatgta gctttcgaca tgatttatct tcgtttcctg caggtttttg ttctgtgcag 2880 ttgggttaag aatactgggc aatttcatgt ttcttcaaca ctacatatgc gtatatatac 2940 caatctaagt ctgtgctcct tccttcgttc ttccttctgt tcggagatta ccgaatcaaa 3000 aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa aaaaatgatg aattgaattg 3060 aaaagctagc ttatcgatga taagctgtca aagatgagaa ttaattccac ggactataga 3120 ctatactaga tactccgtct actgtacgat acacttccgc tcaggtcctt gtcctttaac 3180 gaggccttac cactcttttg ttactctatt gatccagctc agcaaaggca gtgtgatcta 3240 agattctatc ttcgcgatgt agtaaaacta gctagaccga gaaagagact agaaatgcaa 3300 aaggcacttc tacaatggct gccatcatta ttatccgatg tgacgctgca gcttctcaat 3360 gatattcgaa tacgctttga ggagatacag cctaatatcc gacaaactgt tttacagatt 3420 tacgatcgta cttgttaccc atcattgaat tttgaacatc cgaacctggg agttttccct 3480 gaaacagata gtatatttga acctgtataa taatatatag tctagcgctt tacggaagac 3540 aatgtatgta tttcggttcc tggagaaact attgcatcta ttgcataggt aatcttgcac 3600 gtcgcatccc cggttcattt tctgcgtttc catcttgcac ttcaatagca tatctttgtt 3660 aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc gctaattttt 3720 caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa agcgctattt 3780 taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg acgagagcgc 3840 taatttttca aacaaagaat ctgagctgca tttttacaga acagaaatgc aacgcgagag 3900 cgctatttta ccaacaaaga atctatactt cttttttgtt ctacaaaaat gcatcccgag 3960 agcgctattt ttctaacaaa gcatcttaga ttactttttt tctcctttgt gcgctctata 4020 atgcagtctc ttgataactt tttgcactgt aggtccgtta aggttagaag aaggctactt 4080 tggtgtctat tttctcttcc ataaaaaaag cctgactcca cttcccgcgt ttactgatta 4140 ctagcgaagc tgcgggtgca ttttttcaag ataaaggcat ccccgattat attctatacc 4200 gatgtggatt gcgcatactt tgtgaacaga aagtgatagc gttgatgatt cttcattggt 4260 cagaaaatta tgaacggttt cttctatttt gtctctatat actacgtata ggaaatgttt 4320 acattttcgt attgttttcg attcactcta tgaatagttc ttactacaat ttttttgtct 4380 aaagagtaat actagagata aacataaaaa atgtagaggt cgagtttaga tgcaagttca 4440 aggagcgaaa ggtggatggg taggttatat agggatatag cacagagata tatagcaaag 4500 agatactttt gagcaatgtt tgtggaagcg gtattcgcaa tgggaagctc caccccggtt 4560 gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta aattccggaa 4620 cggcgcgcac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 4680 ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 4740 tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 4800 gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 4860 taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 4920 tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 4980 acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 5040 taatatacct ctatacttta acgtcaagga gaaaaaaccg atatcgaatt cggatccaag 5100 cttacataca aaatgggaat ccaaggaggg tctgtcctgt tcgggctgct gctcgtcctg 5160 gctgtcttct gccattcagg tcatagccat caccatcacc atcacctgca gtgctacaac 5220 tgtcctaacc caactgctga ctgcaaaaca gccgtcaatt gttcatctga ttttgatgcg 5280 tgtctcatta ccaaagctgg gttacaagtg tataacaagt gttggaagtt tgagcattgc 5340 aatttcaacg acgtcacaac ccgcttgagg gaaaatgagc taacgtacta ctgctgcaag 5400 aaggacctgt gtaactttaa cgaacagctt gaaaatggtg ggacatcctt atcagagaaa 5460 acagttcttc tgctggtgac tccatttctg gcagcagcct ggagccttca tccctaataa 5520 ggtaccccac aattgtgggg cccgggcgct agctgtacac cacaattgtg gtctagagct 5580 aagcagctcg agcatcatca ccatcaccat taaagatctc tgcaggatat catcatgtaa 5640 ttagttatgt cacgcttaca ttcacgccct ccccccacat ccgctctaac cgaaaaggaa 5700 ggagttagac aacctgaagt ctaggtccct atttattttt ttatagttat gttagtatta 5760 agaacgttat ttatatttca aatttttctt ttttttctgt acaga 5805

Claims

i. Gal1 프로모터, ADH2 프로모터 또는 Gal10 프로모터로부터 선택된 하나 이상의 프로모터와 작동가능하게 연결된, 하나 이상의 에피솜 또는 통합된 효모 기반 발현 벡터의 어레이로서, 프로모터가 단독으로 또는 조합하여 사용될 수 있고; 상기 벡터가 Ura3 또는 Leu2로부터 선택된 영양요구성 선택 마커; 종결인자 CYCT1; 암피실린 내성 마커; 복제 부위 pUC ori의 기원; 2 미크론 기원; 하나 이상의 특이적 업스트림 조절 서열 및 다중 클로닝 부위로 구성된 서열 영역을 포함하고; 상기 벡터가 숙주 세포 내로 소망하는 표적 단백질에 대한 전장 또는 절단된 폴리뉴클레오티드 서열의 삽입을 지시하는, 어레이;
ii. 프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 조작된 프로테아제 결핍 효모 숙주 세포
를 포함하고,
다양한 기원 및 패밀리의 난발현 단백질의 향상된 발현을 허용하는,
다용도 재조합 발현 플랫폼.
제1항에 있어서,
프로테아제 PRB1, 프로테아제 PEP4 및 영양요구성 마커 우라실, 리신, 아데닌 및 류신을 코딩하는 파괴된 내인성 유전자를 갖는 상기 조작된 프로테아제 결핍 효모 숙주 세포가 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인, 재조합 발현 플랫폼.
제1항에 있어서,
상기 난발현 단백질이, 비제한적으로, 바이러스, 원핵생물, 진핵생물, 포유동물, 인간, 식물, 바이러스, 조류 단백질, 독소, 고도의 소수성 단백질, 다중 막관통 도메인을 갖는 단백질, 막관통 단백질, 구조 단백질, 비-구조 단백질, 이온 채널 패밀리와 같은 약물 표적 수용체, G-단백질 결합된 수용체(GPCR), GPI 고정된 단백질, 효소, TNFR 패밀리 및 원형질막에 국소화된 것, 소포체, 골지 구획 및 세포질 국소화된 단백질로부터 선택되는 다양한 기원 및 패밀리로부터의 것인, 재조합 발현 플랫폼.
제1항에 있어서,
상기 난발현 단백질이 바이러스 단백질인, 재조합 발현 플랫폼.
제4항에 있어서,
상기 바이러스 단백질이 바이러스 효소 단백질인, 재조합 발현 플랫폼.
제5항에 있어서,
상기 바이러스 효소 단백질이 막 결합된 단일 통과 막 단백질인 뉴라미니다아제인, 재조합 발현 플랫폼.
전장 뉴라미니다아제를 코딩하는 서열번호 1을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제6항에 따른 막 결합된 뉴라미니다아제의 발현을 위한 서열번호 7을 갖는 핵산 구축물.
i. 제7항에 따른 핵산 구축물을 제조하는 단계;
ii. 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii. 뉴라미니다아제의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 막 결합된 뉴라미니다아제를 생산하는 방법.
면역원성 반응을 유도하고 기능적으로 활성인, 제1항에 따른 플랫폼을 사용하여 발현되는 재조합 전장 뉴라미니다아제 단백질.
제1항에 있어서,
상기 난발현 단백질이 고도의 소수성 바이러스 단백질인, 재조합 발현 플랫폼.
제10항에 있어서,
상기 고도의 소수성 바이러스 단백질이 구조 단백질인, 재조합 발현 플랫폼.
제11항에 있어서,
상기 고도의 소수성 바이러스 구조 단백질이 캡시드 단백질인, 재조합 발현 플랫폼.
제12항에 있어서,
상기 고도의 소수성 바이러스 구조인 캡시드 단백질이 백신 후보인, 재조합 발현 플랫폼.
제13항에 있어서,
상기 백신 후보 단백질이 VP7인, 재조합 발현 플랫폼.
전장 VP7을 코딩하는 핵산 서열 서열번호 2, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제14항에 따른 바이러스 구조 캡시드 단백질 VP7의 발현을 위한 서열번호 8을 갖는 핵산 구축물.
i) 제15항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) VP7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 고도의 소수성 바이러스 구조 캡시드 단백질 VP7을 생산하는 방법.
제1항에 있어서,
상기 난발현 단백질이 다중-통과 막관통 단백질인, 재조합 발현 플랫폼.
제1항에 있어서,
상기 난발현 단백질이 이온 채널 수용체 패밀리로부터의 다중-통과 막관통 단백질인, 재조합 발현 플랫폼.
제18항에 있어서,
상기 다중-통과 막관통 단백질이 이온 채널 수용체 패밀리로부터의 것인, 재조합 발현 플랫폼.
제17항에 있어서,
상기 막관통 단백질이 약물 표적 수용체 단백질인, 재조합 발현 플랫폼.
제20항에 있어서,
상기 약물 표적 수용체 단백질이 나트륨 이온 채널 수용체 Nav1.7인, 재조합 발현 플랫폼.
전장 Nav1.7을 코딩하는 핵산 서열 서열번호 3, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제21항에 따른 막관통 이온 채널 수용체 단백질 Nav1.7의 발현을 위한 서열번호 9를 갖는 핵산 구축물.
i) 제22항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) Nav1.7의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계;
iv) 공초점 현미경을 사용하는 발현된 Nav1.7의 표면 국소화의 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 막관통 Nav1.7 단백질을 생산하는 방법.
제1항에 있어서,
상기 난발현 단백질이 효소 단백질인, 재조합 발현 플랫폼.
제24항에 있어서,
상기 효소 단백질이 막관통 단백질인, 재조합 발현 플랫폼.
제25항에 있어서,
상기 막관통 단백질이 지질 생합성으로부터의 것인, 재조합 발현 플랫폼.
제26항에 있어서,
지질 생합성 단백질이 지방산 불포화효소인, 재조합 발현 플랫폼.
제27항에 있어서,
상기 불포화효소가 진균 기원으로부터의 것인, 재조합 발현 플랫폼.
전장 Nav1.7을 코딩하는 핵산 서열 서열번호 4, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제28항에 따른 지방산 불포화효소의 발현을 위한 서열번호 10을 갖는 핵산 구축물.
i) 제29항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 불포화효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 지방산 불포화효소 단백질을 생산하는 방법.
제1항에 있어서,
상기 난발현 단백질이 효소 단백질인, 재조합 발현 플랫폼.
제31항에 있어서,
상기 효소 단백질이 막관통 단백질인, 재조합 발현 플랫폼.
제32항에 있어서,
상기 막관통 단백질이 지질 생합성으로부터의 것인, 재조합 발현 플랫폼.
제33항에 있어서,
지질 생합성으로부터의 상기 막관통 단백질이 지방산 신장효소인, 재조합 발현 플랫폼.
전장 신장효소를 코딩하는 서열번호 5를 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제33항에 따른 지방산 신장효소의 발현을 위한 서열번호 11을 갖는 핵산 구축물.
i) 제35항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) 지방산 신장효소의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 지방산 신장효소 단백질을 생산하는 방법.
제1항에 있어서,
상기 난발현 단백질이 글리코실포스파티딜이노시톨-고정된(GPI 고정) 단백질인, 재조합 발현 플랫폼.
제37항에 있어서,
상기 GPI 고정 단백질이 약물 표적 단백질인, 재조합 발현 플랫폼.
제38항에 있어서,
상기 약물 표적 단백질이 CD59인, 재조합 발현 플랫폼.
제1항에 있어서,
상기 CD59가 인간 기원으로부터의 것인, 재조합 발현 플랫폼.
전장 신장효소를 코딩하는 서열번호 6을 갖는 핵산 서열, 및 Gal1 프로모터와 함께 Ura3 영양요구성 선택 마커, CYCT1 종결인자, 암피실린 내성 마커, pUC ori를 포함하는 에피솜 발현 벡터를 포함하는, 제40항에 따른 GPI 고정 단백질 CD59의 발현을 위한 서열번호 12를 갖는 핵산 구축물.
i) 제41항에 따른 핵산 구축물을 제조하는 단계;
ii) 상기 구축물을 제1항에 따른 숙주 세포에서 형질전환시키는 단계;
iii) CD59의 향상된 발현을 위해 형질전환된 숙주 세포를 배양하는 단계
를 포함하는, 제1항에 따른 재조합 발현 플랫폼에 의해 GPI 고정 CD59 단백질을 생산하는 방법.
제1항에 있어서,
확장가능하고 산업적 규모로 다양한 기원 및 패밀리로부터 단백질을 생산할 수 있는, 재조합 발현 플랫폼.
제1항에 따른 재조합 발현 플랫폼을 포함하는 키트로서,
i) 난발현 표적 단백질을 코딩하는 핵산 구축물;
ii) 조작된 프로테아제 결핍 효모 숙주 세포;
iii) 키트를 작동하기 위한 사용설명서
를 포함하는, 키트.