KR20230002681A

KR20230002681A - 대형 아데노바이러스 페이로드의 통합

Info

Publication number: KR20230002681A
Application number: KR1020227039575A
Authority: KR
Inventors: 안드레 리버; 한스-피터 키엠; 홍지에 왕
Original assignee: 프레드 허친슨 캔서 센터; 유니버시티 오브 워싱톤
Priority date: 2020-04-13
Filing date: 2021-04-12
Publication date: 2023-01-05
Also published as: MX2022012819A; AU2021256428A1; JP2023521410A; US20230313224A1; EP4136244A1; WO2021211454A9; WO2021211454A1; BR112022020589A2; CN115768901A; CA3174414A1; EP4136244A4; TW202204627A

Abstract

본 개시내용은 대형 트랜스포손 페이로드, 예를 들어 최대 40 kb의 트랜스포손 페이로드를 수용할 수 있거나 또는 이를 함유하는 재조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 제공한다. 아데노바이러스 벡터 및 게놈은, 예를 들어 유전자 요법을 위해 대형 트랜스포손 페이로드를 표적 게놈 내로 전달할 수 있다.

Description

대형 아데노바이러스 페이로드의 통합

관련 출원에 대한 상호 참조

본 출원은 2020년 4월 13일에 출원된 미국 가출원 번호 63/009,298의 보다 이른 출원일에 대한 우선권 및 그의 이익을 주장하며, 이는 그 전문이 본원에 참조로 포함된다.

연방 후원 연구 또는 개발에 관한 진술

본 발명은 국립 보건원에 의해 수여된 승인 번호 HL128288 및 HL136135 하에 정부 지원으로 이루어졌다. 정부는 본 발명에 특정 권리를 갖는다.

개시내용의 분야

본 개시내용은 특히, 대형 트랜스포손 페이로드, 예를 들어 최대 40 kb의 트랜스포손 페이로드를 수용할 수 있거나 또는 이를 함유하는 재조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 제공한다. 특정 아데노바이러스 벡터 및 게놈은, 예를 들어 유전자 요법을 위해 대형 트랜스포손 페이로드를 표적 게놈 내로 전달할 수 있다.

유전자 요법은 많은 도전과제를 제시한다. 바이러스 벡터는 유전자 요법의 한 수단이다. 유전자 요법을 위한 바이러스 벡터의 개발에서 다양한 도전과제는, 일부 경우에, 벡터 페이로드 용량, 표적 세포 게놈 내로의 트랜스진 통합의 효율, 트랜스진 발현의 세포 유형 특이성, 트랜스진 발현의 수준, 및 통합의 위치 효과를 포함한다. 바이러스 벡터를 사용하는 유전자 요법의 다양한 방법은 대상체로부터 세포를 떼어내고 대상체에게 투여하기 전 생체외에서 세포를 조작 및/또는 확장하는 자원-소모 단계를 필요로 한다. 적어도 이들 이유로 인해, 특히 바이러스 벡터를 이용하는 요법의 수가 증가하고 있다는 관점에서, 개선된 바이러스 벡터 설계에 대한 큰 필요가 존재한다.

혈색소병증은 전세계적으로 가장 보편적인 유전 장애 중 하나이며, 특히 저개발 국가에서 태어난 환자의 경우 유의하게 감소된 생존율을 갖는다. 혈색소병증의 예는 겸상 적혈구 질환 및 지중해빈혈을 포함한다. 환자-특이적 혈액 줄기/전구 세포 (HSPC) 유전자 요법은 혈색소병증을 치료하는 큰 잠재력을 갖는다.

추가로, 세계 보건 기구에 의하면 80종 초과의 1차 면역 결핍 질환이 인식된다. 이들 질환은, 일부 경우에, 신체가 감염에 대한 임의의 또는 충분한 항체를 생산할 수 없는 면역계에서의 내인성 결함을 특징으로 한다. 다른 경우에, 감염과 싸우기 위한 세포 방어가 적절하게 작용하지 못한다. 전형적으로, 1차 면역 결핍은 유전성 장애이다.

2차 또는 후천성 면역 결핍은 유전성 유전자 이상의 결과가 아니라, 면역계가 면역계 외부의 인자에 의해 손상된 개체에서 발생한다. 예는 외상, 바이러스, 화학요법, 독소, 및 오염을 포함한다. 후천성 면역결핍 증후군 (AIDS)은 바이러스, 인간 면역결핍 바이러스 (HIV)에 의해 유발된 2차 면역 결핍 장애의 예이며, 여기서 T 림프구의 고갈은 신체가 감염과 싸울 수 없게 만든다.

X-연관 중증 복합 면역결핍 (SCID-X1)은 공통 감마 쇄 유전자 (γC)에서의 돌연변이에 의해 유발되는 세포성 및 체액성 면역 고갈 둘 다이며, 이는 T 및 자연 킬러 (NK) 림프구의 부재 및 비기능적 B 림프구의 존재를 야기한다. SCID-X1은, 면역계가 예를 들어 골수 이식 (BMT) 또는 유전자 요법을 통해 재구성되지 않는 한, 생후 첫 2년 내에 치명적이다.

대부분의 개체는 BMT 또는 비-자가 유전자 요법을 위한 매칭 공여자가 부족하기 때문에, 성숙 T 세포가 고갈된 홑배수동종 모 골수가 종종 사용되지만; 합병증으로 이식편 대 숙주 질환 (GVHD), 적절한 항체 제조 실패, 그에 따른 장기간 이뮤노글로불린 대체의 필요, 조혈 줄기 및 전구 세포 (HSPC) 생착 실패로 인한 후기 T 세포 손실, 만성 사마귀, 및 림프구 조절이상을 포함한다.

판코니 빈혈 (FA)은 골수 부전으로 이어지는 유전성 혈액 장애이다. 이는, 부분적으로, 결핍된 DNA-복구 메카니즘을 특징으로 한다. FA를 갖는 환자의 적어도 20%에서 암, 예컨대 급성 골수성 백혈병, 및 피부암, 간암, 위장관암, 및 부인과계암이 발생한다. 피부 및 위장 종양은 통상적으로 편평 세포 암종이다. 암이 발생한 환자의 평균 연령은 백혈병의 경우 15세, 간 종양의 경우 16세, 및 다른 종양의 경우 23세이다.

바이러스 벡터를 환자에게 직접 전달하는 것을 포함하는 생체내 유전자 요법을 사용하는 치료가 연구되었다. 생체내 유전자 요법은 어떠한 유전자독성 조건화도 필요로 하지 않을 수 있고 (또는 보다 적은 유전자독성 조건화를 필요로 할 수 있음) 또한 생체외 세포 프로세싱도 필요로 하지 않을 수 있기 때문에 간단하고 매력적인 접근법이며, 백신의 전달을 위해 전세계적으로 이미 행해지고 있는 것과 유사하게 요법이 주사를 통해 투여될 수 있기 때문에 개발도상국의 기관을 포함한 전세계의 많은 기관에서 채택될 수 있었다.

아데노바이러스는 그의 중간 크기 게놈, 조작의 용이성, 높은 역가, 넓은 표적-세포 범위 및 높은 감염성으로 인해 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 양쪽 단부는 바이러스 DNA 복제 및 패키징에 필요한 시스 요소인 100-200개 염기쌍의 역전된 반복부 (ITR)를 함유한다. 게놈의 초기 (E) 및 후기 (L) 영역은 바이러스 DNA 복제의 개시에 의해 나누어지는 상이한 전사 단위를 함유한다. E1 영역 (E1A 및 E1B)은 바이러스 게놈 및 소수의 세포 유전자의 전사 조절을 담당하는 단백질을 코딩한다. E2 영역 (E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질의 합성을 발생시킨다. 이들 단백질은 DNA 복제, 후기 유전자 발현 및 숙주 세포 억제에 수반된다. 대부분의 바이러스 캡시드 단백질을 비롯한 후기 유전자의 생성물은 주요 후기 프로모터 (MLP)에 의해 발생되는 단일 1차 전사체의 유의한 프로세싱 후에만 발현된다. MLP는 감염 후기 동안 특히 효율적이고, 이러한 프로모터로부터 발생되는 모든 mRNA는 번역을 위해 mRNA를 선호하게 만드는 5'-3부 리더 (TPL) 서열을 보유한다.

성공적인 유전자 요법을 위해서는, 통합의 위치 효과 및 전사 침묵 없이, 전달된 유전자는 목적하는 조직 또는 세포에서 높은 수준으로 발현되어야 한다. 유전자좌 제어 영역 (LCR)은, LCR이 연결된 유전자의 발현을 이소성 염색질 부위에서 조직-특이적 및 카피수-의존적 방식으로 생리학적 수준으로 증진시키는 그의 능력을 특징으로 하기 때문에, 이러한 작업에 특히 적합하다. LCR의 성분은 통상적으로 발현 세포의 염색질 내 DNAse I 과민성 (HS) 부위에 공동국재화된다. 개별 HS에서의 핵심 결정인자는 다중 편재성 및 계통-특이적 전사 인자-결합 부위의 어레이로 구성된다.

본 개시내용은 특히 아데노바이러스 벡터 및 아데노바이러스 게놈, 본 개시내용의 2개 이상의 아데노바이러스 벡터 및/또는 아데노바이러스 게놈을 포함하는 시스템, 및 이러한 아데노바이러스 벡터, 아데노바이러스 게놈, 및 시스템의 용도를 포함한다. 특정 실시양태에서, 본 발명은 예를 들어 1 kb 내지 40 kb의 트랜스포손 페이로드를 포함하는 아데노바이러스 벡터 및/또는 아데노바이러스 게놈을 포함한다. 본 개시내용의 특정 실시양태에서, 트랜스포사제는 예를 들어 최대 40 kb의 트랜스포손 페이로드의 표적 세포의 게놈 내로의 통합을 유발할 수 있다. 따라서, 본 개시내용은 특히 아데노바이러스 공여자 벡터에 존재하는 최대 40 kb의 페이로드의 표적 세포 게놈 내로의 통합을 가능하게 하는 벡터, 게놈, 및 시스템을 포함한다. 관련 기술분야의 통상의 기술자가 인지할 바와 같이, 벡터 통합 용량은 그 자체로 유전자 요법 시스템의 결정적으로 중요한 특색 중 하나이며, 이는 적어도 부분적으로 통합 용량이 치료 페이로드의 길이 및/또는 복잡성을 제한하기 때문이다.

본 개시내용에서 인식되는 긴 및/또는 복합 핵산 페이로드의 특정 예는 긴 유전자좌 제어 영역을 포함하는 페이로드를 포함한다. 그의 길이로 인해, 긴 유전자좌 제어 영역은 역사적으로 아데노바이러스 페이로드에 포함되기에 부적합하였지만, 긴 유전자좌 제어 영역을 포함하는 긴 및/또는 복합 핵산 페이로드를 포함하나 이에 제한되지는 않는 긴 및/또는 복합 핵산 페이로드는 본원에 개시된 벡터, 게놈, 및 시스템에 따라 표적 세포 게놈 내로 통합될 수 있다.

따라서, 한 실시양태에서, (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터가 제공된다.

또 다른 실시양태는 (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈이다.

또한, (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템이 제공된다.

또 다른 실시양태는 (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템이다.

또한, (a) 본원에 기재된 바와 같은 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템이 제공된다.

추가 실시양태는 본원에 기재된 다양한 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포 (예를 들어, 조혈 줄기 세포)이다.

또한, 본원에 기재된 임의의 실시양태의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포(들) (예를 들어, 조혈 줄기 세포)가 기재되며, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된다.

또 다른 실시양태는 본원에 기재된 실시양태 중 어느 하나에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 여기서 세포는 HEK293 세포이다.

세포를 변형시키는 방법으로서, 세포를 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.

또 다른 실시양태는 대상체의 세포를 변형시키는 방법이며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

또 다른 실시양태는 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법이며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

또한, 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법이 제공되며, 방법은 대상체에게 본원에 기재된 실시양태 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

적어도 한 측면에서, 본 개시내용은 (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터를 제공한다.

적어도 한 측면에서, 본 개시내용은 (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈을 제공한다.

적어도 한 측면에서, 본 개시내용은 (a) 실시양태 1의 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템을 제공한다.

적어도 한 측면에서, 본 개시내용은 (a) 실시양태 2의 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템을 제공한다.

적어도 한 측면에서, 본 개시내용은 (a) 실시양태 2의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템을 제공한다.

다양한 실시양태에서, 트랜스포손 페이로드는 긴 LCR을 포함하고, 임의로 여기서 긴 LCR은 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR이다. 다양한 실시양태에서, 긴 LCR은 길이가 적어도 27 kb이다. 다양한 실시양태에서, 트랜스포손 페이로드는 표 1에 제시된 LCR을 포함한다. 다양한 실시양태에서, 트랜스포손 페이로드는 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는다. 다양한 실시양태에서, 트랜스포손 페이로드는 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는다. 다양한 실시양태에서, 트랜스포손 페이로드는 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는다.

다양한 실시양태에서, 트랜스포손 페이로드는 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질은 치료 단백질이다. 다양한 실시양태에서, 단백질은 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질로 이루어진 군으로부터 선택된다. 다양한 실시양태에서, 단백질은 인자 VIII 대체 단백질이다. 다양한 실시양태에서, 단백질을 코딩하는 핵산 서열은 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터는 β 글로빈 프로모터이다.

다양한 실시양태에서, 트랜스포손 역전된 반복부는 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부는 pT4 역전된 반복부이다. 다양한 실시양태에서, 트랜스포사제는 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제는 슬리핑 뷰티 100x (SB100x)이다. 다양한 실시양태에서, 레콤비나제 직접 반복부는 FRT 부위이다. 다양한 실시양태에서, 아데노바이러스 지지 게놈은 레콤비나제를 코딩하는 핵산을 포함한다. 다양한 실시양태에서, 레콤비나제는 FLP 레콤비나제이다. 다양한 실시양태에서, 트랜스포손 페이로드는 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드는 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부는 SB 역전된 반복부이고, 레콤비나제 직접 반복부는 FRT 부위이다.

다양한 실시양태에서, 트랜스포손 페이로드는 선택 카세트를 포함하고, 임의로 여기서 선택 카세트는 mgmt^P140K를 코딩하는 핵산 서열을 포함한다.

다양한 실시양태에서, 아데노바이러스 캡시드는 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드는 Ad35++ 캡시드이다.

다양한 실시양태에서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소는 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함한다.

다양한 실시양태에서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부는 LoxP 부위이다.

다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포를 제공한다.

다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 트랜스포손 페이로드를 그의 게놈에 포함하는 세포를 제공하며, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된다.

다양한 실시양태에서, 세포는 조혈 줄기 세포이다.

다양한 실시양태에서, 본 개시내용은 본 개시내용에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포를 제공하며, 임의로 여기서 세포는 HEK293 세포이다.

다양한 실시양태에서, 본 개시내용은 세포를 변형시키는 방법을 제공하며, 방법은 세포를 본 개시내용에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함한다.

다양한 실시양태에서, 본 개시내용은 대상체의 세포를 변형시키는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

다양한 실시양태에서, 본 개시내용은 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

다양한 실시양태에서, 본 개시내용은 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법을 제공하며, 방법은 대상체에게 본 개시내용에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함한다.

다양한 실시양태에서, 아데노바이러스 공여자 벡터는 대상체에게 정맥내로 투여된다.

다양한 실시양태에서, 방법은 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함한다. 다양한 실시양태에서, CXCR4 길항제는 AMD3100이다. 다양한 실시양태에서, CXCR2 효능제는 GRO-β이다.

다양한 실시양태에서, 트랜스포손 페이로드는 선택 카세트를 포함하며, 방법은 대상체에게 선택제를 투여하는 것을 포함한다. 다양한 실시양태에서, 선택 카세트는 mgmt^P140K를 코딩하고, 선택제는 O⁶BG/BCNU이다.

다양한 실시양태에서, 방법은 CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발한다. 다양한 실시양태에서, 방법은 조혈 줄기 세포 및/또는 적혈구 Ter119⁺ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발한다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조는 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현이다. 다양한 실시양태에서, 방법은 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조는 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현이다.

다양한 실시양태에서, 대상체는 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함한다. 다양한 실시양태에서, 대상체는 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함한다. 다양한 실시양태에서, 대상체에서의 단백질의 발현은 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료한다.

정의

관사: 본원에 사용된 관사는 하나 또는 하나 초과 (즉, 적어도 하나)의 관사의 문법적 대상을 지칭한다. 예로서, "요소"는 정확히 하나의 요소의 실시양태 및 하나 초과의 요소를 포함하는 실시양태를 개시한다.

약: 본원에 사용된 용어 "약"은, 값의 언급에서 사용되는 경우에, 언급된 값과 관련하여 유사한 값을 지칭한다. 일반적으로, 문맥에 익숙한 관련 기술분야의 통상의 기술자는 그러한 문맥에서 "약"에 의해 포괄되는 관련 변동 정도를 인지할 것이다. 예를 들어, 일부 실시양태에서, 용어 "약"은 언급된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 또는 그 미만 이내인 값의 범위를 포괄할 수 있다.

투여: 본원에 사용된 용어 "투여"는 전형적으로 조성물이거나 또는 조성물에 포함된 작용제의 전달을 달성하기 위해 대상체 또는 시스템에게 조성물을 투여하는 것을 지칭한다.

입양 세포 요법: 본원에 사용된 "입양 세포 요법" 또는 "ACT"는 치료 활성을 갖는 세포를 대상체, 예를 들어 상태, 장애, 또는 질환에 대한 치료를 필요로 하는 대상체 내로 전달하는 것을 수반한다. 일부 실시양태에서, ACT는 세포의 생체외 및/또는 시험관내 조작 및/또는 확장 후에 세포를 대상체 내로 전달하는 것을 포함한다.

친화도: 본원에 사용된 "친화도"는 특정한 결합제 (예를 들어, 바이러스 벡터) 및/또는 그의 결합 모이어티와 결합 표적 (예를 들어, 세포) 사이의 비-공유 상호작용의 총 합계의 강도를 지칭한다. 달리 나타내지 않는 한, 본원에 사용된 "결합 친화도"는 결합제와 그의 결합 표적 (예를 들어, 바이러스 벡터와 바이러스 벡터의 표적 세포) 사이의 1:1 상호작용을 지칭한다. 관련 기술분야의 통상의 기술자는 친화도의 변화가 참조와의 비교에 의해 기재될 수 있거나 (예를 들어, 참조에 비해 증가 또는 감소됨), 또는 수치상 기재될 수 있음을 인지한다. 친화도는 평형 해리 상수 (K_D) 및/또는 평형 회합 상수 (K_A)를 포함하나 이에 제한되지는 않는 관련 기술분야에 공지된 다수의 방식으로 측정 및/또는 표현될 수 있다. K_D는 k_오프/k_온의 몫인 반면, K_A는 k_온/k_오프의 몫이며, 여기서 k_온은 예를 들어 바이러스 벡터와 표적 세포의 회합률 상수를 지칭하고, k_오프는 예를 들어 표적 세포로부터의 바이러스 벡터의 해리를 지칭한다. k_온 및 k_오프는 관련 기술분야의 통상의 기술자에게 공지된 기술에 의해 결정될 수 있다.

작용제: 본원에 사용된 용어 "작용제"는 원자, 분자, 화합물, 아미노산, 폴리펩티드, 뉴클레오티드, 핵산, 단백질, 단백질 복합체, 액체, 용액, 사카라이드, 폴리사카라이드, 지질, 또는 그의 조합 또는 복합체 중 어느 하나 이상을 포함하나 이에 제한되지는 않는 임의의 화학 물질을 지칭할 수 있다.

동종: 본원에 사용된 용어 "동종"은 하나의 대상체로부터 유래된 다음 또 다른 대상체에게 도입되는 임의의 물질, 예를 들어 동종 T 세포 이식을 지칭한다.

사이 또는 로부터: 본원에 사용된 용어 "사이"는 경계를 포함하여, 나타낸 상한 및 하한, 또는 제1 및 제2 경계 사이에 속하는 내용을 지칭한다. 유사하게, 용어 "로부터"는, 값의 범위와 관련하여 사용되는 경우에, 범위가 경계를 포함하여 나타낸 상한 및 하한, 또는 제1 및 제2 경계 사이에 속하는 내용을 포함한다는 것을 나타낸다.

결합: 본원에 사용된 용어 "결합"은 2종 이상의 작용제 사이의 또는 그 중에서의 비-공유 회합을 지칭한다. "직접" 결합은 작용제 사이의 물리적 접촉을 수반하고; 간접 결합은 1종 이상의 중간 작용제와의 물리적 접촉에 의한 물리적 상호작용을 수반한다. 2종 이상의 작용제 사이의 결합은 상호작용 작용제가 단리되어 또는 보다 복잡한 시스템의 문맥에서 (예를 들어, 담체 작용제와 공유적으로 또는 달리 회합되어 있는 동안 및/또는 생물학적 시스템 또는 세포에서) 연구되는 경우를 포함한 임의의 다양한 문맥에서 발생하고/거나 평가될 수 있다.

암: 본원에 사용된 용어 "암"은 세포가 비교적 비정상, 비제어, 및/또는 자율 성장을 나타내어 세포 증식의 제어의 유의한 상실을 특징으로 하는 비정상적으로 상승된 증식 속도 및/또는 이상 성장 표현형을 보이는 상태, 장애, 또는 질환을 지칭한다. 일부 실시양태에서, 암은 1개 이상의 종양을 포함할 수 있다. 일부 실시양태에서, 암은 전암성 (예를 들어, 양성), 악성, 전-전이성, 전이성, 및/또는 비-전이성인 세포일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 암은 고형 종양일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 암은 혈액 종양일 수 있거나 또는 그를 포함할 수 있다.

키메라 항원 수용체: 본원에 사용된 "키메라 항원 수용체" 또는 "CAR"은 (i) 표적 항원에 결합하는 모이어티를 포함하는 세포외 도메인; (ii) 막횡단 도메인; 및 (iii) CAR이 세포외 결합 모이어티와 표적 항원의 결합에 의해 자극될 때 활성화 신호를 전송하는 세포내 신호전달 도메인을 포함하는 조작된 단백질을 지칭한다. 키메라 항원 수용체를 발현하도록 유전자 조작된 T 세포는 CAR T 세포로 지칭될 수 있다. 따라서, 예를 들어, 특정 CAR이 T 세포에 의해 발현되는 경우에, CAR 세포외 결합 모이어티와 표적 항원의 결합은 T 세포를 활성화시킬 수 있다. CAR은 또한 키메라 T 세포 수용체 또는 키메라 면역수용체로 공지되어 있다.

조합 요법: 본원에 사용된 용어 "조합 요법"은 2종 이상의 작용제 또는 요법이 함께 대상체의 상태, 장애, 또는 질환을 치료하도록 2종 이상의 작용제 또는 요법을 대상체에게 투여하는 것을 지칭한다. 일부 실시양태에서, 2종 이상의 치료제 또는 요법은 동시에, 순차적으로, 또는 중첩 투여 요법으로 투여될 수 있다. 관련 기술분야의 통상의 기술자는 조합 요법이 2종의 작용제 또는 요법이 단일 조성물로 함께 투여되거나 또는 동시에 투여되는 것을 포함하나, 이를 필요로 하는 것은 아님을 인지할 것이다.

제어 발현 또는 활성: 본원에 사용된 제1 요소 (예를 들어, 단백질, 예컨대 전사 인자, 또는 핵산 서열, 예컨대 프로모터)는, 제2 요소 (예를 들어, 단백질, 또는 단백질과 같은 작용제를 코딩하는 핵산)의 발현 또는 활성이 적어도 1 세트의 조건 하에 제1 요소의 상태 (예를 들어, 존재, 부재, 입체형태, 화학적 변형, 상호작용, 또는 다른 활성)에 전적으로 또는 부분적으로 의존적인 경우에, 제2 요소의 발현 또는 활성을 "제어" 또는 "구동"한다. 발현 또는 활성의 제어는, 예를 들어 제1 요소의 상태에서의 변화가 적어도 1 세트의 조건 하에 참조 대조군과 비교하여 제2 요소의 발현 또는 활성에서 적어도 10% (예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 2-배, 3-배, 4-배, 5-배, 10-배, 20-배, 30-배, 40-배, 50-배, 100-배)의 변화를 발생시킬 수 있다는 점에서 실질적 제어 또는 활성일 수 있다.

상응하는: 본원에 사용된 용어 "상응하는"은 적절한 참조 화합물 또는 조성물과의 비교를 통해 화합물 또는 조성물에서 구조적 요소의 위치/정체를 지정하는데 사용될 수 있다. 예를 들어, 일부 실시양태에서, 중합체 내의 단량체 잔기 (예를 들어, 폴리펩티드 내의 아미노산 잔기 또는 폴리뉴클레오티드 내의 핵산 잔기)는 적절한 참조 중합체 내의 잔기에 "상응하는" 것으로 확인될 수 있다. 예를 들어, 관련 기술분야의 통상의 기술자는 제공된 폴리펩티드 또는 폴리뉴클레오티드 서열 내의 잔기가 종종 관련 참조 서열의 스킴에 따라 지정 (예를 들어, 넘버링 또는 라벨링)된다는 것을 인지한다 (예를 들어, 이러한 지정이 제공된 서열의 문자 넘버링을 반영하지 않더라도). 예시로서, 참조 서열이 위치 100-110에서 특정한 아미노산 모티프를 포함하고, 제2 관련 서열이 위치 110-120에서 동일한 모티프를 포함하는 경우에, 제2 관련 서열의 모티프 위치는 참조 서열의 위치 100-110"에 상응하는" 것으로 언급될 수 있다. 관련 기술분야의 통상의 기술자는 상응하는 위치가, 예를 들어 서열의 정렬에 의해 용이하게 확인될 수 있고, 이러한 정렬은 소프트웨어 프로그램, 예컨대 예를 들어 BLAST, CS-BLAST, CUDASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, parasail, PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM, 또는 SWIPE를 포함하나 이에 제한되지는 않는 다양한 공지된 도구, 전략, 및/또는 알고리즘 중 임의의 것에 의해 통상적으로 달성된다는 것을 인지한다.

투여 요법: 본원에 사용된 용어 "투여 요법"은, 전형적으로 각각의 복수의 단위 용량 투여가 다른 것의 투여와 소정 기간 분리되어 있는 것을 포함하는, 대상체에게 투여되는 1개 이상의 동일하거나 상이한 단위 용량의 세트를 지칭할 수 있다. 다양한 실시양태에서, 투여 요법의 하나 이상의 또는 모든 단위 용량은 동일할 수 있거나 또는 달라질 수 있다 (예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의료 진료의의 결정에 따라 조정될 수 있음). 다양한 실시양태에서, 각각의 용량 사이의 기간 중 하나 이상 또는 모두는 동일할 수 있거나 또는 달라질 수 있다 (예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의료 진료의의 결정에 따라 조정될 수 있음). 일부 실시양태에서, 주어지는 치료제는 1회 이상의 용량을 수반할 수 있는 권장 투여 요법을 갖는다. 전형적으로, 시판 약물의 적어도 하나의 권장 투여 요법은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 일부 실시양태에서, 투여 요법은 관련 집단에 걸쳐 투여되는 경우에 목적하는 또는 유익한 결과와 상관된다 (즉, 치료 투여 요법임).

하류 및 상류: 본원에 사용된 용어 "하류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C-말단에 더 근접하다는 것을 의미한다. 본원에 사용된 용어 "상류"는 제1 DNA 영역이 제2 DNA 영역에 비해 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N-말단에 더 근접하다는 것을 의미한다.

조작된: 본원에 사용된 용어 "조작된"은 인간의 손에 의해 다루어진 측면을 지칭한다. 예를 들어, 폴리뉴클레오티드는 자연에서 그 순서로 함께 연결되지 않은 2개 이상의 서열이 조작된 폴리뉴클레오티드에서 서로 직접적으로 연결되도록 인간의 손에 의해 다루어진 경우에 "조작된" 것으로 간주된다. 관련 기술분야의 통상의 기술자는 "조작된" 핵산 또는 아미노산 서열이 재조합 핵산 또는 아미노산 서열일 수 있음을 인지할 것이다. 일부 실시양태에서, 조작된 폴리뉴클레오티드는, 자연에서 제1 서열과 작동가능하게 연결되어 발견되지만 자연에서 제2 서열과는 작동가능하게 연결되어 발견되지 않는 코딩 서열 및/또는 조절 서열을 인간의 손에 의해 제2 서열과 작동가능하게 연결된 상태로 조작된 폴리뉴클레오티드에 포함한다. 일부 실시양태에서, 세포 또는 유기체는 그의 유전자 정보가 변경되도록 다루어진 경우에 (예를 들어, 이전에 존재하지 않는 새로운 유전 물질이, 예를 들어 형질전환, 교배, 체세포 혼성화, 형질감염, 형질도입, 또는 다른 메카니즘에 의해 도입되었거나, 또는 이전에 존재하는 유전 물질이, 예를 들어 치환, 결실, 또는 교배에 의해 변경 또는 제거됨) "조작된" 것으로 간주된다. 관례와 같이, 그리고 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 조작된 폴리뉴클레오티드 또는 세포의 완전한 또는 불완전한 자손 또는 카피는 직접 조작이 선행 실체에 대한 것일지라도 전형적으로 여전히 "조작된" 것으로 지칭된다.

부형제: 본원에 사용된 "부형제"는, 예를 들어 목적하는 점조도 또는 안정화 효과를 제공하거나 또는 이에 기여하기 위해 제약 조성물에 포함될 수 있는 비-치료제를 지칭한다. 일부 실시양태에서, 적합한 제약 부형제는, 예를 들어 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 벼, 밀가루, 백악, 실리카 겔, 스테아르산나트륨, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함할 수 있다.

발현: 본원에 사용된 "발현"은 핵산 서열로부터 코딩된 작용제, 예컨대 단백질의 생산을 발생시키는 1종 이상의 생물학적 과정을 개별적으로 및/또는 누적적으로 지칭한다. 발현은 구체적으로 전사 및 번역 중 하나 또는 둘 다를 포함한다.

단편: 본원에 사용된 "단편"은 참조 작용제 (때때로 "모" 작용제로 지칭됨)의 별개의 부분을 포함하고/거나 그로 이루어진 구조를 지칭한다. 일부 실시양태에서, 단편은 참조 작용제에서 발견되는 1개 이상의 모이어티가 결여되어 있다. 일부 실시양태에서, 단편은 참조 작용제에서 발견되는 1개 이상의 모이어티를 포함하거나 또는 그로 이루어진다. 일부 실시양태에서, 참조 작용제는 중합체, 예컨대 폴리뉴클레오티드 또는 폴리펩티드이다. 일부 실시양태에서, 중합체의 단편은 참조 중합체의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 또는 그 초과의 단량체 단위 (예를 들어, 잔기)를 포함하거나 또는 그로 이루어진다. 일부 실시양태에서, 중합체의 단편은 참조 중합체에서 발견되는 단량체 단위 (예를 들어, 잔기)의 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 초과를 포함하거나 또는 그로 이루어진다. 참조 중합체의 단편은 참조 중합체의 상응하는 부분과 반드시 동일하지는 않다. 예를 들어, 참조 중합체의 단편은 참조 중합체에 대해 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 동일성을 갖는 잔기의 서열을 갖는 중합체일 수 있다. 단편은 참조 작용제의 물리적 단편화에 의해 생성될 수 있거나 또는 생성되지 않을 수 있다. 일부 경우에, 단편은 참조 작용제의 물리적 단편화에 의해 생성된다. 일부 경우에, 단편은 참조 작용제의 물리적 단편화에 의해 생성되지 않고, 대신에, 예를 들어 신생 합성 또는 다른 수단에 의해 생산될 수 있다.

유전자, 트랜스진: 본원에 사용된 용어 "유전자"는 임의로 코딩 서열의 발현을 제어하는 조절 서열의 일부 또는 전부와 함께, 코딩 서열이거나 또는 그를 포함하는 DNA 서열 (즉, 발현 생성물, 예컨대 RNA 생성물 및/또는 폴리펩티드 생성물을 코딩하는 DNA 서열)을 지칭한다. 일부 실시양태에서, 유전자는 비-코딩 서열, 예컨대 제한 없이 인트론을 포함한다. 일부 실시양태에서, 유전자는 코딩 (예를 들어, 엑손) 및 비-코딩 (예를 들어, 인트론) 서열 둘 다를 포함할 수 있다. 일부 실시양태에서, 유전자는 프로모터인 조절 서열을 포함한다. 일부 실시양태에서, 유전자는 (i) 공급원 게놈과 같은 참조 콘텍스트에서 코딩 서열의 상류에서 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드, 및 (ii) 공급원 게놈과 같은 참조 콘텍스트에서 코딩 서열의 하류에서 미리 결정된 수의 뉴클레오티드를 연장하는 DNA 뉴클레오티드 중 하나 또는 둘 다를 포함한다. 다양한 실시양태에서, 미리 결정된 수의 뉴클레오티드는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb, 또는 100 kb일 수 있다. 본원에 사용된 "트랜스진"은 유전자가 존재하거나 또는 유전자가 조작에 의해 배치될 수 있는 참조 콘텍스트에 대해 내인성 또는 천연이 아닌 유전자를 지칭한다.

유전자 생성물 또는 발현 생성물: 본원에 사용된 용어 "유전자 생성물" 또는 "발현 생성물"은 일반적으로 유전자로부터 전사된 RNA (프로세싱 전 및/또는 후), 또는 유전자로부터 전사된 RNA에 의해 코딩된 폴리펩티드 (변형 전 및/또는 후)를 지칭한다.

숙주 세포, 표적 세포: 본원에 사용된 "숙주 세포"는 외인성 DNA (재조합 또는 다른 것), 예컨대 트랜스진이 도입된 세포를 지칭한다. 관련 기술분야의 통상의 기술자는 "숙주 세포"가 외인성 DNA가 초기에 도입된 세포 및/또는 그의 완전한 또는 불완전한 자손 또는 카피일 수 있음을 인지한다. 일부 실시양태에서, 숙주 세포는 1종 이상의 바이러스 유전자 또는 트랜스진을 포함한다. 일부 실시양태에서, 의도된 또는 잠재적 숙주 세포는 표적 세포로 지칭될 수 있다.

동일성: 본원에 사용된 용어 "동일성"은 중합체 분자 사이, 예를 들어 핵산 분자 (예를 들어, DNA 분자 및/또는 RNA 분자) 사이 및/또는 폴리펩티드 분자 사이의 전체 관련성을 지칭한다. 2개의 제공된 서열 사이의 퍼센트 동일성의 계산 방법은 관련 기술분야에 공지되어 있다. 2개의 핵산 또는 폴리펩티드 서열의 퍼센트 동일성의 계산은, 예를 들어 최적 비교 목적을 위해 2개의 서열 (또는 하나 또는 둘 다의 서열의 상보체)을 정렬함으로써 수행될 수 있다 (예를 들어, 최적 정렬을 위해 제1 및 제2 서열 중 하나 또는 둘 다에 갭이 도입될 수 있고, 비-동일 서열은 비교 목적을 위해 무시될 수 있음). 이어서, 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교된다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 잔기 (예를 들어, 뉴클레오티드 또는 아미노산)에 의해 점유되는 경우에, 분자는 그 위치에서 동일하다. 2개의 서열 사이의 퍼센트 동일성은, 임의로 2개의 서열의 최적 정렬을 위해 도입될 필요가 있을 수 있는 갭의 수 및 각각의 갭의 길이를 고려한, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 서열의 비교 및 2개의 서열 사이의 퍼센트 동일성의 결정은 컴퓨터 알고리즘, 예컨대 BLAST (베이직 로컬 얼라인먼트 서치 툴)를 사용하여 달성될 수 있다.

"개선시키다", "증가시키다", "억제하다" 또는 "감소시키다": 본원에 사용된 용어 "개선시키다", "증가시키다", "억제하다" 및 "감소시키다" 및 그의 문법적 등가물은 참조로부터의 정성적 또는 정량적 차이를 나타낸다.

단리된: 본원에 사용된 "단리된"은 (1) (자연에서든 및/또는 실험 설정에서든) 초기에 생산되었을 때 그와 회합된 성분 중 적어도 일부로부터 분리되고/거나, (2) 인간의 손에 의해 설계, 생산, 제조, 및/또는 제작된 물질 및/또는 실체를 지칭한다. 단리된 물질 및/또는 실체는 초기에 회합된 다른 성분의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99% 초과로부터 분리될 수 있다. 일부 실시양태에서, 단리된 작용제는 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 또는 약 99% 초과로 순수하다. 본원에 사용된 바와 같이, 물질은 다른 성분이 실질적으로 없는 경우에 "순수"하다. 일부 실시양태에서, 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 물질은 특정 다른 성분, 예컨대 예를 들어 1종 이상의 담체 또는 부형제 (예를 들어, 완충제, 용매, 물 등)와 조합된 후에도 여전히 "단리된" 또는 심지어 "순수한" 것으로 간주될 수 있고; 이러한 실시양태에서, 물질의 퍼센트 단리 또는 순도는 이러한 담체 또는 부형제를 포함하지 않고 계산된다. 하나의 예를 제공하자면, 일부 실시양태에서, 자연 발생 생물학적 중합체, 예컨대 폴리펩티드 또는 폴리뉴클레오티드는 a) 그의 기원 또는 유래 공급원에 의해 자연에서 그의 천연 상태에서 동반되는 성분의 일부 또는 전부와 회합되지 않은 경우; b) 자연에서 그를 생산하는 종으로부터의 동일한 종의 다른 폴리펩티드 또는 핵산이 실질적으로 없는 경우; c) 자연에서 그를 생산하는 종이 아닌 세포 또는 다른 발현 시스템으로부터의 성분에 의해 발현되거나 또는 달리 그와 회합되는 경우, "단리된" 것으로 간주된다. 따라서, 예를 들어, 일부 실시양태에서, 화학적으로 합성되거나 또는 자연에서 그를 생산하는 것과 상이한 세포 시스템에서 합성된 폴리펩티드는 "단리된" 폴리펩티드인 것으로 간주된다. 대안적으로 또는 추가적으로, 일부 실시양태에서, 1종 이상의 정제 기술에 적용된 폴리펩티드는 a) 자연에서 회합된 다른 성분; 및/또는 b) 초기에 생산될 때 회합된 다른 성분으로부터 분리된 정도로 "단리된" 폴리펩티드인 것으로 간주될 수 있다.

작동가능하게 연결된: 본원에 사용된 "작동가능하게 연결된"은 적어도 제1 요소 및 제2 요소가 그의 의도된 방식으로 기능하도록 허용하는 관계에 있도록 구성 요소가 회합된 것을 지칭한다. 예를 들어, 핵산 조절 서열은 조절 서열 및 코딩 서열이 조절 서열에 의한 코딩 서열의 발현의 제어를 허용하는 방식으로 회합된 경우에 핵산 코딩 서열에 "작동가능하게 연결된"다. 일부 실시양태에서, "작동가능하게 연결된" 조절 서열은 코딩 서열과 직접적으로 또는 간접적으로 공유 회합된다 (예를 들어, 단일 핵산에서). 일부 실시양태에서, 조절 서열은 코딩 서열의 발현을 트랜스로 제어하고, 코딩 서열과 동일한 핵산에 조절 서열이 포함되는 것은 작동가능한 연결의 요건이 아니다.

제약상 허용되는: 본원에 개시된 바와 같은 조성물의 제제를 위한 1종 이상의 또는 모든 성분(들)에 적용되는, 본원에 사용된 용어 "제약상 허용되는"은, 각각의 성분이 조성물의 다른 성분과 상용성이어야 하고 그의 수용자에게 유해하지 않아야 함을 의미한다.

제약상 허용되는 담체: 본원에 사용된 용어 "제약상 허용되는 담체"는 작용제 (예를 들어, 제약 작용제)의 제제화를 용이하게 하거나, 작용제의 생체이용률을 변형시키거나, 또는 대상체의 하나의 기관 또는 부분으로부터 또 다른 기관 또는 부분으로의 작용제의 수송을 용이하게 하는 제약상 허용되는 물질, 조성물, 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질을 지칭한다. 제약상 허용되는 담체로서의 역할을 할 수 있는 물질의 일부 예는 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스 및 그의 유도체, 예컨대 소듐 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말화 트라가칸트; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩 오일, 목화씨 오일, 홍화 오일, 참깨 오일, 올리브 오일, 옥수수 오일 및 대두 오일; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 발열원 무함유 물; 등장성 염수; 링거액; 에틸 알콜; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 제약 제제에 사용되는 다른 비-독성 상용성 물질을 포함한다.

제약 조성물: 본원에 사용된 용어 "제약 조성물"은 활성제가 1종 이상의 제약상 허용되는 담체와 함께 제제화된 조성물을 지칭한다.

프로모터: 본원에 사용된 "프로모터" 또는 "프로모터 서열"은 코딩 서열의 전사의 개시 및/또는 진행성에 직접적으로 또는 간접적으로 (예를 들어, 프로모터-결합된 단백질 또는 물질을 통해) 참여하는 DNA 조절 영역일 수 있다. 프로모터는, 적합한 조건 하에, 1개 이상의 전사 인자 및/또는 조절 모이어티와 프로모터의 결합 시 코딩 서열의 전사를 개시할 수 있다. 코딩 서열의 전사의 개시에 참여하는 프로모터는 코딩 서열에 "작동가능하게 연결"될 수 있다. 특정 경우에, 프로모터는 전사 개시 부위로부터 (그의 3' 말단에서) 상류 (5' 방향) 위치로 연장되어 그렇게 지정된 서열이 전사 사건을 개시하는데 필요한 최소 개수의 염기 또는 요소 중 하나 또는 둘 다를 포함하도록 한 DNA 조절 영역일 수 있거나 또는 그를 포함할 수 있다. 프로모터는 발현 제어 서열, 예컨대 인핸서 및 리프레서 서열일 수 있거나, 그를 포함할 수 있거나, 또는 그와 작동가능하게 회합될 수 있거나, 또는 그에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 프로모터는 유도성일 수 있다. 일부 실시양태에서, 프로모터는 구성적 프로모터일 수 있다. 일부 실시양태에서, 조건부 (예를 들어, 유도성) 프로모터는 단방향성 또는 양방향성일 수 있다. 프로모터는 특정한 종의 게놈에서 발생하는 것으로 공지된 서열과 동일한 서열일 수 있거나 또는 그를 포함할 수 있다. 일부 실시양태에서, 프로모터는 전사 조절 영역을 함유하는 서열이 하나의 공급원으로부터 수득될 수 있고 전사 개시 영역을 함유하는 서열이 제2 공급원으로부터 수득될 수 있는 것인 하이브리드 프로모터일 수 있거나 또는 그를 포함할 수 있다. 제어 요소를 트랜스진 내의 코딩 서열에 연결시키기 위한 시스템은 관련 기술분야에 널리 공지되어 있다 (일반적인 분자 생물학적 및 재조합 DNA 기술은 문헌 [Sambrook, Fritsch, and Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989]에 기재되어 있음).

참조: 본원에 사용된 "참조"는 비교가 수행되는 표준물 또는 대조군을 지칭한다. 예를 들어, 일부 실시양태에서, 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단, 또는 그의 측정값 또는 그를 나타내는 특징을 참조, 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단, 또는 그의 측정값 또는 그를 나타내는 특징과 비교한다. 일부 실시양태에서, 참조는 측정된 값이다. 일부 실시양태에서, 참조는 확립된 표준물 또는 예상 값이다. 일부 실시양태에서, 참조는 과거 참조이다. 참조는 정량적 또는 정성적일 수 있다. 전형적으로, 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 참조 및 그와 비교되는 값은 대등한 조건 하의 측정값을 나타낸다. 관련 기술분야의 통상의 기술자는 충분한 유사성이 존재하여 의존 및/또는 비교를 정당화하는 경우를 인지할 것이다. 일부 실시양태에서, 적절한 참조는, 예를 들어 1종 이상의 특정한 변수 (예를 들어, 작용제 또는 조건의 존재 또는 부재), 또는 그의 측정값 또는 그를 나타내는 특징을 평가하기 위한 목적으로, 관련 기술분야의 통상의 기술자가 대등한 것으로 인식할 조건 하의 작용제, 샘플, 서열, 대상체, 동물, 또는 개체, 또는 그의 집단일 수 있다.

조절 서열: 핵산 코딩 서열의 발현과 관련하여 본원에 사용된 조절 서열은 코딩 서열의 발현을 제어하는 핵산 서열이다. 일부 실시양태에서, 조절 서열은 유전자 발현 (예를 들어, 세포-유형-특이적 발현, 유도성 발현 등)의 1종 이상의 측면을 제어하거나 또는 그에 영향을 미칠 수 있다.

대상체: 본원에 사용된 용어 "대상체"는 유기체, 전형적으로 포유동물 (예를 들어, 인간, 래트 또는 마우스)을 지칭한다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태를 앓고 있다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태에 대해 감수성이다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태의 1종 이상의 증상 또는 특징을 나타낸다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태를 앓고 있지 않다. 일부 실시양태에서, 대상체는 질환, 장애 또는 상태의 어떠한 증상 또는 특징도 나타내지 않는다. 일부 실시양태에서, 대상체는 질환, 장애, 또는 상태에 대한 감수성 또는 그의 위험에 특징적인 1종 이상의 특색을 갖는다. 일부 실시양태에서, 대상체는 질환, 장애, 또는 상태에 대해 시험되고/거나 요법이 투여된 대상체이다. 일부 경우에, 인간 대상체는 "환자" 또는 "개체"로서 상호교환가능하게 지칭될 수 있다.

치료제: 본원에 사용된 용어 "치료제"는 대상체에게 투여되는 경우에 목적하는 약리학적 효과를 도출하는 임의의 작용제를 지칭한다. 일부 실시양태에서, 작용제는 적절한 집단에 걸쳐 통계적으로 유의한 효과를 입증하는 경우에 치료제인 것으로 간주된다. 일부 실시양태에서, 적절한 집단은 모델 유기체 집단 또는 인간 집단일 수 있다. 일부 실시양태에서, 적절한 집단은 다양한 기준, 예컨대 특정 연령 군, 성별, 유전적 배경, 기존 임상 상태 등에 의해 규정될 수 있다. 일부 실시양태에서, 치료제는 질환, 장애, 또는 상태의 치료에 사용될 수 있는 물질이다. 일부 실시양태에서, 치료제는 인간에게 투여하기 위해 시판될 수 있기 전에 정부 기관에 의해 승인받았거나 또는 승인될 것이 요구되는 작용제이다. 일부 실시양태에서, 치료제는 인간에게 투여하기 위해 의료 처방이 요구되는 작용제이다.

치료 유효량: 본원에 사용된 "치료 유효량"은 그것이 투여되어 목적하는 효과를 생성하는 양을 지칭한다. 일부 실시양태에서, 상기 용어는 치료 투여 요법에 따라 질환, 장애, 및/또는 상태를 앓고 있거나 또는 그에 대해 감수성인 집단에게 투여되는 경우에 질환, 장애, 및/또는 상태를 치료하기에 충분한 양을 지칭한다. 일부 실시양태에서, 치료 유효량은 질환, 장애, 및/또는 상태의 1종 이상의 증상의 발생률 및/또는 중증도를 감소시키고/거나 그의 발병을 지연시키는 양이다. 관련 기술분야의 통상의 기술자는 용어 "치료 유효량"이 실제로 특정한 개체에서 달성되는 성공적인 치료를 요구하지 않는다는 것을 인지할 것이다. 오히려, 치료 유효량은 이러한 치료를 필요로 하는 환자에게 투여되는 경우에 유의한 수의 대상체에서 특정한 목적하는 약리학적 반응을 제공하는 양일 수 있다. 일부 실시양태에서, 치료 유효량에 대한 언급은 1종 이상의 특정 조직 (예를 들어, 질환, 장애 또는 상태에 걸린 조직) 또는 유체 (예를 들어, 혈액, 타액, 혈청, 땀, 눈물, 소변 등)에서 측정된 바와 같은 양에 대한 언급일 수 있다. 관련 기술분야의 통상의 기술자는, 일부 실시양태에서, 특정한 작용제 또는 요법의 치료 유효량이 단일 용량으로 제제화 및/또는 투여될 수 있다는 것을 인지할 것이다. 일부 실시양태에서, 치료상 유효한 작용제는, 예를 들어 투여 요법의 일부로서 복수의 용량으로 제제화 및/또는 투여될 수 있다.

치료: 본원에 사용된 용어 "치료" (또한 "치료하다" 또는 "치료하는")는 특정한 질환, 장애, 또는 상태의 1종 이상의 증상, 특색, 및/또는 원인을 부분적으로 또는 완전히 완화시키고/거나, 호전시키고/거나, 경감시키고/거나, 억제하고/거나, 그의 발병을 지연시키고/거나, 그의 중증도를 감소시키고/거나, 그의 발생률을 감소시키거나, 또는 임의의 이러한 결과를 달성하기 위한 목적으로 투여되는 요법의 투여를 지칭한다. 일부 실시양태에서, 이러한 치료는 관련 질환, 장애, 또는 상태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애, 또는 상태의 초기 징후만을 나타내는 대상체의 치료일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질환, 장애 및/또는 상태의 1종 이상의 확립된 징후를 나타내는 대상체의 치료일 수 있다. 일부 실시양태에서, 치료는 관련 질환, 장애, 및/또는 상태를 앓는 것으로 진단된 대상체의 치료일 수 있다. 일부 실시양태에서, 치료는 관련 질환, 장애, 또는 상태의 발생 위험의 증가와 통계적으로 상관관계가 있는 1종 이상의 감수성 인자를 갖는 것으로 공지된 대상체의 치료일 수 있다.

단위 용량: 본원에 사용된 용어 "단위 용량"은 제약 조성물의 단일 용량으로서 및/또는 물리적 이산 단위로 투여되는 양을 지칭한다. 많은 실시양태에서, 단위 용량은 활성제의 미리 결정된 양, 예를 들어 미리 결정된 바이러스 역가 (주어진 부피 중 바이러스, 비리온, 또는 바이러스 입자의 수)를 함유한다. 일부 실시양태에서, 단위 용량은 작용제의 전체 단일 용량을 함유한다. 일부 실시양태에서, 1개 초과의 단위 용량이 투여되어 총 단일 용량을 달성한다. 일부 실시양태에서, 의도된 효과를 달성하기 위해 다중 단위 용량의 투여가 요구되거나 또는 요구될 것으로 예상된다. 단위 용량은, 예를 들어 미리 결정된 양의 1종 이상의 치료 모이어티를 함유하는 소정 부피의 액체 (예를 들어, 허용되는 담체), 고체 형태의 미리 결정된 양의 1종 이상의 치료 모이어티, 미리 결정된 양의 1종 이상의 치료 모이어티를 함유하는 지속 방출 제제 또는 약물 전달 장치 등일 수 있다. 단위 용량은 치료 모이어티(들)에 더하여 임의의 다양한 성분을 포함하는 제제 중에 존재할 수 있는 것으로 인지될 것이다. 예를 들어, 허용되는 담체 (예를 들어, 제약상 허용되는 담체), 희석제, 안정화제, 완충제, 보존제 등이 포함될 수 있다. 관련 기술분야의 통상의 기술자는, 많은 실시양태에서, 특정한 치료제의 총 적절한 1일 투여량은 일부의 또는 복수의 단위 용량을 포함할 수 있고, 이는 예를 들어 타당한 의학적 판단의 범주 내에서 의료 진료의에 의해 결정될 수 있음을 인지할 것이다. 일부 실시양태에서, 임의의 특정한 대상체 또는 유기체에 대한 구체적 유효 용량 수준은 치료될 장애 및 장애의 중증도; 사용되는 구체적 활성 화합물의 활성; 사용되는 구체적 조성물; 대상체의 연령, 체중, 전반적 건강, 성별, 및 식이; 투여 시간, 및 사용되는 구체적 활성 화합물의 배출 속도; 치료 지속기간; 이용되는 구체적 화합물(들)과 조합되어 또는 동시에 사용되는 약물 및/또는 추가의 요법, 및 의학 기술분야에 널리 공지된 기타 인자를 포함한 다양한 인자에 좌우될 수 있다.

본원에 제출된 도면 중 1개 이상은 컬러로 더 잘 이해된다. 본 출원인은 도면의 컬러 버전을 원래의 제출의 일부로 간주하고, 이후의 진행에서 도면의 컬러 영상을 제시할 권리를 보유한다.
도 1a-1d. HDAd-긴-LCR을 사용한 생체외 HSPC 형질도입 연구. (도 1a) 벡터 구조. 21.5 kb β-글로빈 LCR의 제어 하의 γ-글로빈 유전자, 1.6 kb β-글로빈 프로모터 및 또한 β-글로빈 유전자좌로부터 유래된 3'HS1 영역. 적혈구 세포에서의 RNA 안정화를 위해, β-글로빈 유전자 UTR을 γ-글로빈 유전자의 3' 단부에 연결시켰다. 벡터는 또한 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 가능하게 하는 mgmt^P140K에 대한 발현 카세트를 함유한다. γ-글로빈 및 mgmt 발현 카세트는 닭 글로빈 HS4 인슐레이터에 의해 분리된다. 32.4 kb LCR-γ-글로빈/mgtm 트랜스포손은 SB100x에 의해 인식되는 역전된 반복부 (IR) 및 Flpe 레콤비나제에 의한 트랜스포손의 원형화를 가능하게 하는 ftr 부위에 플랭킹된다. (도 1b) 실험 요법. CD46-트랜스제닉 마우스로부터의 골수 Lin^- 세포를 HDAd-긴-LCR 및 HDAd-SB로 500 vp/세포의 총 MOI로 형질도입하였다. 배양 1일 후, 1x10⁶개의 형질도입된 세포/마우스를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 제4주에, O⁶BG/BCNU 처리를 시작하고, 2주마다 4회 반복하였다. 각각의 사이클에서, BCNU 농도를 5 mg/kg에서 7.5 mg/kg으로, 10 mg/kg (2회)으로 증가시켰다. 제20주에, 마우스를 희생시켰다. (도 1c) 유동 세포측정법에 의해 측정된 인간 γ-글로빈-양성 말초 적혈구 (RBC)의 백분율. 각각의 기호는 개별 동물이다. (도 1d) 이식 후 제20주에 적혈구 (Ter119⁺) 골수 세포 (하부 패널)에서의 인간 γ-글로빈-발현을 보여주는 대표적인 유동 세포측정 데이터. 상부 패널은 모의-형질도입된 세포가 이식된 마우스를 보여준다.
도 2a-2c. 이식 후 제20주에 동물로부터의 골수 세포에서의 벡터/염색체 접합부의 iPCR 분석. (도 2a) iPCR 분석의 개략도. 5 마이크로그램의 게놈 DNA를 SacI로 소화시키고, 재-라이게이션하고, 표시된 프라이머를 사용한 네스티드, 역 PCR에 적용하였다 (물질 및 방법 참조). (도 2b) 통합 접합부를 함유하는 클로닝된 플라스미드의 아가로스 겔 전기영동. 표시된 밴드를 절제하고 서열분석하였다. 염색체 통합 부위가 겔 아래에 제시된다. (도 2c) 접합부 서열의 예: 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr15, 6805206) 서열식별번호(SEQ ID NO): 1; 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chrX, 16897322) 서열식별번호: 2; 3' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr4, 10207667) 서열식별번호: 3. 벡터 바디 및 IR/DR 서열은 각각 기본 문자 및 밑줄로 지정된다. 염색체 서열은 볼드체 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 괄호표시된다.
도 3a-3e. 32.4 kb 트랜스포손을 함유하는 HDAd-긴-LCR 및 11.8 kb 트랜스포손을 함유하는 HDAd-짧은-LCR로의 생체내 HSPC 형질도입. (도 3a) 21.5 kb HS1-HS5 LCR 및 3'HS1 (도 1a HDAd-짧은-LCR) 대신에, 이 벡터는 DNase 과민성 부위 (HS) 1 내지 4의 코어 영역을 포함하는 4.3 kb 미니-LCR을 함유한다. (도 3b) 처리 요법. hCD46tg 마우스를 가동화하고, HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR +HDAd-SB를 IV 주사하였다 (2회, 각각 둘 다의 바이러스의 1:1 혼합물의 4x10¹⁰ vp). 5주 후, O⁶BG/BCNU 처리를 시작하였다. 각각의 사이클에서, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg으로 증가시켰다. O⁶BG 농도는 모든 3가지 처리에서 30 mg/kg이었다. 분석 및 2차 수용자 내로의 Lin^- 세포 이식을 위해 동물을 희생시킨 경우에 제20주까지 마우스를 추적하였다. 이어서, 2차 수용자를 16주 동안 추적하였다. 생체내 HSPC 형질도입된 동물은 인간 γ-글로빈 및 mgtm 단백질에 대한 면역 반응을 방지하기 위해 면역억제 (IS) 약물을 제공받았다. (도 3c) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. 모의-형질도입된 마우스에서, 0.1% 미만의 세포가 γ-글로빈-양성이었다. (도 3d) 생체내 HSPC 형질도입 후 제20주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 3e) 생체내 HSPC 형질도입 후 제20주에 총 혈액에서 qRT-PCR에 의해 측정된 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α-글로빈 mRNA의 백분율이 제시된다.
도 4. 생체내 HSPC 형질도입 후 제20주에 수거된 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않다.
도 5a-5d. 생체내 HSPC 형질도입 후 제20주에서의 혈액 파라미터. (도 5a) 백혈구 (WBC), 호중구 (NE), 백혈구 (LY), 단핵구 (MO), 호산구 (EO), 및 호염기구 (BA). (도 5b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 5c) 세포 골수 조성. (도 5d) 골수 Lin^- 세포의 콜로니-형성 잠재력. 군 사이의 차이는 도 5a-5d에서 유의하지 않았다. 도 5의 패널에서의 데이터는 HDAd 짧은-LCR 및/또는 긴-LCR 벡터에 의한 생체내 HSPC 형질도입이 골수에서 조혈 및 세포 분포에 영향을 미치지 않는다는 것을 보여준다.
도 6. 슬리핑 뷰티 역전된 반복부 (IR)와 관련하여 HDAd-글로빈 벡터에서의 NheI 및 KpnI 부위의 국재화가 표시된다. 이들 효소는 SB IR/DR과 근접하지만 그의 외부를 절단하며, 비통합된 벡터의 배경을 감소시키는데 사용된다. 골수 Lin^- 세포로부터의 나머지 게놈 DNA를 NheI 및 KpnI로 소화시키고, 열 불활성화 후에 추가로 NlaIII으로 소화시켰다. NlaIII는 4-커터이고, 작은 DNA 단편을 생성할 것이다. 이어서, 소화된 DNA를 공지된 서열 및 소화된 NlaIII 단편에 대한 상용성 단부를 갖는 이중 가닥 올리고와 라이게이션하였다. 열-불활성화 및 세정 후, 링커-라이게이션된 생성물을 선형 증폭에 사용하였고, 이는 SB 좌측 아암으로부터 프라이밍된 단일 가닥 (ss) DNA 집단을 생성한다. 프라이머는 비오티닐화되어, ssDNA는 스트렙타비딘 비드로 수집될 수 있다. 광범위한 세척 후에, ssDNA를 비드로부터 용리시키고, 2 라운드의 네스티드 PCR에 의한 추가의 증폭에 적용하였다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 마우스 게놈 서열에 맵핑하여 통합 부위를 마킹하였다.
도 7a-7d. HSPC에서의 벡터 통합 부위의 분석. HDAd-긴-LCR +HDAd-SB로의 생체내 형질도입 후 제20주에 수거된 골수 Lin- 세포로부터 단리된 게놈 DNA. (도 7aa, 도 7ab) 통합 부위의 염색체 분포. 게놈-전반 슬리핑 뷰티 통합. 통합 부위는 수직선에 의해 마킹된다. (도 7b) 접합부 서열의 예: 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr7, 79796094) 서열식별번호: 4; 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (반복부 영역) 서열식별번호: 5. IR/DR 서열은 밑줄 및 볼드체 문자로 지정된다. 염색체 서열은 기본 문자로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 볼드체표시된다. (도 7c) RefSeq 주석과 관련된 게놈-전반 슬리핑 뷰티 통합. 통합 부위를 마우스 게놈에 맵핑하고, 유전자에 대한 그의 위치를 분석하였다. 1 kb 상류 전사 개시 부위, 엑손의 3'UTR, 단백질 코딩 서열, 인트론, 3'UTR, 3'UTR로부터 1 kb 하류, 및 유전자간에 발생한 통합 사건의 백분율이 제시된다. (도 7d) 무작위화된 대조군과 비교한 슬리핑 뷰티 통합 패턴. 마우스 게놈 윈도우에서의 통합 패턴. 연속 게놈 윈도우 및 무작위화된 마우스 게놈 윈도우와 중첩되는 통합의 수 및 크기를 비교하였다. 이는 통합 패턴이 연속 및 무작위 윈도우에서 유사하다는 것을 보여준다. 임의의 주어진 윈도우에서 최대 통합의 수는 3 이하이고; 윈도우당 1 통합이 보다 높은 발생률을 갖는다. 값은 평균 ± s.d.를 나타낸다. 도 7의 패널의 데이터는 유전자에 대한 선호도 없이 근-무작위 통합 패턴을 보여준다.
도 8a-8e. 2차 수용자의 분석. 생체내 형질도입된 CD46tg 마우스로부터 제20주에 수거한 골수 Lin^- 세포를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 2차 수용자를 16주 동안 추적하였다. (도 8a) CD46-양성 PBMC의 백분율에 기초한 생착률. 2개의 군 사이의 차이는 유의하지 않았다. (도 8b) 유동 세포측정법에 의해 측정된 γ-글로빈-발현 말초 혈액 RBC의 백분율. 2개의 군 사이의 차이는 유의하지 않다. (도 8c) 2차 수용자의 RBC에서 HPLC에 의한 인간 γ-글로빈 쇄의 분석. 이식 후 제4주, 제8주, 제12주, 및 제16주의 인간 γ-글로빈 대 성체 마우스 α 글로빈의 백분율이 제시된다. * p<0.0001. 통계적 분석을 이원 ANOVA를 사용하여 수행하였다. (도 8d) 총 혈액 세포에서의 γ-글로빈 mRNA 수준. 인간 γ-글로빈 mRNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. (도 8e) p.t. 제16주의 γ-글로빈 mRNA 수준 골수 MNC. 인간 γ-글로빈 m-RNA 대 마우스 α 및 β-주요 글로빈 mRNA의 백분율이 제시된다. 도 8 및 9의 패널은, 개별적으로 또는 함께, "32.4" kb 트랜스포손의 통합이 장기 재증식 세포에서 일어났고; 긴 LCR을 갖는 벡터로부터의 γ-글로빈 발현 수준이 짧은 LCR을 갖는 벡터와 비교하여 시간 경과에 따라 증가하였고, 긴 LCR을 갖는 벡터가 γ-글로빈 발현의 보다 엄격한 적혈구 특이성을 제공하였음을 보여준다.
도 9a-9c. 2차 수용자의 골수에서의 γ-글로빈 발현의 적혈구 특이성 (이식 후 제16주). (도 9a) 모든 골수 MNC에서의 γ-글로빈 발현 적혈구 (Ter119⁺ 세포)의 백분율. (도 9b) 적혈구 특이성. 적혈구 (Ter119⁺) 및 비-적혈구 (Ter119^-) 세포에서의 γ-글로빈+ 세포의 백분율. (도 9c) 생체내 HSPC 형질도입 후 제20주에 수거한 골수 MNC에서의 세포당 벡터 카피수 (VCN). 2개의 군 사이의 차이는 유의하지 않다.
도 10a-10d. 이식 후 제16주에 2차 수용자에서의 혈액 파라미터. (도 10a) 백혈구. (도 10b) 적혈구생성 파라미터. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 적혈구 부피, MCH: 평균 적혈구 헤모글로빈, MCHC: 평균 적혈구 헤모글로빈 농도, RDW: 적혈구 분포 폭. 3개의 군 사이의 차이는 유의하지 않았다. (도 10c) 세포 골수 조성. (도 10d) 골수 Lin^- 세포의 콜로니-형성 잠재력.
도 11a-11c. 인간 CD34+ 세포를 사용한 시험관내 연구. (도 11a) 실험의 개략도. CD34+ 세포를 HDAd-긴-LCR + HD-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하고, 적혈구 분화 (ED)에 적용하였다. O⁶BG-BCNU로의 시험관내 선택을 ED의 제5일에 시작하였다. 제18일에 세포를 유동 세포측정법 (도 11b) 및 HPLC (도 11c)에 의해 분석하였다. 도 11의 패널은 인간 세포 시스템에서 HDAd 긴-LCR 벡터가 형질도입된 인간 HSC/CD34+ 세포의 적혈구 분화 후에 보다 높은 γ-글로빈 발현을 제공한다는 것을 보여준다.
도 12a-12b. 마우스에서의 벡터 hCD46tg로의 생체내 HSC 형질도입: "긴" vs "짧은" 벡터 LCR. (도 12a) HDAd-긴-LCR-γ-글로빈/mgmt. 벡터 및 HDAd-짧은-LCR-γ-글로빈/mgmt. 벡터. (도 12b) 마우스에서 벡터 Hbb^th3/CD46의 생체내 형질도입. 군 1은 7마리의 마우스에서의 HDAd-긴-LCR-γ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. 군 2는 3마리의 마우스에서의 HDAd-짧은-LCRγ-글로빈/mgmt 플러스 HDAd-SB/Flpe의 생체내 형질도입을 보여준다. O⁶BG, BCNU를 위해 단지 3회의 선택 사이클이 필요하였다.
도 13. Thbb 마우스 시험 (W6). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이에서 차이가 없고 인간 γ-글로빈 발현이 거의 없음을 보여준다. 2개의 페이지.
도 14. Thbb 마우스 시험 (W8). 그래프 결과는 긴 LCR 벡터 대 짧은 LCR 벡터로 형질도입되었을 때 마우스 사이의 차이를 보여주지만, 짧은 LCR 바이러스가 마우스에서 사멸되었는지는 불명확하다. 2개의 페이지.
도 15. 마우스에서 인간 γ-글로빈 발현 RBC의 백분율을 보여주는 그래프 도면. 그래프는 단지 3회 사이클의 생체내 선택 후의 100% 마킹을 예시한다.
도 16. 마우스 HBA에 대한 상대적인 인간 γ-글로빈을 보여주는 HPLC의 그래프 도면 (제10주). 그래프는 짧은 LCR과 비교하여 긴 LCR에 대해 유의하게 더 높은 γ-글로빈 수준을 보여준다.
도 17. 긴 LCR 벡터를 함유하는 마우스 #57의 예시적인 제10주 혈액 HPLC의 그래프 도면.
도 18a-18d. HDAd-짧은-LCR 및 HDAd-긴-LCR을 사용한 Hbb^th3/CD46 마우스의 생체내 HSC 유전자 요법 후의 인간 γ-글로빈 발현. (도 18a) 치료 요법. 도 3a-3e와 대조적으로, 도 18a-18d는 지중해빈혈 Hbb^th3/CD46 마우스에서의 결과를 보여준다. (도 18b) 유동 세포측정법에 의해 측정된 말초 적혈구 (RBC)에서의 인간 γ-글로빈-양성 세포의 백분율. 각각의 기호는 개별 동물이다. (도 18c) 생체내 HSPC 형질도입 후 제18주에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 인간 γ-글로빈 대 마우스 α-글로빈 단백질 쇄의 백분율이 제시된다. (도 18d) 비처리 Hbb^th3/CD46 마우스 (좌측 패널) 및 처리 후 제21주의 마우스의 대표적인 크로마토그램. 마우스 α- 및 β-쇄뿐만 아니라 부가된 인간 γ-글로빈이 표시된다. 도 18의 패널의 데이터는 긴-LCR HDAd 벡터에 의하면 100% GRP 마킹이 보다 덜 강렬하고/거나 보다 적은 라운드 및/또는 보다 낮은 용량의 생체내 선택으로 달성될 수 있다는 것을 보여준다. γ-글로빈 발현 수준은 효과적인 요법을 제공할 것으로 예상되는 범위 내 (20% 이상)이다.
도 19. 처리 전 및 긴 LCR 처리 후 제10주에 C57BL6 (정상 마우스) 및 타운즈 SCA 마우스의 정규화된 적혈구 형태를 보여주는 현미경사진.
도 20. 처리 전 타운즈 마우스 및 처리 (긴 LCR) 후 제10주의 타운즈 마우스에 대한 정규화된 적혈구생성 (망상적혈구 계수)을 보여주는 현미경사진.
도 21a-21c. 표현형 교정. (도 21a, 21b) 혈액 세포 형태로, 좌측 패널은 김사 염색으로 염색된 혈액 도말표본을 나타내고, 우측 패널은 메이-그륀발트 염색으로 염색된 혈액 도말표본을 나타낸다. 망상적혈구 내의 핵 및 세포질의 잔류물은 자주색 염색을 발생시킨다. (도 21a) 이전 및 제14주의 비교. (도 21b) CD46tg, 이전의 Hbb^th3/CD46 마우스, 제18주의 HDAd-긴-LCR을 갖는 Hbb^th3/CD46 마우스, 및 제21주의 HDAd-긴-LCR을 갖는 Hbb^th3/CD46 마우스에 대한 김사 염색 및 망상적혈구의 비교. (도 21c) 골수 시토스핀. 처리된 것에서 전적모구 우세를 갖는 적혈구생성의 역-이동이 관찰된다. 축척 막대는 20 μm이다. 도 21의 패널의 데이터는 혈액 세포 형태가 HDAd 긴-LCR 벡터에 의한 생체내 HSC 유전자 요법 후에 정규화된다는 것을 보여준다.
도 22. Hbb^th3/CD46⁺ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbb^th3/CD46⁺ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제1주 및 제10주에 마우스를 샘플링하였다. 도 22는 제1주 (상부 패널) 및 제10주 (하부 패널)의, 긴 LCR 벡터로 처리된 마우스, 짧은 LCR 벡터로 처리된 마우스, 및 대조군 CD46tg로부터의 샘플로부터의 WBC, RBC, Hb, HCT, MCV, MCH, MCHC, 및 RDW의 정규화된 적혈구 파라미터의 그래프 도면을 보여준다.
도 23a, 23b. Hbb^th3/CD46⁺ 마우스의 생체내 HSC 유전자 요법 전 및 후의 혈액 파라미터. Hbb^th3/CD46⁺ 마우스는 중간성 지중해빈혈 표현형을 나타낸다. 마우스를 특히 긴 LCR 또는 짧은 LCR에 작동가능하게 연결된 γ-글로빈 핵산 서열을 포함하는 아데노바이러스 공여자 벡터로 처리하였다. 처리 후 제18주에, 마우스를 희생시키고 샘플링하였다. 망상적혈구의 백분율을 혈액 도말표본 상에서 계수하였다 (도 23a; 망상적혈구 계수). 생체내 형질도입 후 제18주의 혈액 파라미터는 그의 대조군 CD46tg 대응물과 구별불가능하였으며, 이는 백혈구 및 적혈구 계수뿐만 아니라 적혈구 특색 (Hb, HCT, MHCH, 및 RDW)에서의 정규화를 포함하여, 완전한 표현형 교정을 시사한다 (도 23b; 혈액 파라미터).
도 24a, 24b. 비장 및 간에서의 골수외 조혈의 표현형 교정. (도 24a) 희생 시 (제21주)의 비장 크기. 상부 2개의 패널은 대표적인 비장 영상을 보여준다. 하부 패널은 이들 결과를 요약한 도트 플롯이다. 각각의 기호는 개별 동물을 나타낸다. 데이터는 평균 ± 평균의 표준 오차 (SEM)로서 제시된다. * p ≤ 0.05. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다. (도 24b) 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. Hbb^th3/CD46 마우스의 간에서의 적혈모구 및 비장에서의 거핵구 클러스터가 흑색 화살표로 표시된다. 축척 막대는 20 μm이다.
도 25. 비장 및 간에서의 혈철증의 표현형 교정. 철 침착은 펄 염색에 의해 비장 및 간 절편에서 헤모시데린의 세포질 청색 안료로서 제시된다. 축척 막대는 20 μm이다. (Exp: 2.24ms, 획득: 4.1x, 포화도: 1.50, 감마: 0.60).
도 26a-26c. 희생 시 (제21주) 골수의 분석. Hbb^th3/CD46tg 마우스의 생체내 HSC 형질도입 후 제21주에 골수를 수거하였다. (도 26a) 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않지만, 보다 큰 샘플 크기로 분석할 경우 유의해질 수 있다. (도 26b, 26c) γ-글로빈 발현의 적혈구 특이성. (도 26B) γ-글로빈 발현 적혈구 (Ter119⁺) 및 비-적혈구 (Ter119^-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 27. 아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46^+/+/Hbb^th-3 마우스로부터의 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈. 철 침착은 펄 염색에 의해 비장에서 헤모시데린의 세포질 청색 안료로서 제시된다.
도 28. 상이한 역전된 반복부 (IR)를 사용한 통합 SB100x 트랜스포사제 효능의 비교를 위한 실험 설계의 개략도. mgmt./GFP 트랜스포손 페이로드가 (i) pT0 ITR; (ii) pT2 ITR; 또는 (iii) pT4 ITR에 플랭킹된 3개의 플라스미드를 사용하였고, 플라스미드는 그 외에는 동일하였다. 293 세포를 mgmt./GFP 트랜스포손 페이로드를 포함하는 3개의 플라스미드로, pSB100x를 코딩하는 지지 플라스미드의 존재 또는 부재 하에 형질감염시켰다. 세포를 선택의 존재 또는 부재 하에 17일 동안 배양하였다. 선택 하에 있지 않은 세포에 대해서는 제3일, 제12일, 및 제17일에, 및 선택 하에 있는 세포에 대해서는 제3일의 50 μM O⁶BG/BCNU의 단일 첨가에 의해 제17일에 배양 샘플을 채취하였다.
도 29. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대한 배양 제12일 및 제17일의 GFP-발현 293 세포의 백분율.
도 30. 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대해 O⁶BG/BCNU로의 선택 하의 세포에 대한 배양 제17일의 GFP-발현 293 세포의 백분율.
도 31. 31.776 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEAd5-PT4-LCR-글로빈-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 32. 31.772 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd5-PT4-긴 LCR 글로빈-rhMGMT)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 33. 13.173 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (HDAd-Ad5-PT4-LCR-hACE2/mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 재조합 인간 ACE2 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 34. 12.169 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCB-마이크로LCR-글로빈/mgmt)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 긴 LCR과 작동가능하게 연결된 감마 글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 35. 9.382 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pWEHCA-파코니-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 IR (특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 DR (특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) pgk 프로모터와 작동가능하게 연결된 FancA 코딩 서열 및 (ii) Ef1a 프로모터와 작동가능하게 연결된 GFP 코딩 서열을 포함한다.
도 36. 5.490 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-rhMGMT-GFP)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) PGK 프로모터와 작동가능하게 연결된 GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 37. 3.797 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.
도 38. 3.709 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pBHCA-PT0-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) eGFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.
도 39. 3.547 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.
도 40. 3.543 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt/GFP)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.
도 41. 2.781 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA(Ad35)-PT4-EF1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 42. 2.777 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-T4-Ef1a-rhMGMT)의 개략도. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.
도 43. 2.751 kb 트랜스포손 페이로드 (통합 카세트)를 포함하는 핵산 (pHCA-Ad5-PT4-Ef1a-mgmt)의 개략도. 개략도는 제시의 용이성을 위해 2개의 중첩 부분으로 나뉘며, 이들 부분의 관계는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 개략도는 원형화된 플라스미드 콘텍스트에서 트랜스포손 페이로드를 제공한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다. 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 개시내용은 특히 아데노바이러스 벡터, 아데노바이러스 벡터 게놈, 및 그의 조합 및 용도를 포함한다. 본 개시내용의 아데노바이러스 벡터 및 아데노바이러스 벡터 게놈은 최대, 예를 들어 20, 25, 30, 또는 심지어 30 kb 초과의 트랜스포손 페이로드를 포함할 수 있고, 또한 다양한 실시양태에서 이러한 대형 트랜스포손 페이로드를 숙주 세포의 게놈 내로 성공적으로 통합시킬 수 있다. 관련 기술분야의 통상의 기술자가 인지할 바와 같이, 벡터 통합 용량은 그 자체로 유전자 요법 시스템의 결정적으로 중요한 특색 중 하나이며, 이는 적어도 부분적으로 통합 용량이 치료 페이로드의 길이 및/또는 복잡성을 제한하기 때문이다. 따라서, 본원에 제공된 방법 및 조성물은, 특히, 예를 들어 20, 25, 30, 또는 심지어 30 kb 초과의 핵산 페이로드의 숙주 세포 게놈 내로의 전위 통합을 허용하는 아데노바이러스 벡터를 사용한 효과적인 유전자 요법을 위한 플랫폼을 제공한다. 관련 기술분야의 통상의 기술자가 본 개시내용으로부터 인지할 바와 같이, 그리고 본원의 다양한 실시양태에 의해 예시된 바와 같이, 이러한 통합 용량은 다양한 이전 시스템에 의해 가능한 것보다 더 큰 복잡성 및 다양성으로 치료 페이로드를 조작하는 것을 허용한다.

본 개시내용의 방법 및 조성물은 통합 용량에 대한 특정의 이전에 이해되었던 제약을 극복한다. 특정의 이러한 제약은 바이러스 벡터 유형과 연관된다. 예를 들어, 렌티바이러스 벡터 페이로드 용량은 약 9 kb이고, 레트로바이러스 페이로드 용량은 약 8 kb이고, 아데노-연관 바이러스 (AAV) 페이로드 용량은 약 5 kb이다. 다른 이러한 제약은 이전에는 전위에 고유한 것으로 이해되었다. 예를 들어, 연구는 트랜스포손의 통합이 길이 의존적이라는 것을 보여주었으며-- 길이가 증가함에 따라 전위하는 능력은 신속하게 감소하고, 이러한 현상은 때때로 관련 기술분야에서 "길이-의존성"으로 언급된다. 이들 현존하는 예상의 관점에서, 본원에 개시된 조성물 및 방법이 이전에 이해되었던 아데노바이러스 전위 통합 용량의 제한을 파괴한다는 발견은 본원에 제공된 본 개시내용 및 실시예에 의해 밝혀진 놀라운 결과였다. 본 발명자들의 지식으로, 본 작업은 본원에 제공된 바와 같은 방법 및 조성물이 본원에 개시된 다양한 특정 크기의 트랜스포손 페이로드를 통합시킬 수 있다는 제1 입증을 나타낸다. 이러한 발견은, 예를 들어 개선된 트랜스진 발현을 위한 대형 조절 영역 (유전자좌 제어 영역, 또는 "LCR")을 포함하는 트랜스포손 페이로드의 통합에 의해 예시된다. 그러나, 어떠한 의심도 피하기 위해, 관련 기술분야의 통상의 기술자는 이러한 예시가 본원에 제공된 아데노바이러스 조성물 및 방법의 높은 전위 통합 용량의 보다 일반적인 발견, 및 특히 유전자 요법 분야를 포함한 다양한 분야에서의 그의 유의성을 대표한다는 것을 인지할 것이다.

본 개시내용의 측면은 이제 하기와 같이 보다 뒷받침되어 상세하게 기재된다: (I) 표적 세포 게놈 내로의 바이러스 벡터 페이로드 통합; (II) 대형 페이로드의 유형; (III) 긴 LCR; (IV) 긴 LCR과 작동가능하게 연결된 코딩 서열; (V) 트랜스포사제; (VI) 조절 성분; (VII) 벡터; (VIII) 제제; (IX) 적용; (X) 예시적 실시양태; (XI) 실험 실시예(들); 및 (XII) 닫는 단락.

(I) 표적 세포 게놈 내로의 바이러스 벡터 페이로드 통합

유전자 요법은 종종 목적하는 핵산 페이로드의 표적 세포의 게놈 내로의 통합을 필요로 한다. 다양한 유전자 요법에 의해 치료될 수 있는 상태의 다양성을 고려하여, 핵산 페이로드의 설계를 위한 많은 전략이 고안되었다. 그러나, 실제로, 치료 페이로드의 전달은 대형 페이로드를 표적 세포 게놈 내로 통합시키는 것의 어려움에 의해 많은 콘텍스트에서 제한되었다. 예를 들어, 렌티바이러스 벡터 페이로드 용량은 약 9 kb이고, 레트로바이러스 페이로드 용량은 약 8 kb이고, 아데노-연관 바이러스 (AAV) 페이로드 용량은 약 5 kb이다. 대형 유전자를 발현하고/거나, 대형 인간 조절 서열을 이용하고/거나, 다중 유전자를 발현할 수 있는 페이로드에 대한 기존의 관심을 고려하면, 이들은 실질적인 제한이다. 더욱이, 관련 기술분야의 통상의 기술자에 의해 널리 인지되는 바와 같이, 각각의 바이러스 플랫폼은 다양한 용도에 각각 고유하게 더 적합하게 또는 덜 적합하게 하는 다양한 상이한 특징과 연관되며, 이러한 인자는, 비제한적으로, 수용자 면역 반응 (예를 들어, 염증 및/또는 기존 항체와의 상호작용), 벡터 생산의 어려움, 세포 형질도입의 효능, 페이로드 통합의 효능, 트랜스진 발현 특징, 표적화된 세포 유형, 유전자독성의 위험 (예를 들어, 종양발생) 등을 포함할 수 있고, 이들 중 임의의 것 또는 모두는 연구원 및 의료 진료의에 의해 다양한 문맥에서 고유하게 가중치가 매겨질 수 있다. 본 개시내용은 하나 이상의 시스템에서 특정의 공지된 조성물 및 방법을 사용한 트랜스포손 페이로드 통합의 효율이 표적 세포 유형, 플라스미드 백본, 및/또는 트랜스포손 길이 중 1종 이상에 의존적이고, 특정의 이러한 의존성은 적어도 본 개시내용의 특정 조성물 및 방법, 예를 들어 SB 역전된 반복부에 플랭킹된 트랜스포손 페이로드를 포함하는 아데노바이러스 게놈을 포함하는 조성물 및 방법에서 (예를 들어 인간 대상체 세포, 예를 들어 조혈 줄기 세포에서 및/또는 생체내 요법에서, 예를 들어 SB100x 트랜스포사제 또는 또 다른 SB 트랜스포사제에 의한 전위의 경우) 감소되거나 제거된다는 것을 인식한다.

아데노바이러스 벡터는 가장 통상적으로 이용되는 유전자 요법 벡터 중 하나이다. 예를 들어, 적어도 일부의 보고에 따르면, 아데노바이러스 벡터는 암 유전자 요법을 위해 가장 통상적으로 사용되는 벡터이다. 실제로, 예를 들어 백신 용도, 치료적 트랜스진 도입, 및/또는 암 치료를 위해, 400종 초과의 유전자 요법 시험이 인간 Ad 벡터를 사용하여 개시되고/거나 완료되었다. 유전자 요법에서 아데노바이러스 벡터의 보급에 기여하고/거나 적어도 부분적으로 그의 원인이 된 아데노바이러스 벡터의 다양한 이점이 관련 기술분야에 공지되어 있다. 그럼에도 불구하고, 심지어 통상적으로 사용되는 벡터로도, 유전자 요법은 적어도 부분적으로 장기간의 표현형 교정이 치료 트랜스진의 충분히 효율적이고 충분히 안정한 통합 및 발현을 필요로 하기 때문에 어려운 도전과제로 남아있다.

일부 아데노바이러스 벡터가 최대 약 36-37 kb의 높은 클로닝 용량을 갖는 것으로 공지되어 있지만, 대형 페이로드를 보유하는 벡터를 물리적으로 생성하는 능력은 페이로드의 표적 세포 게놈 내로의 통합을 효율적으로 매개하는 그러한 벡터의 능력을 반영하지 않는다. 실제로, 전형적으로 26-45 kb (예를 들어, Ad5의 경우 약 36 kb)의 선형 이중 가닥 DNA 게놈인 아데노바이러스 벡터 게놈은 전형적으로 숙주 세포 게놈 내로 자연적으로 통합되지 않는다. 반대로, 아데노바이러스 벡터는 숙주 세포에서 바이러스 게놈의 에피솜 유지를 특징으로 한다. 에피솜 유지는 삽입 효과의 위험을 최소화하지만, 에피솜 게놈은 종종 관련 기술분야의 통상의 기술자에게 공지된 다른 어려움 중에서도 표적 세포 및 표적 세포 자손에 의해 불충분하게 보유된다. 적어도 이들 이유로, 그의 천연 대응물과 달리 숙주 세포 게놈 내로의 통합을 위해 조작된 아데노바이러스 벡터를 생산하기 위한 노력이 이루어져 왔다. 이들 접근법도 또한 도전과제가 없지 않았다. 예를 들어, 특정 통합 아데노바이러스 벡터가 갖는 하나의 문제는 유전자독성 효과를 특징으로 하는 통합 부위 선호도였다.

페이로드를 숙주 세포 게놈 내로 통합시키는 아데노바이러스 벡터를 조작하는 하나의 수단은 통합 바이러스 하이브리드 벡터를 생산하는 것이었다. 통합 바이러스 하이브리드 벡터는 표적 세포를 효율적으로 형질도입하는 벡터의 유전 요소를 그의 벡터 페이로드를 안정하게 통합하는 벡터의 유전 요소와 조합한다. 예를 들어 아데노바이러스 벡터와 조합하여 사용하기 위한 관심 통합 요소는 박테리오파지 인테그라제 PHiC31, 레트로트랜스포손, 레트로바이러스 (예를 들어, LTR-매개 또는 레트로바이러스 통합-매개), 아연-핑거 뉴클레아제, DNA-결합 도메인-레트로바이러스 인테그라제 융합 단백질, AAV (예를 들어, AAV-ITR 또는 AAV-Rep 단백질-매개), 및 슬리핑 뷰티 (SB) 트랜스포사제의 것을 포함하였다.

벡터 그 자체와 같이, 통합 바이러스 하이브리드 벡터의 통합 시스템은 특징적인 위치 통합 패턴 및 페이로드 용량을 비롯한 그 자체의 고유한 이점 및 단점을 겪는다. 예를 들어, 연구는 트랜스포손의 통합이 길이 의존적이라는 것을 보여주었으며; 길이가 증가함에 따라 전위하는 능력은 신속하게 감소하고, 이러한 현상은 때때로 관련 기술분야에서 "길이-의존성"으로 언급된다. SB 트랜스포사제의 경우에, 연구는 SB 트랜스포손 효능이 각각의 부가된 1 kb의 트랜스포손 (페이로드) 길이마다 30% 감소하고, 약 9 kb 초과 시 완전히 상실되었음을 보여주었다. 일부 연구는 작은 분율의 SB 트랜스포손 통합이 적어도 약 10 kb까지는 보유되었음을 나타내었지만, 증거는 보다 큰 SB 트랜스포손이 보다 작은 대응물에 비해 효율적으로 통합되지 않음을 입증하였다. 통합 효능을 증진시키기 위해 변형된 특정 SB 시스템도 또한 실질적으로 감소된 트랜스포손 통합 수준을 갖는 유의한 길이-의존성 효과를 겪었다 (Turchiano et al., PLOS One, 9: e112712, 2014).

본 개시내용은, 특히, 적어도 약 30 kb 내지 약 35 kb까지의 트랜스포손 페이로드가 치료 용도에 충분한 효능으로 숙주 세포 게놈 내로 통합될 수 있다는 본 발명자들의 놀라운 발견을 제공한다. 다양한 실시양태에서, 본 개시내용은 SB 역전된 반복부에 플랭킹되고 이어서 레콤비나제의 존재 하에 트랜스포손 페이로드를 포함하는 게놈 또는 그의 부분이 원형화되도록 하는 FRT 재조합 부위에 플랭킹된 트랜스포손 페이로드를 포함하는 아데노바이러스 게놈을 포함하는 대형 페이로드 (예를 들어, 적어도 약 30 kb 내지 약 35 kb까지)의 통합을 위한 벡터, 게놈, 및 시스템을 제공하며, 본 발명자들이 발견한 것은 SB 트랜스포사제의 존재 하에 표적 세포 게놈 내로 대형 트랜스포손 페이로드를 통합시킬 수 있다. 본 개시내용은 추가로, 이러한 조성물이 생체내 요법을 달성하기에, 예를 들어 통합 및 트랜스진 발현을 위해 충분히 효율적이라는 것을 제공한다. 길이 의존성 및 통합 효능의 이전 개념과 뚜렷하게 대조되는 이들 주목할 만한 발견은 이전에 달성불가능한 것으로 생각되었던 아데노바이러스 벡터의 치료 및 연구 용도를 가능하게 한다.

(II) 대형 페이로드의 유형

특정한 실시양태에서, 본원에 개시된 발명은 대형 트랜스포손 페이로드의 전달 및 통합을 용이하게 한다. 대형 페이로드는 예를 들어 본원에 기재된 것을 포함한, 긴 LCR에 연결된 코딩 서열을 포함한다. 특정한 실시양태에서, 페이로드는 적어도 10 kb이다. 특정한 실시양태에서, 페이로드는 적어도 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 또는 그 초과이다. 특정한 실시양태에서, 페이로드는 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는다. 특정한 실시양태에서, 페이로드는 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는다. 특정한 실시양태에서, 페이로드는 단일의 긴 (대형) 단백질을 코딩한다. 특정한 실시양태에서, 페이로드는 다중 단백질; 예를 들어 2종 이상의 단백질, 예컨대 2, 3, 4, 또는 5종 또는 그 초과의 단백질을 코딩한다. 페이로드가 다중 단백질을 코딩하는 실시양태에서, 그렇게 코딩된 임의의 개별 단백질이 독립적으로 "대형" 또는 "긴" 것으로 간주될 필요는 없으며; 오히려, 아데노바이러스 벡터에 의해 보유된 전체 페이로드는 다수의 보다 작은 개별 단백질 코딩 서열을 함유하더라도 "대형"인 것으로 이해된다. 특정한 실시양태에서, 페이로드는 긴 LCR을 포함한다.

(III) 긴 LCR

대형 페이로드를 숙주 세포 게놈 내로 통합시키는 능력은 이전에 효과적인 치료 용도를 위해 너무 대형인 것으로 생각되었던 구축물의 통합을 가능하게 한다. 대형 페이로드를 통합할 수 있는 즉각적으로 명백한 일반적 유용성을 넘어서, 대형 페이로드의 하나의 카테고리는 긴 유전자좌 제어 영역 (또는 긴 LCR)을 포함하는 페이로드를 포함한다. 일부 경우에, 유전자 요법을 위한 적어도 특정의 기존 벡터 시스템, 예컨대 렌티바이러스 및 AAV 시스템에 의해 수용되는 것보다 더 큰 조절 영역은 페이로드로부터 치료상 유효한 트랜스진 발현을 달성하고/거나 발현의 수준 (예를 들어, 트랜스진 발현 생성물을 코딩하는 mRNA의 생산 및/또는 트랜스진에 의해 코딩된 트랜스진 발현 생성물의 수 또는 빈도) 및/또는 발현의 특이성 (예를 들어, 발현의 시기 및/또는 발현의 세포 또는 조직 특이성)을 증가시키는데 유용하다.

어떠한 특정한 과학적 이론에 얽매이는 것을 원하지는 않지만, 인간 게놈은 예를 들어 루프 형성을 통한 조절 영역 (예컨대 전사 인자 결합 부위 및 이들이 발현을 제어하는 코딩 영역) 사이의 긴-범위의 직접 및/또는 간접 상호작용을 포함하는 3차원 구조로 조직화된다. 많은 경우에, 이들 긴-범위의 상호작용은 위상학적 회합 도메인 (TAD)의 콘텍스트에서 발생한다. TAD는 인핸서와 다른 조절 영역의 상호작용을 용이하게 하여 전사를 제어할 수 있는 염색체 조직화의 기능적 단위로 간주된다. TAD는 경계에 의해 구분되며, 경계는 인핸서 및 프로모터의 검색 공간을 제한하고 원치 않는 조절 접촉이 형성되는 것을 방지하는 것으로 생각된다. 이들 도메인의 양측의 TAD 경계는 상이한 포유동물 세포 유형 사이에서, 심지어 종에 걸쳐 보존된다.

게놈에서의 그의 중요한 역할 및 특히 유전자 및 트랜스진 발현에 기여하는 핵산 서열 및 단백질을 조직화하는데 있어서의 그의 역할로 인해, TAD는 유전자 요법의 안전성 및/또는 효능을 증가시키는데 사용될 수 있다. TAD 그 자체는 임의의 기존 바이러스 벡터에 포함되기에 너무 크다. TAD의 중앙 크기는 880 kb이다. 그러나, TAD의 유전자 또는 트랜스진 발현 효과의 일부 또는 전부를 포괄하는 TAD 내에 존재하는 특정 기능적 요소가 확인되었고, 이는 본원에 개시된 아데노바이러스 벡터에 포함되기에 적합한 크기이지만, 많은 경우에 특정의 다른 벡터, 예컨대 렌티바이러스 및 AAV 벡터에 포함되기에는 너무 크다. 일부 경우에, TAD의 1개 이상의 핵산 서열을 포함하는 조절 서열은 LCR로 지칭될 수 있다. LCR은 다양한 길이를 갖도록, 예를 들어 일부 경우에 비교적 작은 페이로드 용량을 갖는 벡터, 예컨대 렌티바이러스 또는 AAV 벡터에 포함시키기 위해 비교적 짧은 길이를 갖도록 조작되었다. 그러나, 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 관련 기술분야의 통상의 기술자는 보다 긴 서열이, 전체적으로 또는 부분적으로 이들이 유래되거나 또는 전체적으로 또는 부분적으로 그의 서열이 기초로 하는 내인성 서열의 유리한 발현 효과를 연관된 유전자 또는 트랜스진에 부여하는 보다 큰 용량을 갖는다는 것을 인지한다. 따라서, 일부 LCR은 예를 들어 5 kb 이하, 6 kb 이하, 7 kb 이하, 8 kb 이하, 또는 9 kb 이하의 비교적 짧은 길이를 갖도록 조작되었다. 대조적으로, 본 개시내용은 긴 LCR (예를 들어, 9 kb 이상, 10 kb 이상, 11 kb 이상, 12 kb 이상, 13 kb 이상, 14 kb 이상, 15 kb 이상, 20 kb 이상, 25 kb 이상, 또는 30 kb 이상의 조절 서열)이 본원에 제공된 벡터, 게놈, 및 방법을 사용하여 숙주 세포 게놈 내로 통합될 수 있다는 것을 인식한다. 다양한 실시양태에서, 긴 LCR은 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 및 30 kb 중 임의의 것으로부터 선택된 하한 및 30 kb, 31 kb, 32 kb, 33 kb, 34 kb, 35 kb, 36 kb, 37 kb, 38 kb, 39 kb, 및 40 kb 중 임의의 것으로부터 선택된 상한을 갖는 길이의 범위를 갖는 조절 서열을 포함한다. 긴 LCR은 또한 본원에 제공된 임의의 LCR의 임의의 길이를 가질 수 있으며, 이러한 길이는 다양한 실시양태에서 하한 또는 상한으로서 간주될 수 있다.

LCR의 예는 표 1에 제시된 것을 포함한다. 달리 나타내거나 또는 관련 기술분야의 통상의 기술자에게 명백할 것을 제외하고, 참조 게놈은 GRCh38 참조 게놈, 예컨대 GRCH38/hg38 또는 GRCh38.p13이다.

표 1:

β-글로빈 LCR은 적어도 몇몇 측면에서 예시적인 적어도 일부 LCR이다. 예를 들어, 많은 다른 LCR과 같이, β-글로빈 LCR은 작동가능하게 연결된 유전자 또는 트랜스진의 발현을 증진시키고 (예를 들어, 증가된 전사, 증가된 번역, 및/또는 증가된 세포 또는 조직 특이성), LCR의 발현 효과를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 (HS) 영역을 포함한다. 또한, 많은 다른 LCR과 같이, β-글로빈 LCR은, 예를 들어 모든 β-글로빈 LCR HS 영역 (HS1-HS5)을 포함하거나 또는 β-글로빈 LCR HS 영역의 하위세트 (예를 들어, HS1-HS4)를 포함하는 β-글로빈 LCR 서열을 포함하는 핵산에 이용될 수 있다는 점에서, 전체적으로 또는 부분적으로 이용될 수 있다.

염색체 11 상의 호모 사피엔스(Homo sapiens) β-글로빈 영역에 대한 예시적인 핵산 서열은 진뱅크(GenBank) 수탁 번호 NG_000007로 제공된다. β-글로빈 긴 LCR은, 일부 경우에, 유전자좌에서 제1 (배아) 글로빈 유전자에 대해 5'의 6 내지 22 kb에 위치하는 서열일 수 있거나 또는 그를 포함할 수 있다. β-글로빈 긴 LCR은 5개의 DNAse I 과민성 부위, 5'HS 1 내지 5를 포함할 수 있다. 문헌 [Li et al., Blood, 100(9):3077-3086, 2002]. NG_000007은 유전자좌 제어 영역 내의 DNAse I 과민성 부위 HS1, HS2, HS3, 및 HS4를 서술하는 제한 부위 (예를 들어, HS2의 SnaBI 및 BstXI 제한 부위, HS3의 HindIII 및 BamHI 제한 부위, 및 HS4의 BamHI 및 BanII 제한 부위)의 위치를 제공하며, 이는 그 전문 및 특히 과민성 부위 위치와 관련하여 본원에 참조로 포함된다. HS1의 서열 및 위치는, 예를 들어 문헌 [Pasceri et al., Ann NY Acad. Sci. 1998; 850:377-381; Pasceri et al., Blood. 92:653-663, 1998; 및 Milot et al., Cell. 87:105-114, 1996]에 기재되어 있다. 특정한 실시양태에서, HS2 영역은 유전자좌 제어 영역의 위치 16,671에서 17,058까지 연장된다. HS2의 SnaBI 및 BstXI 제한 부위는 각각 위치 17,093 및 16,240에 위치한다. HS3 영역은 유전자좌 제어 영역의 위치 12,459에서 13,097까지 연장된다. HS3의 BamHI 및 HindIII 제한 부위는 각각 위치 12,065 및 13,360에 위치한다. HS4 영역은 유전자좌 제어 영역의 위치 9,048에서 9,713까지 연장된다. HS4의 BamHI 및 BanII 제한 부위는 각각 위치 8,496 및 9,576에 위치한다.

본원에 개시된 특정한 실시양태는 β-글로빈 LCR의 미니-부분을 이용한다. LCR이 β-글로빈 LCR의 모든 5개의 절편을 포함하지 않는 한, 미니-부분은 모든 5개 미만의 HS 영역, 예컨대 HS1, HS2, HS3, HS4, 및/또는 HS5를 포함한다. 본 개시내용의 실시예 1에서 사용된 4.3 kb HS1-HS4 LCR은 미니-LCR의 한 예를 제공한다. 다른 미니-LCR은, 예를 들어 HS1, HS2, 및 HS3; HS2, HS3, 및 HS4; HS3, HS4, 및 HS5; HS1, HS3, 및 HS5; HS1, HS2, 및 HS5; 및 HS1, HS4, 및 HS5를 포함할 수 있다. 미니-LCR의 추가의 예에 대해, 문헌 [Sadelain et al., Proc. Nat. Acad. Sci. (USA) 92: 6728-6732, 1995; 및 Lebouich et al., EMBO J. 13: 3065-3076, 1994]을 참조한다. 특정한 실시양태는 β-글로빈 프로모터와 조합된 미니-β-글로빈 LCR을 이용할 수 있다. 특정한 실시양태에서, 이러한 조합은 5.9 kb LCR-프로모터 조합을 생성한다. LCR과 관련하여, "미니" 및 "마이크로"는 본원에서 상호교환가능하게 사용된다.

본원에 개시된 특정한 실시양태는 유전자좌 제어 영역 (LCR)의 긴 부분을 이용한다. 긴 β-글로빈 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다. 특정한 실시양태에서, 긴 LCR은 β-글로빈 LCR의 HS1, HS2, HS3, HS4, 및 HS5를 포함하는 대략 21.5 kb 서열을 포함한다. 긴 β-글로빈 LCR은 β-글로빈 프로모터와 커플링되어 높은 단백질 발현 수준을 구동할 수 있다.

특정한 실시양태는 GRCH38/hg38에 열거된 바와 같은 인간 염색체 11의 긴 β-글로빈 LCR 위치 5292319-5270789 (21,531 bp) (서열식별번호: 6)를 포함할 수 있다. 다양한 실시양태에서, 긴 LCR은 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 21.5 kb, 또는 21.531 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 긴 LCR은 서열식별번호: 6의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 긴 LCR은 서열식별번호: 6의 적어도 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 또는 21.5 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 서열식별번호: 6의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다. 다양한 실시양태에서, 긴 LCR은 1개 이상의 제한 부위, 예컨대 XhoI 제한 부위를 포함한다는 점에서 천연 게놈 서열과 상이할 수 있다 (예를 들어 서열식별번호: 98 참조, 여기서 예시적인 XhoI 부위 (이탤릭체)가 위치 10655-10661에 제공됨). 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터 시스템은 예를 들어 β-글로빈 프로모터로서 GRCh38에 열거된 바와 같은 인간 염색체 11의 위치 5228631-5227018 (1614 bp)을 포함하는 전위가능한 트랜스진 삽입물 (서열식별번호: 7)을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 예를 들어 1.0 kb, 1.1. kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 서열식별번호: 7의 적어도 1.0 kb, 1.1 kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb를 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 엡실론 (HBE1), G-감마 (HBG2), A-감마 (HBG1), 델타 (HBD), 및 베타 (HBB) 글로빈 유전자 및/또는 헤모글로빈 β 유전자좌 (11:5,225,463-5,227,070, 상보체)에 존재하는 하나 이상의 유전자 중 임의의 것을 포함하나 이에 제한되지는 않는, 그의 발현이 β-글로빈 LCR에 의해 조절되는 유전자의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류에, 예를 들어 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb 이상의 총 길이의 핵산 서열을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 염색체 11 NC_000011.10 위치 5227021의 상류, 예를 들어 바로 상류에, 예를 들어 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb 이상의 총 길이의 핵산 서열을 포함할 수 있다. 다양한 실시양태에서, β-글로빈 프로모터는 서열식별번호: 7의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상의 총 길이를 가질 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, β-글로빈 프로모터는 참조 게놈에 존재하는 β-글로빈 프로모터 서열의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있으며, 임의로 여기서 β-글로빈 프로모터는 서열식별번호: 7의 서열을 포함한다.

다양한 실시양태에서, β-글로빈 LCR, 예컨대 긴 β-글로빈 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 β-글로빈 프로모터와 또한 작동가능하게 연결된다.

이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 (예를 들어, 전사를 증가시키고/거나, 번역을 증가시키고/거나, 세포 또는 조직 특이성을 증가시키는) 예시적인 LCR이다. 코딩 서열의 발현은 완전한 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 인핸서-유전자좌 제어 영역 (LCR)으로서 기능하는 이뮤노글로불린 중쇄 (IgH) 유전자좌의 3'Cα 영역에 4개의 DNase I-과민성 부위 (HS1, HS2, HS3, 및 HS4)를 포함한다. 따라서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 모든 HS1-HS4를 포함하는 완전한 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR일 수 있거나, 또는 과민성 부위 HS1-HS4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다. 이들 HS 부위는 약 10-30 kb의 IgH C 유전자에 맵핑되고, 일시적 형질감염 검정에서 림프성 세포-특이적 및 발생적으로 조절되는 인핸서 요소를 유발할 수 있다. 이러한 핵산 서열은 버킷 림프종 및 형질세포종 세포주에서 c-myc 유전자에 연결된 경우에 유사한 발현 패턴을 지시할 수 있는 것으로 관찰되었다. 버킷 림프종 및 형질세포종에서, B-세포 LCR에 의한 c-myc의 제어는 c-myc 유전자가 IgH 서열과 병치되게 하여 비정상적인 c-myc 전사를 야기하는 특징적인 염색체 전위로 인해 발생한다. B 세포 LCR에 관한 추가의 설명은 예를 들어 문헌 [Madisen et al., Mol Cell Biol. 18(11):6281-92, 1998; Giannini et al., J. Immunol. 150:1772-1780, 1993; Madisen & Groudine, Genes Dev. 8:2212-2226, 1994; 및 Michaelson et al., Nucleic Acids Res. 23:975-981, 1995]에서 찾아볼 수 있다.

특정한 실시양태는 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 염색체 14 - NC_000014.9 (105586437-106879844, 상보체) (1,293,408 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 위치 105586437-106879844의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR을, 예를 들어 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR 및 임의로 인간 게놈에서 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 작동가능하게 연결된 유전자는 이뮤노글로불린 중쇄 유전자이다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자 프로모터는, 예를 들어 참조 게놈에서 이뮤노글로불린 중쇄 유전자의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 이뮤노글로불린 중쇄 유전자의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR, 예컨대 긴 이뮤노글로불린 중쇄 유전자좌 B 세포 LCR은 B 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 이뮤노글로불린 중쇄 유전자 프로모터와 또한 작동가능하게 연결된다.

또 다른 예시적인 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 T 세포 수용체 알파/델타 유전자좌의 T 세포 LCR이다. T 세포 수용체 (TCR) 알파/델타 유전자좌에서, LCR은 차등 조직 및 발생 발현 및 TCR 알파 및 델타 유전자의 재배열을 조절할 수 있다. 코딩 서열의 발현은 T 세포 수용체 알파/델타 유전자좌 LCR 서열의 완전한 T 세포 LCR을 포함하고/거나 그의 발현-조절 단편을 포함하는 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR은 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. T 세포 LCR은 8개의 T 세포-특이적 뉴클레아제 과민성 도메인 (HS-1 내지 HS-8)을 포함하는 TCR 알파/델타 유전자좌의 3' 영역으로서 확인되었다. 따라서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR은 모든 HS1-HS8를 포함하는 T 세포 수용체 알파/델타 유전자좌 LCR의 완전한 T 세포 LCR일 수 있거나, 또는 과민성 부위 HS1-HS8의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다. 트랜스제닉 마우스에서, 이러한 영역에 연결된 TCR 알파 유전자가 통합 부위에 비의존적으로 높은 수준으로 발현되고 이는 유전자 카피수와 상관된다는 것이 관찰되었다. 이러한 트랜스진은 알파 베타에서는 발현되었지만 감마 델타 T 세포 하위세트에서는 발현되지 않았고, 발생 동안 적절한 시기에 활성화되었다. LCR 기능은 적어도 HS-2 내지 HS-6을 필요로 한다. B 세포 LCR에 관한 추가의 설명은 예를 들어 문헌 [Diaz et al., Immunity 1(3):207-17, 1994]에서 찾아볼 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR을, 예를 들어 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR 및 임의로 인간 게놈에서 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 작동가능하게 연결된 유전자는 염색체 14, NC_000014.9 (21621904..22552132) 상의 TCR 알파 또는 염색체 14, NC_000014.9 (22422546..22466577) 상의 TCR 델타 유전자좌이다. 다양한 실시양태에서, TCR 알파 또는 TCR 델타 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, TCR 알파 또는 TCR 델타 프로모터는, 예를 들어 참조 게놈에서 TCR 알파 또는 TCR 델타의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 TCR 알파 또는 TCR 델타의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, T 세포 수용체 알파/델타 유전자좌 LCR의 T 세포 LCR, 예컨대 T 세포 수용체 알파/델타 유전자좌 LCR의 긴 T 세포 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 TCR 알파 또는 TCR 델타 프로모터와 또한 작동가능하게 연결된다.

아데노신 데아미나제 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아데노신 데아미나제 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아데노신 데아미나제 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 아데노신 데아미나제 LCR은 과민성 부위 1-6을 포함한다. 따라서, 아데노신 데아미나제 LCR은 모든 HS1-HS6을 포함하는 완전한 아데노신 데아미나제 LCR일 수 있거나, 또는 과민성 부위 HS1-HS6의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 20의 아데노신 데아미나제 LCR 위치 NC_000020.11 44629004-44651567 (22,564 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 또는 22 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 아데노신 데아미나제 LCR 위치 44629004-44651567의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아데노신 데아미나제 LCR을, 예를 들어 아데노신 데아미나제 LCR 및 임의로 인간 게놈에서 아데노신 데아미나제 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 LCR과 작동가능하게 연결된 유전자는 아데노신 데아미나제 (20:44,619,518-44,651,757, 상보체)이다. 다양한 실시양태에서, 아데노신 데아미나제 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아데노신 데아미나제 프로모터는, 예를 들어 참조 게놈에서 아데노신 데아미나제의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아데노신 데아미나제 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 20 - NC_000020.11 44651607에서의 아데노신 데아미나제의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 아데노신 데아미나제 LCR, 예컨대 긴 아데노신 데아미나제 LCR은 혈액, 장, 및 림프성 조직 중 1종 이상에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 아데노신 데아미나제 프로모터와 또한 작동가능하게 연결된다.

아포지단백질 E/C LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아포지단백질 E/C LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아포지단백질 E/C LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아포지단백질 E/C LCR은 아포지단백질 E/C LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 아포지단백질 E/C LCR은 과민성 부위 1-6을 포함한다. 따라서, 아포지단백질 E/C LCR은 모든 HS1-HS6을 포함하는 완전한 아포지단백질 E/C LCR일 수 있거나, 또는 과민성 부위 HS1-HS6의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아포지단백질 E/C LCR을, 예를 들어 아포지단백질 E/C LCR 및 임의로 인간 게놈에서 아포지단백질 E/C LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아포지단백질 E/C LCR과 작동가능하게 연결된 유전자는 아포지단백질 E (19:44,905,795-44,909,394)이다. 다양한 실시양태에서, 아포지단백질 E 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 아포지단백질 E 프로모터는, 예를 들어 참조 게놈에서 아포지단백질 E의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아포지단백질 E/C LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 19 - NC_000019.10 (44906625)에서의 아포지단백질 E의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 아포지단백질 E/C LCR, 예컨대 긴 아포지단백질 E/C LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 아포지단백질 E/C 프로모터와 또한 작동가능하게 연결된다.

Th2 시토카인 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 Th2 시토카인 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 Th2 시토카인 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. Th2 시토카인 LCR은 Th2 시토카인 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. Th2 시토카인 LCR은 과민성 부위 RHS5-RHS7을 포함한다. 따라서, Th2 시토카인 LCR은 모든 RHS5-RHS7을 포함하는 완전한 Th2 시토카인 LCR일 수 있거나, 또는 과민성 부위 RHS5-RHS7의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 5의 Th2 시토카인 LCR 위치 NC_000005.10 (132629263-132642195) (12,933 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 또는 12 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 Th2 시토카인 LCR 위치 132629263-132642195의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 Th2 시토카인 LCR을, 예를 들어 Th2 시토카인 LCR 및 임의로 인간 게놈에서 Th2 시토카인 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, Th2 시토카인 LCR과 작동가능하게 연결된 유전자는 Th2 시토카인, 예를 들어 IL-4, IL-13, 또는 IL-5이다. 다양한 실시양태에서, Th2 시토카인 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, Th2 시토카인 프로모터는, 예를 들어 참조 게놈에서 Th2 시토카인의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.

다양한 실시양태에서, Th2 시토카인 LCR, 예컨대 긴 Th2 시토카인 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 Th2 시토카인 프로모터와 또한 작동가능하게 연결된다.

CD2 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CD2 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CD2 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CD2 LCR은 CD2 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. CD2 LCR은 과민성 부위 1-3을 포함한다. 따라서, CD2 LCR은 모든 HS1-HS3을 포함하는 완전한 CD2 LCR일 수 있거나, 또는 과민성 부위 HS1-HS3의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 1의 CD2 LCR 위치 NC_000001.11 116769217-116774826 (5,610 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, CD2 LCR은 CD2 LCR 위치 116769217-116774826의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD2 LCR은 CD2 LCR 위치 116769217-116774826의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 또는 5 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 CD2 LCR 위치 116769217-116774826의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CD2 LCR을, 예를 들어 CD2 LCR 및 임의로 인간 게놈에서 CD2 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CD2 LCR과 작동가능하게 연결된 유전자는 CD2 (1:116,754,429-116,769,228)이다. 다양한 실시양태에서, CD2 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD2 프로모터는, 예를 들어 참조 게놈에서 CD2의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CD2 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 1 - NC_000001.11 (116754493)에서의 CD2의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, CD2 LCR, 예컨대 긴 CD2 LCR은 T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CD2 프로모터와 또한 작동가능하게 연결된다.

S100β LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 S100β LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 S100β LCR과 작동가능하게 연결된 경우에 증진될 수 있다. S100β LCR은 S100β LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 S100β LCR을, 예를 들어 S100β LCR 및 임의로 인간 게놈에서 S100β LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, S100β LCR과 작동가능하게 연결된 유전자는 S100β (21:46,598,603-46,605,242, 상보체)이다. 다양한 실시양태에서, S100β 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, S100β 프로모터는, 예를 들어 참조 게놈에서 S100β의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 S100β LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 S100β (염색체 21 - NC_000021.9 (46602415))의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, S100β LCR, 예컨대 긴 S100β LCR은 뇌 성상세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 S100β 프로모터와 또한 작동가능하게 연결된다.

성장 호르몬 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 성장 호르몬 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 성장 호르몬 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 성장 호르몬 LCR은 성장 호르몬 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 성장 호르몬 LCR은 과민성 부위 1-5를 포함한다. 따라서, 성장 호르몬 LCR은 모든 HS1-HS5를 포함하는 완전한 성장 호르몬 LCR일 수 있거나, 또는 과민성 부위 HS1-HS5의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 17의 성장 호르몬 LCR 위치 NC_000017.11 (63917193-63958852) (41,660 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 성장 호르몬 LCR 위치 63917193-63958852의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 성장 호르몬 LCR을, 예를 들어 성장 호르몬 LCR 및 임의로 인간 게놈에서 성장 호르몬 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 성장 호르몬 LCR과 작동가능하게 연결된 유전자는 GH1 (성장 호르몬 1), CSHL1 (융모성 소마토맘모트로핀 호르몬-유사 1), CSH1 (융모성 소마토맘모트로핀 호르몬 1 (태반 락토겐)), GH2 (성장 호르몬 2), 또는 CSH2 (융모성 소마토마모트로핀 호르몬 2)이다. 다양한 실시양태에서, GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터는, 예를 들어 참조 게놈에서 GH1, CSHL1, CSH1, GH2, 또는 CSH2의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 성장 호르몬 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 성장 호르몬 (17:63,917,202-63,918,838, 상보체) 위치 NC_000017.11 (63918776)의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 성장 호르몬 LCR, 예컨대 긴 성장 호르몬 LCR은 뇌하수체에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 GH1, CSHL1, CSH1, GH2, 또는 CSH2 프로모터와 또한 작동가능하게 연결된다.

아포지단백질 B LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 아포지단백질 B LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 아포지단백질 B LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 아포지단백질 B LCR은 아포지단백질 B LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 아포지단백질 B LCR을, 예를 들어 아포지단백질 B LCR 및 임의로 인간 게놈에서 아포지단백질 B LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 아포지단백질 B LCR과 작동가능하게 연결된 유전자는 APOB (2:21,001,428-21,044,072, 상보체)이다. 다양한 실시양태에서, APOB 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, APOB 프로모터는, 예를 들어 참조 게놈에서 APOB의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 아포지단백질 B LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 위치 염색체 2 - NC_000002.12 (21043945)에서의 APOB의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 아포지단백질 B LCR, 예컨대 긴 아포지단백질 B LCR은 장 및/또는 간에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 APOB 프로모터와 또한 작동가능하게 연결된다.

β 미오신 중쇄 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 β 미오신 중쇄 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 β 미오신 중쇄 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. β 미오신 중쇄 LCR은 β 미오신 중쇄 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. β 미오신 중쇄 LCR은 과민성 부위 1 및 2를 포함한다. 따라서, β 미오신 중쇄 LCR은 HS1 및 HS2 둘 다를 포함하는 완전한 β 미오신 중쇄 LCR일 수 있거나, 또는 과민성 부위의 하위세트 (HS1 또는 HS2)를 포함하는 그의 발현-조절 단편일 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 β 미오신 중쇄 LCR을, 예를 들어 β 미오신 중쇄 LCR 및 임의로 인간 게놈에서 β 미오신 중쇄 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, β 미오신 중쇄 LCR과 작동가능하게 연결된 유전자는 β 미오신 중쇄 (14:23,412,739-23,435,676, 상보체)이다. 다양한 실시양태에서, β 미오신 중쇄 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, β 미오신 중쇄 프로모터는, 예를 들어 참조 게놈에서 β 미오신 중쇄의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 β 미오신 중쇄 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 14 - NC_000014.9 (23433732)에서의 β 미오신 중쇄의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, β 미오신 중쇄 LCR, 예컨대 긴 β 미오신 중쇄 LCR은 심장 근육 및/또는 골격근에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 β 미오신 중쇄 프로모터와 또한 작동가능하게 연결된다.

MHC 부류 I HLA-B7 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 MHC 부류 I HLA-B7 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 MHC 부류 I HLA-B7 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. MHC 부류 I HLA-B7 LCR은 MHC 부류 I HLA-B7 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 MHC 부류 I HLA-B7 LCR을, 예를 들어 MHC 부류 I HLA-B7 LCR 및 임의로 인간 게놈에서 MHC 부류 I HLA-B7 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-B7 LCR과 작동가능하게 연결된 유전자는 MHC 부류 I HLA-B7이다. 다양한 실시양태에서, MHC 부류 I HLA-B7 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-B7 프로모터는, 예를 들어 참조 게놈에서 MHC 부류 I HLA-B7의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.

다양한 실시양태에서, MHC 부류 I HLA-B7 LCR, 예컨대 긴 MHC 부류 I HLA-B7 LCR은 많은 세포 유형에서 또는 편재적으로 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 MHC 부류 I HLA-B7 프로모터와 또한 작동가능하게 연결된다.

MHC 부류 I HLA-G LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 MHC 부류 I HLA-G LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 MHC 부류 I HLA-G LCR과 작동가능하게 연결된 경우에 증진될 수 있다. MHC 부류 I HLA-G LCR은 MHC 부류 I HLA-G LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 MHC 부류 I HLA-G LCR을, 예를 들어 MHC 부류 I HLA-G LCR 및 임의로 인간 게놈에서 MHC 부류 I HLA-G LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-G LCR과 작동가능하게 연결된 유전자는 MHC 부류 I HLA-G이다. 다양한 실시양태에서, MHC 부류 I HLA-G 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, MHC 부류 I HLA-G 프로모터는, 예를 들어 참조 게놈에서 MHC 부류 I HLA-G의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다.

다양한 실시양태에서, MHC 부류 I HLA-G LCR, 예컨대 긴 MHC 부류 I HLA-G LCR은 많은 세포 유형에서 또는 편재적으로 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 MHC 부류 I HLA-G 프로모터와 또한 작동가능하게 연결된다.

케라틴 18 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 케라틴 18 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 케라틴 18 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 케라틴 18 LCR은 케라틴 18 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 케라틴 18 LCR은 과민성 부위 1-4를 포함한다. 따라서, 케라틴 18 LCR은 모든 HS1-HS4를 포함하는 완전한 케라틴 18 LCR일 수 있거나, 또는 과민성 부위 HS1-HS4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 12의 케라틴 18 LCR 위치 NC_000012.12 (52948039-52956706) (8,668 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 케라틴 18 LCR은 케라틴 18 LCR 위치 52948039-52956706의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 케라틴 18 LCR은 케라틴 18 LCR 위치 52948039-52956706의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 또는 8 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 케라틴 18 LCR 위치 52948039-52956706의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 케라틴 18 LCR을, 예를 들어 케라틴 18 LCR 및 임의로 인간 게놈에서 케라틴 18 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 케라틴 18 LCR과 작동가능하게 연결된 유전자는 케라틴 18 (12:52,948,870-52,952,905)이다. 다양한 실시양태에서, 케라틴 18 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 케라틴 18 프로모터는, 예를 들어 참조 게놈에서 케라틴 18의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 케라틴 18 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (52949174)에서의 케라틴 18의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 케라틴 18 LCR, 예컨대 긴 케라틴 18 LCR은 상피 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 케라틴 18 프로모터와 또한 작동가능하게 연결된다.

보체 성분 C4A/B LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 보체 성분 C4A/B LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 보체 성분 C4A/B LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 보체 성분 C4A/B LCR은 보체 성분 C4A/B LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 보체 성분 C4A/B LCR을, 예를 들어 보체 성분 C4A/B LCR 및 임의로 인간 게놈에서 보체 성분 C4A/B LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 보체 성분 C4A/B LCR과 작동가능하게 연결된 유전자는 C4A (6:31,982,056-32,002,680)이다. 다양한 실시양태에서, C4A 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, C4A 프로모터는, 예를 들어 참조 게놈에서 C4A의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 보체 성분 C4A/B LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 6 - NC_000006.12 (31982108)에서의 C4A의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 보체 성분 C4A/B LCR, 예컨대 긴 보체 성분 C4A/B LCR은 간에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 C4A 프로모터와 또한 작동가능하게 연결된다.

적색 및 녹색 시각 색소 (옵신) LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 적색 및 녹색 시각 색소 (옵신) LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 적색 및 녹색 시각 색소 (옵신) LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 적색 및 녹색 시각 색소 (옵신) LCR은 과민성 부위 1-3을 포함한다. 따라서, 적색 및 녹색 시각 색소 (옵신) LCR은 모든 HS1-HS3을 포함하는 완전한 적색 및 녹색 시각 색소 (옵신) LCR일 수 있거나, 또는 과민성 부위 HS1-HS3의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 X의 적색 및 녹색 시각 색소 (옵신) LCR 위치 NC_000023.11 (154137727-154144286) (6,560 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR 위치 154137727-154144286의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR은 적색 및 녹색 시각 색소 (옵신) LCR 위치 154137727-154144286의 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 또는 6 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 적색 및 녹색 시각 안료 (옵신) LCR 위치 154137727-154144286의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 적색 및 녹색 시각 색소 (옵신) LCR을, 예를 들어 적색 및 녹색 시각 색소 (옵신) LCR 및 임의로 인간 게놈에서 적색 및 녹색 시각 색소 (옵신) LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR과 작동가능하게 연결된 유전자는 옵신 1 (X:154,144,242-154,159,031), 장파-감수성 (OPN1LW), 옵신 1, 중간파-감수성 (OPN1MW), OPN1MW2, 또는 OPN1MW3이다. 다양한 실시양태에서, OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터는, 예를 들어 참조 게놈에서 OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 적색 및 녹색 시각 색소 (옵신) LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 X - NC_000023.11 (154144284)에서의 OPN1LW 또는 염색체 X - NC_000023.11 (154182678)에서의 OPN1MW의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 적색 및 녹색 시각 색소 (옵신) LCR, 예컨대 긴 적색 및 녹색 시각 색소 (옵신) LCR은 원추 광수용체에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 OPN1LW, OPN1MW, OPN1MW2, 또는 OPN1MW3 프로모터와 또한 작동가능하게 연결된다.

α-글로빈 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 α-글로빈 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 α-글로빈 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. α-글로빈 LCR은 α-글로빈 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. α-글로빈 LCR은 과민성 부위 MCS-R1 내지 MCS-R4를 포함한다. 따라서, α-글로빈 LCR은 모든 MCS-R1 내지 MCS-R4를 포함하는 완전한 α-글로빈 LCR일 수 있거나, 또는 과민성 부위 MCS-R1 내지 MCS-R4의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 16의 α-글로빈 LCR 위치 NC_000016.10 (87808-152854) (65,047 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, α-글로빈 LCR은 α-글로빈 LCR 위치 87808-152854의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, α-글로빈 LCR은 α-글로빈 LCR 위치 87808-152854의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 18 kb, 19 kb, 20 kb, 21 kb, 22 kb, 23 kb, 24 kb, 25 kb, 26 kb, 27 kb, 28 kb, 29 kb, 또는 30 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 α-글로빈 LCR 위치 87808-152854의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 α-글로빈 LCR을, 예를 들어 α-글로빈 LCR 및 임의로 인간 게놈에서 α-글로빈 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, α-글로빈 LCR과 작동가능하게 연결된 유전자는 알파-글로빈 유전자 클러스터 (주요 α-글로빈 유전자좌: 16:172,875-173,709) 내의 HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1)이다. 다양한 실시양태에서, HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1) 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1) 프로모터는, 예를 들어 참조 게놈에서 HBZ (헤모글로빈, 제타), HBA2 (헤모글로빈, 알파 2), HBA1 (헤모글로빈, 알파 1), 또는 HBQ1 (헤모글로빈, 세타 1)의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 α-글로빈 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 HBA1 염색체 16 - NC_000016.10 (176717), HBA2 염색체 16 - NC_000016.10 (172913), HBZ 염색체 16 - NC_000016.10 (152910), 또는 HBQ1 염색체 16 - NC_000016.10 (180487)의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, α-글로빈 LCR, 예컨대 긴 α-글로빈 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 프로모터와 또한 작동가능하게 연결된다.

데스민 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 데스민 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 데스민 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. 데스민 LCR은 데스민 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. 데스민 LCR은 과민성 부위 1-5를 포함한다. 따라서, 데스민 LCR은 모든 HS1-HS5를 포함하는 완전한 데스민 LCR일 수 있거나, 또는 과민성 부위 HS1-HS5의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

특정한 실시양태는 인간 염색체 2의 데스민 LCR 위치 NC_000002.12 (219399709-219418452) (18,743 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, 데스민 LCR은 데스민 LCR 위치 219399709-219418452의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 데스민 LCR은 데스민 LCR 위치 219399709-219418452의 적어도 10 kb, 15 kb, 16 kb, 17 kb, 또는 18 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 데스민 LCR 위치 219399709-219418452의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 데스민 LCR을, 예를 들어 데스민 LCR 및 임의로 인간 게놈에서 데스민 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, 데스민 LCR과 작동가능하게 연결된 유전자는 데스민 (2:219,418,376-219,426,733)이다. 다양한 실시양태에서, 데스민 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, 데스민 프로모터는, 예를 들어 참조 게놈에서 데스민의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 데스민 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 2 - NC_000002.12 (21941863)에서의 데스민의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, 데스민 LCR, 예컨대 긴 데스민 LCR은 심장 근육, 골격근, 및/또는 평활근에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 데스민 프로모터와 또한 작동가능하게 연결된다.

핵 인자, 적혈구 2 유사 1 (NFE2L1) LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 NFE2L1 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 NFE2L1 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. NFE2L1 LCR은 NFE2L1 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

특정한 실시양태는 인간 염색체 17의 NFE2L1 LCR 위치 NC_000017.11 (48048359-48061545) (13, 186 bp) 또는 그의 발현-조절 단편을 포함할 수 있다. 다양한 실시양태에서, NFE2L1 LCR은 NFE2L1 LCR 위치 48048359-48061545의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, NFE2L1 LCR은 NFE2L1 LCR 위치 48048359-48061545의 적어도 10 kb, 11 kb, 12 kb, 또는 13 kb를 포함할 수 있다. 본원에 제공된 다양한 실시양태 중 임의의 것에서, 긴 LCR은 NFE2L1 LCR 위치 48048359-48061545의 상응하는 인접 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산일 수 있거나 또는 그를 포함할 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 NFE2L1 LCR을, 예를 들어 NFE2L1 LCR 및 임의로 인간 게놈에서 NFE2L1 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, NFE2L1 LCR과 작동가능하게 연결된 유전자는 NFE2L1 (17:48,048,358-48,061,544)이다. 다양한 실시양태에서, NFE2L1 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, NFE2L1 프로모터는, 예를 들어 참조 게놈에서 NFE2L1의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 NFE2L1 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 17 - NC_000017.11 (48051119)에서의 NFE2L1의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, NFE2L1 LCR, 예컨대 긴 NFE2L1 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 NFE2L1 프로모터와 또한 작동가능하게 연결된다.

CD4 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CD4 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CD4 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CD4 LCR은 CD4 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다. CD4 LCR은 최대 17개의 과민성 부위 DH1-DH17을 포함한다. 따라서, CD4 LCR은 모든 DH1-DH17을 포함하는 완전한 CD4 LCR일 수 있거나, 또는 과민성 부위 DH1-DH17의 하위세트를 포함하는 그의 발현-조절 단편일 수 있다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CD4 LCR을, 예를 들어 CD4 LCR 및 임의로 인간 게놈에서 CD4 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CD4 LCR과 작동가능하게 연결된 유전자는 CD4 (12:6,789,527-6,820,809)이다. 다양한 실시양태에서, CD4 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CD4 프로모터는, 예를 들어 참조 게놈에서 CD4의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CD4 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (6800139)에서의 CD4의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, CD4 LCR, 예컨대 긴 CD4 LCR은 CD4+ T 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CD4 프로모터와 또한 작동가능하게 연결된다.

α-락트알부민 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 α-락트알부민 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 α-락트알부민 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. α-락트알부민 LCR은 α-락트알부민 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 α-락트알부민 LCR을, 예를 들어 α-락트알부민 LCR 및 임의로 인간 게놈에서 α-락트알부민 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, α-락트알부민 LCR과 작동가능하게 연결된 유전자는 α-락트알부민 (12:48,567,683-48,571,882)이다. 다양한 실시양태에서, α-락트알부민 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, α-락트알부민 프로모터는, 예를 들어 참조 게놈에서 α-락트알부민의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 α-락트알부민 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 12 - NC_000012.12 (48570020)에서의 α-락트알부민의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, α-락트알부민 LCR, 예컨대 긴 α-락트알부민 LCR은 유선에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 α-락트알부민 프로모터와 또한 작동가능하게 연결된다.

CYP19/아로마타제 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 CYP19/아로마타제 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 CYP19/아로마타제 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. CYP19/아로마타제 LCR은 CYP19/아로마타제 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 CYP19/아로마타제 LCR을, 예를 들어 CYP19/아로마타제 LCR 및 임의로 인간 게놈에서 CYP19/아로마타제 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, CYP19/아로마타제 LCR과 작동가능하게 연결된 유전자는 CYP19A1 (15:51,208,056-51,338,595)이다. 다양한 실시양태에서, CYP19A1 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, CYP19A1 프로모터는, 예를 들어 참조 게놈에서 CYP19A1의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 CYP19/아로마타제 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 15 - NC_000015.10 (51242912)에서의 CYP19A1의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, CYP19/아로마타제 LCR, 예컨대 긴 CYP19/아로마타제 LCR은 다수의 다양한 조직에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 CYP19A1 프로모터와 또한 작동가능하게 연결된다.

C-fes 원종양유전자 LCR은 작동가능하게 연결된 코딩 서열의 발현을 증진시키는 예시적인 LCR이다. 코딩 서열의 발현은 완전한 C-fes 원종양유전자 LCR 서열을 포함하고/거나 그의 발현-조절 단편을 포함하는 C-fes 원종양유전자 LCR과 작동가능하게 연결된 경우에 증진될 수 있다. C-fes 원종양유전자 LCR은 C-fes 원종양유전자 LCR의 발현-증진 효과의 적어도 일부를 매개하는 것으로 관련 기술분야의 통상의 기술자에 의해 이해되는 DNAse 과민성 부위 (HS)를 포함한다.

다양한 실시양태에서, Ad35 벡터는 본원에 제공된 바와 같은 C-fes 원종양유전자 LCR을, 예를 들어 C-fes 원종양유전자 LCR 및 임의로 인간 게놈에서 C-fes 원종양유전자 LCR과 전형적으로 작동가능하게 연결된 유전자의 프로모터를 포함하는 페이로드에 포함할 수 있다. 다양한 실시양태에서, C-fes 원종양유전자 LCR과 작동가능하게 연결된 유전자는 FES (15:90,884,420-90,895,775)이다. 다양한 실시양태에서, FES 프로모터는 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb 이상의 총 길이를 가질 수 있다. 다양한 실시양태에서, FES 프로모터는, 예를 들어 참조 게놈에서 FES의 상류, 예를 들어 그의 제1 코딩 뉴클레오티드의 바로 상류인 상응하는 핵산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 적어도 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1.0 kb, 1.5 kb, 2.0 kb, 2.5 kb, 3.0 kb, 4.0 kb, 또는 5.0 kb를 포함한다. 일부 실시양태에서, 인간 게놈에서 C-fes 원종양유전자 LCR과 전형적으로 작동가능하게 연결된 유전자의 코딩 서열의 제1 코딩 뉴클레오티드는 염색체 15 - NC_000015.10 (90885046)에서의 FES의 제1 코딩 뉴클레오티드이다.

다양한 실시양태에서, C-fes 원종양유전자 LCR, 예컨대 긴 C-fes 원종양유전자 LCR은 대식세포 및 호중구를 포함한 골수 세포에서 작동가능하게 연결된 코딩 서열의 발현을 유발한다. 다양한 실시양태에서, 작동가능하게 연결된 코딩 서열은 본원에 제시되거나 또는 관련 기술분야에 달리 공지된 바와 같이 FES 프로모터와 또한 작동가능하게 연결된다.

(IV) 긴 LCR과 작동가능하게 연결된 코딩 서열

(IV-b) 단백질 요법, 예를 들어 단백질/효소 대체 요법

특정한 실시양태에서, 긴 LCR과 작동가능하게 연결된 코딩 서열은 치료 단백질을 코딩하는 트랜스진을 포함한다. 코딩 서열은 본원에 기재된 바와 같은 1종 이상의 치료 단백질을 코딩하는 핵산 서열 (폴리뉴클레오티드 또는 뉴클레오티드 서열과 상호교환가능하게 사용됨)을 지칭한다. 이러한 정의는 다양한 서열 다형성, 돌연변이, 및/또는 서열 변이체를 포함하며, 여기서 이러한 변경은 코딩된 1종 이상의 치료 단백질의 기능에 실질적으로 영향을 미치지 않는다. 코딩 서열 또는 "유전자"는 코딩 서열뿐만 아니라 조절 영역, 예컨대 프로모터, 인핸서, 및 종결 영역을 포함할 수 있다. 상기 용어는 mRNA 전사체로부터 스플라이싱된 모든 인트론 및 다른 DNA 서열을, 대안적 스플라이스 부위로부터 생성된 변이체와 함께 추가로 포함할 수 있다. 분자를 코딩하는 유전자 서열은 1종 이상의 치료 단백질의 발현을 지시하는 DNA 또는 RNA일 수 있다. 이들 핵산 서열은 RNA로 전사되는 DNA 가닥 서열 또는 단백질로 번역되는 RNA 서열일 수 있다. 핵산 서열은 전장 핵산 서열뿐만 아니라 전장 단백질로부터 유래된 비-전장 서열 둘 다를 포함한다. 서열은 또한 특정 세포 유형에서 코돈 선호도를 제공하기 위해 도입될 수 있는 천연 서열 또는 서열들의 축중성 코돈을 포함할 수 있다.

1종 이상의 치료 단백질을 코딩하는 유전자 서열은 관련 아미노산 서열로부터 합성 또는 재조합 방법에 의해 용이하게 제조될 수 있다. 특정한 실시양태에서, 이들 서열 중 임의의 것을 코딩하는 유전자 서열은 또한 서열을 코딩하는 유전자 서열의 용이한 절제 및 상이한 서열을 코딩하는 또 다른 유전자 서열로의 대체를 제공하기 위해 코딩 서열의 5' 및/또는 3' 단부에 1개 이상의 제한 효소 부위를 가질 수 있다. 특정한 실시양태에서, 서열을 코딩하는 유전자 서열은 포유동물 세포에서의 발현을 위해 코돈 최적화될 수 있다. 치료 단백질에 대한 코딩 서열은 본원에서 치료 유전자로 지칭된다.

치료 유전자는, 특정한 실시양태에서, 유전되는 상태에 대해 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 상태는 그레이브스병, 류마티스 관절염, 악성 빈혈, 다발성 경화증 (MS), 염증성 장 질환, 전신 홍반성 루푸스 (SLE), 아데노신 데아미나제 결핍 (ADA-SCID) 또는 중증 복합 면역결핍 질환 (SCID), 비스코트-알드리치 증후군 (WAS), 만성 육아종성 질환 (CGD), 판코니 빈혈 (FA), 배튼병, 부신백질이영양증 (ALD) 또는 이염성 백질이영양증 (MLD), 근육 이영양증, 폐포 단백증 (PAP), 피루베이트 키나제 결핍, 슈바크만-다이아몬드-블랙판 빈혈, 선천성 이상각화증, 낭성 섬유증, 파킨슨병, 알츠하이머병 또는 근위축성 측삭 경화증 (루게릭병)일 수 있다. 특정한 실시양태에서, 상태에 따라, 치료 유전자는 단백질을 코딩하는 유전자 및/또는 기능이 중단된 유전자일 수 있다.

예시적인 치료 유전자 및 유전자 생성물은 CD4, CD5, CD7, CD52 등에 대한 항체; 항체; IL1, IL2, IL6에 대한 항체; 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체; IL4; IL10; IL12; IL13; IL1Ra; sIL1RI; sIL1RII; TNF에 대한 항체; ABCA3; ABCD1; ADA; AK2; APP; 아르기나제; 아릴술파타제 A; A1AT; CD3D; CD3E; CD3G; CD3Z; CFTR; CHD7; 키메라 항원 수용체 (CAR); CIITA; CLN3; 보체 인자, CORO1A; CTLA; C1 억제제; C9ORF72; DCLRE1B; DCLRE1C; 디코이 수용체; DKC1; DRB1*1501/DQB1*0602; 디스트로핀; 효소; 인자 VIII, FANC 패밀리 유전자 (FancA, FancB, FancC, FancD1 (BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ (BRIP1), FancL, FancM, FancN (PALB2), FancO (RAD51C), FancP (SLX4), FancQ (ERCC4), FancR (RAD51), FancS (BRCA1), FancT (UBE2T), FancU (XRCC2), FancV (MAD2L2), 및 FancW (RFWD3)); Fas L; FUS; GATA1; 글로빈 패밀리 유전자 (즉 γ-글로빈); F8; 글루타미나제; HBA1; HBA2; HBB; IL7RA; JAK3; LCK; LIG4; LRRK2; NHEJ1; NLX2.1; 중화 항체; ORAI1; PARK2; PARK7; phox; PINK1; PNP; PRKDC; PSEN1; PSEN2; PTPN22; PTPRC; P53; 피루베이트 키나제; RAG1; RAG2; RFXANK; RFXAP; RFX5; RMRP; 리보솜 단백질 유전자; SFTPB; SFTPC; SOD1; 가용성 CD40; STIM1; sTNFRI; sTNFRII; SLC46A1; SNCA; TDP43; TERT; TERC; TINF2; 유비퀼린 2; WAS; WHN; ZAP70; γC; 및 본원에 기재된 다른 치료 유전자를 포함한다.

치료 유효량은 면역 및 다른 혈액 세포 및/또는 소교 세포에 기능을 제공할 수 있거나, 또는 대안적으로-치료되는 상태에 따라-림프구 활성화를 억제하고/거나, 림프구에서 아폽토시스를 유도하고/거나, 림프구의 다양한 하위세트를 제거하고/거나, T 세포 활성화를 억제하고/거나, 자가반응성 T 세포를 제거 또는 억제하고/거나, Th-2 또는 Th-1 림프구 활성을 억제하고/거나, IL-1 또는 TNF를 길항하고/거나, 염증을 감소시키고/거나, 자극제에 대한 선택적 관용을 유도하고/거나, 면역-매개 상태를 감소 또는 제거하고/거나; 면역-매개된 상태의 증상을 감소 또는 제거할 수 있다. 치료 유효량은 또한 기능적 DNA 복구 메카니즘; 계면활성제 단백질 발현; 텔로미어 유지; 리소솜 기능; 지질 또는 다른 단백질, 예컨대 아밀로이드의 분해를 제공할 수 있고/거나; 리보솜 기능을 허용할 수 있고/거나; 그렇지 않으면 다른 백혈구 유형의 대식세포와 같이 발생하지 않을 성숙 혈액 세포 계통의 발생을 허용할 수 있다.

또 다른 예로서, 치료 유전자는 적혈구 및 응고와 관련된 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 질환은 지중해빈혈과 같은 혈색소병증, 또는 겸상 적혈구 질환/형질이다. 치료 유전자는, 예를 들어 헤모글로빈의 생산을 유도 또는 증가시키거나; β-글로빈, γ-글로빈, 또는 α-글로빈의 생산을 유도 또는 증가시키거나; 또는 신체 내 세포에 대한 산소의 이용가능성을 증가시키는 유전자일 수 있다. 치료 유전자는 예를 들어 HBB 또는 CYB5R3일 수 있다. 예시적인 유효 치료는, 예를 들어 환자에서 혈액 세포 수를 증가시키거나, 혈액 세포 기능을 개선시키거나, 또는 세포의 산소화를 증가시킬 수 있다. 또 다른 특정한 실시양태에서, 질환은 혈우병이다. 치료 유전자는, 예를 들어 응고/응고 인자 VIII 또는 응고/응고 인자 IX의 생산을 증가시키는 유전자, 응고 인자 VIII 또는 응고 인자 IX의 정상 버전의 생산을 유발하는 유전자, 응고/응고 인자 VIII 또는 응고/응고 인자 IX에 대한 항체의 생산을 감소시키는 유전자, 또는 혈병의 적절한 형성을 유발하는 유전자일 수 있다. 예시적인 치료 유전자는 F8 및 F9를 포함한다. 예시적인 유효 치료는, 예를 들어 응고/응고 인자 VIII 및 IX의 생산을 증가 또는 유도하거나; 응고/응고 인자 VIII 및 IX의 기능을 개선시키거나, 또는 대상체에서 응고 시간을 감소시킬 수 있다.

하기 참고문헌은 기능적 글로빈 유전자의 특정한 예시적인 서열을 기재한다. 참고문헌 1-4는 α-유형 글로빈 서열에 관한 것이고, 참고문헌 4-12는 β-유형 글로빈 서열 (β 및 γ 글로빈 서열 포함)에 관한 것이다: (1) 진뱅크 수탁 번호 Z84721 (1997년 3월 19일); (2) 진뱅크 수탁 번호 NM_000517 (2000년 10월 31일); (3) Hardison et al., J. Mol. Biol. 222(2):233-249, 1991; (4) A Syllabus of Human Hemoglobin Variants (1996), by Titus et al., published by The Sickle Cell Anemia Foundation in Augusta, GA (온라인 globin.cse.psu.edu에서 이용가능함); (5) 진뱅크 수탁 번호 J00179 (1993년 8월 26일); (6) Tagle et al., Genomics 13(3):741-760, 1992; (7) Grovsfeld et al., Cell 51(6):975-985, 1987; (8) Li et al., Blood 93(7):2208-2216, 1999; (9) Gorman et al., J. Biol. Chem .275(46):35914-35919, 2000; (10) Slightom et al., Cell 21(3):627-638, 1980; (11) Fritsch et al., Cell 19(4): 959-972, 1980; (12) Marotta et al., J. Biol. Chem. 252(14):5040-5053, 1977. 글로빈을 코딩하는 유전자의 추가의 코딩 및 비-코딩 영역에 대해서는, 예를 들어 문헌 [Marotta et al., Prog. Nucleic Acid Res. Mol. Biol. 19, 165-175, 1976, Lawn et al., Cell 21 (3), 647-651, 1980, 및 Sadelain et al., PNAS. 92:6728-6732, 1995]을 참조한다.

헤모글로빈 서브유닛 β의 예시적인 아미노산 서열은 예를 들어 NCBI 수탁 번호 P68871에 제공된다. β-글로빈에 대한 예시적인 아미노산 서열은 예를 들어 NCBI 수탁 번호 NP_000509에 제공된다.

또 다른 예로서, 치료 유전자는 리소솜 축적 장애에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 리소솜 축적 장애는 뮤코폴리사카라이드증 (MPS), 유형 I; MPS II 또는 헌터 증후군; MPS III 또는 산필리포 증후군; MPS IV 또는 모르키오 증후군; MPS V; MPS VI 또는 마로토-라미 증후군; MPS VII 또는 슬라이 증후군; α-만노시드축적증; β-만노시드축적증; GSDI, 폰 기에르케병, 또는 테이 삭스로도 공지된 글리코겐 축적 질환 유형 I; 폼페병; 고셔병; 파브리병이다. 치료 유전자는, 예를 들어 효소를 코딩하거나 또는 그의 생산을 유도하거나, 또는 달리 리소솜에서 뮤코폴리사카라이드의 분해를 유발하는 유전자일 수 있다. 예시적인 치료 유전자는 IDUA 또는 이두로니다제, IDS, GNS, HGSNAT, SGSH, NAGLU, GUSB, GALNS, GLB1, ARSB, 및 HYAL1을 포함한다. 리소솜 축적 장애에 대한 예시적인 유효 유전자 요법은, 예를 들어 리소솜에서 다양한 물질의 분해를 담당하는 효소를 코딩하거나 또는 그의 생산을 유도할 수 있고; 머리 (예를 들어, 대두증), 간, 비장, 혀, 또는 성대를 포함한 다양한 기관에서 종창을 감소, 제거, 방지, 또는 지연시킬 수 있고; 뇌 내의 유체를 감소시킬 수 있고; 심장 판막 이상을 감소시킬 수 있고; 기도 협착을 방지 또는 확장시킬 수 있고, 관련 상부 호흡기 상태 예컨대 감염 및 수면 무호흡을 방지할 수 있고; 뉴런의 파괴 및/또는 관련 증상을 감소, 제거, 방지, 또는 지연시킬 수 있다.

또 다른 예로서, 치료 유전자는 과다증식성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 과다증식성 질환은 암이다. 치료 유전자는, 예를 들어 종양 억제 유전자, 아폽토시스를 유도하는 유전자, 효소를 코딩하는 유전자, 항체를 코딩하는 유전자, 또는 호르몬을 코딩하는 유전자일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 (본원의 다른 곳에 열거된 것에 더하여) 101F6, 123F2 (RASSF1), 53BP2, abl, ABLI, ADP, aFGF, APC, ApoAI, ApoAIV, ApoE, ATM, BAI-1, BDNF, 베타*(BLU), bFGF, BLC1, BLC6, BRCA1, BRCA2, CBFA1, CBL, C-CAM, CNTF, COX-1, CSFIR, CTS-1, 시토신 데아미나제, DBCCR-1, DCC, Dp, DPC-4, E1A, E2F, EBRB2, erb, ERBA, ERBB, ETS1, ETS2, ETV6, Fab, FCC, FGF, FGR, FHIT, fms, FOX, FUS1, FYN, G-CSF, GDAIF, 유전자 21 (NPRL2), 유전자 26 (CACNA2D2), GM-CSF, GMF, gsp, HCR, HIC-1, HRAS, hst, IGF, IL-1, IL-2, IL-3, IL-5, IL-6, IL-7, IL-8, IL-9, IL-11, ING1, 인터페론 α, 인터페론 β, 인터페론 γ, IRF-1, JUN, KRAS, LUCA-1 (HYAL1), LUCA-2 (HYAL2), LYN, MADH4, MADR2, MCC, mda7, MDM2, MEN-I, MEN-II, MLL, MMAC1, MYB, MYC, MYCL1, MYCN, neu, NF-1, NF-2, NGF, NOEY1, NOEY2, NRAS, NT3, NT5, OVCA1, p16, p21, p27, p57, p73, p300, PGS, PIM1, PL6, PML, PTEN, raf, Rap1A, ras, Rb, RB1, RET, rks-3, ScFv, scFV ras, SEM A3, SRC, TALI, TCL3, TFPI, 트롬보스폰딘, 티미딘 키나제, TNF, TP53, trk, T-VEC, VEGF, VHL, WT1, WT-1, YES, 및 zac1을 포함한다. 예시적인 유효 유전자 요법은 종양을 억제 또는 제거하거나, 암 세포 수의 감소, 종양 크기의 감소를 발생시키거나, 종양 성장을 둔화 또는 제거하거나, 또는 종양에 의해 유발된 증상을 완화시킬 수 있다.

또 다른 예로서, 치료 유전자는 감염성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 감염성 질환은 인간 면역결핍 바이러스 (HIV)이다. 치료 유전자는, 예를 들어 면역 세포를 HIV 감염에 대해 저항성이 되게 하는 유전자일 수 있거나, 또는 면역 재구축, 면역 세포에 의해 발현되는 단백질을 코딩하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우기에 유리한 유전자, 감염원, 수용체 또는 보조수용체를 코딩하는 유전자; 수용체 또는 보조수용체에 대한 리간드를 코딩하는 유전자; 특정 전사 인자의 작용을 차단하기 위한 리보자임, 안티센스 RNA, 소형 간섭 RNA (siRNA) 또는 디코이 RNA를 코딩하는 유전자를 포함한, 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인 및 자살 유전자를 코딩하는 유전자를 통해 면역 세포가 바이러스를 효과적으로 중화시킬 수 있게 하는 것일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료 유효량은, 예를 들어 HIV에 대한 대상체의 면역을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 호전시키거나, 또는 대상체에서 HIV에 대한 선천성 또는 적응성 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산을 포함할 수 있고, AIDS의 예방을 발생시킬 수 있고/거나 대상체의 AIDS 또는 HIV 감염의 증상을 호전시킬 수 있거나, 또는 HIV 감염성 및/또는 병독성을 감소 또는 제거할 수 있다.

(IV-c) 항체, CAR, 및 TCR

치료 유전자 및/또는 유전자 생성물에 더하여, 코딩 서열은 또한 치료 분자, 예컨대 항체, 1종 이상의 암 항원에 특이적인 키메라 항원 수용체 분자 및/또는 1종 이상의 암 항원에 특이적인 T-세포 수용체를 코딩할 수 있다.

원치않는 세포 유형, 예컨대 암 세포를 표적화하고 사멸시키도록 면역계의 T 세포를 유전자 조작하는 것에서 유의한 진전이 이루어졌다. 많은 이들 T 세포는 키메라 항원 수용체 (CAR) 구축물을 발현하도록 유전자 조작되었다. CAR은 유전자 변형된 T 세포가 암 세포를 인식하고 사멸시키도록 하는 여러 별개의 하위성분을 포함하는 단백질이다. 하위성분은 적어도 세포외 성분 및 세포내 성분을 포함한다.

세포외 성분은 원치않는 세포의 표면 상에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함한다. 결합 도메인이 이러한 마커에 결합하는 경우에, 세포내 성분은 T 세포가 결합된 암 세포를 파괴하도록 지시한다. 결합 도메인은 전형적으로 모노클로날 항체 (mAb)로부터 유래된 단일-쇄 가변 단편 (scFv)이지만, 항체-유사 항원 결합 부위를 포함하는 다른 포맷에 기초할 수 있다.

세포내 성분은 이펙터 도메인의 포함에 기초하여 활성화 신호를 제공한다. 제1 세대 CAR은 이펙터 도메인으로서 CD3ζ의 세포질 영역을 이용하였다. 제2 세대 CAR은 CD3ζ를 분화 클러스터 28 (CD28) 또는 4-1BB (CD137)와 조합하여 이용한 한편, 제3 세대 CAR은 CD3ζ를 세포내 이펙터 도메인 내의 CD28 및 4-1BB와 조합하여 이용하였다.

CAR은 일반적으로 또한 분자 내에서 다양한 목적을 위해 사용되는 1개 이상의 링커 서열을 포함한다. 예를 들어, 막횡단 도메인은 CAR의 세포외 성분을 세포내 성분에 연결하기 위해 사용될 수 있다. 결합 도메인에 대해 막-근위인 스페이서 영역으로서 종종 지칭되는 가요성 링커 서열은 결합 도메인과 세포 막 사이에 추가의 거리를 생성하는데 사용될 수 있다. 이는 막에의 근접성에 기초하여 결합에 대한 입체 장애를 감소시키는데 유익할 수 있다. 표적화되는 세포 마커에 따라, 더 조밀한 스페이서 또는 더 긴 스페이서가 사용될 수 있다. 다른 잠재적 CAR 하위성분은 본원의 다른 곳에 보다 상세히 기재되어 있다. CAR의 성분은 이제 하기와 같이 추가로 상세하게 기재된다: 결합 도메인; 세포내 신호전달 성분; 링커; 막횡단 도메인; 접합부 아미노산; 및 제어 특색 포함 태그 카세트. 결합 도메인에 관한 설명은 또한 치료 분자로서의 항체와 관련된다.

결합 도메인. 결합 도메인은 세포 마커에 결합하여 복합체를 형성하는 임의의 물질을 포함한다. 결합 도메인의 선택은 표적 세포의 표면을 규정하는 세포 마커의 유형 및 수에 좌우될 수 있다. 결합 도메인의 예는 세포 마커 리간드, 수용체 리간드, 항체, 펩티드, 펩티드 압타머, 수용체 (예를 들어, T 세포 수용체), 키메라 항원 수용체 (CAR), 또는 그의 조합 및 조작된 단편 또는 포맷을 포함한다.

항체는 결합 도메인의 한 예이고, 세포 마커에 특이적으로 결합하는 전체 항체 또는 항체의 결합 단편, 예를 들어 Fv, Fab, Fab', F(ab')₂, 및 단일 쇄 (sc) 형태 및 그의 단편을 포함한다. 항체 또는 항원 결합 단편은 폴리클로날 항체, 모노클로날 항체, 인간 항체, 인간화 항체, 합성 항체, 비-인간 항체, 재조합 항체, 키메라 항체, 이중특이적 항체, 미니바디, 및 선형 항체의 전부 또는 일부를 포함할 수 있다.

항체는 2개의 유전자, 중쇄 유전자 및 경쇄 유전자로부터 생산된다. 일반적으로, 항체는 중쇄의 2개의 동일한 카피 및 경쇄의 2개의 동일한 카피를 포함한다. 가변 중쇄 및 가변 경쇄 내에서, 상보성 결정 영역 (CDR)으로 지칭되는 절편은 에피토프 결합을 좌우한다. 각각의 중쇄는 3개의 CDR (즉, CDRH1, CDRH2, 및 CDRH3)을 갖고, 각각의 경쇄는 3개의 CDR (즉, CDRL1, CDRL2, 및 CDRL3)을 갖는다. CDR 영역은 프레임워크 잔기 (FR)에 플랭킹된다.

일부 경우에, 결합 도메인은 궁극적으로 사용될 동일한 종으로부터 유래되는 것이 유익하다. 예를 들어, 인간에서의 사용을 위해, 항원 결합 도메인은 인간 항체, 인간화 항체, 또는 그의 단편 또는 조작된 형태를 포함하는 것이 유익할 수 있다. 인간 기원으로부터의 항체 또는 인간화 항체는 인간에서 저하된 면역원성을 갖거나 또는 면역원성을 갖지 않고, 비-인간 항체와 비교하여 더 낮은 수의 비-면역원성 에피토프를 갖는다. 항체 및 그의 조작된 단편은 일반적으로 인간 대상체에서 감소된 수준의 항원성을 갖거나 또는 갖지 않도록 선택될 것이다.

특정한 실시양태에서, 결합 도메인은 인간화 항체 또는 그의 조작된 단편을 포함한다. 특정한 실시양태에서, 비-인간 항체는 인간화 항체이며, 여기서 항체의 적어도 1개의 아미노산 잔기는 인간에서 자연적으로 생산된 항체 또는 그의 단편과의 유사성을 증가시키도록 변형된다. 이들 비인간 아미노산 잔기는 종종 "유입" 잔기로 지칭되며, 이는 전형적으로 "유입" 가변 도메인으로부터 취해진다. 본원에 제공된 바와 같이, 인간화 항체 또는 항체 단편은 비인간 이뮤노글로불린 분자로부터의 1개 이상의 CDR 및 프레임워크 영역을 포함하며, 여기서 프레임워크를 포함한 아미노산 잔기는 완전히 또는 대부분 인간 배선으로부터 유래된다. 한 측면에서, 항원 결합 도메인은 인간화된다. 인간화 항체는 CDR-그라프팅 (예를 들어, 유럽 특허 번호 EP 239,400; WO 91/09967; 및 US 5,225,539, US 5,530,101, 및 US 5,585,089 참조), 베니어링 또는 재표면화 (예를 들어, EP 592,106 및 EP 519,596; 문헌 [Padlan, Molecular Immunology, 28(4/5):489-498, 1991; Studnicka et al., Protein Engineering, 7(6):805-81, 19944; 및 Roguska et al., PNAS, 91:969-973, 1994] 참조), 쇄 셔플링 (예를 들어, 미국 특허 번호 5,565,332 참조), 및 예를 들어 미국 공개 번호 2005/0042664, 미국 공개 번호 2005/0048617, 미국 특허 번호 6,407,213, 미국 특허 번호 5,766,886, WO 9317105, 문헌 [Tan et al., J. Immunol., 169:1119-25, 2002, Caldas et al., Protein Eng., 13(5):353-60, 2000, Morea et al., Methods, 20(3):267-79, 2000, Baca et al., J. Biol. Chem., 272(16): 10678-84, 1997, Roguska et al., Protein Eng., 9(10):895-904, 1996, Couto et al., Cancer Res., 55 (23 Supp):5973s-5977s, 1995, Couto et al., Cancer Res., 55(8):1717-22, 1995, Sandhu, Gene, 150(2):409-10, 1994, 및 Pedersen et al., J. Mol. Biol., 235(3):959-73, 1994]에 개시된 기술을 비롯한 관련 기술분야에 공지된 다양한 기술을 사용하여 생산될 수 있다. 종종, 프레임워크 영역 내의 프레임워크 잔기는 세포 마커 결합을 변경, 예를 들어 개선시키기 위해 CDR 공여자 항체로부터의 상응하는 잔기로 치환될 것이다. 이들 프레임워크 치환은 관련 기술분야에 널리 공지된 방법에 의해, 예를 들어 세포 마커 결합에 중요한 프레임워크 잔기를 확인하기 위한 CDR 및 프레임워크 잔기의 상호작용의 모델링 및 특정한 위치에서 비통상적인 프레임워크 잔기를 확인하기 위한 서열 비교에 의해 확인된다. (예를 들어, 미국 특허 번호 5,585,089; 및 문헌 [Riechmann et al., Nature, 332:323, 1988] 참조).

세포 마커에 특이적으로 결합하는 결합 도메인을 갖는 항체는 관련 기술분야의 통상의 기술자에게 공지된 바와 같은 모노클로날 항체를 수득하는 방법, 파지 디스플레이 방법, 인간 또는 인간화 항체를 생성하는 방법, 또는 항체를 생산하도록 조작된 트랜스제닉 동물 또는 식물을 사용하는 방법을 사용하여 제조될 수 있다 (예를 들어, US 6,291,161 및 US 6,291,158 참조). 부분 또는 완전 합성 항체의 파지 디스플레이 라이브러리가 이용가능하고, 세포 마커에 결합할 수 있는 항체 또는 그의 단편에 대해 스크리닝될 수 있다. 예를 들어, 결합 도메인은 세포 마커에 특이적으로 결합하는 Fab 단편에 대해 Fab 파지 라이브러리를 스크리닝함으로써 확인될 수 있다 (문헌 [Hoet et al., Nat. Biotechnol. 23:344, 2005] 참조). 인간 항체의 파지 디스플레이 라이브러리가 또한 이용가능하다. 추가적으로, 편리한 시스템 (예를 들어, 마우스, HuMAb 마우스® (젠팜 인터내셔널 인크.(GenPharm Int'l. Inc.), 캘리포니아주 마운틴 뷰), TC 마우스® (키린 파마 캄파니 리미티드(Kirin Pharma Co. Ltd.), 일본 도쿄), KM-마우스® (메다렉스, 인크.(Medarex, Inc.), 뉴저지주 프린스턴), 라마, 닭, 래트, 햄스터, 토끼 등)에서 면역원으로서 세포 마커를 사용하는 하이브리도마 개발을 위한 전통적인 전략을 사용하여 결합 도메인을 개발할 수 있다. 일단 확인되면, 항체의 아미노산 서열 및 항체를 코딩하는 유전자 서열을 단리 및/또는 결정할 수 있다.

일부 경우에, scFv는 관련 기술분야에 공지된 방법에 따라 제조될 수 있다 (예를 들어, 문헌 [Bird et al., Science 242:423-426 1988; 및 Huston et al., Proc. Natl. Acad. Sci. USA 85:5879-5883, 1988] 참조). ScFv 분자는 가요성 폴리펩티드 링커를 사용하여 항체의 VH 및 VL 영역을 함께 연결함으로써 생산될 수 있다. 짧은 폴리펩티드 링커가 사용되는 경우 (예를 들어, 5-10개 아미노산), 쇄내 폴딩이 방지된다. 2개의 가변 영역을 함께 모아 기능적 에피토프 결합 부위를 형성하기 위해 쇄간 폴딩이 또한 요구된다. 링커 배향 및 크기의 예에 대해서는, 예를 들어 문헌 [Hollinger et al., Proc Natl Acad. Sci. U.S.A. 90:6444-6448, 1993], 미국 공개 번호 2005/0100543, 미국 공개 번호 2005/0175606, 미국 공개 번호 2007/0014794, 및 WO2006/020258 및 WO2007/024715를 참조한다. 보다 특히, scFv의 VL 및 VH를 연결하는데 사용되는 링커 서열은 일반적으로 5 내지 35개 아미노산 길이이다. 특정한 실시양태에서, VL-VH 링커는 5 내지 35개, 10 내지 30개의 아미노산 또는 15 내지 25개의 아미노산을 포함한다. 링커 길이의 변동은 활성을 유지 또는 증진시켜, 활성 연구에서 우수한 효능을 발생시킬 수 있다. scFv는 CAR의 결합 도메인으로서 통상적으로 사용된다.

항체-기반 결합 도메인 포맷의 추가의 예는 scFv-기반 그라바바디 및 가용성 VH 도메인 항체를 포함한다. 이들 항체는 오직 중쇄 가변 영역만을 사용하여 결합 영역을 형성한다. 예를 들어, 문헌 [Jespers et al., Nat. Biotechnol. 22:1161, 2004; Cortez-Retamozo et al., Cancer Res. 64:2853, 2004; Baral et al., Nature Med. 12:580, 2006; 및 Barthelemy et al., J. Biol. Chem. 283:3639, 2008]을 참조한다.

특정한 실시양태에서, 본 개시내용의 결합 도메인 내의 VL 영역은 공지된 모노클로날 항체의 VL로부터 유래되거나 또는 이를 기초로 하고, 공지된 모노클로날 항체의 VL과 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유한다. 삽입, 결실 또는 치환은 VL 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VL 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.

특정한 실시양태에서, 본 개시내용의 결합 도메인 VH 영역은 공지된 모노클로날 항체의 VH로부터 유래되거나 또는 이를 기초로 할 수 있고, 공지된 모노클로날 항체의 VH와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유할 수 있다. 삽입, 결실 또는 치환은 VH 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VH 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.

특정한 실시양태에서, 결합 도메인은 경쇄 가변 영역 (VL)의 아미노산 서열 또는 중쇄 가변 영역 (VH), 또는 둘 다에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열이거나 또는 이를 포함하며, 여기서 각각의 CDR은 관심 세포 마커에 특이적으로 결합하는 모노클로날 항체 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.

결합 도메인의 대안적 공급원은 무작위 펩티드 라이브러리를 코딩하는 서열 또는 대안적 비-항체 스캐폴드, 예컨대 단일 쇄 (sc) T-세포 수용체 (scTCR) (예를 들어, 문헌 [Lake et al., Int. Immunol. 11:745, 1999; Maynard et al., J. Immunol. Methods 306:51, 2005]; US 8,361,794 참조), 피브리노겐 도메인 (예를 들어, 문헌 [Weisel et al., Science 230:1388, 1985] 참조), 쿠니츠 도메인 (예를 들어, US 6,423,498 참조), 설계된 안키린 반복 단백질 (DARPin; 문헌 [Binz et al., J. Mol. Biol. 332:489, 2003 및 Binz et al., Nat. Biotechnol. 22:575, 2004]), 피브로넥틴 결합 도메인 (애드넥틴 또는 모노바디; 문헌 [Richards et al., J. Mol. Biol. 326:1475, 2003; Parker et al., Protein Eng. Des. Selec. 18:435, 2005 및 Hackel et al., J. Mol. Biol. 381:1238-1252, 2008]), 시스테인-노트 미니단백질 (Vita et al., Proc. Nat'l. Acad. Sci. (USA) 92:6404-6408, 1995; Martin et al., Nat. Biotechnol. 21:71, 2002 및 Huang et al., Structure 13:755, 2005), 테트라트리코펩티드 반복 도메인 (Main et al., Structure 11:497, 2003 및 Cortajarena et al., ACS Chem. Biol. 3:161, 2008), 류신-풍부 반복 도메인 (Stumpp et al., J. Mol. Biol. 332:471, 2003), 리포칼린 도메인 (예를 들어, WO 2006/095164, 문헌 [Beste et al., Proc. Nat'l. Acad. Sci. (USA) 96:1898, 1999 및 Schoenfeld et al., Proc. Nat'l. Acad. Sci. (USA) 106:8198, 2009] 참조), V-유사 도메인 (예를 들어, US 2007/0065431 참조), C-유형 렉틴 도메인 (Zelensky & Gready, FEBS J. 272:6179, 2005; Beavil et al., Proc. Nat'l. Acad. Sci. (USA) 89:753, 1992 및 Sato et al., Proc. Nat'l. Acad. Sci. (USA) 100:7779, 2003), 항원 결합 도메인을 갖는 mAb2 또는 Fc-영역 (Fcab™ (에프-스타 바이오테크놀로지(F-Star Biotechnology), 영국 캠브리지; 예를 들어 WO 2007/098934 및 WO 2006/072620 참조), 아르마딜로 반복 단백질 (예를 들어, 문헌 [Madhurantakam et al., Protein Sci. 21: 1015, 2012]; WO 2009/040338 참조), 아필린 (Ebersbach et al., J. Mol. Biol. 372: 172, 2007), 아피바디, 아비머, 노틴, 피노머, 아트리머, 세포독성 T-림프구 연관 단백질-4 (Weidle et al., Cancer Gen. Proteo. 10:155, 2013) 등의 루프 영역 내의 조작된 다양한 아미노산을 코딩하는 서열을 포함한다 (Nord et al., Protein Eng. 8:601, 1995; Nord et al., Nat. Biotechnol. 15:772, 1997; Nord et al., Euro. J. Biochem. 268:4269, 2001; Binz et al., Nat. Biotechnol. 23:1257, 2005; Boersma & Plueckthun, Curr. Opin. Biotechnol. 22:849, 2011).

펩티드 압타머는 양쪽 말단에서 단백질 스캐폴드에 부착된 펩티드 루프 (이는 세포 마커에 특이적임)를 포함한다. 이러한 이중 구조적 제약은 펩티드 압타머의 결합 친화도를 항체에 대등한 수준으로 증가시킨다. 가변 루프 길이는 전형적으로 8 내지 20개 아미노산이고, 스캐폴드는 안정하고, 가용성이고, 작고, 비-독성인 임의의 단백질일 수 있다. 펩티드 압타머 선택은 상이한 시스템, 예컨대 효모 2-하이브리드 시스템 (예를 들어, Gal4 효모-2-하이브리드 시스템), 또는 LexA 상호작용 트랩 시스템을 사용하여 이루어질 수 있다.

특정한 실시양태에서, 결합 도메인은 Vα/β 및 Cα/β 쇄 (예를 들어, Vα-Cα, Vβ-Cβ, Vα-Vβ)를 포함하거나 또는 세포 마커 펩티드-MHC 복합체에 특이적인 Vα-Cα, Vβ-Cβ, Vα-Vβ 쌍을 포함하는 sc T 세포 수용체 (scTCR)이다.

특정한 실시양태에서, 조작된 결합 도메인은 Vα, Vβ, Cα, 또는 Cβ로부터 유래되거나 또는 이를 기초로 하는 Vα, Vβ, Cα, 또는 Cβ 영역을 포함하고, 언급된 Vα, Vβ, Cα, 또는 Cβ와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 포함한다. 삽입, 결실 또는 치환은 V_L, V_H, Vα, Vβ, Cα, 또는 Cβ 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이들 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 Vα, Vβ, Cα, 또는 Cβ 영역을 함유하는 표적 결합 도메인은 여전히 야생형과 유사한 친화도 및 작용으로 그의 표적에 특이적으로 결합할 수 있다.

특정한 실시양태에서, 조작된 결합 도메인은 공지되거나 확인된 결합 도메인의 아미노산 서열에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열을 포함하고, 여기서 각각의 CDR은 표적화된 세포 마커에 특이적으로 결합하는 공지되거나 확인된 결합 도메인 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.

주어진 CDR 또는 FR의 정확한 아미노산 서열 경계는 문헌 [Kabat et al., (1991) "Sequences of Proteins of Immunological Interest," 5th Ed. Public Health Service, National Institutes of Health, Bethesda, Md. (카바트 넘버링 스킴); Al-Lazikani et al., J Mol Biol 273: 927-948, 1997 (코티아 넘버링 스킴); Maccallum et al., J Mol Biol 262: 732-745, 1996 (접촉 넘버링 스킴); Martin et al., Proc. Natl. Acad. Sci., 86: 9268-9272, 1989 (AbM 넘버링 스킴); Lefranc et al., Dev Comp Immunol 27(1): 55-77, 2003 (IMGT 넘버링 스킴); 및 Honegger & Pluckthun, J Mol Biol 309(3): 657-670, 2001 ("Aho" 넘버링 스킴)]에 기재된 것을 포함한, 널리 공지된 다수의 스킴 중 임의의 것을 사용하여 용이하게 결정될 수 있다. 주어진 CDR 또는 FR의 경계는 확인에 사용된 스킴에 따라 달라질 수 있다. 예를 들어, 카바트 스킴은 구조적 정렬에 기초하는 반면, 코티아 스킴은 구조적 정보에 기초한다. 카바트 및 코티아 스킴 둘 다에 대한 넘버링은 가장 통상적인 항체 영역 서열 길이에 기초하며, 삽입은 삽입 문자, 예를 들어 "30a"에 의해 제공되고, 결실이 일부 항체에서 나타난다. 2개의 스킴은 상이한 위치에 특정 삽입 및 결실 ("indel")을 배치하여, 차등 넘버링을 생성한다. 접촉 스킴은 복잡한 결정 구조의 분석을 기초로 하고, 많은 측면에서 코티아 넘버링 스킴과 유사하다. 특정한 실시양태에서, 본원에 개시된 항체 CDR 서열은 카바트 넘버링에 따른다.

CAR은 특정 표적에 결합하여 반응을 도출하도록 설계된 조작된 수용체이다. CAR은 세포 상에서 발현되는 경우에 유전자 변형된 세포가 원치않는 세포, 예컨대 암 세포 또는 바이러스-감염된 세포를 인식하고 사멸시키도록 하는 여러 별개의 하위성분을 포함한다. 하위성분은 적어도 세포외 성분 및 세포내 성분을 포함한다. 세포외 성분은 원치않는 세포의 표면 상에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함한다. 결합 도메인이 이러한 마커에 결합하는 경우에, 세포내 성분은 유전자 변형된 세포를 활성화시켜 결합된 세포를 파괴한다. CAR은 세포외 성분을 세포내 성분에 연결하는 막횡단 도메인, 및 CAR의 기능을 증가시킬 수 있는 다른 하위성분을 추가적으로 포함한다. 예를 들어, 1개 이상의 링커 서열, 예컨대 스페이서 영역의 포함은 CAR이 추가의 입체형태적 가요성을 갖도록 하여, 종종 표적화된 세포 마커에 결합하는 결합 도메인의 능력을 증가시킬 수 있다.

CAR의 세포외 도메인은 결합 도메인을 포함한다. 결합 도메인은 이전에 논의되었고, 항체, scFv, 리간드, 펩티드, 펩티드 압타머, 또는 수용체를 포함할 수 있다.

특정한 실시양태에서, 조작된 CAR은 공지되거나 확인된 TCR Vα, Vβ, Cα, 또는 Cβ의 아미노산 서열에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열을 포함하고, 여기서 각각의 CDR은 표적화된 세포 마커에 특이적으로 결합하는 TCR 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.

특정한 실시양태에서, 조작된 CAR은 공지되거나 확인된 TCR (예를 들어, 고친화도 TCR)의 Vα, Vβ, Cα, 또는 Cβ로부터 유래되거나 또는 이를 기초로 하는 Vα, Vβ, Cα, 또는 Cβ 영역을 포함하고, 공지되거나 확인된 TCR의 Vα, Vβ, Cα, 또는 Cβ와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 포함한다. 삽입, 결실 또는 치환은 Vα, Vβ, Cα, 또는 Cβ 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이들 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 Vα, Vβ, Cα, 또는 Cβ 영역을 함유하는 표적 결합 도메인은 여전히 야생형과 유사한 친화도 및 작용으로 그의 표적에 특이적으로 결합할 수 있다.

특정한 실시양태에서, CAR의 결합 도메인은 경쇄 가변 영역 (VL)의 아미노산 서열 또는 중쇄 가변 영역 (VH), 또는 둘 다에 대해 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열이거나 또는 이를 포함하며, 여기서 각각의 CDR은 관심 세포 마커에 특이적으로 결합하는 모노클로날 항체 또는 그의 단편 또는 유도체로부터 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함한다.

특정한 실시양태에서, 본 개시내용의 CAR 내의 VL 영역은 공지된 모노클로날 항체의 VL로부터 유래되거나 또는 이를 기초로 하고, 공지된 모노클로날 항체의 VL과 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유한다. 삽입, 결실 또는 치환은 VL 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VL 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.

특정한 실시양태에서, 본 개시내용의 CAR 내의 결합 도메인 VH 영역은 공지된 모노클로날 항체의 VH로부터 유래되거나 또는 이를 기초로 할 수 있고, 공지된 모노클로날 항체의 VH와 비교했을 때 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 삽입, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 결실, 1개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10개)의 아미노산 치환 (예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 함유할 수 있다. 삽입, 결실 또는 치환은 VH 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역 내의 임의의 곳에서 이루어질 수 있고, 단 각각의 CDR은 0개의 변화 또는 최대 1, 2, 또는 3개의 변화를 포함하고, 변형된 VH 영역을 함유하는 결합 도메인은 여전히 야생형 결합 도메인과 유사한 친화도로 그의 표적에 특이적으로 결합할 수 있다.

전립선암과 연관된 특정한 세포 마커는 PSMA, WT1, 전립선줄기 세포 항원 (PSCA), 및 SV40 T를 포함한다. 유방암과 연관된 특정한 세포 마커는 HER2 및 ERBB2를 포함한다. 난소암과 연관된 특정한 세포 마커는 L1-CAM, MUC16의 세포외 도메인 (MUC-CD), 폴레이트 결합 단백질 (폴레이트 수용체), 루이스 Y, 메소텔린, 및 WT-1을 포함한다. 췌장암과 연관된 특정한 세포 마커는 메소텔린, CEA 및 CD24를 포함한다. 다발성 골수종과 연관된 특정한 세포 마커는 BCMA, GPRC5D, CD38, 및 CS-1을 포함한다. 백혈병 및/또는 림프종과 연관된 특정한 마커는 CLL-1, CD123, CD33, 및 PD-L1을 포함한다.

특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 Her2에 결합한다. 특정한 실시양태에서, HER2에 결합하는 결합 도메인은 트라스투주맙 (헤르셉틴)으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 8을 포함하는 CDRL1 서열, 서열식별번호: 9를 포함하는 CDRL2 서열, 및 서열식별번호: 10을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 11을 포함하는 CDRH1 서열, 서열식별번호: 12를 포함하는 CDRH2 서열, 및 서열식별번호: 13을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.

특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 PD-L1에 결합한다. 특정한 실시양태에서, PD-L1에 결합하는 결합 도메인은 펨브롤리주맙 또는 FAZ053 (노파르티스(Novartis)) 중 적어도 1종으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 14를 포함하는 CDRL1 서열, 서열식별번호: 15를 포함하는 CDRL2 서열, 및 서열식별번호: 16을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 17을 포함하는 CDRH1 서열, 서열식별번호: 18을 포함하는 CDRH2 서열, 및 서열식별번호: 19를 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.

PD-L1에 대한 예시적인 결합 도메인은 아벨루맙 또는 아테졸리주맙을 포함할 수 있거나 또는 그로부터 유래될 수 있다. 특정한 실시양태에서, 아벨루맙의 가변 중쇄는 서열식별번호: 20을 포함한다.

특정한 실시양태에서, 아벨루맙의 가변 경쇄는 서열식별번호: 21을 포함한다.

특정한 실시양태에서, 아벨루맙의 CDR 영역은 CDRH1 (서열식별번호: 22); CDRH2 (서열식별번호: 23); CDRH3 (서열식별번호: 24); CDRL1 (서열식별번호: 25); CDRL2 (서열식별번호: 26); 및 CDRL3 (서열식별번호: 27)을 포함한다.

특정한 실시양태에서, 아테졸리주맙의 가변 중쇄는 서열식별번호: 28을 포함한다. 특정한 실시양태에서, 아테졸리주맙의 가변 경쇄는 서열식별번호: 29를 포함한다.

특정한 실시양태에서, 아테졸리주맙의 CDR 영역은 CDRH1 (서열식별번호: 30); CDRH2 (서열식별번호: 31); CDRH3 (서열식별번호: 32); CDRL1 (서열식별번호: 33); CDRL2 (서열식별번호: 34); 및 CDRL3 (서열식별번호: 35)을 포함한다.

특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 PSMA에 결합한다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 36을 포함하는 CDRL1 서열, 서열식별번호: 37을 포함하는 CDRL2 서열, 서열식별번호: 38을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 39를 포함하는 CDRH1 서열, 서열식별번호: 40을 포함하는 CDRH2 서열, 및 서열식별번호: 41을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.

특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 MUC16에 결합한다. 특정한 실시양태에서, 결합 도메인은 인간 또는 인간화 도메인이고, 서열식별번호: 42를 포함하는 CDRL1 서열, GAS를 포함하는 CDRL2 서열, 서열식별번호: 43을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정한 실시양태에서, 결합 도메인은 인간 또는 인간화 도메인이고, 서열식별번호: 44를 포함하는 CDRH1 서열, 서열식별번호: 45를 포함하는 CDRH2 서열, 및 서열식별번호: 46을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.

특정한 실시양태에서, CAR의 결합 도메인은 세포 마커 FOLR에 결합한다. 특정한 실시양태에서, FOLR에 결합하는 결합 도메인은 파를레투주맙으로부터 유래된다. 특정한 실시양태에서, 결합 도메인은 서열식별번호: 47을 포함하는 CDRL1 서열, 서열식별번호: 48을 포함하는 CDRL2 서열, 및 서열식별번호: 49를 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열식별번호: 50을 포함하는 CDRH1 서열, 서열식별번호: 51을 포함하는 CDRH2 서열, 및 서열식별번호: 52를 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.

메소텔린에 대한 예시적인 결합 도메인은 아마툭시맙을 포함할 수 있거나 또는 그로부터 유래될 수 있다.

특정한 실시양태에서, 아마툭시맙의 가변 중쇄는 서열식별번호: 53을 포함한다. 특정한 실시양태에서, 아마툭시맙의 가변 경쇄는 서열식별번호: 54를 포함한다.

특정한 실시양태에서, 아마툭시맙의 CDR 영역은 CDRH1 (서열식별번호: 55); CDRH2 (서열식별번호: 56); CDRH3 (서열식별번호: 57); CDRL1 (서열식별번호: 58); CDRL2 (서열식별번호: 59); 및 CDRL3 (서열식별번호: 60)을 포함한다.

또한, 예를 들어 감염원 항원에 결합함으로써 감염원 작용제에 특이적인 결합 도메인이 고려된다. 이들은 예를 들어 바이러스 감염된 세포에 의해 발현되는 예를 들어 바이러스 항원 또는 다른 바이러스 마커를 포함한다. 예시적인 바이러스는 아데노바이러스, 아레나바이러스, 분야바이러스, 코로나바이러스, 플라비바이러스, 한타바이러스, 헤파드나바이러스, 헤르페스바이러스, 유두종바이러스, 파라믹소바이러스, 파르보바이러스, 피코르나바이러스, 폭스바이러스, 오르토믹소바이러스, 레트로바이러스, 레오바이러스, 랍도바이러스, 로타바이러스, 해면상 바이러스 또는 토가바이러스를 포함한다. 추가의 실시양태에서, 바이러스 항원 마커는 CMV, 콜드 바이러스, 엡스타인-바르, 플루 바이러스, A형, B형, 및 C형 간염 바이러스, 단순 포진, HIV, 인플루엔자, 일본 뇌염, 홍역, 소아마비, 광견병, 호흡기 세포융합, 풍진, 천연두, 수두 대상포진 또는 웨스트 나일 바이러스에 의해 발현된 펩티드를 포함한다.

추가의 특정한 예로서, 시토메갈로바이러스 항원은 외피 당단백질 B 및 CMV pp65를 포함하고; 엡스타인-바르 항원은 EBV EBNAI, EBV P18, 및 EBV P23을 포함하고; 간염 항원은 HBV의 S, M, 및 L 단백질, HBV의 프리-S 항원, HBCAG 델타, HBV HBE, C형 간염 바이러스 RNA, HCV NS3 및 HCV NS4를 포함하고; 단순 포진 바이러스 항원은 극초기 단백질 및 당단백질 D를 포함하고; HIV 항원은 gag, pol, 및 env 유전자의 유전자 생성물 예컨대 HIV gp32, HIV gp41, HIV gp120, HIV gp160, HIV P17/24, HIV P24, HIV P55 GAG, HIV P66 POL, HIV TAT, HIV GP36, Nef 단백질 및 리버스 트랜스크립타제를 포함하고; 인플루엔자 항원은 헤마글루티닌 및 뉴라미니다제를 포함하고; 일본 뇌염 바이러스 항원은 단백질 E, M-E, M-E-NS1, NS1, NS1-NS2A 및 80% E를 포함하고; 홍역 항원은 홍역 바이러스 융합 단백질을 포함하고; 광견병 항원은 광견병 당단백질 및 광견병 핵단백질을 포함하고; 호흡기 세포융합 바이러스 항원은 RSV 융합 단백질 및 M2 단백질을 포함하고; 로타바이러스 항원은 VP7sc를 포함하고; 풍진 항원은 단백질 E1 및 E2를 포함하고; 수두 대상포진 바이러스 항원은 gpI 및 gpII를 포함한다. 추가의 특정한 예시적인 바이러스 항원 서열은 Nef (66-97) (서열식별번호: 61); Nef (116-145) (서열식별번호: 62); Gag p17 (17-35) (서열식별번호: 63); Gag p17-p24 (253-284) (서열식별번호: 64); 및 Pol 325-355 (RT 158-188) (서열식별번호: 65)를 포함한다. 바이러스 항원의 추가의 예에 대해서는 문헌 [Fundamental Virology, Second Edition, eds. Fields, B. N. and Knipe, D. M. (Raven Press, New York, 1991)]을 참조한다.

세포내 신호전달 성분. CAR의 세포내 또는 다른 세포질 신호전달 성분은 CAR이 발현되는 세포의 활성화를 담당한다. 용어 "세포내 신호전달 성분" 또는 "세포내 성분"은 따라서 활성화 신호를 전달하기에 충분한 세포내 도메인의 임의의 부분을 포함하는 것으로 의도된다. 발현된 CAR의 세포내 성분은 이펙터 도메인을 포함할 수 있다. 이펙터 도메인은 적절한 신호의 수신 시 세포에서 생물학적 또는 생리학적 반응을 직접적으로 또는 간접적으로 촉진할 수 있는 융합 단백질 또는 수용체의 세포내 부분이다. 특정 실시양태에서, 이펙터 도메인은 결합 시 신호를 수신하는 단백질 또는 단백질 복합체의 일부이거나, 또는 이펙터 도메인으로부터의 신호를 촉발하는 표적 분자에 직접적으로 결합한다. 이펙터 도메인은 1개 이상의 신호전달 도메인 또는 모티프, 예컨대 면역수용체 티로신-기반 활성화 모티프 (ITAM)를 함유하는 경우에 세포 반응을 직접적으로 촉진할 수 있다. 다른 실시양태에서, 이펙터 도메인은 세포 반응을 직접적으로 촉진하는 1종 이상의 다른 단백질, 예컨대 공동-자극 도메인과 회합함으로써 세포 반응을 간접적으로 촉진할 것이다.

이펙터 도메인은 암 세포에 의해 발현된 세포 마커에 결합 시 변형된 세포의 적어도 1종의 기능의 활성화를 제공할 수 있다. 변형된 세포의 활성화는 분화, 증식 및/또는 활성화 중 1종 이상 또는 다른 이펙터 기능을 포함할 수 있다. 특정한 실시양태에서, 이펙터 도메인은 T 세포 수용체, 및 공동-수용체 또는 공동-자극 분자로부터의 세포질 서열을 포함할 수 있는 공동-자극 도메인을 포함한 세포내 신호전달 성분을 포함할 수 있다.

이펙터 도메인은 1, 2, 3개 또는 그 초과의 수용체 신호전달 도메인, 세포내 신호전달 성분 (예를 들어, 세포질 신호전달 서열), 공동-자극 도메인, 또는 그의 조합을 포함할 수 있다. 예시적인 이펙터 도메인은 4-1BB (CD137), CARD11, CD3γ, CD3δ, CD3ε, CD3ζ, CD27, CD28, CD79A, CD79B, DAP10, FcRα, FcRβ (FcεR1b), FcRγ, Fyn, HVEM (LIGHTR), ICOS, LAG3, LAT, Lck, LRP, NKG2D, NOTCH1, pTα, PTCH2, OX40, ROR2, Ryk, SLAMF1, Slp76, TCRα, TCRβ, TRIM, Wnt, Zap70, 또는 그의 임의의 조합으로부터 선택된 신호전달 및 자극 도메인을 포함한다. 특정한 실시양태에서, 예시적인 이펙터 도메인은 CD86, FcγRIIa, DAP12, CD30, CD40, PD-1, 림프구 기능-연관 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, CD83과 특이적으로 결합하는 리간드, CDS, ICAM-1, GITR, BAFFR, SLAMF7, NKp80 (KLRF1), CD127, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CD11d, ITGAE, CD103, ITGAL, CD11a, ITGAM, CD11b, ITGAX, CD11c, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1 (CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), CEACAM1, CRTAM, Ly9 (CD229), PSGL1, CD100 (SEMA4D), CD69, SLAMF6 (NTB-A, Ly108), SLAM (CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, GADS, PAG/Cbp, NKp44, NKp30, 또는 NKp46으로부터 선택된 신호전달 및 공동-자극 도메인을 포함한다.

자극 방식으로 작용하는 세포내 신호전달 성분 서열은 iTAM을 포함할 수 있다. 1차 세포질 신호전달 서열을 포함하는 iTAM의 예는 CD3γ, CD3δ, CD3ε, CD3ζ, CD5, CD22, CD66d, CD79a, CD79b, 및 통상의 FcRγ (FCER1G), FcγRlla, FcRβ (Fcε Rib), DAP10, 및 DAP12로부터 유래된 것을 포함한다. 특정한 실시양태에서, CD3ζ의 변이체는 적어도 1, 2, 3개, 또는 모든 ITAM 영역을 보유한다.

특정한 실시양태에서, 이펙터 도메인은 세포질 신호전달 단백질과 회합하는 세포질 부분을 포함하며, 여기서 세포질 신호전달 단백질은 림프구 수용체 또는 그의 신호전달 도메인, 복수의 ITAM을 포함하는 단백질, 공동-자극 도메인, 또는 그의 임의의 조합이다.

세포내 신호전달 성분의 추가의 예는 CD3ζ 쇄의 세포질 서열, 및/또는 결합 도메인 결속 후에 신호 전달을 개시하기 위해 협력하여 작용하는 보조-수용체를 포함한다.

공동-자극 도메인은 그의 활성화가 세포 마커 결합에 대한 효율적인 림프구 반응에 요구될 수 있는 도메인이다. 일부 분자는 세포내 신호전달 성분 또는 공동-자극 도메인으로서 상호교환가능하다. 공동자극 도메인의 예는 CD27, CD28, 4-1BB (CD 137), OX40, CD30, CD40, PD-1, ICOS, 림프구 기능-연관 항원-1 (LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, 및 CD83과 특이적으로 결합하는 리간드를 포함한다. 예를 들어, CD27 공동-자극은 시험관내 인간 CART 세포의 확장, 이펙터 기능, 및 생존을 증진시키고, 생체내 인간 T 세포 지속성 및 항암 활성을 증대시키는 것으로 입증되었다 (Song et al., Blood. 2012; 119(3):696-706). 이러한 공동-자극 도메인 분자의 추가의 예는 CDS, ICAM-1, GITR, BAFFR, HVEM (LIGHTR), SLAMF7, NKp80 (KLRF1), NKp44, NKp30, NKp46, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDlld, ITGAE, CD103, ITGAL, CDlla, ITGAM, CDl lb, ITGAX, CDllc, ITGBl, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1 (CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), NKG2D, CEACAM1, CRTAM, Ly9 (CD229), PSGL1, CD100 (SEMA4D), CD69, SLAMF6 (NTB-A, Lyl08), SLAM (SLAMF1, CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, LAT, GADS, SLP-76, PAG/Cbp, 및 CD19a를 포함한다.

특정한 실시양태에서, 세포내 신호전달 성분의 아미노산 서열은 CD3ζ의 변이체 및 4-1BB 세포내 신호전달 성분의 부분을 포함한다.

특정한 실시양태에서, 세포내 신호전달 성분은 (i) CD3ζ의 신호전달 도메인의 전부 또는 일부, (ii) 4-1BB의 신호전달 도메인의 전부 또는 일부, 또는 (iii) CD3ζ 및 4-1BB의 신호전달 도메인의 전부 또는 일부를 포함한다.

세포내 성분은 또한 Wnt 신호전달 경로 (예를 들어, LRP, Ryk, 또는 ROR2), NOTCH 신호전달 경로 (예를 들어, NOTCH1, NOTCH2, NOTCH3, 또는 NOTCH4), 헤지호그 신호전달 경로 (예를 들어, PTCH 또는 SMO)의 단백질, 수용체 티로신 키나제 (RTK) (예를 들어, 표피 성장 인자 (EGF) 수용체 패밀리, 섬유모세포 성장 인자 (FGF) 수용체 패밀리, 간세포 성장 인자 (HGF) 수용체 패밀리, 인슐린 수용체 (IR) 패밀리, 혈소판-유래 성장 인자 (PDGF) 수용체 패밀리, 혈관 내피 성장 인자 (VEGF) 수용체 패밀리, 트로포미오신 수용체 키나제 (Trk) 수용체 패밀리, 에프린 (Eph) 수용체 패밀리, AXL 수용체 패밀리, 백혈구 티로신 키나제 (LTK) 수용체 패밀리, 이뮤노글로불린-유사 및 EGF-유사 도메인 1을 갖는 티로신 키나제 (TIE) 수용체 패밀리, 수용체 티로신 키나제-유사 고아 (ROR) 수용체 패밀리, 디스코이딘 도메인 (DDR) 수용체 패밀리, 형질감염 중 재배열 (RET) 수용체 패밀리, 티로신-단백질 키나제-유사 (PTK7) 수용체 패밀리, 수용체 티로신 키나제 관련 (RYK) 수용체 패밀리, 또는 근육 특이적 키나제 (MuSK) 수용체 패밀리); G-단백질-커플링된 수용체, GPCR (프리즐드 또는 스무슨드); 세린/트레오닌 키나제 수용체 (BMPR 또는 TGFR); 또는 시토카인 수용체 (IL1R, IL2R, IL7R, 또는 IL15R) 중 1종 이상을 포함할 수 있다.

링커. 본원에 사용된 링커는 분자의 2개의 다른 하위성분을 연결하는 역할을 하는 CAR 분자의 임의의 부분일 수 있다. 일부 링커는 다른 성분을 연결하는 것 외의 다른 목적을 제공하지 않는 반면, 많은 링커는 추가의 목적을 제공한다. scFv의 항체 유래 결합 도메인의 VL 및 VH를 연결하는 것과 관련된 링커는 상기 기재되어 있다. 링커는 또한 스페이서 영역, 및 접합부 아미노산을 포함할 수 있다.

스페이서 영역은 다른 연결된 성분으로부터 적절한 거리 및/또는 가요성을 생성하는데 사용되는 링커 영역의 유형이다. 특정한 실시양태에서, 스페이서 영역의 길이는 원치않는 세포 인식 및 파괴를 최적화하기 위해 원치않는 세포 상의 개별 세포 마커에 대해 맞춤화될 수 있다. 스페이서는 스페이서의 부재 하와 비교하여 항원 결합 후에 세포의 증가된 반응성을 제공하는 길이일 수 있다. 특정한 실시양태에서, 스페이서 영역 길이는 세포 마커 에피토프의 위치, 에피토프에 대한 결합 도메인의 친화도, 및/또는 세포 마커 인식에 반응하여 시험관내 및/또는 생체내에서 증식하는 분자를 발현하는 변형된 세포의 능력에 기초하여 선택될 수 있다. 스페이서 영역은 또한 변형된 세포에서 높은 발현 수준을 허용할 수 있다.

특정한 실시양태에서, 스페이서 영역은 유형 II C-렉틴 도메인간 (줄기) 영역 또는 분화 클러스터 (CD) 분자 줄기 영역인 힌지 영역을 포함한다. 본원에 사용된 "야생형 이뮤노글로불린 힌지 영역"은 항체의 중쇄에서 발견되는 CH1 및 CH2 도메인 (IgG, IgA, 및 IgD의 경우) 사이에 개재되어 이들을 연결하거나 또는 CH1 및 CH3 도메인 (IgE 및 IgM의 경우) 사이에 개재되어 이들을 연결하는 자연 발생 상부 및 중간 힌지 아미노산 서열을 지칭한다.

유형 II C-렉틴 또는 CD 분자의 "줄기 영역"은 C-유형 렉틴-유사 도메인 (CTLD; 예를 들어, 천연 킬러 세포 수용체의 CTLD와 유사함)과 소수성 부분 (막횡단 도메인) 사이에 위치하는 유형 II C-렉틴 또는 CD 분자의 세포외 도메인의 부분을 지칭한다. 예를 들어, 인간 CD94의 세포외 도메인 (진뱅크 수탁 번호 AAC50291.1)은 아미노산 잔기 34-179에 상응하지만, CTLD는 아미노산 잔기 61-176에 상응하고, 따라서 인간 CD94 분자의 줄기 영역은 소수성 부분 (막횡단 도메인)과 CTLD 사이에 위치하는 아미노산 잔기 34-60을 포함한다 (문헌 [Boyington et al., Immunity 10:15, 1999] 참조; 다른 줄기 영역의 설명에 대해서는, 또한 문헌 [Beavil et al., Proc. Nat'l. Acad. Sci. USA 89:153, 1992; 및 Figdor et al., Nat. Rev. Immunol. 2:11, 2002] 참조). 이들 유형 II C-렉틴 또는 CD 분자는 또한 줄기 영역과 막횡단 영역 또는 CTLD 사이에 접합부 아미노산 (하기 기재됨)을 가질 수 있다. 또 다른 예에서, 233개 아미노산의 인간 NKG2A 단백질 (진뱅크 수탁 번호 P26715.1)은 아미노산 71-93 범위의 소수성 부분 (막횡단 도메인) 및 아미노산 94-233 범위의 세포외 도메인을 갖는다. CTLD는 아미노산 119-231을 포함하고, 줄기 영역은 아미노산 99-116을 포함하며, 이는 추가의 접합부 아미노산에 플랭킹될 수 있다. 다른 유형 II C-렉틴 또는 CD 분자, 뿐만 아니라 그의 세포외 리간드-결합 도메인, 줄기 영역, 및 CTLD는 관련 기술분야에 공지되어 있다 (예를 들어, 각각 인간 CD23, CD69, CD72, NKG2A, 및 NKG2D의 서열 및 그의 설명에 대해; 진뱅크 수탁 번호 NP 001993.2; AAH07037.1; NP 001773.1; AAL65234.1; CAA04925.1 참조).

스페이서 영역에 관한 추가의 설명으로서, 융합 단백질의 세포외 성분은 임의로 세포외, 비-신호전달 스페이서 또는 링커 영역을 포함하며, 이는 예를 들어 결합 도메인을 숙주 세포 (예를 들어, T 세포) 표면으로부터 멀리 위치시켜 적절한 세포/세포 접촉, 항원 결합 및 활성화를 가능하게 할 수 있다 (Patel et al., Gene Therapy 6: 412-419, 1999). 나타낸 바와 같이, 융합 결합 단백질의 세포외 스페이서 영역은 일반적으로 소수성 부분 또는 막횡단 도메인과 세포외 결합 도메인 사이에 위치하고, 스페이서 영역 길이는 선택된 표적 분자, 선택된 결합 에피토프, 또는 항원-결합 도메인 크기 및 친화도에 기초하여 항원 인식 (예를 들어, 종양 인식)을 최대화하도록 달라질 수 있다 (예를 들어, 문헌 [Guest et al., J. Immunother. 28:203-11, 2005]; PCT 공개 번호 WO 2014/031687 참조). 특정 실시양태에서, 스페이서 영역은 이뮤노글로불린 힌지 영역을 포함한다. 이뮤노글로불린 힌지 영역은 야생형 이뮤노글로불린 힌지 영역 또는 변경된 야생형 이뮤노글로불린 힌지 영역일 수 있다. 특정 실시양태에서, 이뮤노글로불린 힌지 영역은 인간 이뮤노글로불린 힌지 영역이다. 이뮤노글로불린 힌지 영역은 IgG, IgA, IgD, IgE, 또는 IgM 힌지 영역일 수 있다. IgG 힌지 영역은 IgG1, IgG2, IgG3, 또는 IgG4 힌지 영역일 수 있다. 본원에 기재된 융합 결합 단백질에 사용되는 힌지 영역의 다른 예는 야생형 또는 그의 변이체일 수 있는 유형 1 막 단백질, 예컨대 CD8α, CD4, CD28, 및 CD7의 세포외 영역에 존재하는 힌지 영역을 포함한다.

특정 실시양태에서, 세포외 스페이서 영역은 CH1 도메인, CH2 도메인, CH3 도메인, CH4 도메인, 또는 그의 임의의 조합으로부터 선택된 Fc 도메인의 전부 또는 일부를 포함한다. Fc 도메인 또는 그의 부분은 야생형 또는 (예를 들어, 항체 이펙터 기능을 감소시키기 위해) 변경된 것일 수 있다. 특정 실시양태에서, 세포외 성분은 결합 도메인과 소수성 부분 사이에 배치된 이뮤노글로불린 힌지 영역, CH2 도메인, CH3 도메인, 또는 그의 임의의 조합을 포함한다.

접합부 아미노산은 스페이서에 의해 제공되는 거리를 필요로 하지 않고/거나 원치 않는 경우에 CAR 도메인의 서열을 연결하는데 사용될 수 있는 링커일 수 있다. 접합부 아미노산은 공동-자극 세포내 신호전달 성분을 연결하는데 사용될 수 있는 짧은 아미노산 서열이다. 특정한 실시양태에서, 접합부 아미노산은 9개 이하의 아미노산이다.

접합부 아미노산은 링커를 형성하기 위한 짧은 올리고- 또는 단백질 링커, 바람직하게는 2 내지 9개 아미노산 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 또는 9개 아미노산) 길이일 수 있다. 특정한 실시양태에서, 글리신-세린 이중체가 적합한 접합부 아미노산 링커로서 사용될 수 있다. 특정한 실시양태에서, 단일 아미노산, 예를 들어 알라닌, 글리신이 적합한 접합부 아미노산으로서 사용될 수 있다.

막횡단 도메인. 나타낸 바와 같이, CAR 분자 내의 막횡단 도메인은 종종 세포 막을 통해 세포외 성분 및 세포내 성분을 연결하는 역할을 한다. 막횡단 도메인은 발현된 분자를 변형된 세포의 막에 고정시킬 수 있다.

막횡단 도메인은 천연 및/또는 합성 공급원으로부터 유래될 수 있다. 공급원이 천연인 경우, 막횡단 도메인은 임의의 막-결합 또는 막횡단 단백질로부터 유래될 수 있다. 막횡단 도메인은 적어도 T-세포 수용체, CD28, CD27, CD3 엡실론, CD45, CD4, CD5, CD8, CD9, CD16, CD22; CD33, CD37, CD64, CD80, CD86, CD134, CD137 및 CD154의 α, β 또는 ζ 쇄의 막횡단 영역(들)을 포함할 수 있다. 특정한 실시양태에서, 막횡단 도메인은 적어도 예를 들어 KIRDS2, OX40, CD2, CD27, LFA-1 (CD 11a, CD18), ICOS (CD278), 4-1BB (CD137), GITR, CD40, BAFFR, HVEM (LIGHTR), SLAMF7, NKp80 (KLRF1), NKp44, NKp30, NKp46, CD160, CD19, IL2Rβ, IL2Rγ, IL7R a, ITGA1, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDl ld, ITGAE, CD103, ITGAL, CDl la, ITGAM, CDl lb, ITGAX, CDl lc, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, DNAM1(CD226), SLAMF4 (CD244, 2B4), CD84, CD96 (Tactile), CEACAM1, CRT AM, Ly9(CD229), PSGL1, CD100 (SEMA4D), SLAMF6 (NTB-A, Lyl08), SLAM (SLAMF1, CD150, IPO-3), BLAME (SLAMF8), SELPLG (CD162), LTBR, PAG/Cbp, NKG2D, 또는 NKG2C의 막횡단 영역(들)을 포함할 수 있다.

특정한 실시양태에서, 막횡단 도메인은 세포 막에서 열역학적으로 안정한 3차원 구조를 갖고, 일반적으로 15 내지 30개 아미노산의 길이 범위이다. 막횡단 도메인의 구조는 α 나선, β 배럴, β 시트, β 나선, 또는 그의 임의의 조합을 포함할 수 있다.

막횡단 도메인은 막횡단 영역에 인접한 1개 이상의 추가의 아미노산, 예를 들어 CAR의 세포외 영역 내의 1개 이상의 아미노산 (예를 들어, 세포외 영역의 최대 15개의 아미노산) 및/또는 CAR의 세포내 영역 내의 1개 이상의 추가의 아미노산 (예를 들어, 세포내 성분의 최대 15개의 아미노산)을 포함할 수 있다. 한 측면에서, 막횡단 도메인은 신호전달 도메인, 공동-자극 도메인 또는 힌지 도메인이 유래된 동일한 단백질로부터의 것이다. 또 다른 측면에서, 막횡단 도메인은 CAR의 임의의 다른 도메인이 유래된 동일한 단백질로부터 유래되지 않는다. 일부 경우에, 막횡단 도메인은 이러한 도메인이 동일하거나 상이한 표면 막 단백질의 막횡단 도메인에 결합하는 것을 피하여 수용체 복합체의 다른 의도하지 않은 구성원과의 상호작용을 최소화하기 위해 선택될 수 있거나 또는 아미노산 치환에 의해 변형될 수 있다. 한 측면에서, 막횡단 도메인은 CAR-발현 세포의 세포 표면 상의 또 다른 CAR과 동종이량체화될 수 있다. 상이한 측면에서, 막횡단 도메인의 아미노산 서열은 동일한 CAR-발현 세포에 존재하는 천연 결합 파트너의 결합 도메인과의 상호작용을 최소화하기 위해 변형 또는 치환될 수 있다. 특정한 실시양태에서, 막횡단 도메인은 CD28 막횡단 도메인의 아미노산 서열을 포함한다.

형질도입 마커는 말단절단된 CD19 (tCD19; 문헌 [Budde et al., Blood 122: 1660, 2013] 참조); 말단절단된 인간 EGFR (tEGFR; 문헌 [Wang et al., Blood 118: 1255, 2011] 참조); 인간 CD34의 세포외 도메인; 및/또는 CD34 (문헌 [Fehse et al., Mol. Therapy 1(5 Pt 1):448-456, 2000] 참조) 및 CD20 항원 (문헌 [Philip et al., Blood 124: 1277-1278, 2014] 참조)으로부터의 표적 에피토프를 조합한 RQR8 중 적어도 1종으로부터 선택될 수 있다.

특정한 실시양태에서, i카스파제9 구축물 (iCasp9)을 코딩하는 폴리뉴클레오티드는 자살 스위치로서 CAR 뉴클레오티드 구축물 내로 삽입될 수 있다.

제어 특색은 CAR에서 다중 카피로 존재할 수 있거나, 또는 스키핑 요소의 사용에 의해 별개의 분자로서 발현될 수 있다. 특정한 실시양태에서, 형질도입 마커는 tEGFR을 포함한다. 예시적인 형질도입 마커 및 동족 쌍은 미국 특허 번호 8,802,374에 기재되어 있다.

CAR에서 적어도 1종의 제어 특색을 포함하는 것의 하나의 이점은 대상체에게 투여된 CAR 발현 세포가 제어 특색에 대한 동족 결합 분자를 사용하여, 또는 CAR을 발현하고 제어 특색에 대해 특이성을 갖는 제2 변형된 세포를 사용하는 것에 의해 고갈될 수 있다는 것이다. 변형된 세포의 제거는 제어 특색에 특이적인 고갈 작용제를 사용하여 달성될 수 있다.

특정 실시양태에서, 키메라 분자를 발현하는 변형된 세포는 제어 특색에 대해 특이성을 가지고 결합하는 항체를 사용함으로써, 또는 제어 특색에 특이적으로 결합하는 다른 동족 결합 분자에 의해 생체내에서 검출 또는 추적될 수 있으며, 제어 특색에 대한 결합 파트너는 형광 염료, 방사성-추적자, 산화철 나노입자, 또는 X선, CT-스캔, MRI-스캔, PET-스캔, 초음파, 유동-세포측정법, 근적외선 영상화 시스템, 또는 다른 영상화 양식에 의한 검출을 위해 관련 기술분야에 공지된 다른 영상화제에 접합된다 (예를 들어, 문헌 [Yu et al., Theranostics 2:3, 2012] 참조).

따라서, CAR과 함께 적어도 1종의 제어 특색을 발현하는 변형된 세포는 태그 카세트가 없는 변형된 세포와 비교하여, 예를 들어 보다 용이하게 확인, 단리, 분류, 증식 유도, 추적, 및/또는 제거될 수 있다.

T-세포 수용체 (TCR)는 주요 조직적합성 복합체 (MHC)에 결합된 펩티드의 T-세포 인식을 담당하는 T 세포의 표면 상에서 발견되는 분자이다.

TCR은 자연 발생 T 세포 수용체를 지칭한다. HSC는 선택된 TCR을 발현하도록 생체내에서 변형될 수 있다. CAR/TCR 하이브리드는 TCR의 요소 및 CAR의 요소를 갖는 단백질을 지칭한다. 예를 들어, CAR/TCR 하이브리드는 TCR 결합 도메인이 자연적으로 회합되지 않은 이펙터 도메인을 갖는 자연 발생 TCR 결합 도메인을 가질 수 있다. CAR/TCR 하이브리드는 돌연변이된 TCR 결합 도메인 및 ITAM 신호전달 도메인을 가질 수 있다. CAR/TCR 하이브리드는 삽입된 비-자연 발생 스페이서 영역 또는 막횡단 도메인을 갖는 자연 발생 TCR을 가질 수 있다.

특정한 CAR/TCR 하이브리드는 TRuC® (T 세포 수용체 융합 구축물) 하이브리드; TCR2 테라퓨틱스(TCR2 Therapeutics), 매사추세츠주 캠브리지를 포함한다. 예로서, TCR 융합 단백질의 생산은 국제 특허 공개 WO 2018/026953 및 WO 2018/067993, 및 출원 공개 US 2017/0166622에 기재되어 있다.

특정한 실시양태에서, CAR/TCR 하이브리드는 "T-세포 수용체 (TCR) 융합 단백질" 또는 "TFP"를 포함한다. TFP는 일반적으로 i) 표적 세포 상의 표면 항원에 결합할 수 있고, ii) 전형적으로 T-세포의 표면 내에 또는 표면 상에 공동-위치하는 경우에 무손상 TCR 복합체의 다른 폴리펩티드 성분과 상호작용할 수 있는 TCR을 포함하는 다양한 폴리펩티드로부터 유래된 재조합 폴리펩티드를 포함한다.

(IV-d) CRISPR

CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)/Cas (CRISPR-연관 단백질) 뉴클레아제 시스템은 박테리아 시스템에 기초한 유전자 조작에 사용되는 조작된 뉴클레아제 시스템이다. 이는 부분적으로 많은 박테리아 및 고세균의 적응 면역 반응에 기초한다. 바이러스 또는 플라스미드가 박테리아를 침습할 때, 침습자의 DNA 절편은 박테리아의 "면역" 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이어서, crRNA는 부분적 상보성 영역을 통해 tracrRNA로 불리는 또 다른 유형의 RNA와 회합하여 Cas 뉴클레아제를 "프로토스페이서"로 불리는 표적 DNA 내의 crRNA에 상동성인 영역으로 가이드한다. Cas 뉴클레아제는 DNA를 절단하여 crRNA 전사체 내에 함유된 20-뉴클레오티드 상보적 가닥 서열에 의해 명시된 부위에서의 이중-가닥 파괴에서 평활 말단을 생성한다. 일부 경우에, Cas 뉴클레아제는 부위-특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 필요로 한다.

가이드 RNA (gRNA)는 표적화 요소의 한 예이다. 그의 가장 단순한 형태에서, gRNA는 상보성에 기초하여 게놈 내의 부위를 표적화하는 서열 (예를 들어, crRNA)을 제공한다. 그러나, 하기 설명되는 바와 같이, gRNA는 또한 추가의 성분을 포함할 수 있다. 예를 들어, 특정한 실시양태에서, gRNA는 표적화 서열 (예를 들어, crRNA) 및 표적화 서열을 절단 요소에 연결하는 성분을 포함할 수 있다. 이러한 연결 성분은 tracrRNA일 수 있다. 특정한 실시양태에서, 하기 기재된 바와 같이, crRNA 및 tracrRNA를 포함하는 gRNA는 단일 gRNA (sgRNA)로 지칭되는 단일 분자로서 발현될 수 있다. gRNA는 또한 다른 메카니즘을 통해, 예컨대 나노입자를 통해 또는 이중 또는 다목적 분자의 발현 또는 구축을 통해 절단 요소에 연결될 수 있다.

특정한 실시양태에서, 표적화 요소 (예를 들어, gRNA)는 새로운 또는 증진된 특색 (예를 들어, 개선된 안정성)을 갖는 핵산을 제공하기 위해 1종 이상의 변형 (예를 들어, 염기 변형, 백본 변형)을 포함할 수 있다. 변형된 백본은 백본에 인 원자를 보유하는 것 및 백본에 인 원자를 갖지 않는 것을 포함할 수 있다. 인 원자를 함유하는 적합한 변형된 백본은, 예를 들어, 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르 , 메틸 및 다른 알킬 포스포네이트 예컨대 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함한 포스포르아미데이트, 포스포로디아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트, 및 정상 3'-5' 연결, 2'-5' 연결된 유사체를 갖는 보라노포스페이트, 및 1개 이상의 뉴클레오티드간 연결이 3'에서 3', 5'에서 5' 또는 2'에서 2' 연결인 역극성을 갖는 것을 포함할 수 있다. 역극성을 갖는 적합한 표적화 요소는 3'-대부분의 뉴클레오티드간 연결에서 단일 3'에서 3' 연결 (즉, 핵염기가 누락되거나 또는 그 대신 히드록실 기를 갖는 단일 역전된 뉴클레오시드 잔기)을 포함할 수 있다. 다양한 염 (예를 들어, 염화칼륨 또는 염화나트륨), 혼합된 염, 및 유리 산 형태가 또한 포함될 수 있다.

표적화 요소는 1개 이상의 포스포로티오에이트 및/또는 헤테로원자 뉴클레오시드간 연결, 특히 -CH₂-NH-O-CH₂-, -CH₂-N(CH₃)-O-CH₂- (즉, 메틸렌 (메틸이미노) 또는 MMI 백본), -CH₂-O-N(CH₃)-CH₂-, -CH₂-N(CH₃)-N(CH₃)-CH₂- 및 -O-N(CH₃)-CH₂-CH₂- (여기서, 천연 포스포디에스테르 뉴클레오티드간 연결은 -O-P(=O)(OH)-O-CH₂-로 표시됨)를 포함할 수 있다.

특정한 실시양태에서, 표적화 요소는 모르폴리노 백본 구조를 포함할 수 있다. 예를 들어, 표적화 요소는 리보스 고리 대신 6-원 모르폴리노 고리를 포함할 수 있다. 이들 실시양태 중 일부에서, 포스포로디아미데이트 또는 다른 비-포스포디에스테르 뉴클레오시드간 연결은 포스포디에스테르 연결을 대체한다.

특정한 실시양태에서, 표적화 요소는 1개 이상의 치환된 당 모이어티를 포함할 수 있다. 적합한 폴리뉴클레오티드는 OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함할 수 있으며, 여기서 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. O((CH₂)_nO) mCH₃, O(CH2)_nOCH₃, O(CH₂)_nNH₂, O(CH₂)_nCH₃, O(CH₂)_nONH₂, 및 O(CH₂)_nON((CH₂)_nCH₃)₂가 특히 적합하며, 여기서 n 및 m은 독립적으로 1 내지 10이다.

절단 요소의 예는 뉴클레아제를 포함한다. CRISPR-Cas 유전자좌는 50개 초과의 유전자 패밀리를 갖고, 엄격하게 보편적인 유전자는 존재하지 않으며, 이는 유전자좌 아키텍처의 빠른 진화 및 극도의 다양성을 나타낸다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (또한 Csnl 및 Csxl2로도 공지됨), CaslO, , Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csfl, Csf2, Csf3, 및 Csf4를 포함한다.

Cas 뉴클레아제의 3가지 주요 유형 (유형 I, 유형 II, 및 유형 III), 및 5가지 유형 I, 3가지 유형 II, 및 2가지 유형 III 단백질을 포함하는 10가지 하위유형이 존재한다 (예를 들어, 문헌 [Hochstrasser and Doudna, Trends Biochem Sci, 40(l):58-66, 2015] 참조). 유형 II Cas 뉴클레아제는 Casl, Cas2, Csn2, 및 Cas9를 포함한다. 이들 Cas 뉴클레아제는 관련 기술분야의 통상의 기술자에게 공지되어 있다. 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어 NBCI Ref. Seq. No. NP 269215에 제시되어 있고, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어 NBCI Ref. Seq. No. WP_011681470에 제시되어 있다.

특정한 실시양태에서, Cas9는 RNA-가이드된 이중-가닥 DNA-결합 뉴클레아제 단백질 또는 니카제 단백질을 지칭한다. 야생형 Cas9 뉴클레아제는 상이한 DNA 가닥을 절단하는 2개의 기능적 도메인, 예를 들어 RuvC 및 HNH를 갖는다. Cas9는 둘 다의 기능적 도메인이 활성인 경우에 게놈 DNA (표적 DNA)에서 이중-가닥 파괴를 유도할 수 있다. 일부 실시양태에서, Cas9 효소는 박테리아, 예컨대 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토르(Filif actor), 유박테리움(Eubacterium), 스트렙토코쿠스(Streptococcus), 락토바실루스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스(Bacteroides), 플라비이볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코쿠스(Staphylococcus), 니트라티프락토르(Nitratifractor), 및 캄필로박터(Campylobacter)로부터 유래된 Cas9 단백질의 1개 이상의 촉매 도메인을 포함한다. 일부 실시양태에서, Cas9는 융합 단백질이고, 예를 들어 2개의 촉매 도메인은 상이한 박테리아 종으로부터 유래된다.

이전에 나타낸 바와 같이, CRISPR/Cas 시스템은 특정 경우에 crRNA 및 tracrRNA가 단일 gRNA (sgRNA)로 불리는 1개의 분자로 조합될 수 있도록 조작되었다. 이러한 조작된 접근법에서, sgRNA는 Cas를 임의의 목적하는 서열을 표적화하도록 가이드한다 (예를 들어, 문헌 [Jinek et al., Science 337:816-821, 2012; Jinek et al., eLife 2:e00471, 2013; Segal, eLife 2:e00563, 2013] 참조). 따라서, CRISPR/Cas 시스템은 세포의 게놈 내의 목적하는 표적에서 이중-가닥 파괴를 생성하도록 조작될 수 있고, 세포의 내인성 메카니즘을 이용하여 HDR 또는 NHEJ에 의해 유도된 파괴를 복구할 수 있다. 본원에 기재된 특정한 실시양태는 규정된 통합 부위에서 HDR을 촉진하기 위해 상동성 아암을 이용한다.

Cas9 뉴클레아제의 유용한 변이체는 단일 불활성 촉매 도메인, 예컨대 RuvC^" 또는 HNH^" 효소 또는 니카제를 포함한다. Cas9 니카제는 단지 1개의 활성 기능적 도메인을 갖고, 일부 실시양태에서, 표적 DNA의 단지 1개의 가닥을 절단하여, 단일 가닥 파괴 또는 닉을 생성한다. 일부 실시양태에서, 적어도 D10A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 니카제이다. 다른 실시양태에서, 적어도 H840A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 니카제이다. Cas9 니카제에 존재하는 돌연변이의 다른 예는 N854A 및 N863A를 포함한다. 대향하는 DNA 가닥을 표적화하는 적어도 2개의 DNA-표적화 RNA가 사용되는 경우에 Cas9 니카제를 사용하여 이중-가닥 파괴가 도입된다. 이중-닉킹된 유도된 이중-가닥 파괴는 HDR 또는 NHEJ에 의해 복구된다. 이러한 유전자 편집 전략은 일반적으로 HDR을 선호하고, 오프-타겟 DNA 부위에서 indel 돌연변이의 빈도를 감소시킨다. 일부 실시양태에서, Cas9 뉴클레아제 또는 니카제는 표적 세포 또는 표적 유기체에 대해 코돈-최적화된다.

특정한 실시양태는 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 (SaCas9)를 이용할 수 있다. 특정한 실시양태는 하기 위치: E782, N968, 및/또는 R1015 중 1개 이상에서 돌연변이를 갖는 SaCas9를 이용할 수 있다. 특정한 실시양태는 하기 위치: E735, E782, K929, N968, A1021, K1044 및/또는 R1015 중 1개 이상에서 돌연변이를 갖는 SaCas9를 이용할 수 있다. 일부 실시양태에서, 변이체 SaCas9 단백질은 하기 돌연변이: R1015Q, R1015H, E782K, N968K, E735K, K929R, A1021T, 및/또는 K1044N 중 1개 이상을 포함한다. 일부 실시양태에서, 변이체 SaCas9 단백질은 D10A, D556A, H557A, N580A, 예를 들어 D10A/H557A 및/또는 D10A/D556A/H557A/N580A에서 돌연변이를 포함한다. 일부 실시양태에서, 변이체 SaCas9 단백질은 E735, E782, K929, N968, R1015, A1021, 및/또는 K1044로부터 선택된 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 변이체는 하기 돌연변이 세트: E782K/N968K/R1015H (KKH 변이체); E782K/K929R/R1015H (KRH 변이체); 또는 E782K/K929R/N968K/R1015H (KRKH 변이체) 중 하나를 포함할 수 있다.

Cpf1에 의해 예시된 부류 II, 유형 V CRISPR-Cas 부류는 문헌 [Zetsche et al., Cell 163(3): 759-771, 2015]에서 확인된다. Cpf1 뉴클레아제는 특히 프로토스페이서-인접 모티프 또는 PAM으로 공지된 짧은 3개 염기 쌍 인식 서열 (TTN)에 의해 표적 부위 선택에서 부가된 유연성을 제공할 수 있다. Cpf1의 절단 부위는 PAM 서열로부터 적어도 18bp 떨어져 있다. 더욱이, 점착성 말단을 갖는 엇갈린 DSB는 배향-특이적 공여자 주형 삽입을 허용하며, 이는 비-분열 세포에서 유리하다.

특정한 실시양태는 조작된 Cpf1을 이용할 수 있다. 예를 들어, US 2018/0030425는 변경되고 개선된 표적 특이성을 갖는 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) ND2006 및 아시다미노코쿠스(Acidaminococcus) 종 BV3L6으로부터의 조작된 Cpf1 뉴클레아제를 기재한다. 특정한 변이체는 예를 들어 하기 위치: S202, N274, N278, K290, K367, K532, K609, K915, Q962, K963, K966, K1002, 및/또는 S1003 중 1개 이상에서 돌연변이 (즉, 천연 아미노산의 상이한 아미노산, 예를 들어 알라닌, 글리신, 또는 세린으로의 대체)를 갖는 아미노산 19-1246을 적어도 포함하는 라크노스피라세아에 박테리아 ND2006을 포함한다. 특정한 Cpf1 변이체는 또한 하기 위치: N178, S186, N278, N282, R301, T315, S376, N515, K523, K524, K603, K965, Q1013, Q1014, 및/또는 K1054 중 1개 이상에서 돌연변이 (즉, 천연 아미노산의 상이한 아미노산, 예를 들어 알라닌, 글리신, 또는 세린으로의 대체 (천연 아미노산이 세린인 경우는 제외))를 갖는 아시다미노코쿠스 종 BV3L6 Cpf1 (AsCpf1)을 포함할 수 있다.

다른 Cpf1 변이체는 문헌 [Zetsche et al., (Cell 163: 759-771, 2015)]에 개시된 Cpf1 폴리펩티드뿐만 아니라 미국 특허 공개 번호 2016/0208243에 개시된 Cpf1 폴리펩티드의 Cpf1 상동체 및 오르토로그를 포함한다. 다른 조작된 Cpf1 변이체는 관련 기술분야의 통상의 기술자에게 공지되어 있고, 본 개시내용의 범주 내에 포함된다 (예를 들어, WO/2017/184768 참조).

이전에 나타낸 바와 같이, 실시양태는 상동성 지정 복구를 이용하여 유전자 구축물의 표적화된 삽입을 용이하게 하기 위해 상동성 아암을 이용한다. 상동성 아암은 절단 부위의 게놈 서열에 대해 충분한 상동성, 예를 들어 절단 부위, 예를 들어 절단 부위의 50개 이하의 염기 내, 예를 들어 30개 염기 내, 15개 염기 내, 10개 염기 내, 5개 염기 내에 플랭킹되거나 또는 절단 부위에 바로 플랭킹된 뉴클레오티드 서열과 70%, 80%, 85%, 90%, 95%, 또는 100% 상동성을 가져, 그것과 상동성을 보유하는 게놈 서열 사이의 HDR을 지지하는 임의의 길이일 수 있다. 상동성 아암은 일반적으로 게놈 서열, 예를 들어 이중 가닥 절단 (DSB)이 발생하는 게놈 영역과 동일하다. 그러나, 나타낸 바와 같이, 절대적 동일성은 요구되지 않는다.

특정한 실시양태는 상동성-지정 복구 주형과 표적화된 게놈 서열 사이에 25, 50, 100, 또는 200개 뉴클레오티드, 또는 200개 초과의 뉴클레오티드의 서열 상동성 (또는 10 내지 200개 뉴클레오티드 또는 그 초과의 임의의 정수 값)을 갖는 상동성 아암을 이용할 수 있다. 특정한 실시양태에서, 상동성 아암은 40개 뉴클레오티드 (nt) - 1000개 nt 길이이다. 특정한 실시양태에서, 상동성 아암은 500-2500개 염기 쌍, 700 - 2000개 염기 쌍, 또는 800 - 1800개 염기 쌍이다. 특정한 실시양태에서, 상동성 아암은 적어도 800개 염기 쌍 또는 적어도 850개 염기 쌍을 포함한다. 상동성 아암의 길이는 또한 대칭 또는 비대칭일 수 있다. 상동성 아암에 관한 추가의 정보에 대해서는, 문헌 [Richardson et al., Nat Biotechnol., 34(3):339-44, 2016]을 참조한다.

CRISPR-Cas 시스템 및 그의 성분에 관한 추가의 정보는 US8697359, US8771945, US8795965, US8865406, US8871445, US8889356, US8889418, US8895308, US8906616, US8932814, US8945839, US8993233, 및 US8999641; 및 그와 관련된 출원; 및 WO2014/018423, WO2014/093595, WO2014/093622, WO2014/093635, WO2014/093655, WO2014/093661, WO2014/093694, WO2014/093701, WO2014/093709, WO2014/093712, WO2014/093718, WO2014/145599, WO2014/204723, WO2014/204724, WO2014/204725, WO2014/204726, WO2014/204727, WO2014/204728, WO2014/204729, WO2015/065964, WO2015/089351, WO2015/089354, WO2015/089364, WO2015/089419, WO2015/089427, WO2015/089462, WO2015/089465, WO2015/089473 및 WO2015/089486, WO2016/205711, WO2017/106657, WO2017/127807; 및 그와 관련된 출원에 기재되어 있다.

(IV-e) 염기 편집 시스템

염기 편집은 게놈 DNA 또는 세포 RNA 내의 염기 또는 염기 쌍을 상이한 염기 또는 염기 쌍으로 전환시키는 것에 의한 핵산 서열의 선택적 변형을 지칭한다 (Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018). DNA 염기 편집제의 2가지 일반적 부류가 존재한다: (i) 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환시키는 시토신 염기 편집제 (CBE), 및 (ii) 아데닌-티민 염기 쌍을 구아닌 시토신 염기 쌍으로 전환시키는 아데닌 염기 편집제 (ABE).

DNA 염기 편집제는 이중-가닥 파괴를 생성하지 않으면서 비-분열 세포에 이러한 점 돌연변이를 삽입할 수 있다. 이중-가닥 파괴의 결여로 인해, 염기 편집제는 과도한 바람직하지 않은 편집 부산물, 예컨대 삽입 및 결실 (indel)을 발생시키지 않는다. 예를 들어, 염기 편집제는 이중-가닥 파괴에 의존하는 기술과 비교하여 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5%, 또는 0.1% 미만의 indel을 생성할 수 있다.

대부분의 염기-편집 시스템의 성분은 (1) 표적화된 DNA 결합 단백질, (2) 핵염기 데아미나제 효소, 및 (3) DNA 글리코실라제 억제제를 포함한다.

CRISPR 시스템의 임의의 뉴클레아제는 불능화될 수 있고 염기 편집 시스템 내에서 사용될 수 있다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (또한 Csnl 및 Csxl2로도 공지됨), CaslO, , Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csf1, Csf2, Csf3, Csf4 및 그의 돌연변이를 포함한다.

다른 유전자-편집 시스템으로부터의 뉴클레아제가 또한 사용될 수 있다. 예를 들어, 염기-편집 시스템은 아연 핑거 뉴클레아제 (ZFN) (Urnov et al., Nat Rev Genet., 11(9):636-46, 2010) 및 전사 활성화제 유사 이펙터 뉴클레아제 (TALEN) (Joung et al., Nat Rev Mol Cell Biol. 14(1):49-55, 2013)를 이용할 수 있다. DNA-결합 뉴클레아제에 관한 추가의 정보에 대해서는, US2018/0312825A1을 참조한다.

특정한 실시양태에서, 핵염기 데아미나제 효소는 시티딘 데아미나제 도메인 또는 아데닌 데아미나제 도메인을 포함한다.

특정한 실시양태에서, 시티딘 데아미나제 도메인을 이용하는 CBE는 시토신의 엑소시클릭 아민을 탈아미노화하여 우라실을 생성함으로써 구아닌-시토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환시킨다. 시토신 데아미나제 효소의 예는 APOBEC1, APOBEC3A, APOBEC3G, CDA1, 및 AID를 포함한다. APOBEC1은 특히 단일 가닥 (ss)DNA를 기질로서 수용하지만, 이중 가닥 (ds)DNA에 대해서는 작용할 수 없다.

대부분의 염기-편집 시스템은 또한 의도된 염기 편집을 달리 복구할 수 있는 천연 DNA 복구 메카니즘을 무효화하는 역할을 하는 DNA 글리코실라제 억제제를 포함한다. 특정한 실시양태에서, DNA 글리코실라제 억제제는 우라실 글리코실라제 억제제, 예컨대 문헌 [Wang et al., (Gene 99, 31-37, 1991)]에 기재된 우라실 DNA 글리코실라제 억제제 단백질 (UGI)을 포함한다.

염기 편집제의 성분은 직접적으로 (예를 들어, 직접 공유 결합에 의해) 또는 링커를 통해 융합될 수 있다. 예를 들어, 촉매적으로 불능화된 뉴클레아제는 링커를 통해 데아미나제 효소 및/또는 글리코실라제 억제제에 융합될 수 있다. 다중 글리코실라제 억제제는 또한 링커를 통해 융합될 수 있다. 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 링커는 임의의 펩티드 또는 그의 부분을 연결하는데 사용될 수 있다.

예시적인 링커는 중합체 링커 (예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르); 아미노산 링커; 탄소-질소 결합 아미드 링커; 시클릭 또는 비-시클릭, 치환 또는 비치환된, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커; 단량체, 이량체, 또는 중합체 아미노알칸산 링커; 아미노알칸산 (예를 들어, 글리신, 에탄산, 알라닌, β-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산) 링커; 단량체, 이량체, 또는 중합체 아미노헥산산 (Ahx) 링커; 카르보시클릭 모이어티 (예를 들어, 시클로펜탄, 시클로헥산) 링커; 아릴 또는 헤테로아릴 모이어티 링커; 및 페닐 고리 링커를 포함한다.

링커는 또한 펩티드로부터 링커로 친핵체 (예를 들어, 티올, 아미노)의 부착을 용이하게 하기 위해 관능화된 모이어티를 포함할 수 있다. 임의의 친전자체가 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용자, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함한다.

특정한 실시양태에서, 링커는 4-100개 아미노산 길이의 범위이다. 특정한 실시양태에서, 링커는 4개 아미노산, 9개 아미노산, 14개 아미노산, 16개 아미노산, 32개 아미노산, 또는 100개 아미노산이다.

표적화된 DNA 결합 단백질을 시티딘 데아미나제 효소 및 DNA 글리코실라제 억제제 (예를 들어, UGI)와 연결함으로써 형성된 수많은 염기-편집 (BE) 시스템이 기재되어 있다. 이들 복합체는 예를 들어 BE1 ([APOBEC1-16 아미노산 (aa) 링커-Sp dCas9 (D10A, H840A)] Komer et al., Nature, 533, 420-424, 2016), BE2 ([APOBEC1-16aa 링커-Sp dCas9 (D10A, H840A)-4aa 링커-UGI] Komer et al., 2016 상기 문헌), BE3 ([APOBEC1-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Komer et al., 상기 문헌), HF-BE3 ([APOBEC1-16aa 링커-HF nCas9 (D10A)-4aa 링커-UGI] Rees et al., Nat. Commun. 8, 15790, 2017), BE4, BE4max ([APOBEC1-32aa 링커-Sp nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Koblan et al., Nat. Biotechnol 10.1038/nbt.4172, 2018; Komer et al., Sci. Adv., 3, eaao4774, 2017), BE4-GAM ([Gam-16aa 링커-APOBEC1-32aa 링커-Sp nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Komer et al., 2017 상기 문헌), YE1-BE3 ([APOBEC1 (W90Y, R126E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., Nat. Biotechnol. 35, 475-480, 2017) , EE-BE3 ([APOBEC1 (R126E, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), YE2-BE3 ([APOBEC1 (W90Y, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI]Kim et al., 2017 상기 문헌), YEE-BE3 ([APOBEC1 (W90Y, R126E, R132E)-16aa 링커-Sp nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), VQR-BE3 ([APOBEC1-16aa 링커-Sp VQR nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), VRER-BE3 ([APOBEC1-16aa 링커-Sp VRER nCas9 (D10A)-4aa 링커-UGI] Kim et al., Nat. Biotechnol. 35, 475-480, 2017), Sa-BE3 ([APOBEC1-16aa 링커-Sa nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), SA-BE4 ([APOBEC1-32aa 링커-Sa nCas9 (D10A)-9aa 링커-UGI-9aa linker-UGI] Komer et al., 2017 상기 문헌), SaBE4-Gam ([Gam-16aa 링커-APOBEC1-32aa 링커-Sa nCas9 (D10A)-9aa 링커-UGI-9aa 링커-UGI] Komer et al., 2017 상기 문헌), SaKKH-BE3 ([APOBEC1-16aa 링커-Sa KKH nCas9 (D10A)-4aa 링커-UGI] Kim et al., 2017 상기 문헌), Cas12a-BE ([APOBEC1-16aa 링커-dCas12a-14aa 링커-UGI], Li et al., Nat. Biotechnol. 36, 324-327, 2018), 표적-AID ([Sp nCas9 (D10A)-100aa 링커-CDA1-9aa 링커-UGI] Nishida et al., Science, 353, 10.1126/science.aaf8729, 2016), 표적-AID-NG ([Sp nCas9 (D10A)-NG-100aa 링커-CDA1-9aa 링커-UGI] Nishimasu et al., Science, 361(6408): 1259-1262, 2018), xBE3 ([APOBEC1-16aa 링커-xCas9(D10A)-4aa 링커-UGI] Hu et al., Nature, 556, 57-63, 2018), eA3A-BE3 ([APOBEC3A (N37G)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Gerkhe et al., Nat. Biotechnol., 10.1038/nbt.4199, 2018), A3A-BE3 ([hAPOBEC3A-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Wang et al., Nat. Biotechnol. 10.1038/nbt.4198, 2018), 및 BE-PLUS ([10X GCN4-Sp nCas9(D10A) / ScFv-rAPOBEC1-UGI] Jiang et al., Cell. Res, 10.1038/s41422-018-0052-4, 2018)를 포함한다. 아데닌 데아미나제 염기 편집제를 포함한 BE 복합체의 추가의 예에 대해서는, 문헌 [Rees & Liu Nat. Rev Genet. 2018 Dec; 19(12): 770-788]을 참조한다.

염기 편집제에 관한 추가의 정보에 대해서는, US2018/0312825A1, WO2018/165629A, 문헌 [Urnov et al., Nat Rev Genet. 2010; 11(9):636-46; Joung et al., Nat Rev Mol Cell Biol. 2013; 14(1):49-55; Charpentier et al., Nature.; 495(7439):50-1, 2013; 및 Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018]을 참조한다.

(IV-f) 소형 RNA

소형 RNA는 유전자 발현을 조절하는 역할을 하는 짧은 비-코딩 RNA 분자이다. 특정한 실시양태에서, 소형 RNA는 200개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 100개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 50개 미만의 뉴클레오티드 길이이다. 특정한 실시양태에서, 소형 RNA는 20개 미만의 뉴클레오티드 길이이다. 소형 RNA는 마이크로RNA (miRNA, Piwi-상호작용 RNA (piRNA), 소형 간섭 RNA (siRNA), 소형 핵소체 RNA (snoRNA), tRNA-유래 소형 RNA (tsRNA), 소형 rDNA-유래 RNA (srRNA), 및 소형 핵 RNA를 포함한다. 소형 RNA의 추가의 부류가 계속해서 발견된다.

특정한 실시양태에서, 표적 mRNA에 상동인 간섭 RNA 분자는 RNA 간섭 (RNAi)으로 지칭되는 과정인 그의 분해를 유도할 수 있다 (Carthew, Curr. Opin. Cell. Biol. 13: 244-248, 2001). RNAi는 세포에서 자연적으로 발생하여 외래 RNA (예를 들어, 바이러스 RNA)를 제거한다. 천연 RNAi는 분해 메카니즘을 다른 유사한 RNA 서열로 지시하는 유리 이중-가닥 RNA (dsRNA)로부터 절단된 단편을 통해 진행된다. 대안적으로, RNAi는 예를 들어 표적 유전자의 발현을 침묵시키기 위해 제조될 수 있다. 예시적인 RNAi 분자는 소형 헤어핀 RNA (shRNA, 또한 짧은 헤어핀 RNA로도 지칭됨) 및 소형 간섭 RNA (siRNA)를 포함한다.

본 개시내용을 제한하지 않고, 이론에 얽매이지는 않지만, RNA 간섭은 전형적으로 2-단계 과정이다. 개시 단계인 제1 단계에서, 투입 dsRNA는 아마도 dsRNA-특이적 리보뉴클레아제의 리보뉴클레아제 (RNase) III 패밀리의 구성원인 다이서의 작용에 의해 21-23개 뉴클레오티드 (nt) siRNA로 소화되며, 이는 ATP-의존성 방식으로 dsRNA (직접적으로 또는 트랜스진 또는 바이러스를 통해 도입됨)를 프로세싱 (절단)한다. 연속 절단 사건은 RNA를 각각 2-뉴클레오티드 3' 오버행을 갖는 19-21개 염기 쌍 (bp) 듀플렉스 (siRNA)로 분해한다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Bernstein, Nature 409:363-366, 2001).

이펙터 단계에서, siRNA 듀플렉스는 뉴클레아제 복합체에 결합하여 RNA-유도된 침묵 복합체 (RISC)를 형성한다. siRNA 듀플렉스의 ATP-의존성 풀림이 RISC의 활성화에 요구된다. 이어서, 활성 RISC는 염기 쌍형성 상호작용에 의해 상동 전사체를 표적화하고, 전형적으로 mRNA를 siRNA의 3' 말단으로부터 12개의 뉴클레오티드 단편으로 절단한다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond et al., Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). 연구는 각각의 RISC가 단일 siRNA 및 RNase를 함유함을 나타낸다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002).

RNAi의 주목할 만한 효력으로 인해, RNAi 경로 내의 증폭 단계가 제안되었다. 증폭은 더 많은 siRNA를 생성할 투입 dsRNA의 카피에 의해, 또는 형성된 siRNA의 복제에 의해 발생할 수 있다. 대안적으로 또는 추가적으로, 증폭은 RISC의 다중 전환 사건에 의해 이루어질 수 있다 (Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond et al., Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). RNAi는 또한 문헌 [Tuschl (Chem. Biochem. 2: 239-245, 2001); Cullen (Nat. Immunol. 3:597-599, 2002); 및 Brantl (Biochem. Biophys. Act. 1575:15-25, 2002)]에 기재되어 있다.

본 개시내용에서 사용하기에 적합한 RNAi 분자의 합성은 하기와 같이 수행될 수 있다. 먼저, mRNA 서열을 표적화된 트랜스진의 개시 코돈의 하류에서 스캐닝할 수 있다. 각각의 AA 및 3' 인접 19개 뉴클레오티드의 발생을 잠재적 siRNA 표적 부위로서 기록한다. 특정한 실시양태에서, siRNA 표적 부위는, 비번역 영역 (UTR)이 조절 단백질 결합 부위에서 더 풍부하기 때문에 오픈 리딩 프레임으로부터 선택될 수 있다. UTR-결합 단백질 및/또는 번역 개시 복합체는 siRNA 엔도뉴클레아제 복합체의 결합을 방해할 수 있다 (Tuschl, Chem. Biochem. 2: 239-245, 2001). 글리세르알데히드 3-포스페이트 데히드로게나제 (GAPDH)에 대해 입증된 바와 같이 비번역 영역에 지시된 siRNA가 또한 효과적일 수 있으며, 여기서 5' UTR에 지시된 siRNA는 세포 GAPDH mRNA의 90% 감소를 매개하고 단백질 수준을 완전히 폐지하였음이 인지될 것이다. 둘째로, 잠재적 표적 부위는 임의의 서열 정렬 소프트웨어, 예컨대 국립 생물 정보 센터 (NCBI) 서버로부터 이용가능한 베이직 로컬 얼라인먼트 서치 툴 (BLAST) 소프트웨어를 사용하여 적절한 게놈 데이터베이스와 비교될 수 있다. 다른 코딩 서열에 대해 유의한 상동성을 나타내는 추정 표적 부위가 필터링될 수 있다.

적격 표적 서열은 siRNA 합성을 위한 주형으로서 선택될 수 있다. 선택된 서열은 G/C 함량이 낮은 것을 포함할 수 있으며, 이는 G/C 함량이 55%를 초과하는 것과 비교하여 유전자 침묵을 매개하는데 있어서 보다 효과적인 것으로 나타났기 때문이다. 몇몇 표적 부위는 평가를 위해 표적 유전자의 길이를 따라 선택될 수 있다. 선택된 siRNA의 보다 우수한 평가를 위해, 음성 대조군이 사용될 수 있다. 음성 대조군 siRNA는 siRNA와 동일한 뉴클레오티드 조성을 포함할 수 있지만, 게놈에 대한 유의한 상동성이 결여될 수 있다. 따라서, 다른 유전자에 대한 임의의 유의한 상동성을 나타내지 않는 한, siRNA의 스크램블된 뉴클레오티드 서열이 사용될 수 있다.

센스 가닥은 선택된 부분의 서열에 기초하여 설계된다. 안티센스 가닥은 상용적으로 센스 가닥과 동일한 길이이고, 상보적 뉴클레오티드를 포함한다. 특정한 실시양태에서, 가닥은 정렬 또는 어닐링 시 완전히 상보적이고 평활-말단이다. 다른 실시양태에서, 가닥은 1-, 2- 또는 3-뉴클레오티드 오버행이 생성되도록, 즉 센스 가닥의 3' 단부가 안티센스 가닥의 5' 단부보다 1, 2 또는 3개의 뉴클레오티드만큼 추가로 연장되고/거나 안티센스 가닥의 3' 단부가 센스 가닥의 5' 단부보다 1, 2 또는 3개의 뉴클레오티드만큼 추가로 연장되도록 정렬 또는 어닐링된다. 오버행은 표적 유전자 서열 (또는 그의 상보체)에 상응하는 뉴클레오티드를 포함할 수 있다. 대안적으로, 오버행은 데옥시리보뉴클레오티드, 예를 들어 데옥시티민 (dT), 또는 뉴클레오티드 유사체, 또는 다른 적합한 비-뉴클레오티드 물질을 포함할 수 있다.

RISC 내로의 안티센스 가닥의 진입을 용이하게 하기 위해 (및 따라서 표적 절단 및 침묵의 효율을 증가 또는 개선시키기 위해), 센스 가닥의 5' 단부와 안티센스 가닥의 3' 단부 사이의 염기 쌍 강도가 변경, 예를 들어 저하 또는 감소될 수 있다. 특정한 실시양태에서, 염기-쌍 강도는 제1 또는 안티센스 가닥의 3' 단부와 제2 또는 센스 가닥의 5' 단부 사이보다 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 더 적은 G:C 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 적어도 1개의 미스매칭된 염기 쌍으로 인해 더 약하다. 바람직하게는, 미스매치된 염기 쌍은 G:A, C:A, C:U, G:G, A:A, C:C 및 U:U를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부와 제2 또는 센스 가닥의 3' 단부 사이의 적어도 1개의 워블 염기 쌍, 예를 들어 G:U로 인해 더 약하다. 또 다른 실시양태에서, 염기 쌍 강도는 희귀 뉴클레오티드, 예를 들어 이노신 (I)을 포함하는 적어도 1개의 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 염기 쌍은 I:A, I:U 및 I:C를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 염기 쌍 강도는 변형된 뉴클레오티드를 포함하는 적어도 1개의 염기 쌍으로 인해 더 약하다. 특정한 실시양태에서, 변형된 뉴클레오티드는, 예를 들어 2-아미노-G, 2-아미노-A, 2,6-디아미노-G, 및 2,6-디아미노-A로부터 선택된다.

ShRNA는 헤어핀 루프 구조를 갖는 단일-가닥 폴리뉴클레오티드이다. 단일-가닥 폴리뉴클레오티드는 이중-가닥 영역 내의 하나의 가닥의 3' 단부와 이중-가닥 영역 내의 다른 가닥의 5' 단부를 연결하는 루프 절편을 갖는다. 이중-가닥 영역은 표적 서열, 예컨대 트랜스진을 코딩하는 폴리뉴클레오티드에 혼성화가능한 제1 서열, 및 제1 서열에 상보적인 제2 서열로부터 형성되고, 따라서 제1 및 제2 서열은 연결 서열이 단부를 연결하여 헤어핀 루프 구조를 형성한 이중 가닥 영역을 형성한다. 제1 서열은 트랜스진을 코딩하는 폴리뉴클레오티드의 임의의 부분에 혼성화가능할 수 있다. shRNA의 이중 가닥 스템 도메인은 제한 엔도뉴클레아제 부위를 포함할 수 있다.

shRNA의 전사는 폴리머라제 III (Pol III) 프로모터에서 개시되고, 4-5-티민 전사 종결 부위의 위치 2에서 종결되는 것으로 생각된다. 발현 시, shRNA는 3' UU-오버행을 갖는 스템-루프 구조로 폴딩되는 것으로 생각되고; 후속적으로, 이들 shRNA의 단부는 프로세싱되어, shRNA가 21-23개 뉴클레오티드의 siRNA-유사 분자로 전환된다 (Brummelkamp et al., Science. 296(5567):550-553, 2002; Lee et al., Nature Biotechnol. 20(5):500-505, 2002; Miyagishi & Taira, Nature Biotechnol. 20(5):497-500, 2002; Paddison et al., Genes & Dev. 16(8): 948-958, 2002; Paul et al., Nature Biotechnol. 20(5):505-508, 2002; Sui, Proc. Natl. Acad. Sci. USA. 99(6):5515-5520, 2002; Yu et al., Proc. Natl. Acad. Sci. USA. 99(9):6047-6052, 2002).

shRNA의 스템-루프 구조는 임의적인 뉴클레오티드 오버행, 예컨대 2-bp 오버행, 예를 들어 3' UU 오버행을 가질 수 있다. 변이가 있을 수 있지만, 스템은 전형적으로 15 내지 49, 15 내지 35, 19 내지 35, 21 내지 31 bp, 또는 21 내지 29 bp의 범위이고, 루프는 4 내지 30 bp, 예를 들어, 4 내지 23 bp의 범위일 수 있다. 특정한 실시양태에서, shRNA 서열은 45-65 bp; 50-60 bp; 또는 51, 52, 53, 54, 55, 56, 57, 58, 또는 59 bp를 포함한다. 특정한 실시양태에서, shRNA 서열은 52 또는 55 bp를 포함한다. 특정한 실시양태에서, siRNA는 15-25 bp를 갖는다. 특정한 실시양태에서, siRNA는 16, 17, 18, 19, 20, 21, 22, 23, 또는 24 bp를 갖는다. 특정한 실시양태에서, siRNA는 19 bp를 갖는다. 그러나, 통상의 기술자는 16개 미만의 뉴클레오티드 또는 24개 초과의 뉴클레오티드 길이를 갖는 siRNA가 또한 RNAi를 매개하는 기능을 할 수 있다는 것을 인지할 것이다. 보다 긴 RNAi 작용제는, 바람직하지 않을 수 있는, 특정 포유동물 세포에서 인터페론 또는 단백질 키나제 R (PKR) 반응을 도출하는 것으로 입증되었다. 바람직하게는 RNAi 작용제는 PKR 반응을 도출하지 않는다 (즉, 충분히 짧은 길이를 가짐). 그러나, 보다 긴 RNAi 작용제는, 예를 들어 PKR 반응이 대안적 수단에 의해 하향조절되거나 약화된 상황에서 유용할 수 있다.

소형 RNA가 유전자 발현을 활성화시키는데 또한 사용될 수 있다.

(IV-g) 특정한 코딩 서열 및 특정한 LCR의 쌍형성

본 개시내용은 LCR, 예컨대 긴 LCR이 작동가능하게 연결된 코딩 핵산 서열의 발현 (예를 들어, 발현 수준 또는 발현의 세포 유형 특이성)을 제어할 수 있다는 인식을 포함한다. 본 개시내용의 특정한 LCR과 연관된 예시적인 발현 패턴 (예를 들어, 세포 유형 및/또는 조직 유형)이 표 1에 제공된다. 따라서, 다양한 실시양태에서, 트랜스포손 페이로드는 LCR이 발현을 구동하는 것으로 공지된 1종 이상의 세포 또는 조직 유형에서의 발현을 위한 생성물을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 LCR, 예컨대 긴 LCR을 포함할 수 있다. 몇몇 예를 제공하기 위해, 본 발현의 트랜스포손 페이로드는 (i) 적혈구, 예를 들어 조혈 줄기 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 β-글로빈 LCR; (2) B 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 이뮤노글로불린 중쇄 LCR; 또는 (3) T 세포에서의 발현을 위한 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 T 세포 수용체 α/δ LCR 또는 CD2 LCR을 포함할 수 있다. 예를 들어, 조혈 줄기 세포에서의 발현을 위한 단백질은 지중해빈혈, 겸상 적혈구 빈혈, 또는 혈우병으로부터 선택된 장애의 치료를 위한 단백질일 수 있고; B 세포에서의 발현을 위한 단백질은 항체, 예컨대 치료 항체일 수 있고; T 세포에서의 발현을 위한 단백질은 T 세포 수용체 (TCR), 예컨대 조작된 TCR 또는 키메라 항원 수용체 (CAR)일 수 있다. 따라서, 본 개시내용은 특히 (i) γ-글로빈, β-글로빈, 또는 인자 VIII를 부분적으로 또는 완전히 기능적으로 대체할 수 있는 단백질을 코딩하는 코딩 서열과 작동가능하게 연결된 β-글로빈 LCR, 또는 겸상 적혈구 빈혈을 유발하는 돌연변이의 교정을 위한 유전자 편집 CRISPR-Cas; (2) 항체를 코딩하는 코딩 서열과 작동가능하게 연결된 이뮤노글로불린 중쇄 LCR; 또는 (3) TCR 또는 CAR을 코딩하는 코딩 서열과 작동가능하게 연결된 T 세포 수용체 α/δ LCR 또는 CD2 LCR을 포함한다.

(V) 트랜스포사제

트랜스포사제는 전위할 수 있고 전위를 매개할 수 있는 기능적 핵산-단백질 복합체의 성분인 효소를 지칭한다. 트랜스포사제는 또한 레트로트랜스포손으로부터의 또는 레트로바이러스 기원의 인테그라제를 지칭한다. 전위 반응은 트랜스포사제 및 트랜스포사제 또는 인테그라제 효소를 포함한다. 특정한 실시양태에서, 통합의 효율, 통합될 수 있는 DNA 서열의 크기, 및 게놈 내로 통합될 수 있는 DNA 서열의 카피의 수는 이러한 전위가능 요소를 사용하는 것에 의해 개선될 수 있다. 트랜스포손은 DNA의 보다 큰 절편의 상류 및 하류에 말단 반복 서열을 갖는 짧은 핵산 서열을 포함한다. 트랜스포사제는 말단 반복 서열에 결합하고, 게놈의 또 다른 부분으로의 트랜스포손의 이동을 촉매한다.

(V-a) 슬리핑 뷰티 트랜스포사제 SB100x의 사용

슬리핑 뷰티 (SB)는 연어과 어류의 게놈으로부터 유래된 트랜스포사제이다. SB는 문헌 [Ivics et al., Cell 91, 501-510, 1997; Izsvak et al., J. Mol. Biol., 93-102, 302(1), 2000; Geurts et al., Molecular Therapy, 8(1):108-117, 2003; Mates et al., Nature Genetics 41, 753-761, 2009]; 및 미국 특허 번호 6,489,458; 7,148,203; 및 7,160,682; 미국 공개 번호 2011/117072; 2004/077572; 및 2006/252140에 기재되어 있다.

SB 트랜스포사제의 활성을 증가시키기 위해 체계적인 돌연변이유발 연구가 착수되었다. 예를 들어, 얀트(Yant) 등은 SB 트랜스포사제의 N-말단 95 AA의 알라닌으로의 체계적 교환에 착수하였다 (Mol. Cell Biol. 24: 9239-9247, 2004). 이들 치환 중 10개는 참조로서 SB10과 비교하여 200-400%의 과다활성을 유발하였다. 문헌 [Baus et al., Mol. Therapy 12: 1148-1156, 2005]에 기재된 SB16은 SB10과 비교하여 16-배 활성 증가를 갖는 것으로 보고되었다. 추가의 과다활성 SB 변이체는 문헌 [Zayed et al., (Mol Therapy, 9(2):292-304, 2004)] 및 미국 특허 번호 9,840,696에 기재되어 있다. SB 트랜스포사제의 몇몇 변이체를 스크리닝한 후, SB100X가 제1-세대 트랜스포사제보다 100-배 더 효율적인 것으로 밝혀졌다.

SB 트랜스포손은 전위시키기 위해 원형화될 필요가 있다 (Yant, et al., Nature Biotechnology, 20: 999-1005, 2002). 또한, 1.9 내지 7.2 kb의 트랜스포손의 경우 트랜스포손의 길이와 전위 빈도 사이에 역 선형 관계가 존재한다. 다시 말해서, SB 트랜스포사제는 보다 작은 트랜스포손과 비교하여 보다 큰 트랜스포손의 전달을 덜 효율적으로 매개한다 (Geurts, et al., Mol Ther., 8(1):108-17, 2003).

(V-a-i) 역전된 반복부 서열 및 위치

특정한 실시양태에서, IR (역전된 반복부)/DR (직접 반복부)을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 66을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 67을 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR 코딩 서열은 서열식별번호: 68을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 69를 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 70을 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR을 코딩하는 서열은 서열식별번호: 71을 포함한다. 특정한 실시양태에서, IR/DR을 코딩하는 서열 및 슬리핑 뷰티의 염색체 서열은 서열식별번호: 72를 포함한다. 특정한 실시양태에서, 슬리핑 뷰티의 IR/DR을 코딩하는 서열은 서열식별번호: 73을 포함한다.

(V-a-ii) 트랜스포사제 서열

특정 실시양태에서, 슬리핑 뷰티 트랜스포사제 효소는 서열식별번호: 74의 서열을 갖는다.

특정 실시양태에서, 과다활성 슬리핑 뷰티는 SB100X이다. 특정한 실시양태에서, SB100X는 서열식별번호: 75의 서열을 갖는다.

(V-b) 다른 트랜스포사제

SB에 더하여, 인간을 포함한 척추동물의 게놈 내로의 핵산의 삽입을 용이하게 하는 다수의 트랜스포사제가 관련 기술분야에 기재되어 있다. 이러한 트랜스포사제의 예는 피기백(piggyBac)™ (예를 들어, 레피도프테란(lepidopteran) 세포 및/또는 미오티스 루시푸구스(Myotis lucifugus)로부터 유래됨); 마리네르 (예를 들어, 드로소필라(Drosophila)로부터 유래됨); 프로그 프린스 (예를 들어, 라나 피피엔스(Rana pipiens)로부터 유래됨); Tol1; Tol2 (예를 들어, 메다카 피쉬(medaka fish)로부터 유래됨); Tc부스터(TcBuster)™ (예를 들어, 거짓쌀도둑거저리 트리볼리움 카스타네움(Tribolium castaneum)으로부터 유래됨), 헬라이세르(Helraiser), 히마르1(Himar1), 패스포트(Passport), 미노스(Minos), Ac/Ds, PIF, 하르빈게르(Harbinger), 하르빈게르3-DR, HSmar1, 및 스핀온(spinON)을 포함한다.

(V-b-i) 성분 및 서열

피기백™ (PB) 트랜스포사제는, 예를 들어 문헌 [Fraser et al., Insect Mol. Biol., 5:141-51, 1996; Mitra et al., EMBO J. 27:1097-1109, 2008; Ding et al., Cell, 122:473-83, 2005]; 및 미국 특허 번호 6,218,185; 6,551,825; 6,962,810; 7,105,343; 및 7,932,088에 기재된 조밀한 기능적 트랜스포사제 단백질이다. 과다활성 피기백™ 트랜스포사제는 미국 특허 번호 10,131,885에 기재되어 있다.

특정한 실시양태에서, PB 트랜스포사제는 서열식별번호: 76 (진뱅크 ABS12111.1)에 제시된 서열을 갖는다.

특정한 실시양태에서, 프로그 프린스(Frog Prince) 트랜스포사제는 서열식별번호: 77 (진뱅크: AAP49009.1)에 제시된 바와 같은 서열을 갖는다. 또한 US2005/0241007을 참조한다.

특정한 실시양태에서, TcBuster 트랜스포사제는 서열식별번호: 78 (진뱅크: ABF20545.1)에 제시된 바와 같은 서열을 갖는다.

특정한 실시양태에서, Tol2 트랜스포사제는 서열식별번호: 79 (진뱅크: BAA87039.1)에 제시된 서열을 갖는다.

DNA 트랜스포손에 대한 추가의 정보는, 예를 들어 문헌 [Munoz-Lopez & Garcia Perez, Curr Genomics, 11(2):115-128, 2010]에서 찾아볼 수 있다.

(VI) 조절 성분

용어 "조절 성분"은 프로모터, 인핸서, 전사 종결 신호, 폴리아데닐화 서열, 및 다른 발현 제어 서열을 포함한다. 본 발명에서 언급되는 조절 성분은 핵산 서열 숙주 세포의 발현을 제어하는 것을 포함한다.

(VI-a) 프로모터

프로모터는 전사 개시 전 RNA 폴리머라제가 결합하는, 통상적으로 관련 코딩 서열의 상류 (5')에 있는 비-코딩 게놈 DNA 서열이다. 이러한 결합은 전사가 특이적 전사 개시 부위에서 개시되도록 RNA 폴리머라제를 정렬시킨다. 프로모터의 뉴클레오티드 서열은 효소 및 그에 부착되는 다른 관련 단백질 인자의 성질 및 RNA 합성 속도를 결정한다. RNA는 프로세싱되어 메신저 RNA (mRNA)를 생산하며, 이는 코딩된 폴리펩티드의 아미노산 서열로의 RNA 서열의 번역을 위한 주형으로서의 역할을 한다. 5' 비-번역 리더 서열은 mRNA의 개시 및 번역에서 소정의 역할을 할 수 있는 코딩 영역 상류의 mRNA 영역이다. 3' 전사 종결/폴리아데닐화 신호는 식물 세포에서 RNA 합성의 종결 및 3' 단부에의 폴리아데닐레이트 뉴클레오티드의 부가를 유발하도록 기능하는, 코딩 영역 하류의 비-번역 영역이다.

프로모터는 일반적 프로모터, 조직-특이적 프로모터, 세포-특이적 프로모터, 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터, 및/또는 유도성 (조건부) 프로모터를 포함할 수 있다. 유도성 프로모터는 특정 조건, 신호 또는 세포 사건에 반응하여 발현을 제어한다. 예를 들어, 프로모터는 프로모터로부터 전사를 수행하기 위해 특정한 리간드, 소분자, 전사 인자 또는 호르몬 단백질을 필요로 하는 유도성 프로모터일 수 있다. 프로모터의 특정한 예는 AFP (α-태아단백질) 프로모터, 아밀라제1C 프로모터, 아쿠아포린-5 (AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, CMV (시토메갈로바이러스 바이러스) 프로모터, minCMV 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, EF1α (신장 인자 lα) 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, Hsp68 최소 프로모터, HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터 (MLP), Mb 프로모터, Rho 프로모터, MT (메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK (포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 폴리머라제 III (Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, 라우스 육종 바이러스 (RSV) 긴-말단 반복부 (LTR) 프로모터, SP-B 프로모터, 서바이빈 프로모터, SV40 (원숭이 바이러스 40) 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, 및 WASP 프로모터를 포함한다.

(VI-a-i) 프로모터의 공급원

프로모터는 천연 프로모터 또는 복합 프로모터로서 수득될 수 있다. 천연 프로모터, 또는 최소 프로모터는 주어진 유전자의 5' 영역으로부터의 뉴클레오티드 서열을 포함하는 프로모터를 지칭한다. 천연 프로모터는 코어 프로모터 및 그의 천연 5'UTR을 포함한다. 특정한 실시양태에서, 5'UTR은 인트론을 포함한다. 복합 프로모터는 상이한 기원의 프로모터 요소를 조합하거나 또는 원위 인핸서를 동일하거나 상이한 기원의 최소 프로모터와 조합함으로써 유래된 프로모터를 지칭한다.

(VI-a-ii) 예시적인 프로모터의 서열 및 서열에 대한 변이

특정한 실시양태에서, SV40 프로모터는 서열식별번호: 80에 제시된 서열을 포함한다. 특정한 실시양태에서, dESV40 프로모터 (인핸서 영역이 결실된 SV40 프로모터)는 서열식별번호: 81에 제시된 서열을 포함한다. 특정한 실시양태에서, 인간 텔로머라제 촉매 서브유닛 (hTERT) 프로모터는 서열식별번호: 82에 제시된 서열을 포함한다. 특정한 실시양태에서, 슈미트-루핀(Schmidt-Ruppin) A 균주로부터 유래된 RSV 프로모터는 서열식별번호: 83에 제시된 서열을 포함한다. 특정한 실시양태에서, hNIS 프로모터는 서열식별번호: 84에 제시된 서열을 포함한다. 특정한 실시양태에서, 인간 글루코코르티코이드 수용체 1A (hGR 1/Ap/e) 프로모터는 서열식별번호: 85에 제시된 서열을 포함한다.

특정한 실시양태에서, 프로모터는 야생형 프로모터 서열 및 야생형 프로모터에 비해 특정 위치에서 임의적인 변화 (삽입, 점 돌연변이 또는 결실 포함)를 갖는 서열을 포함한다. 특정한 실시양태에서, 프로모터는 20개 뉴클레오티드 스트레치당 1개 변화, 20개 뉴클레오티드 스트레치당 2개 변화, 20개 뉴클레오티드 스트레치당 3개 변화, 20개 뉴클레오티드 스트레치당 4개 변화, 또는 20개 뉴클레오티드 스트레치당 5개 변화를 가짐으로써 자연 발생 프로모터와 상이하다. 특정한 실시양태에서, 천연 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 염기에서 변경될 것이다. 프로모터는 다른 바이러스 서열의 존재 또는 부재 하에 LTR 서열의 약 50개 뉴클레오티드 내지 LTR 서열의 100, 200, 250 또는 350개 뉴클레오티드를 포함하여 길이가 다양할 수 있다.

(VI-a-iii) 프로모터의 발현 패턴

일부 프로모터는 조직 또는 세포에 특이적이고, 일부 프로모터는 조직 또는 세포에 비-특이적이다. 포유동물 세포의 각각의 유전자는 그 자신의 프로모터를 갖고, 일부 프로모터는 특정 세포 유형에서만 활성화될 수 있다. 비-특이적 프로모터 또는 편재성 프로모터는 광범위한 세포, 조직 및 세포 주기에서 프로모터 서열과 작동가능하게 연결된 유전자 또는 뉴클레오티드 서열의 전사의 개시를 돕는다. 특정한 실시양태에서, 프로모터는 비-특이적 프로모터이다. 특정한 실시양태에서, 비-특이적 프로모터는 CMV 프로모터, RSV 프로모터, SV40 프로모터, 포유동물 신장 인자 1α (EF1α) 프로모터, β-act 프로모터, EGR1 프로모터, eIF4A1 프로모터, FerH 프로모터, FerL 프로모터, GAPDH 프로모터, GRP78 프로모터, GRP94 프로모터, HSP70 프로모터, β-Kin 프로모터, PGK-1 프로모터, ROSA 프로모터, 및/또는 유비퀴틴 B 프로모터를 포함한다.

특이적 프로모터는 프로모터 서열과 작동가능하게 연결된 뉴클레오티드 서열의 세포 특이적 발현을 돕는다. 특정한 실시양태에서, 특이적 프로모터는 B 세포, 단핵구 세포, 백혈구, 대식세포, 췌장 선방 세포, 내피 세포, 성상세포, 및/또는 임의의 다른 세포 유형 또는 세포 주기에서 활성이다. 특정한 실시양태에서, 프로모터는 특이적 프로모터이다. 특정한 실시양태에서, SYT8 유전자 프로모터는 인간 섬에서 유전자 발현을 조절한다 (Xu, et al., Nat Struct Mol Biol., 2011, 18: 372-378). 특정한 실시양태에서, 칼리크레인 프로모터는 관 세포 특이적 타액선에서 유전자 발현을 조절한다. 특정한 실시양태에서, 아밀라제 1C 프로모터는 선방 세포에서의 유전자 발현을 조절한다. 특정한 실시양태에서, 아쿠아포린-5 (AP5) 프로모터는 선방 세포에서 유전자 발현을 조절한다 (Zheng and Baum, Methods Mol Biol., 434: 205-219, 2008). 특정한 실시양태에서, B29 프로모터는 B 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD14 프로모터는 단핵구 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD43 프로모터는 백혈구 및 혈소판에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD45 프로모터는 조혈 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, CD68 프로모터는 대식세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 데스민 프로모터는 근육 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 엘라스타제-1 프로모터는 췌장 선방 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 엔도글린 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, 피브로넥틴 프로모터는 분화 세포 또는 치유 조직에서 유전자 발현을 조절한다. 특정한 실시양태에서, Flt-1 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, GFAP 프로모터는 성상세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, GPIIb 프로모터는 거핵구에서 유전자 발현을 조절한다. 특정한 실시양태에서, ICAM-2 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, Mb 프로모터는 근육에서 유전자 발현을 조절한다. 특정한 실시양태에서, NphsI 프로모터는 족세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, OG-2 프로모터는 골모세포, 상아질모세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, SP-B 프로모터는 폐 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, SYN1 프로모터는 뉴런에서 유전자 발현을 조절한다. 특정한 실시양태에서, WASP 프로모터는 조혈 세포에서 유전자 발현을 조절한다.

특정한 실시양태에서, 프로모터는 종양-특이적 프로모터이다. 특정한 실시양태에서, AFP 프로모터는 간세포성 암종에서 유전자 발현을 조절한다. 특정한 실시양태에서, CCKAR 프로모터는 췌장암에서 유전자 발현을 조절한다. 특정한 실시양태에서, CEA 프로모터는 상피암에서 유전자 발현을 조절한다. 특정한 실시양태에서, c-erbB2 프로모터는 유방암 및 췌장암에서 유전자 발현을 조절한다. 특정한 실시양태에서, COX-2 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, CXCR4 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, E2F-1 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, HE4 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, LP 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, MUC1 프로모터는 암종 세포에서 유전자 발현을 조절한다. 특정한 실시양태에서, PSA 프로모터는 전립선 및 전립선암에서 유전자 발현을 조절한다. 특정한 실시양태에서, 서바이빈 프로모터는 종양에서 유전자 발현을 조절한다. 특정한 실시양태에서, TRP1 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다. 특정한 실시양태에서, Tyr 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다.

(VI-b) 마이크로 RNA 부위

다양한 실시양태에서, 마이크로RNA 제어 시스템은 유전자의 발현이 마이크로RNA 부위 (예를 들어, 마이크로RNA가 상호작용할 수 있는 핵산 서열)의 존재에 의해 조절되는 방법 또는 조성물을 지칭할 수 있다. 특정한 실시양태에서, 마이크로RNA 제어 시스템은 유전자가 표적 세포, 예컨대 HSPC, 예를 들어 종양 침윤 HSPC에서 독점적으로 발현되도록 유전자의 발현을 조절하였다. 일부 실시양태에서, 관심 단백질 또는 핵산 (예를 들어, 항암제, 예컨대 CAR, TCR, 항체, 및/또는 체크포인트 억제제, 예를 들어 체크포인트 억제제인 αPD-L1 항체 (예를 들어, αPD-L1γ1 항체))을 코딩하는 핵산 (예를 들어, 치료 유전자)은 마이크로RNA 부위, 복수의 동일한 마이크로RNA 부위, 또는 복수의 별개의 마이크로RNA 부위를 포함하거나, 그와 회합되거나, 또는 그와 작동가능하게 연결된다. 관련 기술분야의 통상의 기술자는 마이크로RNA 부위를 관심 유전자를 코딩하는 서열을 갖는 핵산 또는 그의 부분과 회합시키는 수단 및 기술에 친숙할 것이지만, 특정의 비제한적 예가 본원에 제공된다. 예를 들어, 관심 유전자 (예를 들어, αPD-L1γ1 항체를 코딩하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서의 발현을 억제하지만 종양-침윤 백혈구에서의 발현은 억제하지 않는 1개 이상의 마이크로RNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 특정의 특정한 예에서, 관심 유전자 (예를 들어, αPD-L1γ1 항체를 코딩하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서의 발현을 억제하지만 종양-침윤 백혈구에서의 발현은 억제하지 않는 1개 이상의 miR423-5p 마이크로RNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 다양한 실시양태에서, 마이크로RNA 제어 시스템은 1개 이상의 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 마이크로RNA 부위를 포함하거나 또는 관심 단백질 또는 핵산의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다. 다양한 실시양태에서, 마이크로RNA 제어 시스템은 1개 이상의 miR423-5p 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 miR423-5p 마이크로RNA 부위를 포함하거나 또는 관심 단백질 또는 핵산의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다. 일부 특정한 실시양태에서, 마이크로RNA 제어 시스템은 αPD-L1γ1 항체를 코딩하고, 1개 이상의 miR423-5p 마이크로RNA 부위, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 miR423-5p 마이크로RNA 부위, 예를 들어 miR423-5p 마이크로RNA 부위를 포함하거나 또는 αPD-L1γ1 항체의 발현이 그에 의해 조절되는 핵산을 포함할 수 있다.

(VI-c) 특정한 조절 성분, 특정한 코딩 서열, 및/또는 특정한 긴 LCR의 쌍형성

본 개시내용의 트랜스포손 페이로드는 코딩 핵산 서열 (예를 들어, 단백질을 코딩하는 핵산 서열)과 작동가능하게 연결된 LCR, 예컨대 긴 LCR을 포함할 수 있으며, 여기서 코딩 핵산 서열은 또한 프로모터와 작동가능하게 연결된다. 다양한 실시양태에서, 트랜스포손 페이로드는 (i) LCR 및 (ii) 인간 게놈에서 LCR과 전형적으로 작동가능하게 연결된 프로모터 둘 다와 작동가능하게 연결된 코딩 핵산 서열을 포함한다. 다시 말해서, 트랜스포손 페이로드는 LCR을 그와 자연 쌍형성된 프로모터와 함께 포함할 수 있으며, 여기서 둘 다 함께 코딩 핵산 서열의 발현을 구동한다. 다양한 실시양태에서, LCR과 자연 쌍형성된 프로모터는 표 2에 제시된 바와 같은 프로모터이다. 다양한 실시양태에서, 프로모터는 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열의 개시 코돈의 바로 상류에 있는 핵산 서열, 예를 들어 참조 게놈에서 예를 들어 개시 코돈의 바로 상류의 100bp, 200bp, 300bp, 400bp, 500bp, 1,000bp, 1,500bp, 2,000bp, 3,000bp, 4,000bp, 5,000bp, 또는 그 초과의 뉴클레오티드를 포함하는 핵산 서열이다. 다양한 실시양태에서, 프로모터는 예를 들어 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열의 개시 코돈의 바로 상류의 100bp-5,000bp, 100bp-4,000bp, 100bp-3,000bp, 100bp-2,000bp, 100bp-1,000bp, 1,000bp-5,000bp, 1,000bp-4,000bp, 1,000bp-3,000bp, 또는 1,000bp-2,000bp를 포함하는 핵산 서열을 포함하는 핵산 서열이다. 다양한 실시양태에서, 인간 게놈에서 LCR과 자연 쌍형성된 코딩 서열은 표 1 또는 표 2에 제시된 코딩 서열이다.

다양한 실시양태에서, 트랜스포손 페이로드는 (i) LCR 및 (ii) 인간 게놈에서 LCR과 전형적으로 작동가능하게 연결되지 않은 프로모터 둘 다와 작동가능하게 연결된 코딩 핵산 서열을 포함한다. 본 개시내용은 LCR이 특정한 콘텍스트에서 진화될 수 있지만, 인간 게놈에서 전형적으로 작동가능하게 연결되지 않은 코딩 핵산 서열의 발현을 제어하고/거나 LCR이 인간 게놈에서 전형적으로 회합되지 않은 프로모터에 의해 또한 구동되는 코딩 핵산 서열 발현의 발현을 구동하는데 적용될 수 있다는 인식을 포괄한다. 따라서, LCR은 자연적으로 작동가능하게 연결된 프로모터 및/또는 유전자와 쌍형성될 수 있거나 (예를 들어, β-글로빈 프로모터와 함께 β-글로빈 또는 γ-글로빈을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 β-글로빈 LCR을 포함하는 트랜스포손 페이로드에서), 또는 자연적으로 작동가능하게 연결되지 않은 프로모터 및/또는 유전자와 쌍형성될 수 있다 (예를 들어, 인자 VIII에 대한 대체물, 예컨대 ET3을 코딩하는 코딩 핵산 서열과 작동가능하게 연결된 β-글로빈 LCR).

표 2.

(VII) 벡터

(VII-a) 대형 페이로드 통합을 개선시키기 위해 최적화될 수 있는 벡터 특색

아데노바이러스 게놈은 혈청형에 따라 26 kb 내지 45 kb 길이 범위의 선형, 비-절편화 이중-가닥 DNA이다. 아데노바이러스 DNA는 양쪽 단부 상에서 역전된 말단 반복부 (ITR)와 플랭킹되고, 이는 자기-프라이머로서 작용하여 프리마제-비의존성 DNA 합성을 촉진하고 숙주 게놈 내로의 통합을 용이하게 한다. 아데노바이러스 게놈은 또한 적절한 바이러스 전사체 패키징을 용이하게 하고 게놈의 좌측 아암에 위치하는 패키징 신호를 함유한다. 바이러스 전사체는 초기 전사 단위, E1, E2, E3, 및 E4, 및 Ad 비리온의 구조적 성분을 코딩하는 후기 전사 단위를 포함한 여러 단백질을 코딩한다 (Lee et al., Genes Dis., 4(2):43-63, 2017).

아데노바이러스는 대형의, 이십면체 형상의 비-외피보유 바이러스이다. 바이러스 캡시드는 섬유, 펜톤, 및 헥손 기반 단백질을 비롯한 3가지 유형의 단백질을 포함한다. 헥손은 바이러스 캡시드의 대부분을 구성하여, 20개의 삼각형 면을 형성한다. 펜톤 염기는 캡시드의 12개의 버텍스에 위치하고, 섬유 (또한 노브형 섬유로도 지칭됨)는 각각의 펜톤 염기로부터 돌출된다. 이들 단백질, 펜톤 및 섬유는 숙주 세포에 대한 캡시드의 부착을 용이하게 하기 때문에 수용체 결합 및 내재화에서 특히 중요하다 (Lee et al., Genes Dis., 4(2):43-63, 2017).

아데노바이러스는 그의 안정하고 안전한 게놈으로 인해 유전자 요법에 특히 적합하다. Ad 벡터의 이중 가닥 특징은 단일-가닥 DNA 또는 RNA 바이러스와 비교하여 벡터 안정성을 증가시키고 유전자 시프트 또는 드리프트를 감소시킨다. DNA 복제 동안 오류를 감소시키기 위해, Ad 벡터는 교정 DNA 폴리머라제를 사용한다. 또한, Ad 벡터는 그의 DNA를 숙주의 게놈과 통합시키지 않고, 오히려 에피솜 DNA를 숙주 세포의 핵으로 전달한다.

Ad 벡터는 또한 유전자 변형에 대해 감수성이고, 연구는 유전자 요법에서의 그의 용도를 추가로 개선시키기 위해 변형을 가하였다.

(VII-b) 혈청형 및 유사형

인간 아데노바이러스 (Ad)는 50종 초과의 혈청형을 함유하는 6개의 하위군으로 분류된다. 군은 A에서 F로 라벨링된다. 군 B Ad는 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, Ad 35, 및 Ad50을 포함한다. Ad5는 군 C로 분류된다. 50종 초과의 인간 Ad 혈청형이 존재하기 때문에, Ad 벡터는 상이한 관심 숙주 세포를 표적화하도록 변형될 수 있다. 상이한 Ad 혈청형은 상이한 세포 수용체에 결합하고, 상이한 진입 메카니즘을 사용한다.

상이한 Ad 혈청형의 감염성은 다수의 인간 세포주로 제한된다. 감염성 연구는 Ad5 및 Ad3이 내피 또는 림프성 세포를 감염시키고 표적화하는데 특히 적합한 반면, Ad9, Ad11 및 Ad35는 인간 골수 세포를 효율적으로 감염시켰음을 밝혀내었다. 따라서, Ad9, Ad11 및 Ad35의 섬유 단백질의 노브 도메인은 Ad5 벡터를 인간 골수 세포로 재표적화하기 위한 탁월한 후보이다. 다른 가능한 혈청형은 Ad7을 포함한다.

특정한 실시양태에서, Ad 벡터는 재조합 벡터이다. 특정한 실시양태에서, Ad5/35는 Ad5의 섬유 꼬리 도메인 및 Ad35의 섬유 샤프트 및 노브 도메인을 포함하는 변형된 섬유 단백질을 발현하는 재조합 Ad5 벡터이다. 특정한 실시양태에서, Ad 벡터는 Ad5, Ad35, Ad5/35, Ad5/35++, 또는 Ad35++로부터 선택된다.

특정한 실시양태에서, Ad 벡터는 CD46 결합 아데노바이러스 섬유 폴리펩티드를 코딩하는 핵산을 포함한다. 섬유 폴리펩티드는 (a) 캡시드의 펜톤 염기 단백질과 상호작용하고 세포 핵으로의 단백질의 수송에 필요한 신호를 함유하는 N-말단 꼬리 도메인 또는 그의 등가물; (b) 1개 이상의 샤프트 도메인 또는 그의 등가물; 및 (c) 수용체 결합을 위한 결정기를 함유하는 C-말단 노브 도메인 또는 그의 등가물을 포함하는 폴리펩티드를 지칭한다. CD46에 결합하는 동종삼량체로 형성될 수 있는 섬유 폴리펩티드의 C-말단 도메인은 섬유 노브로 지칭된다. 섬유 단백질의 C-말단 부분은 삼량체화되어 CD46에 결합하는 섬유 구조를 형성할 수 있다. 섬유 노브만이 CD46-표적화에 요구된다. 따라서, 제2 핵산 모듈은 CD46에 결합하는 1개 이상의 인간 아데노바이러스 노브 도메인 또는 그의 등가물을 포함하는 아데노바이러스 섬유를 코딩한다. 다중 노브 도메인이 코딩되는 경우에, 노브 도메인은 이들이 각각 CD46에 결합하는 한 동일하거나 상이할 수 있다. 본원에 사용된 노브 도메인 "기능적 등가물"은 CD34+ 세포의 표면 상의 CD46에 대한 결합을 보유하는 1개 이상의 아미노산 결실, 치환, 또는 부가를 갖는 노브 도메인이다.

아데노바이러스 섬유 폴리펩티드는 또한 샤프트 도메인을 포함한다. 샤프트 도메인은 CD46 결합에 중요하지 않다. 특정한 실시양태에서, 샤프트 도메인은 상이한 인간 Ad 혈청형으로부터의 1개 이상의 샤프트 도메인을 포함할 수 있다. 특정한 실시양태에서, 샤프트 도메인은 섬유 노브 삼량체화를 허용하는 샤프트 도메인의 임의의 부분 또는 그의 돌연변이체를 포함할 수 있다. 특정한 실시양태에서, 샤프트 도메인은 Ad5 샤프트 도메인, Ad35 샤프트 도메인, 및 그의 기능적 등가물로부터 선택된다. 본원에 사용된 샤프트 도메인의 기능적 등가물은 섬유 노브 삼량체화를 허용하는 샤프트 도메인의 임의의 부분 또는 그의 돌연변이체이다. 1개 초과의 샤프트 도메인 또는 등가물이 존재하는 경우에, 각각의 샤프트 도메인 또는 등가물은 동일할 수 있거나, 또는 샤프트 도메인 또는 등가물의 1개 이상의 카피는 단일 재조합 폴리펩티드에서 상이할 수 있다.

아데노바이러스 섬유 폴리펩티드는 또한 꼬리 도메인을 포함한다. 아데노바이러스 꼬리 도메인 또는 그의 돌연변이체는 (헬퍼 Ad 바이러스 상의) 캡시드의 펜톤 염기 단백질과 상호작용하고, 세포 핵으로의 단백질의 수송에 필요한 신호를 함유한다. 사용된 꼬리 도메인은 HD-Ad 생산에 사용되는 헬퍼 Ad 바이러스 캡시드의 펜톤 기반 단백질과 상호작용할 것이다. 따라서, Ad5 헬퍼 바이러스가 사용되는 경우, 꼬리 도메인은 Ad5로부터 유래될 것이고; Ad35 헬퍼 바이러스가 사용되는 경우, 꼬리 도메인은 Ad 35로부터 유래될 것인 등이다.

특정한 실시양태에서, Ad 벡터는 Ad5/35 벡터를 포함한다. 특정한 실시양태에서, Ad5/35 벡터는 Ad35 섬유 노브 및 Ad5 샤프트를 갖는 키메라 Ad 벡터이다.

특정한 실시양태에서, Ad 벡터는 Ad5/35++ 벡터를 포함한다. 특정한 실시양태에서, Ad5/35++ 벡터는 돌연변이체 Ad35 섬유 노브를 갖는 키메라 Ad5/35 벡터이다. 벡터는 CD46에 대한 친화도를 25-배 증가시키고, 보다 낮은 감염 다중도 (MOI)에서 세포 형질도입 효율을 증가시키기 위해 돌연변이된다 (Li and Lieber, FEBS Letters, 593(24): 3623-3648, 2019).

특정한 실시양태에서, Ad 벡터는 Ad35 벡터를 포함한다. 특정한 실시양태에서, Ad35 벡터는 Ad35 섬유 노브 및 샤프트를 갖는 부류 B Ad 벡터이다.

특정한 실시양태에서, Ad 벡터는 Ad35++ 벡터를 포함한다. 특정한 실시양태에서, Ad35++ 벡터는 증진된 Ad35 섬유 노브 및 Ad35 샤프트를 갖는 Ad35 벡터이다.

특정한 실시양태에서, Ad 벡터는 Ad3, Ad7, Ad11, Ad14, Ad16, Ad21, Ad34, 또는 Ad50을 포함한다.

(VII-c) 성분

특정한 실시양태에서, 벡터는 페이로드, 조절 성분, 통합 요소, 선택 카세트, 및 스터퍼 서열을 포함한 성분을 포함한다.

(VII-c-i) 페이로드

특정한 실시양태에서, 벡터는 페이로드 (예를 들어, 트랜스포손 페이로드)를 포함한다. 특정한 실시양태에서, 페이로드는 관심 유전자를 코딩한다. 특정한 실시양태에서, 페이로드는 발현을 위한 추가의 요소, 예컨대 인트론 서열, 신호 서열, 핵 국재화 서열, 전사 종결 서열, 또는 IRES 유형의 번역의 개시를 위한 부위를 포함할 수 있다. 페이로드의 추가의 설명은 본원에서 찾아볼 수 있다.

(VII-c-ii) 조절 성분

특정한 실시양태에서, 벡터는 조절 성분을 포함한다. 조절 성분은 섹션 VI에 보다 상세히 기재되어 있다. 조절 성분은 인핸서, 프로모터, 및 유전자 발현을 조절하는 다른 서열을 포함할 수 있다.

특정한 실시양태에서, 조절 성분은 페이로드를 코딩하는 서열의 RNA로의 전사 및/또는 mRNA의 단백질로의 번역을 용이하게 한다. 적합한 프로모터는 예를 들어 진핵 또는 바이러스 기원의 것을 포함한다. 적합한 프로모터는 구성적 또는 조절성 (예를 들어, 유도성)일 수 있다. 적합한 프로모터의 예는 예를 들어 AFP (α-태아단백질) 프로모터, 아밀라제1C 프로모터, 아쿠아포린-5 (AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, CMV (시토메갈로바이러스 바이러스) 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, EF1α (신장 인자 lα) 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터 (MLP), Mb 프로모터, Rho 프로모터, MT (메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK (포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 폴리머라제 III (Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, 라우스 육종 바이러스 (RSV) 긴-말단 반복부 (LTR) 프로모터, SP-B 프로모터, 서바이빈 프로모터, SV40 (원숭이 바이러스 40) 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, 및 WASP 프로모터를 포함한다.

(VII-c-iii) 통합 요소

다양한 SB 트랜스포사제가 관련 기술분야에 공지되어 있다. 관련 기술분야에 공지된 SB 트랜스포사제의 예는, 비제한적으로, SB, SB11, SB12, HSB1, HSB2, HSB3, HSB4, HSB5, HSB13, HSB14, HSB15, HSB16, HSB17, SB100x, 및 SB150x를 포함한다. 특정한 실시양태에서, 본 개시내용은 SB100x 트랜스포사제를 이용한다. 일부 실시양태에서, SB100x 또는 SB150x 트랜스포사제가 사용될 수 있다. 일부 실시양태에서, 임의의 SB 트랜스포사제가 사용될 수 있다.

SB 트랜스포사제는 SB 역전된 말단 반복부 (ITR) 사이에 위치하는 핵산 트랜스포손 페이로드를 전위시킨다. 다양한 SB ITR이 관련 기술분야에 공지되어 있다. 일부 실시양태에서, SB ITR은 트랜스포사제에 대한 인식 신호로서 작용하는 32 bp 길이의 불완전한 직접 반복부를 포함하는 230 bp 서열이다. 조작된 SB ITR은 pT, pT2, pT3, pT2B, 및 pT4로 공지된 SB ITR을 비롯하여 관련 기술분야에 공지되어 있다. 일부 실시양태에서, pT4 ITR은, 예를 들어 SB100x 트랜스포사제에 의한 전위를 위해, 예를 들어 본 개시내용의 트랜스포손 페이로드에 플랭킹시키는데 사용된다.

(VII-c-iv) 선택 요소

특정한 실시양태에서, 벡터는 선택 카세트를 포함한 선택 요소를 포함한다. 특정한 실시양태에서, 선택 카세트는 프로모터, 선택제에 대한 저항성을 부가하는 cDNA, 및 독립적인 전사 요소의 전사를 정지시킬 수 있는 폴리 A 서열을 포함한다.

선택 카세트는 (a) 항생제 또는 다른 독소에 대한 저항성을 부여하거나, (b) 영양요구성 결핍을 보완하거나, 또는 (c) 복합 배지로부터 이용가능하지 않은 중요한 영양분을 공급하는 단백질, 예를 들어 바실루스의 경우 D-알라닌 라세마제를 코딩하는 유전자를 코딩할 수 있다. 임의의 수의 선택 시스템을 사용하여 형질전환된 세포주를 회수할 수 있다. 특정한 실시양태에서, 양성 선택 카세트는 네오마이신, 히그로마이신, 암피실린, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신에 대한 저항성 유전자를 포함한다. 특정한 실시양태에서, 양성 선택 카세트는 메토트렉세이트에 대한 저항성을 제공하는 DHFR (디히드로폴레이트 리덕타제) 유전자, O⁶BG/BCNU에 대한 저항성을 담당하는 MGMT P140K 유전자, HAT 선택 배지 내에 존재하는 특정 염기 (아미노프테린, 하이포크산틴, 티미딘)의 변환을 담당하는 HPRT (하이포크산틴 포스포리보실 트랜스퍼라제) 유전자 및 일부 약물에 대한 해독을 위한 다른 유전자를 포함한다. 특정한 실시양태에서, 선택제는 네오마이신, 히그로마이신, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신, 암피실린, O⁶BG/BCNU, 메토트렉세이트, 테트라시클린, 아미노프테린, 히포크산틴, 티미딘 키나제, DHFR, Gln 신테타제, 또는 ADA를 포함한다.

특정한 실시양태에서, 음성 선택 카세트는 배양 배지에 존재하는 기질을 유전자를 발현하는 세포에 대한 독성 물질로 변환시키기 위한 유전자를 포함한다. 이들 분자는 디프테리아 독소 (DTA)의 해독 유전자 (Yagi et al., Anal Biochem. 214(1):77-86, 1993; Yanagawa et al., Transgenic Res. 8(3):215-221, 1999), 간시클로비르 또는 FIAU의 존재에 감수성인 포진 바이러스의 키나제 티미딘 유전자 (HSV TK)를 포함한다. HPRT 유전자는 또한 6-티오구아닌 (6TG)을 배지 내로 첨가하는 것에 의해 음성 선택으로서 사용될 수 있고, 모든 양성 및 음성 선택을 위해 상이한 기원으로부터의 폴리 A 전사 종결 서열이 사용될 수 있으며, 가장 전형적인 것은 SV40 폴리 A 또는 진핵 유전자 폴리 A (소 성장 호르몬, 토끼β-글로빈 등)로부터 유래된 것이다.

특정한 실시양태에서, 선택 카세트는 문헌 [Olszko et al., (Gene Therapy 22: 591-595, 2015)]에 기재된 바와 같은 MGMT P140K를 포함한다. 특정한 요소에서, 선택제는 O⁶BG/BCNU를 포함한다.

인간 알킬 구아닌 트랜스퍼라제 (hAGT)를 코딩하는 약물 저항성 유전자 MGMT는 알킬화제, 예컨대 니트로소우레아 및 테모졸로미드 (TMZ)의 세포독성 효과에 대한 저항성을 부여하는 DNA 복구 단백질이다. 6-벤질구아닌 (6-BG)은 니트로소우레아 독성을 강화시키는 AGT의 억제제이며, TMZ와 공투여되어 이러한 작용제의 세포독성 효과를 강화시킨다. AGT의 변이체를 코딩하는 MGMT의 여러 돌연변이체 형태는 6-BG에 의한 불활성화에 대해 고도로 저항성이지만, DNA 손상을 복구하는 그의 능력을 보유한다 (Maze et al., J. Pharmacol. Exp. Ther. 290: 1467-1474, 1999). P140K^MGMT-기반 약물 저항성 유전자 요법은 마우스, 개, 레서스 마카크, 및 인간 세포, 구체적으로 조혈 세포에 화학보호를 부여하는 것으로 밝혀졌다 (Zielske et al., J. Clin. Invest. 112: 1561-1570, 2003; Pollok et al., Hum. Gene Ther. 14: 1703-1714, 2003; Gerull et al., Hum. Gene Ther. 18: 451-456, 2007; Neff et al., Blood 105: 997-1002, 2005; Larochelle et al., J. Clin. Invest. 119: 1952-1963, 2009; Sawai et al., Mol. Ther. 3: 78-87, 2001).

특정한 실시양태에서, 생체내 선택 카세트와의 조합은 유전자-교정된 세포의 선택적 이점 없이 질환에 대한 중요한 성분일 것이다. 예를 들어, SCID 및 일부 다른 면역결핍 및 FA에서, 교정된 세포는 이점을 갖고, 단지 치료 유전자로 "소수의" HSPC를 형질도입시키는 것만으로 치료 효능에 충분하다. 세포가 경쟁적 이점을 입증하지 않은 혈색소병증 (즉, 겸상 적혈구 질환 및 지중해빈혈)과 같은 다른 질환의 경우에, 예컨대 생체내 선택 카세트, 예컨대 MGMT P140K와 조합된 유전자 교정된 세포의 생체내 선택은 소수의 형질도입된 HSPC를 선택하여, 유전자 교정된 세포의 증가를 가능하게 하고 치료 효능을 달성할 것이다. 이러한 접근법은 또한 HSPC를 생체외 유전자 변형보다 생체내에서 HIV에 저항성이게 만듦으로써 HIV에 대해 적용될 수 있다.

(VII-c-v) 스터퍼 서열

특정한 실시양태에서, 벡터는 스터퍼 서열을 포함한다. 특정한 실시양태에서, 스터퍼 서열은 벡터 게놈을 야생형 길이의 크기에 가까운 크기로 만들기 위해 부가될 수 있다. 스터퍼는 길이를 연장하도록 의도된 기능적으로 불활성인 서열을 정의하는 것으로 의도된, 관련 기술분야에서 일반적으로 인식되는 용어이다.

스터퍼 서열은 벡터의 효율적인 패키징 및 안정성을 달성하기 위해 사용된다. 특정한 실시양태에서, 스터퍼 서열은 벡터 게놈 크기를 야생형 바이러스의 게놈 크기의 70% 내지 110%로 만드는데 사용된다.

스터퍼 서열은 바람직하게는 포유동물 기원의 임의의 DNA일 수 있다. 본 발명의 바람직한 실시양태에서, 스터퍼 서열은 포유동물 기원의 비-코딩 서열, 예를 들어 인트론 단편이다.

스터퍼 서열은, 벡터의 크기를 미리 결정된 크기로 유지시키는데 사용되는 경우에, 벡터 게놈이 분열 또는 비분열 세포에서 안정하게 유지되도록 하는 임의의 비-코딩 코딩 서열 또는 서열일 수 있다. 이들 서열은 다른 바이러스 게놈 (예를 들어 엡스타인 바르(Epstein barr) 바이러스) 또는 유기체 (예를 들어 효모)로부터 유래될 수 있다. 예를 들어, 이들 서열은 동원체 및/또는 텔로미어의 기능적 부분일 수 있다.

(VII-d) 헬퍼-의존성 아데노바이러스 벡터

헬퍼-의존성 아데노바이러스 벡터 (HDAd)는 모든 바이러스 코딩 서열이 결여되도록 조작되고, 매우 다양한 세포 유형을 효율적으로 형질도입시키며, 무시할만한 만성 독성 하에 장기간 트랜스진 발현을 매개할 수 있다. 바이러스 코딩 서열의 결실 및 벡터 게놈 복제 (ITR) 및 캡시드화 (Ψ)에 필요한 시스-작용성 요소만을 남기는 것으로, Ad 벡터에 대한 세포성 면역 반응이 감소된다. HDAd 벡터는 최대 37 kb의 대형 클로닝 용량을 가지며, 이는 대형 페이로드의 전달을 가능하게 한다. 이들 페이로드는 대형 치료 유전자 또는 심지어 다중 트랜스진 및 트랜스진 발현을 증진, 연장, 및 조절하기 위한 대형 조절 성분을 포함할 수 있다. 다른 아데노바이러스 벡터와 같이, HDAd 게놈은 에피솜으로 남아있고, 숙주 게놈과 통합되지 않는다 (Rosewell et al., J Genet Syndr Gene Ther. Suppl 5:001, 2011).

일부 HDAd 벡터 시스템에서, 하나의 바이러스 게놈 (헬퍼)은 복제에 필요한 모든 단백질을 코딩하지만 패키징 서열 내에 조건부 결함을 갖고, 이는 비리온 내로 패키징될 가능성을 낮게 한다. 제2 바이러스 게놈은 오직 바이러스 역전된 말단 반복부 (ITR), 치료 페이로드, 및 정상 패키징 서열만을 포함하며, 이는 이러한 제2 바이러스 게놈이 HDAd 바이러스 벡터 내로 선택적으로 패키징되게 하고 생산자 세포로부터 단리되도록 한다. HDAd 바이러스 벡터는 물리적 수단에 의해 헬퍼 벡터로부터 추가로 정제될 수 있다. 일반적으로, HDAd 바이러스 벡터 및 HDAd 바이러스 벡터 제제에서 헬퍼 벡터 및/또는 헬퍼 게놈의 일부 오염이 발생할 수 있고 받아들여질 수 있다.

일부 HDAd 벡터 시스템에서, 헬퍼 게놈은 Cre/loxP 시스템을 이용한다. 특정의 이러한 HDAd 벡터 시스템에서, HDAd 공여자 벡터 게놈은 벡터 게놈 복제에 요구되는 아데노바이러스 ITR을 포함하는 500 bp의 비코딩 아데노바이러스 DNA, 및 벡터 게놈의 캡시드 내로의 캡시드화에 요구되는 패키징 서열인 Ψ를 포함한다. 또한, HDAd 공여자 벡터 게놈은 약 27.7 kb 내지 약 37 kb의 총 길이를 가질 때 가장 효율적으로 패키징될 수 있는 것으로 관찰되었고, 길이는 예를 들어 치료 페이로드 및/또는 "스터퍼" 서열로 구성될 수 있다. HDAd 공여자 벡터 게놈은 세포, 예컨대 Cre 레콤비나제를 발현하는 293 세포에 전달될 수 있고, 임의로 여기서 HDAd 공여자 벡터 게놈은 세포에 비-바이러스 벡터 형태, 예컨대 박테리아 플라스미드 형태로 전달된다 (예를 들어, HDAd 공여자 벡터 게놈은 박테리아 플라스미드 (pHDAd)로서 구축되고 제한 효소 소화에 의해 유리됨). 동일한 세포는 헬퍼 게놈에 의해 형질도입될 수 있으며, 이는 loxP 부위에 플랭킹된 패키징 서열을 보유하는 E1-결실된, Ad 벡터를 포함할 수 있어서, Cre 레콤비나제를 발현하는 293 세포의 감염 후에, 패키징 서열이 loxP 부위 사이의 Cre-매개된 부위-특이적 재조합에 의해 헬퍼 게놈으로부터 절제된다. 따라서, HDAd 공여자 벡터 게놈으로 Cre를 발현하는 293 세포를 형질감염시킬 수 있고 이는 loxP 부위에 플랭킹된 패키징 신호 (Ψ)를 보유하는 헬퍼 게놈으로 형질도입되어서, Ψ의 Cre-매개된 절제는 헬퍼 바이러스 게놈을 패키징불가능하게 만들지만, 여전히 HDAd의 증식을 위한 모든 필요한 트랜스-작용성 인자를 제공할 수 있게 한다. 패키징 서열의 절제 후에, 헬퍼 게놈은 패키징불가능하지만, 여전히 DNA 복제를 수행할 수 있고, 따라서 HDAd 공여자 벡터 게놈의 복제 및 캡시드화를 트랜스-보완한다. 일부 실시양태에서, 293 세포에 존재하는 헬퍼 및 HDAd 공여자 벡터 게놈 사이의 상동 재조합의 결과로서 복제 적격 Ad (RCA; E1⁺)의 생성을 방지하기 위해, "스터퍼" 서열을 E3 영역 내로 삽입하여 임의의 E1⁺ 재조합체가 패키징되기에 너무 커지게 만들 수 있다. FLP (예를 들어, FLPe)/frt 부위-특이적 재조합을 사용하는 유사한 HDAd 생산 시스템이 개발되었으며, 여기서 헬퍼 게놈의 패키징 신호에 플랭킹된 frt 부위 사이의 FLP-매개된 재조합은 FLP를 발현하는 293 세포에서의 헬퍼 게놈의 캡시드화에 대해 선택한다. 헬퍼 벡터에 대해 선택하기 위한 대안적 전략이 개발되었다.

HDAd5/35 벡터는 Ad35 섬유 노브 및 Ad5 샤프트를 갖는 헬퍼-의존성 키메라 Ad5/35 벡터이다. HDAd5/35++ 벡터는 돌연변이체 Ad35 섬유 노브를 갖는 헬퍼-의존성 키메라 Ad5/35 벡터이다. 벡터는 CD46에 대한 친화도를 25-배 증가시키고, 보다 낮은 감염 다중도 (MOI)에서 세포 형질도입 효율을 증가시키기 위해 돌연변이된다 (Li & Lieber, FEBS Letters, 593(24): 3623-3648, 2019). HDAd35 벡터는 헬퍼-의존성 Ad35 벡터이다. HDAd35++ 벡터는 CD46에 대한 그의 친화도를 증진시키고 세포 형질도입 효율을 증가시키는 돌연변이체 Ad35 섬유 노브를 갖는 헬퍼-의존성 Ad35 벡터이다.

(VII-e) 벡터-표적화된 세포 유형 (및 벡터 분자 표적)

(VII-e-i) HSC

특정한 실시양태에서, 벡터-표적화된 세포 유형은 조혈 줄기 세포 (HSC)를 포함한다. HSC는 CD46에의 결합에 의해 생체내 유전자 변형을 위해 표적화된다. 벡터는 CD46 결합의 특이성 및/또는 강도를 증가시키기 위해 돌연변이를 포함할 수 있다. HSC는 또한 하기 마커 프로파일에 의해 확인될 수 있다: CD34+, Lin-CD34+CD38-CD45RA-CD90+CD49f+ (HSC1) 및 CD34+CD38-CD45RA-CD90- CD49f+ (HSC2). 인간 HSC1은 하기 프로파일에 의해 확인될 수 있으며: CD34+/CD38-/CD45RA-/CD90+ 또는 CD34+/CD45RA-/CD90+ 및 마우스 LT-HSC는 Lin-Sca1+ckit+CD150+CD48-Flt3-CD34-에 의해 확인될 수 있다 (여기서 Lin은 CD3, Cd4, CD8, CD11b, CD11c, NK1.1, Gr1, 및 TER119를 포함한 성숙 세포의 임의의 마커의 발현의 부재를 나타냄). 특정한 실시양태에서, HSC는 CD164+ 프로파일에 의해 확인된다. 특정한 실시양태에서, HSC는 CD34+/CD164+ 프로파일에 의해 확인된다. HSC 마커 프로파일에 관한 추가의 정보에 대해서는 WO2017/218948을 참조한다.

(VII-e-ii) T 세포

T-세포의 여러 상이한 하위세트가 발견되었고, 각각은 별개의 기능을 갖는다. 예를 들어, 대다수의 T-세포는 여러 단백질의 복합체로서 존재하는 T-세포 수용체 (TCR)를 갖는다. 실제 T-세포 수용체는 독립적인 T-세포 수용체 알파 및 베타 (TCRα 및 TCRβ) 유전자로부터 생산되는, α- 및 β-TCR 쇄로 불리는 2개의 별개의 펩티드 쇄로 구성된다.

γδ T-세포는 그의 표면 상에 별개의 T-세포 수용체 (TCR)를 보유하는 T-세포의 소형 하위세트를 나타낸다. γδ T-세포에서, TCR은 1개의 γ-쇄 및 1개의 δ-쇄로 구성된다. 이러한 군의 T-세포는 αβ T-세포보다 훨씬 덜 흔하다 (총 T-세포의 2%).

CD3은 모든 성숙 T 세포 상에서 발현된다. 활성화된 T-세포는 4-1BB (CD137), CD69 및 CD25를 발현한다. CD5 및 트랜스페린 수용체가 또한 T-세포 상에서 발현된다.

T-세포는 헬퍼 세포 (CD4+ T-세포), 및 세포용해 T-세포를 포함하는 세포독성 T-세포 (CTL, CD8+ T-세포)로 추가로 분류될 수 있다. T 헬퍼 세포는 다른 기능 중에서도 B 세포의 형질 세포로의 성숙 및 세포독성 T-세포 및 대식세포의 활성화를 포함하여, 면역학적 과정에서 다른 백혈구를 보조한다. 이들 세포는 그의 표면 상에 CD4 단백질을 발현하기 때문에 CD4+ T-세포로도 공지되어 있다. 헬퍼 T-세포는 항원 제시 세포 (APC)의 표면 상에 발현되는 MHC 부류 II 분자에 의해 펩티드 항원이 제시될 때 활성화된다. 활성화되면, 이들은 신속하게 분열하고, 활성 면역 반응을 조절하거나 보조하는 시토카인으로 불리는 소형 단백질을 분비한다.

세포독성 T-세포는 바이러스 감염된 세포 및 종양 세포를 파괴하고, 또한 이식 거부에 연루된다. 이들 세포는 그의 표면 상에 CD8 당단백질을 발현하기 때문에 CD8+ T-세포로도 공지되어 있다. 이들 세포는 신체의 거의 모든 세포의 표면 상에 존재하는 MHC 부류 I과 회합된 항원에 결합함으로써 그의 표적을 인식한다.

특정한 실시양태에서, CAR은 세포독성 T-세포에서 발현되도록 유전자 변형된다.

본원에 사용된 "중심 기억" T-세포 (또는 "TCM")는 나이브 세포와 비교하여 그의 표면 상에 CD62L 또는 CCR7 및 CD45RO를 발현하고 CD45RA를 발현하지 않거나 감소된 발현을 갖는 항원 경험 CTL을 지칭한다. 특정한 실시양태에서, 중심 기억 세포는 나이브 세포와 비교하여 CD62L, CCR7, CD25, CD127, CD45RO, 및 CD95의 발현에 대해 양성이고, CD45RA의 감소된 발현을 갖는다.

본원에 사용된 "이펙터 기억" T-세포 (또는 "TEM")는 중심 기억 세포와 비교하여 그의 표면 상에 CD62L을 발현하지 않거나 감소된 발현을 갖고, 나이브 세포와 비교하여 CD45RA를 발현하지 않거나 감소된 발현을 갖는 항원 경험 T-세포를 지칭한다. 특정한 실시양태에서, 이펙터 기억 세포는 나이브 세포 또는 중심 기억 세포와 비교하여 CD62L 및 CCR7의 발현에 대해 음성이고, CD28 및 CD45RA의 가변 발현을 갖는다. 이펙터 T-세포는 기억 또는 나이브 T-세포와 비교하여 그랜자임 B 및 퍼포린에 대해 양성이다.

본원에 사용된 "나이브" T-세포는 중심 또는 이펙터 기억 세포와 비교하여 CD62L 및 CD45RA를 발현하고 CD45RO를 발현하지 않는 비-항원 경험 T 세포를 지칭한다. 특정한 실시양태에서, 나이브 CD8+ T 림프구는 CD62L, CCR7, CD28, CD127, 및 CD45RA를 포함한 나이브 T-세포의 표현형 마커의 발현을 특징으로 한다.

세포 또는 세포의 집단이 특정한 마커에 대해 "양성"이거나 또는 이를 발현한다는 언급은 세포 상에 또는 세포 내에 특정한 마커가 검출가능하게 존재한다는 것을 지칭한다. 표면 마커를 언급하는 경우에, 상기 용어는 유동 세포측정법에 의해, 예를 들어 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출하는 것에 의해 검출되는 바와 같은 표면 발현의 존재를 지칭할 수 있으며, 여기서 염색은 이소형-매칭 대조군을 사용하여 그 외에는 동일한 조건 하에 동일한 절차를 수행하여 검출된 염색을 실질적으로 초과하는 수준에서 및/또는 마커에 대해 양성인 것으로 공지된 세포에 대한 것과 실질적으로 유사한 수준에서, 및/또는 마커에 대해 음성인 것으로 공지된 세포에 대한 것보다 실질적으로 더 높은 수준에서 유동 세포측정법에 의해 검출가능하다.

세포 또는 세포의 집단이 특정한 마커에 대해 "음성"이거나 또는 마커의 발현이 결여되어 있다는 언급은 세포 상에 또는 세포 내에 특정한 마커가 실질적으로 검출가능하게 존재하지 않는다는 것을 지칭한다. 표면 마커를 언급하는 경우에, 상기 용어는 유동 세포측정법에 의해, 예를 들어 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출하는 것에 의해 검출되는 바와 같은 표면 발현의 부재를 지칭할 수 있으며, 여기서 염색은 이소형-매칭 대조군을 사용하여 그 외에는 동일한 조건 하에 동일한 절차를 수행하여 검출된 염색을 실질적으로 초과하는 수준에서, 및/또는 마커에 대해 양성인 것으로 공지된 세포에 대한 것보다 실질적으로 더 낮은 수준에서, 및/또는 마커에 대해 음성인 것으로 공지된 세포에 대한 것과 비교하여 실질적으로 유사한 수준에서 유동 세포측정법에 의해 검출되지 않는다.

(VII-e-iii) B 세포

B 세포는 체액성 반응의 매개자이고, 항원에 특이적인 항체의 생산 및 방출을 담당한다. 핵심 마커에 의해 특징화될 수 있는 여러 유형의 B 세포가 존재한다. 일반적으로, 미성숙 B 세포는 CD19, CD20, CD34, CD38, 및 CD45R을 발현하고, 이들이 성숙함에 따라 핵심 발현 마커는 CD19 및 IgM이다.

(VII-e-iv) 종양

특정한 실시양태에서, 벡터는 종양을 표적화할 수 있다. 특정한 실시양태에서, 종양은 건강한 세포가 아니라 종양 세포 상에 존재하는 수용체를 표적화하는 것에 의해 표적화된다. 종양은 αv 인테그린에 결합하는 것에 의해 생체내 유전자 변형을 위해 표적화될 수 있다. αv 인테그린은 혈관신생에서 중요한 역할을 한다. αvβ3 및 αvβ5 인테그린은 정상 내피 세포에서는 부재하거나 낮은 수준으로 발현되지만, 종양의 혈관신생 혈관계에서 유도된다 (Brooks et al., Cell, 79: 1157-1164, 1994; Hammes et al., Nature Med, 2: 529-533, 1996). 아미노펩티다제 N/CD13은 최근에 NGR 모티프에 대한 혈관신생 수용체로서 확인되었다 (Burg et al., Cancer Res, 59:2869-74, 1999). 아미노펩티다제 N/CD13은 암의 혈관신생 혈관 및 다른 혈관신생 조직에서 강하게 발현된다.

특정한 실시양태에서, 벡터는 암 세포 항원 에피토프를 표적화함으로써 종양을 표적화할 수 있다. 암 세포 항원은 암 세포 또는 종양에 의해 발현된다.

특정한 실시양태에서, 암 세포 항원 에피토프는 암 세포에 의해 우선적으로 발현된다. "우선적으로 발현된"은 암 세포 항원이 다른 세포 유형과 비교하여 암 세포 상에서 보다 높은 수준으로 발견된다는 것을 의미한다. 일부 경우에, 암 항원 에피토프는 표적화된 암 세포 유형에 의해서만 발현된다. 다른 경우에, 암 항원은 비-표적화된 세포 상에서보다 표적화된 암 세포 유형 상에서 적어도 25%, 35%, 45%, 55%, 65%, 75%, 85%, 95%, 96%, 97%, 98%, 99%, 또는 100% 더 많이 발현된다.

특정한 실시양태에서, 암 세포 항원은 암성 및 건강한 조직 상에서 유의하게 발현된다. 특정한 실시양태에서, 유의하게 발현된다는 것은 이중-특이적 항체의 사용이 온-타겟/오프-암 독성에 기초하여 발생 동안 정지되었다는 것을 의미한다. 특정한 실시양태에서, 유의하게 발현된다는 것은 이중-특이적 항체의 사용이 온-타겟/오프-암 독성에 기초하여 잠재적인 부정적 부작용에 관한 경고를 요구한다는 것을 의미한다. 한 예로서, 세툭시맙은 피부에서의 EGFR 발현으로 인한 것으로 생각되는 중증 피부 발진과 연관된 항-EGFR 항체이다. 또 다른 예는 항-HER2 (ERBB2) 항체인 헤르셉틴 (트라스투주맙)이다. 헤르셉틴은 심장에서의 표적 발현으로 인한 심장독성과 연관된다. 더욱이, CAR-T 세포로 Her2를 표적화하는 것은 폐에서의 온-타겟, 오프-암 발현으로 인해 환자에서 치명적이었다.

표 3은 특정한 암 유형에서 공동-발현될 가능성이 보다 큰 암 항원의 예를 제공한다.

표 3:

보다 특정한 예에서, 암 세포 항원은 메소텔린, MUC16, FOLR, PD-L1, ROR1, 글리피칸-2 (GPC2), 디시알로강글리오시드 (GD2), HER2, EGFR, EGFRvIII, CEA, CD56, CLL-1, CD19, CD20, CD123, CD30, CD33 (전장), CD33 (델타E2 변이체), CD33 (C-말단 절단을 가짐), BCMA, IGFR, MUC1, VEGFR, PSMA, PSCA, IL13Ra2, FAP, EpCAM, CD44, CD133, Tro-2, CD200, FLT3, GCC, 및 WT1을 포함한다. 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 표적화된 항원은 신호 펩티드가 결여될 수 있다.

신경 세포 부착 분자 1 (NCAM1)로도 공지된 CD56은 세포-세포 및 세포-매트릭스 부착에 수반되는 유형 I 막 당단백질이다. 그의 세포외 도메인은 N-말단에 5개의 IgG-유사 도메인 및 막-근위 영역에 2개의 피브로넥틴 유형 III 도메인을 갖는다.

디시알로강글리오시드 GalAc베타1-4(NeuAc알파2-8NeuAc알파2-3)Gal베타1-4Glc베타1- 1Cer (GD2)은 신경모세포종을 비롯한 다양한 종양 상에서 발현된다. 디시알로강글리오시드 항원 GD2는 시알산 및 지질 잔기에 플랭킹된 올리고사카라이드의 백본을 포함한다. 예를 들어, 문헌 [Cheresh (Surv. Synth. Pathol. Res. 4:97, 1987)] 및 미국 특허 번호 5,653,977을 참조한다.

EGFR의 종양 특이적 돌연변이체인 EGFR 변이체 III (EGFRvIII)은 종종 야생형 EGFR 유전자 증폭과 연관되는 게놈 재배열의 생성물이다. EGFRvIII은 엑손 2-7의 인-프레임 결실에 의해 형성되며, 이는 접합부에서의 글리신 치환과 함께 267개 아미노산의 결실로 이어진다. 말단절단된 수용체는 리간드에 결합하는 그의 능력을 상실하지만, 구성적 키나제 활성을 획득한다. 흥미롭게도, EGFRvIII은 동일한 종양 세포에서 전장 야생형 EGFR과 빈번하게 공동 발현된다. 또한, EGFRvIII 발현 세포는 증가된 증식, 침습, 혈관신생 및 아폽토시스에 대한 저항성을 나타낸다.

EGFRvIII은 다형성 교모세포종 (GBM)에서 가장 자주 발견된다. GBM의 25-35%가 이러한 말단절단된 수용체를 보유하는 것으로 추정된다. 또한, 그의 발현은 종종 보다 공격적인 표현형 및 불량한 예후를 반영한다. GBM 외에도, EGFRvIII의 발현은 또한 다른 고형 종양, 예컨대 비소세포 폐암, 두경부암, 유방암, 난소암 및 전립선암에서 보고되었다. 대조적으로, EGFRvIII은 건강한 조직에서는 발현되지 않는다.

특정한 실시양태에서, 표적화된 암 항원 에피토프는 표적화된 암 세포 또는 종양에 의한 높은 발현 또는 표적화된 암 세포 또는 종양에 의한 낮은 발현을 가질 수 있다. 특정한 실시양태에서, 높은 발현 및 낮은 발현은 유동 세포측정법 또는 형광-활성화 세포-분류 (FAC)를 사용하여 결정될 수 있다. 유동 세포측정법의 관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, "hi", "lo", "+" 및 "-"는 음성 또는 다른 집단에 대한 신호의 강도를 지칭한다. 특정한 실시양태에서, 양성 발현 (+)은 마커가 유동 세포측정법을 사용하여 세포 상에서 검출가능하다는 것을 의미한다. 특정한 실시양태에서, 음성 발현 (-)은 마커가 유동 세포측정법을 사용하여 검출가능하지 않다는 것을 의미한다. 특정한 실시양태에서, "hi"는 관심 마커의 양성 발현이 발현에 대해 또한 양성인 다른 세포보다 형광에 의해 측정 시 (예를 들어 FACS를 사용함) 더 밝다는 것을 의미한다. 이들 실시양태에서, 관련 기술분야의 통상의 기술자는 휘도가 검출 역치에 기초한다는 것을 인식한다. 일반적으로, 관련 기술분야의 통상의 기술자는 먼저 음성 대조군 튜브를 분석하고, FSC 및 SSC에 의해 관심 집단 주위에 게이트 (비트맵)를 설정하고, 목적하는 방출 파장에서 광전자증배관 전압 및 형광 획득을 조정하여, 세포의 97%가 음성 대조군을 갖는 형광 마커에 대해 비염색된 것으로 보이게 할 것이다. 이들 파라미터가 확립되면, 염색된 세포를 분석하고, 비염색된 형광 세포 집단과 대비하여 형광을 기록한다. 특정한 실시양태에서, 전형적인 FACS 플롯을 나타낸 것에서, hi는 가장 우측 (x 선) 또는 가장 높은 상단의 선 (상부 우측 또는 좌측)을 의미하는 반면, lo는 좌측 하부 4분면 내 또는 우측 및 좌측 4분면 사이의 중간 (그러나 음성 집단 대비 이동됨)을 의미한다. 특정한 실시양태에서, "hi"는 + 세포 대비 검출가능한 형광에서 +의 20-배 초과, +의 30-배 초과, +의 40-배 초과, +의 50-배 초과, +의 60-배 초과, +의 70-배 초과, +의 80-배 초과, +의 90-배 초과, +의 100-배 초과, 또는 그 초과의 증가를 지칭한다. 반대로, "lo"는 "hi"로서 정의된 것의 상반된 집단을 지칭할 수 있다.

(VII-e-v) 다른 표적

HSC, T 세포, B 세포, 및 종양 (또는 암 세포)에 더하여, 벡터는 박테리아 및 진균에 대한 다른 항원을 표적화할 수 있다.

박테리아를 표적화하는 항원은, 예를 들어 탄저병, 그람-음성 바실루스(bacilli), 클라미디아(chlamydia), 디프테리아(diphtheria), 헬리코박터 필로리(Helicobacter pylori), 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis), 백일해 독소, 폐렴구균, 리케치아(rickettsiae), 스타필로코쿠스(staphylococcus), 스트렙토코쿠스(streptococcus) 및 파상풍으로부터 유래될 수 있다.

박테리아 항원 마커의 특정한 예로서, 탄저병 항원은 탄저병 보호 항원을 포함하고; 그람-음성 바실루스 항원은 리포폴리사카라이드를 포함하고; 디프테리아 항원은 디프테리아 독소를 포함하고; 미코박테리움 투베르쿨로시스 항원은 미콜산, 열 쇼크 단백질 65 (HSP65), 30 kDa 주요 분비 단백질 및 항원 85A를 포함하고; 백일해 독소 항원은 헤마글루티닌, 페르탁틴, FIM2, FIM3 및 아데닐레이트 시클라제를 포함하고; 폐렴구균 항원은 뉴모리신 및 폐렴구균 피막 폴리사카라이드를 포함하고; 리케치아 항원은 rompA를 포함하고; 스트렙토코쿠스 항원은 M 단백질을 포함하고; 파상풍 항원은 파상풍 독소를 포함한다.

진균을 표적화하는 항원은, 예를 들어 칸디다(candida), 콕시디오이데스(coccidioides), 크립토코쿠스(cryptococcus), 히스토플라스마(histoplasma), 리슈마니아(leishmania), 플라스모디움(plasmodium), 원충, 기생충, 쉬스토소마, 백선, 톡소플라스마 및 트리파노소마 크루지(Trypanosoma cruzi)로부터 유래될 수 있다.

진균 항원의 특정한 예로서, 콕시디오이데스 항원은 소구 항원을 포함하고; 크립토코쿠스 항원은 피막 폴리사카라이드를 포함하고; 히스토플라스마 항원은 열 쇼크 단백질 60 (HSP60)을 포함하고; 리슈마니아 항원은 gp63 및 리포포스포글리칸을 포함하고; 플라스모디움 팔시파룸 항원은 분열소체 표면 항원, 포자소체 표면 항원, 환상포자소체 항원, 생식모세포/생식자 표면 항원, 원충성 및 다른 기생충 항원, 예컨대 혈액-단계 항원 pf 155/RESA를 포함하고; 쉬스토소마 항원은 글루타티온-S-트랜스퍼라제 및 파라미오신을 포함하고; 백선 진균 항원은 트리코피틴을 포함하고; 톡소플라스마 항원은 SAG-1 및 p30을 포함하고; 트리파노소마 크루지 항원은 75-77 kDa 항원 및 56 kDa 항원을 포함한다.

(VII-f) 예시적인 벡터

특정한 실시양태에서, 벡터는 페이로드, LCR, 조절 성분, 통합 요소, 선택 카세트, 및 스터퍼 서열을 갖는 HDAd5/35++ 벡터를 포함한다. 특정한 실시양태에서, 페이로드는 인간 γ-글로빈 유전자를 포함한다. 특정한 실시양태에서, LCR은 β-글로빈 LCR을 포함한다. 특정한 실시양태에서, 조절 성분은 β-글로빈 프로모터를 포함한다. 특정한 실시양태에서, 통합 요소는 슬리핑 뷰티 100X 트랜스포사제를 포함한다. 특정한 실시양태에서, 선택 카세트는 MGMT (P140K)를 포함한다. 특정한 실시양태에서, 벡터는 EF1α 프로모터를 추가로 포함한다.

다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는, 예를 들어 표적 세포 유형 또는 조직, 예컨대 표 1에 제시된 바와 같은 LCR이 발현을 제어하는 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR을 포함하는 벡터는 LCR을 포함하지 않는 참조 벡터와 비교하여, 예를 들어 표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 긴 LCR을 포함하는 벡터는 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 미니-LCR을 포함하는 참조 벡터와 비교하여, 예를 들어 표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 증가된 발현을 제공한다. 다양한 실시양태에서, 증가는 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%의 증가일 수 있다. 일부 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 건강한 대상체에서, 예를 들어 표적 세포 유형 또는 조직에서 참조 내인성 코딩 핵산 서열의 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%인 작동가능하게 연결된 코딩 핵산 서열의 발현을 유발한다.

다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 1종 이상의 비-표적 세포 유형 또는 조직, 예컨대 LCR이 발현을 제어하는 세포 유형 또는 조직으로서 표 1에 제시된 세포 유형 또는 조직이 아닌 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 LCR을 포함하지 않는 참조 벡터와 비교하여 1종 이상의 비-표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 미니-LCR을 포함하는 참조 벡터와 비교하여 1종 이상의 비-표적 세포 유형 또는 조직에서 작동가능하게 연결된 코딩 핵산 서열의 감소된 발현을 제공한다. 다양한 실시양태에서, 감소는 참조 발현 수준의 적어도 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%의 감소일 수 있다. 예를 들어, 특정한 실시양태에서, β-글로빈 긴 LCR의 사용은 β-글로빈 긴 LCR을 포함하지 않는 참조 벡터, 예를 들어 보다 짧은 LCR, 예컨대 β-글로빈 미니-LCR을 포함하는 참조 벡터와 비교하여, 적혈구가 아닌 세포에서 작동가능하게 연결된 코딩 서열, 예컨대 γ-글로빈 또는 β-글로빈을 코딩하는 코딩 서열의 발현을 감소시킨다.

관련 기술분야의 통상의 기술자가 인지할 바와 같이, 표적 세포 및/또는 조직에서의 증가된 발현 (예를 들어, 본 개시내용의 긴 LCR, 예컨대 긴 LCR의 사용으로 인함)은 유전자 요법에서 벡터의 최소 치료 유효 투여량을 감소시키고, 따라서 최소 치료 유효 투여량의 면역독성 및/또는 면역독성의 위험을 감소시킨다. 관련 기술분야의 통상의 기술자는 비-표적 세포 및/또는 조직에서의 감소된 발현 (예를 들어, 본 개시내용의 긴 LCR, 예컨대 긴 LCR의 사용으로 인함)이 면역독성 및/또는 면역독성의 위험을 감소시킨다는 것을 추가로 재인지할 것이다. 특정의 특정한 예에서, β-글로빈 긴 LCR의 사용은 조혈 줄기 세포에서 작동가능하게 연결된 코딩 핵산 서열의 발현을 증가시키고/거나 비-적혈구 세포에서 작동가능하게 연결된 코딩 핵산 서열의 발현을 감소시켜, 유전자 요법 면역독성 및/또는 그의 위험을 감소시킨다. 다양한 실시양태에서, 표적 세포에서 바이러스 벡터 트랜스포손 페이로드로부터의 증가된 발현 및/또는 면역독성의 감소로 인해 바이러스 벡터의 보다 많은 투여량을 전달하는 능력은 유전자 요법을 제공받는 대상체의 표적 세포 또는 조직에서 달성될 수 있는 트랜스포손 페이로드에 의해 코딩된 작용제의 총 발현을 개선시킨다. 따라서, 본 개시내용의 LCR, 예컨대 긴 LCR을 포함하는 벡터는 참조 벡터, 예컨대 LCR을 포함하지 않거나 긴 LCR을 포함하지 않는 참조 벡터와 비교하여 증가된 치료 효능을 제공할 수 있다.

(VIII) 제제

본원에 기재된 아데노바이러스 공여자 벡터, 대형 페이로드 아데노바이러스 벡터, 아데노바이러스 게놈, 및 아데노바이러스 시스템은 대상체에게의 투여를 위해 제제화될 수 있다. 제제는 치료 유전자와 회합된 재조합 대형 페이로드 아데노바이러스 벡터, 아데노바이러스 게놈, 및/또는 아데노바이러스 시스템 ("활성 성분") 및 1종 이상의 제약상 허용되는 담체를 포함한다.

특정한 실시양태에서, 제제는 제제의 적어도 0.1% w/v 또는 w/w; 제제의 적어도 1% w/v 또는 w/w; 제제의 적어도 10% w/v 또는 w/w; 제제의 적어도 20% w/v 또는 w/w; 제제의 적어도 30% w/v 또는 w/w; 제제의 적어도 40% w/v 또는 w/w; 제제의 적어도 50% w/v 또는 w/w; 제제의 적어도 60% w/v 또는 w/w; 제제의 적어도 70% w/v 또는 w/w; 제제의 적어도 80% w/v 또는 w/w; 제제의 적어도 90% w/v 또는 w/w; 제제의 적어도 95% w/v 또는 w/w; 또는 제제의 적어도 99% w/v 또는 w/w의 활성 성분을 포함한다.

예시적인 일반적으로 사용되는 제약상 허용되는 담체는 임의의 및 모든 흡수 지연제, 항산화제, 결합제, 완충제, 벌킹제 또는 충전제, 킬레이트화제, 코팅, 붕해제, 분산 매질, 겔, 등장화제, 윤활제, 보존제, 염, 용매 또는 공-용매, 안정화제, 계면활성제, 및/또는 전달 비히클을 포함한다.

예시적인 항산화제는 아스코르브산, 메티오닌, 및 비타민 E를 포함한다.

예시적인 완충제는 시트레이트 완충제, 숙시네이트 완충제, 타르트레이트 완충제, 푸마레이트 완충제, 글루코네이트 완충제, 옥살레이트 완충제, 락테이트 완충제, 아세테이트 완충제, 포스페이트 완충제, 히스티딘 완충제 및/또는 트리메틸아민 염을 포함한다.

예시적인 킬레이트화제는 EDTA이다.

예시적인 등장화제는 3가 이상의 당 알콜, 예컨대 글리세린, 에리트리톨, 아라비톨, 크실리톨, 소르비톨, 또는 만니톨을 포함한 다가 당 알콜을 포함한다.

예시적인 보존제는 페놀, 벤질 알콜, 메타-크레졸, 메틸 파라벤, 프로필 파라벤, 옥타데실디메틸벤질 암모늄 클로라이드, 벤즈알코늄 할라이드, 헥사메토늄 클로라이드, 알킬 파라벤, 예컨대 메틸 또는 프로필 파라벤, 카테콜, 레조르시놀, 시클로헥산올 및 3-펜탄올을 포함한다.

안정화제는 기능상 벌킹제로부터 활성 성분을 가용화하거나 변성 또는 용기 벽에의 부착을 방지하는 것을 돕는 첨가제까지의 범위일 수 있는 넓은 카테고리의 부형제를 지칭한다. 전형적인 안정화제는 다가 당 알콜; 아미노산, 예컨대 아르기닌, 리신, 글리신, 글루타민, 아스파라긴, 히스티딘, 알라닌, 오르니틴, L-류신, 2-페닐알라닌, 글루탐산 및 트레오닌; 유기 당 또는 당 알콜, 예컨대 락토스, 트레할로스, 스타키오스, 만니톨, 소르비톨, 크실리톨, 리비톨, 미오이니시톨, 갈락티톨, 글리세롤 및 시클리톨, 예컨대 이노시톨; PEG; 아미노산 중합체; 황-함유 환원제, 예컨대 우레아, 글루타티온, 티옥트산, 소듐 티오글리콜레이트, 티오글리세롤, α-모노티오글리세롤 및 티오황산나트륨; 저분자량 폴리펩티드 (즉, <10개 잔기); 단백질, 예컨대 인간 혈청 알부민, 소 혈청 알부민, 젤라틴 또는 이뮤노글로불린; 친수성 중합체, 예컨대 폴리비닐피롤리돈; 모노사카라이드, 예컨대 크실로스, 만노스, 프룩토스 및 글루코스; 디사카라이드, 예컨대 락토스, 말토스 및 수크로스; 트리사카라이드, 예컨대 라피노스, 및 폴리사카라이드, 예컨대 덱스트란을 포함할 수 있다. 안정화제는 전형적으로 치료 중량에 기초하여 0.1 내지 10,000 중량부의 범위로 존재한다.

본원에 개시된 제제는, 예를 들어 주사에 의한 투여를 위해 제제화될 수 있다. 주사를 위해, 제제는 예컨대 행크 용액, 링거액, 또는 생리 염수를 포함한 완충제 중에, 또는 배양 배지, 예컨대 이스코브 변형 둘베코 배지 (IMDM) 중에 수용액으로서 제제화될 수 있다. 수용액은 제제화제, 예컨대 현탁화제, 안정화제, 및/또는 분산제를 포함할 수 있다. 대안적으로, 제제는 사용 전에 적합한 비히클, 예를 들어 멸균 발열원-무함유 물로 구성하기 위한 동결건조된 및/또는 분말 형태일 수 있다.

본원에 개시된 임의의 제제는 유리하게는 투여 이익을 능가하는 유의하게 유해하거나, 알레르기성이거나, 또는 다른 불리한 반응을 생성하지 않는 것을 포함한, 임의의 다른 제약상 허용되는 담체를 포함할 수 있다. 예시적인 제약상 허용되는 담체 및 제제는 문헌 [Remington's Pharmaceutical Sciences, 18th Ed. Mack Printing Company, 1990]에 개시되어 있다. 더욱이, 제제는 US FDA 생물학적 표준 사무국 및/또는 다른 관련 외국 규제 기관에 의해 요구되는 바와 같은 멸균성, 발열원성, 일반적 안전성, 및 순도 표준을 충족시키도록 제조될 수 있다.

(IX) 적용

(IX-a) 생체내 요법

본원에 개시된 제제는 대상체 (인간, 수의학적 동물 (개, 고양이, 파충류, 조류 등), 가축 (말, 소, 염소, 돼지, 닭 등) 및 연구용 동물 (원숭이, 래트, 마우스, 어류 등)을 치료하는데 사용될 수 있다. 대상체를 치료하는 것은 치료 유효량을 전달하는 것을 포함한다. 치료 유효량은 유효량, 예방적 치료, 및/또는 치유적 치료를 제공하는 것을 포함한다.

본원에 기재된 제제는 HSPC 가동화와 협력하여 투여될 수 있다. 특정 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 1종 이상의 가동화 인자의 투여와 공동으로 이루어진다. 특정한 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 1종 이상의 가동화 인자의 투여에 후속한다. 특정한 실시양태에서, 아데노바이러스 공여자 벡터의 투여는 제1의 1종 이상의 가동화 인자의 투여에 후속하며, 제2의 1종 이상의 가동화 인자의 투여와 공동으로 이루어진다.

특정한 대상체에게 투여되는 아데노바이러스 공여자 벡터, 및 특정한 실시양태에서 아데노바이러스 공여자 벡터 및 가동화 인자의 실제 용량 및 양, 및 조화되는 가동화 절차 및 스케줄은, 예를 들어 표적; 체중; 상태의 유형; 상태의 중증도; 공지되었을 때 예정된 관련 사건; 이전 또는 공동 치료적 개입; 대상체의 특발증; 및 투여 경로를 포함한 물리적 및 생리학적 인자와 같은 파라미터를 고려하여 의사, 수의사, 또는 연구자에 의해 결정될 수 있다. 또한, 최적의 투여량 범위를 확인하는 것을 돕기 위해 시험관내 및 생체내 검정이 임의로 사용될 수 있다.

치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은, 예를 들어 1 x 10⁷ 내지 50 x 10⁸ 감염 단위 (IU) 또는 5 x 10⁷ 내지 20 x 10⁸ IU 범위의 용량을 포함할 수 있다. 다른 예에서, 용량은 5 x 10⁷ IU, 6 x 10⁷ IU, 7 x 10⁷ IU, 8 x 10⁷ IU, 9 x 10⁷ IU, 1 x 10⁸ IU, 2 x 10⁸ IU, 3 x 10⁸ IU, 4 x 10⁸ IU, 5 x 10⁸ IU, 6 x 10⁸ IU, 7 x 10⁸ IU, 8 x 10⁸ IU, 9 x 10⁸ IU, 10 x 10⁸ IU, 또는 그 초과를 포함할 수 있다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 4 x 10⁸ IU를 포함한다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, 치료 유전자와 회합된 아데노바이러스 공여자 벡터의 치료 유효량은 1종 이상의 가동화 인자로의 투여에 후속하여 투여될 수 있다.

특정한 실시양태에서, G-CSF의 치료 유효량은 0.1 μg/kg 내지 100 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 0.5 μg/kg 내지 50 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, G-CSF의 치료 유효량은 5 μg/kg을 포함한다. 특정한 실시양태에서, G-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, G-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, G-CSF는 연속 4일 동안 투여될 수 있다. 특정한 실시양태에서, G-CSF는 연속 5일 동안 투여될 수 있다. 특정한 실시양태에서, 단일 작용제로서, G-CSF는 아데노바이러스 공여자 벡터 전달 3, 4, 5, 6, 7, 또는 8일 전에 개시되어 매일 10 μg/kg의 용량으로 피하로 사용될 수 있다. 특정한 실시양태에서, G-CSF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, G-CSF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 G-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 G-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.

투여할 GM-CSF의 치료 유효량은 예를 들어 0.1 내지 50 μg/kg 또는 0.5 내지 30 μg/kg 범위의 용량을 포함할 수 있다. 특정한 실시양태에서, GM-CSF가 투여될 수 있는 용량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, GM-CSF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 피하로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 아데노바이러스 공여자 벡터 전달 3, 4, 5, 6, 7, 또는 8일 전에 개시되어 매일 10 μg/kg의 용량으로 피하로 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, GM-CSF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 GM-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 GM-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5일 치료를 포함한다. 사르그라모스팀 (GM-CSF)에 대한 투여 요법은 200 μg/m², 210 μg/m², 220 μg/m², 230 μg/m², 240 μg/m², 250 μg/m², 260 μg/m², 270 μg/m², 280 μg/m², 290 μg/m², 300 μg/m², 또는 그 초과를 포함할 수 있다. 특정한 실시양태에서, 사르그라모스팀은 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀에 대한 투여 요법은 250 μg/m²/일 정맥내 또는 피하를 포함할 수 있고, 표적화된 세포 양이 말초 혈액에서 도달될 때까지 계속될 수 있거나 또는 5일 동안 계속될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, 사르그라모스팀은 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 사르그라모스팀이 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 사르그라모스팀 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5일 치료를 포함한다.

특정한 실시양태에서, AMD3100의 치료 유효량은 0.1 mg/kg 내지 100 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 0.5 mg/kg 내지 50 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 0.5 mg/kg, 1 mg/kg, 2 mg/kg, 3 mg/kg, 4 mg/kg, 5 mg/kg, 6 mg/kg, 7 mg/kg, 8 mg/kg, 9 mg/kg, 10 mg/kg, 11 mg/kg, 12 mg/kg, 13 mg/kg, 14 mg/kg, 15 mg/kg, 16 mg/kg, 17 mg/kg, 18 mg/kg, 19 mg/kg, 20 mg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 4 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 5 mg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 10 μg/kg 내지 500 μg/kg 또는 50 μg/kg 내지 400 μg/kg을 포함한다. 특정한 실시양태에서, AMD3100의 치료 유효량은 100 μg/kg, 150 μg/kg, 200 μg/kg, 250 μg/kg, 300 μg/kg, 350 μg/kg, 또는 그 초과를 포함한다. 특정한 실시양태에서, AMD3100은 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, AMD3100은 아데노바이러스 공여자 벡터 전달 6 내지 11시간 전에 160-240 μg/kg으로 피하로 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 또 다른 가동화 인자의 투여와 공동으로 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 또 다른 가동화 인자의 투여에 후속하여 투여될 수 있다. 특정한 실시양태에서, 치료 유효량의 AMD3100은 G-CSF의 투여에 후속하여 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 G-CSF가 제1일, 제2일, 제3일, 및 제4일에 투여되고, 제5일에는 G-CSF 및 AMD3100이 아데노바이러스 공여자 벡터 주사 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.

투여할 SCF의 치료 유효량은 예를 들어 0.1 내지 100 μg/kg/일 또는 0.5 내지 50 μg/kg/일 범위의 용량을 포함할 수 있다. 특정한 실시양태에서, SCF가 투여될 수 있는 용량은 0.5 μg/kg/일, 1 μg/kg/일, 2 μg/kg/일, 3 μg/kg/일, 4 μg/kg/일, 5 μg/kg/일, 6 μg/kg/일, 7 μg/kg/일, 8 μg/kg/일, 9 μg/kg/일, 10 μg/kg/일, 11 μg/kg/일, 12 μg/kg/일, 13 μg/kg/일, 14 μg/kg/일, 15 μg/kg/일, 16 μg/kg/일, 17 μg/kg/일, 18 μg/kg/일, 19 μg/kg/일, 20 μg/kg/일, 21 μg/kg/일, 22 μg/kg/일, 23 μg/kg/일, 24 μg/kg/일, 25 μg/kg/일, 26 μg/kg/일, 27 μg/kg/일, 28 μg/kg/일, 29 μg/kg/일, 30 μg/kg/일, 또는 그 초과를 포함한다. 특정한 실시양태에서, SCF는 1일, 연속 2일, 연속 3일, 연속 4일, 연속 5일, 또는 그 초과 동안 투여될 수 있다. 특정한 실시양태에서, SCF는 피하로 또는 정맥내로 투여될 수 있다. 특정한 실시양태에서, SCF는 20 μg/kg/일로 피하로 주사될 수 있다. 특정한 실시양태에서, SCF는 단일 작용제로서 투여되고, 이어서 또 다른 가동화 인자와 공동 투여될 수 있다. 특정한 실시양태에서, SCF는 단일 작용제로서 투여되고, 이어서 AMD3100과 공동 투여될 수 있다. 특정한 실시양태에서, 치료 프로토콜은 SCF가 제1일, 제2일, 제3일, 및 제4일에 투여될 수 있고, 제5일에는 SCF 및 AMD3100이 아데노바이러스 공여자 벡터 투여 6 내지 8시간 전에 투여되는 5-일 치료를 포함한다.

특정한 실시양태에서, 성장 인자 GM-CSF 및 G-CSF는 골수 함요 내의 HSPC를 말초 순환 혈액으로 가동화하여 혈액 중 순환하는 HSPC의 분율을 증가시키기 위해 투여될 수 있다. 특정한 실시양태에서, 가동화는 G-CSF/필그라스팀 (암젠(Amgen)) 및/또는 AMD3100 (시그마(Sigma))의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, 가동화는 GM-CSF/사르그라모스팀 (암젠) 및/또는 AMD3100 (시그마)의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, 가동화는 SCF/안세스팀 (암젠) 및/또는 AMD3100 (시그마)의 투여에 의해 달성될 수 있다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여와 공동으로 이루어진다. 특정한 실시양태에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행하고, 이어서 G-CSF/필그라스팀 및 AMD3100의 공동 투여가 이어진다. US 20140193376은 S1P 수용체 1 (S1PR1) 조정제 작용제와 함께 CXCR4 길항제를 이용하는 가동화 프로토콜을 기재한다. US 20110044997은 혈관 내피 성장 인자 수용체 (VEGFR) 효능제와 함께 CXCR4 길항제를 이용하는 가동화 프로토콜을 기재한다.

치료적 대형-페이로드 아데노바이러스 벡터(들)는 스테로이드, IL-1 수용체 길항제, 및/또는 IL-6 수용체 길항제 투여와 공동으로 또는 그 후에 투여될 수 있다. 이들 프로토콜은 치료의 잠재적 부작용을 완화시킬 수 있다.

IL-1 수용체 길항제는 공지되어 있고, ADC-1001 (엘리게이터 바이오사이언스(Alligator Bioscience), 스웨덴 룬드), FX-201 (플렉시온 테라퓨틱스(Flexion Therapeutics), 매사추세츠주 벌링턴), 바이오아시스 테크놀로지스(Bioasis Technologies) (캐나다 리치먼드)로부터 입수가능한 융합 단백질, GQ-303 (진퀸 바이오테라퓨틱스 게엠베하(Genequine Biotherapeutics GmbH), 독일 함부르크), HL-2351 (한독, 인크.(Handok, Inc.), 한국 서울), MBIL-1RA (프로테오테라, 인크.(ProteoThera, Inc.), 매사추세츠주 뉴턴), 아나킨라 (피보르 파마슈티칼스(Pivor Pharmaceuticals), 캐나다 밴쿠버), 인간 이뮤노글로불린 G 또는 글로불린 S (지씨 파마(GC Pharma), 한국 경기도)를 포함한다. IL-6 수용체 길항제도 또한 관련 기술분야에 공지되어 있고, 토실리주맙, BCD-089 (바이오카드(Biocad), 러시아), HS-628 (제지앙 히순 팜(Zhejiang Hisun Pharm), 중국 타이저우 시티), 및 APX-007 (아펙시겐(Apexigen), 캘리포니아주 샌 카를로스)을 포함한다.

특정한 실시양태에서, HSPC를 풍부화하기 위해 HSC 풍부화제, 예컨대 CD19 면역독소 또는 5-FU가 투여될 수 있다. CD19 면역독소는 골수 세포의 30%를 차지하는 모든 CD19 계통 세포를 고갈시키는데 사용될 수 있다. 고갈은 골수로부터의 배출을 촉진한다. HSPC가 증식하도록 함으로써 (CD19 면역독소 또는 5-FU를 통함), 이는 그의 분화 및 골수로부터의 배출을 자극하고, 말초 혈액 세포에서 트랜스진 마킹을 증가시킨다.

치료 유효량은 임의의 적절한 투여 경로를 통해, 예컨대 주사, 주입, 관류에 의해, 보다 특히 골수, 정맥내, 피내, 동맥내, 결절내, 림프내, 복강내 주사, 주입, 또는 관류 중 1종 이상에 의한 투여에 의해 투여될 수 있다.

(IX-b) 생체외 요법 및 시험관내 용도

본원에 제공된 방법 및 조성물은 적어도 부분적으로 생체내 유전자 요법에 사용하기 위해 개시된다. 그러나, 의심을 피하기 위해, 본 개시내용은 세포 및/또는 조직의 생체외 조작을 위한 본원에 제공된 조성물 및 방법의 용도, 뿐만 아니라 연구 목적을 위한 세포 및/또는 조직의 조작을 포함한 시험관내 용도를 명백하게 포함한다.

(IX-c) 특정한 혈액 장애 (예를 들어, 혈우병, 지중해빈혈)의 치료

특정한 실시양태에서, 본원에 개시된 방법 및 제제는 혈액 장애를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 혈우병, β-중증성 지중해빈혈, 다이아몬드 블랙판 빈혈 (DBA), 발작성 야간 혈색소뇨 (PNH), 순수 적혈구 무형성증 (PRCA), 불응성 빈혈, 중증 재생불량성 빈혈, 및/또는 혈액암, 예컨대 백혈병, 림프종, 및 골수종을 치료하기 위해 대상체에게 투여된다.

특정한 실시양태에서, 치료상 유효한 치료는 HbF의 발현을 유도 또는 증가시키고/거나, 헤모글로빈의 생산을 유도 또는 증가시키고/거나,β-글로빈의 생산을 유도 또는 증가시킨다. 특정한 실시양태에서, 치료상 유효한 치료는 혈액 세포 기능을 개선시키고/거나 세포의 산소화를 증가시킨다.

특정한 실시양태에서, 본 개시내용의 방법은 골수 기능의 회복을 필요로 하는 대상체에서 골수 기능을 회복시킬 수 있다. 특정한 실시양태에서, 골수 기능을 회복시키는 것은 본원에 기재된 요법이 투여되지 않은 골수 재증식을 필요로 하는 대상체와 비교하여 유전자 교정된 세포로 골수 재증식을 개선시키는 것을 포함할 수 있다. 유전자 교정된 세포로 골수 재증식을 개선시키는 것은 유전자 교정된 세포의 백분율을 증가시키는 것을 포함할 수 있다. 특정한 실시양태에서, 세포는 백혈구 및 골수 유래 세포로부터 선택된다. 특정한 실시양태에서, 유전자 교정된 세포의 백분율은 정량적 실시간 PCR 및 유동 세포측정법으로부터 선택된 검정을 사용하여 측정될 수 있다.

특정한 실시양태에서, 본 개시내용의 방법은 FA를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 치료 효능은 림프구 재구성, 개선된 클론 다양성 및 흉선세포증식, 감소된 감염, 및/또는 개선된 환자 결과를 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 개선된 위장 기능 (예를 들어, 감소된 설사), 감소된 상기도 증상, 구강의 감소된 진균 감염 (아구창), 폐렴의 감소된 발생률 및 중증도, 감소된 수막염 및 혈류 감염, 및 감소된 귀 감염 중 1종 이상을 통해 관찰될 수 있다. 특정한 실시양태에서, FA를 본 개시내용의 방법으로 치료하는 것은 미토마이신 C (MMC)에 대한 골수 유래 세포의 저항성을 증가시키는 것을 포함한다. 특정한 실시양태에서, MMC에 대한 골수 유래 세포의 저항성은 메틸셀룰로스 및 MMC에서의 세포 생존 검정에 의해 측정될 수 있다.

(IX-c-i) 혈액 장애를 치료하기 위한 LCR, 프로모터, 코딩 서열, 및 벡터

다양한 실시양태에서, 본 개시내용은 β-글로빈 긴 LCR, β-글로빈 프로모터, 및 혈액 장애의 치료를 위한 단백질 또는 작용제를 코딩하는 코딩 핵산 서열을 포함하는 본 개시내용의 아데노바이러스 공여자 벡터를 사용한 혈액 장애의 치료를 포함한다. 다양한 실시양태에서, 혈액 장애는 지중해빈혈이고, 단백질은 β-글로빈 또는 γ-글로빈 단백질, 또는 다르게는 β-글로빈 또는 γ-글로빈을 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시양태에서, 혈액 장애는 혈우병이고, 단백질은 ET3, 또는 다르게는 인자 VIII을 부분적으로 또는 완전히 기능적으로 대체하는 단백질이다. 다양한 실시양태에서, 혈액 장애는 점 돌연변이 질환, 예컨대 겸상 적혈구 빈혈이고, 작용제는 유전자 편집 단백질이다.

ET3은 하기 아미노산 서열: 서열식별번호: 99를 가질 수 있다. 다양한 실시양태에서, 인자 VIII 대체 단백질은 서열식별번호: 99에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.

β-글로빈은 하기 아미노산 서열: 서열식별번호: 100을 가질 수 있다. 다양한 실시양태에서, β-글로빈 대체 단백질은 서열식별번호: 100에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.

γ-글로빈은 하기 아미노산 서열: 서열식별번호: 101을 가질 수 있다. 다양한 실시양태에서, γ-글로빈 대체 단백질은 서열식별번호: 101에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.

(IX-c-ii) 투여량 및 제제

벡터는 세포 또는 동물, 예를 들어 인간에게 투여하기에 제약상 허용되도록 제제화될 수 있다. 벡터는 시험관내, 생체외, 또는 생체내 투여될 수 있다. 다양한 예에서, 벡터는 제약상 허용되는 담체 또는 부형제를 포함하도록 제제화될 수 있다. 제약상 허용되는 담체의 예는 생리학상 상용성인 임의의 및 모든 용매, 분산 매질, 코팅, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제 등을 포함하나 이에 제한되지는 않는다. 본 발명의 조성물은 제약상 허용되는 염, 예를 들어 산 부가염 또는 염기 부가염을 포함할 수 있다.

다양한 실시양태에서, 본원에 기재된 바와 같은 벡터를 포함하는 조성물, 예를 들어 주사용 멸균 제제는 비히클로서 주사용 증류수를 사용하여 통상적인 제약 실시에 따라 제제화될 수 있다. 예를 들어, 생리 염수, 또는 글루코스 및 다른 보충제, 예컨대 D-소르비톨, D-만노스, D-만니톨, 및 염화나트륨을 함유하는 등장성 용액이 주사용 수용액으로서, 임의로 적합한 가용화제, 예를 들어 알콜, 예컨대 에탄올 및 폴리알콜, 예컨대 프로필렌 글리콜 또는 폴리에틸렌 글리콜, 및 비이온성 계면활성제, 예컨대 폴리소르베이트 80™, HCO-50 등과 조합되어 사용될 수 있다.

본원에 개시된 바와 같이, 벡터는 관련 기술분야에 공지된 임의의 형태일 수 있다. 이러한 형태는, 예를 들어 액체, 반고체 및 고체 투여 형태, 예컨대 액체 용액 (예를 들어, 주사가능한 및 주입가능한 용액), 분산액 또는 현탁액, 정제, 환제, 분말, 리포솜 및 좌제를 포함한다.

임의의 특정한 형태의 선택 또는 사용은, 부분적으로, 의도된 투여 방식 및 치료 용도에 좌우될 수 있다. 예를 들어, 전신 또는 국부 전달을 위해 의도된 조성물을 함유하는 조성물은 주사가능한 또는 주입가능한 용액의 형태일 수 있다. 따라서, 벡터는 비경구 방식 (예를 들어, 정맥내, 피하, 복강내, 또는 근육내 주사)에 의한 투여를 위해 제제화될 수 있다. 본원에 사용된 비경구 투여는 통상적으로 주사에 의한, 경장 및 국소 투여 외의 투여 방식을 지칭하고, 정맥내, 비강내, 안내, 폐, 근육내, 동맥내, 척수강내, 피막내, 안와내, 심장내, 피내, 폐내, 복강내, 경기관, 피하, 각피하, 관절내, 피막하, 지주막하, 척수내, 경막외, 뇌내, 두개내, 경동맥내 및 수조내 주사 및 주입을 포함하나 이에 제한되지는 않는다. 비경구 투여 경로는, 예를 들어 주사에 의한 투여, 경비 투여, 경폐 투여, 또는 경피 투여일 수 있다. 투여는 정맥내 주사, 근육내 주사, 복강내 주사, 피하 주사에 의한 전신 또는 국부 투여일 수 있다.

다양한 실시양태에서, 본 발명의 벡터는 용액, 마이크로에멀젼, 분산액, 리포솜, 또는 고농도에서 안정한 저장에 적합한 다른 정렬된 구조로서 제제화될 수 있다. 멸균 주사가능한 용액은 필요한 양의 본원에 기재된 조성물을 상기 열거된 성분 중 하나 또는 그의 조합과 함께 적절한 용매 중에 혼입시킨 후, 필요에 따라, 여과 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 본원에 기재된 조성물을 염기성 분산 매질 및 상기 열거된 것으로부터의 필요한 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 제조 방법은 그의 이전에 멸균-여과된 용액으로부터 본원에 기재된 조성물 플러스 임의의 추가의 목적하는 성분 (하기 참조)의 분말을 생성하는 진공 건조 및 동결-건조를 포함한다. 용액의 적절한 유동성은, 예를 들어 코팅, 예컨대 레시틴의 사용에 의해, 분산액의 경우에 요구되는 입자 크기의 유지에 의해, 및 계면활성제의 사용에 의해 유지될 수 있다. 주사가능한 조성물의 지속 흡수는 흡수를 지연시키는 시약, 예를 들어 모노스테아레이트 염 및 젤라틴을 조성물에 포함시킴으로써 달성될 수 있다.

벡터는 물 또는 또 다른 제약상 허용되는 액체 중 멸균 용액 또는 현탁액을 포함하는 주사가능한 제제의 형태로 비경구로 투여될 수 있다. 예를 들어, 벡터는 치료 분자를 제약상 허용되는 비히클 또는 매질, 예컨대 멸균수 및 생리 염수, 식물성 오일, 유화제, 현탁화제, 계면활성제, 안정화제, 향미 부형제, 희석제, 비히클, 보존제, 결합제와 적합하게 조합한 다음, 일반적으로 허용되는 제약 실시에 요구되는 단위 용량 형태로 혼합함으로써 제제화될 수 있다. 제약 제제에 포함된 벡터의 양은 지정된 범위 내의 적합한 용량이 제공되도록 하는 양이다. 유성 액체의 비제한적 예는 참깨 오일 및 대두 오일을 포함하고, 이는 가용화제로서 벤질 벤조에이트 또는 벤질 알콜과 조합될 수 있다. 포함될 수 있는 다른 항목은 완충제, 예컨대 포스페이트 완충제, 또는 아세트산나트륨 완충제, 수딩제, 예컨대 프로카인 히드로클로라이드, 안정화제, 예컨대 벤질 알콜 또는 페놀, 및 항산화제이다. 제제화된 주사제는 적합한 앰플에 포장될 수 있다.

다양한 실시양태에서, 피하 투여는 장치, 예컨대 시린지, 사전충전 시린지, 자가-주사기 (예를 들어, 일회용 또는 재사용가능), 펜 주사기, 패치 주사기, 착용가능한 주사기, 피하 주입 세트가 구비된 보행용 시린지 주입 펌프, 또는 피하 주사를 위한 다른 장치에 의해 달성될 수 있다.

일부 실시양태에서, 본원에 기재된 벡터는 국부 투여에 의해 대상체에게 치료적으로 전달될 수 있다. 본원에 사용된 "국부 투여" 또는 "국부 전달"은 혈관계를 통한 그의 의도된 표적 조직 또는 부위로의 벡터 또는 벡터의 수송에 의존하지 않는 전달을 지칭할 수 있다. 예를 들어, 벡터는 조성물 또는 작용제의 주사 또는 이식에 의해 또는 조성물 또는 작용제를 함유하는 장치의 주사 또는 이식에 의해 전달될 수 있다. 특정 실시양태에서, 표적 조직 또는 부위 부근에서의 국부 투여 후, 조성물 또는 작용제, 또는 그의 1종 이상의 성분은 투여 부위가 아닌 의도된 표적 조직 또는 부위로 확산될 수 있다.

일부 실시양태에서, 본원에 제공된 조성물은 단위 투여 형태로 존재하며, 단위 투여 형태는 자기-투여에 적합할 수 있다. 이러한 단위 투여 형태는 용기, 전형적으로 예를 들어 바이알, 카트리지, 사전충전된 시린지 또는 일회용 펜 내에 제공될 수 있다. 미국 특허 번호 6,302,855에 기재된 투여 장치와 같은 투여기가 또한 예를 들어 본원에 기재된 바와 같은 주사 시스템과 함께 사용될 수 있다.

주사에 적합한 벡터 제제의 제약 형태는 멸균 수용액 또는 분산액을 포함할 수 있다. 제제는 멸균일 수 있고, 시린지 내외로의 적절한 유동을 가능하게 하는 유체이어야 한다. 제제는 또한 제조 및 저장 조건 하에 안정할 수 있다. 담체는 예를 들어 물 및 염수 또는 완충 수용액을 함유하는 용매 또는 분산 매질일 수 있다. 바람직하게는, 등장화제, 예를 들어 당 또는 염화나트륨이 제제에 사용될 수 있다.

또한, 관련 기술분야의 통상의 기술자는 전기천공, 초음파영동, 골내 주사 방법을 통하거나 또는 유전자 총을 사용하는 것에 의할 수 있는 추가의 전달 방법을 또한 고려할 수 있다. 벡터는 또한 마이크로칩, 나노-칩 또는 나노입자 내로 이식될 수 있다.

본원에 기재된 벡터의 적합한 용량은, 예를 들어 치료될 대상체의 연령, 성별, 및 체중, 치료될 상태 또는 질환, 및 사용되는 특정한 벡터를 비롯한 다양한 인자에 좌우될 수 있다. 대상체에게 투여되는 용량에 영향을 미치는 다른 인자는, 예를 들어 상태 또는 질환의 유형 또는 중증도를 포함한다. 다른 인자는, 예를 들어 대상체에게 공동으로 영향을 미치거나 이전에 영향을 미친 다른 의학적 장애, 대상체의 전반적 건강, 대상체의 유전적 소인, 식이, 투여 시간, 배출 속도, 약물 조합물, 및 대상체에게 투여되는 임의의 다른 추가의 치료제를 포함할 수 있다. 벡터의 적합한 투여 수단은 치료될 상태 또는 질환 및 대상체의 연령 및 상태에 기초하여 선택될 수 있다. 용량 및 투여 방법은 환자의 체중, 연령, 상태 등에 따라 달라질 수 있고, 관련 기술분야의 통상의 기술자에 의해 필요에 따라 적합하게 선택될 수 있다. 임의의 특정한 대상체에 대한 구체적 투여량 및 치료 요법은 의료 진료의의 판단에 기초하여 조정될 수 있다.

벡터 용액은 치료 유효량의 본원에 기재된 조성물을 포함할 수 있다. 이러한 유효량은, 부분적으로, 투여된 조성물의 효과, 또는 1종 초과의 작용제가 사용되는 경우에 조성물 및 1종 이상의 추가의 활성제의 조합 효과에 기초하여 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 치료 유효량은 치료상 유익한 효과가 조성물의 임의의 독성 또는 유해한 효과를 능가하는 양일 수 있다.

(IX-d) 암 유형의 치료

특정한 실시양태에서, 본원에 개시된 방법 및 제제는 암을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 급성 림프모구성 백혈병 (ALL), 급성 골수 백혈병 (AML), 만성 림프구성 백혈병 (CLL), 만성 골수 백혈병 (CML), 만성 골수단핵구성 백혈병, 미만성 대 B-세포 림프종, 여포성 림프종, 호지킨 림프종, 소아 골수단핵구성 백혈병, 다발성 골수종, 골수이형성증, 및/또는 비-호지킨 림프종을 치료하기 위해 대상체에게 투여된다.

치료될 수 있는 추가의 예시적인 암은 성상세포종, 비정형 기형 횡문근양 종양, 뇌 및 중추 신경계 (CNS) 암, 유방암, 암육종, 연골육종, 척삭종, 맥락총 암종, 맥락총 유두종, 투명 세포 연부 조직 육종, 미만성 대 B-세포 림프종, 상의세포종, 상피양 육종, 생식선외 배세포 종양, 신외 횡문근양 종양, 유잉 육종, 위장 기질 종양, 교모세포종, HBV-유발 간세포성 암종, 두경부암, 신장암, 폐암, 악성 횡문근양 종양, 수모세포종, 흑색종, 수막종, 중피종, 다발성 골수종, 신경교 종양, 달리 명시되지 않은 (NOS) 육종, 핍지교성상세포종, 핍지교종, 골육종, 난소암, 난소 투명 세포 선암종, 난소 자궁내막양 선암종, 난소 장액성 선암종, 췌장암, 췌장관 선암종, 췌장 내분비 종양, 송과체모세포종, 전립선암, 신세포 암종, 신장 수질 암종, 횡문근육종, 육종, 슈반세포종, 피부 편평 세포 암종, 및 줄기 세포 암을 포함한다. 다양한 특정한 실시양태에서, 암은 난소암이다. 다양한 특정한 실시양태에서, 암은 유방암이다.

(IX-d-i) 암 유형을 치료하기 위한 LCR, 프로모터, 코딩 서열, 및 벡터

본원에 기재된 아데노바이러스 공여자 벡터는 암의 치료에 유용하다. 이러한 아데노바이러스 공여자 벡터, 뿐만 아니라 아데노바이러스 공여자 게놈, 전위 시스템, 및 아데노바이러스 생산 시스템의 실시양태에서, 제공된 긴 LCR은 암 치료에 유용한 표적 세포로의 유전자(들)의 전달을 매개하는데 사용될 수 있다. 관련 기술분야의 통상의 기술자는 구체적 유형의 암을 치료하는데 유용할 적절한 프로모터, 코딩 서열, 및 벡터 구조를 인식할 것이다. 또한, 이러한 요소의 예는 본원에 기재되어 있다.

특정한 실시양태에서, 아데노바이러스 공여자 벡터는 암-특이적 또는 암-표적화된 치료 유전자를 발현하는 서열을 포함할 수 있다. 이러한 암-표적화된 치료 유전자의 예는 암 항원 (예를 들어, CD19, ROR1 등 - 본원에 기재된 것을 포함함)에 결합하는 항체 단편을 포함하며, 여기서 항체 단편의 서열은 TCR 서브유닛 또는 그의 부분을 코딩하는 핵산 서열과 인접하여 동일한 리딩 프레임 내에 존재한다. 이러한 TFP는 기능적 TCR 복합체를 형성하기 위해 1개 이상의 내인성 (또는 대안적으로, 1개 이상의 외인성, 또는 내인성 및 외인성의 조합) TCR 서브유닛과 회합할 수 있다.

특정한 실시양태에서, 치료 유전자는 항체 또는 항체의 결합 단편, 예컨대 Fab 또는 scFv를 코딩할 수 있다. 발현될 수 있는 예시적인 항체 (scFv 포함)는 WO2014164553A1, US20170283504, US7083785B2, US10189906B2, US10174095B2, WO2005102387A2, US20110206701A1, WO2014179759A1, US20180037651A1, US20180118822A1, WO2008047242A2, WO1996016990A1, WO2005103083A2, 및 WO1999062526A2에 기재된 것을 포함한다. 결합 도메인과 관련하여 본원에 기재된 항체, 뿐만 아니라 아테졸리주맙, 블리나투모맙, 브렌툭시맙, 세툭시맙, 시름투주맙, 파를레투주맙, 겜투주맙, OKT3, 오레고보맙, 프로믹시맙, 펨브롤리주맙, 및 트라스투주맙이 또한 사용될 수 있다.

면역 체크포인트 억제제가 또한 사용될 수 있다. 면역 체크포인트 억제제는 면역 억제 체크포인트 단백질의 기능을 억제하는 화합물을 지칭한다. 억제는 기능의 감소 및 완전한 차단을 포함한다. 바람직한 면역 체크포인트 억제제는 면역 체크포인트 단백질을 특이적으로 인식하는 항체이다. 특정한 실시양태에서, 면역 체크포인트 억제제는 대상체에서 CD8+ T 세포의 증식, 이동, 지속성 및/또는 세포독성 활성, 및 특히 대상체의 CD8+ T 세포의 종양-침윤을 증진시킨다. 따라서, 본 개시내용의 예시적인 면역 체크포인트 억제제는 αPD-L1γ1 항체 (대안적으로 αPD-L1γ₁로 지칭됨)를 포함한다. αPD-L1γ1은 문헌 [Engeland et al., 2014 Mol Ther 22(11):1949-1959]에 추가로 기재되어 있다.

PD-1 및 PD-L1 항체의 예는 US 7,488,802; US 7,943,743; US 8,008,449; US 8,168,757; US 8,217,149, WO03042402, WO2008156712, WO2010089411, WO2010036959, WO2011066342, WO2011159877, WO2011082400, 및 WO2011161699에 기재되어 있다. 일부 실시양태에서, PD-1 차단제는 항-PD-L1 항체를 포함한다. 다른 실시양태에서, PD-1 차단제는 항-PD-1 항체 및 유사한 결합 단백질, 예컨대 니볼루맙 (MDX 1106, BMS 936558, ONO 4538), 그의 리간드 PD-L1 및 PD-L2에 결합하고 그에 의한 PD-1의 활성화를 차단하는 완전 인간 IgG4 항체; PD-1에 대한 인간화 모노클로날 IgG4 항체인 람브롤리주맙 (MK-3475 또는 SCH 900475); PD-1에 결합하는 인간화 항체인 CT-011; B7-DC의 융합 단백질인 AMP-224; 항체 Fc 부분; PD-L1 (B7-H1) 차단을 위한 BMS-936559 (MDX-1105-01)를 포함한다.

다른 면역-체크포인트 억제제는 림프구 활성화 유전자-3 (LAG-3) 억제제, 예컨대 가용성 Ig 융합 단백질인 IMP321을 포함한다 (Brignone et al., 2007, J. Immunol. 179:4202-4211). 다른 면역-체크포인트 억제제는 B7 억제제, 예컨대 B7-H3 및 B7-H4 억제제를 포함한다. 특히, 항-B7-H3 항체 MGA271 (Loo et al., 2012, Clin. Cancer Res. July 15 (18) 3834). 또한, TIM3 (T-세포 이뮤노글로불린 도메인 및 뮤신 도메인 3) 억제제가 포함된다 (Fourcade et al., 2010, J. Exp. Med. 207:2175-86 및 Sakuishi et al., 2010, J. Exp. Med. 207:2187-94). 본원에 사용된 용어 "TIM-3"은 관련 기술분야에서의 그의 일반적 의미를 갖고, T 세포 이뮤노글로불린 및 뮤신 도메인-함유 분자 3을 지칭한다. TIM-3의 천연 리간드는 갈렉틴 9 (Ga19)이다. 따라서, 본원에 사용된 용어 "TIM-3 억제제"는 TIM-3의 기능을 억제할 수 있는 화합물, 물질 또는 조성물을 지칭한다. 예를 들어, 억제제는 TIM-3의 발현 또는 활성을 억제하고/거나, TIM-3 신호전달 경로를 조정 또는 차단하고/거나, 갈렉틴-9에 대한 TIM-3의 결합을 차단할 수 있다. TIM-3에 대한 특이성을 갖는 항체는 관련 기술분야에 널리 공지되어 있고, 전형적으로 WO2011/155607, WO2013/006490 및 WO2010/117057에 기재된 것이다.

추가의 특정한 면역 체크포인트 억제제는 아테졸리주맙, BMS-936559, 이필리무맙, MEDI0680, MEDI4736, MSB0010718C, 펨브롤리주맙, 피딜리주맙, 및 트레멜리무맙을 포함한다. 또한, WO 1998/42752; WO 2000/37504; WO 2001/014424; WO 2004/035607; US 2005/0201994; US 2002/0039581; US 2002/086014; US 5,811,097; US 5,855,887; US 5,977,318; US 6,051,227; US 6,984,720; US 6,682,736; US 6,207,156; US 6,682,736; US 7,109,003; US 7,132,281; EP1212422B1; 문헌 [Hurwitz et al., Proc. Natl. Acad. Sci. USA, 95(17):10067-10071 (1998); Camacho et al., J. Clin. Oncology, 22(145): Abstract No. 2505 (2004) (항체 CP-675206); 및 Mokyr et al., Cancer Res, 58:5301-5304 (1998)]을 참조한다.

(IX-d-ii) 투여량 및 제제

암과 관련하여, 치료 유효량은 치료 후 종양 세포의 수를 감소시키고/거나, 전이의 수를 감소시키고/거나, 종양 부피를 감소시키고/거나, 기대 수명을 증가시키고/거나, 암 세포의 아폽토시스를 유도하고/거나, 암 세포 사멸을 유도하고/거나, 암 세포에서 화학- 또는 방사선감수성을 유도하고/거나, 암 세포 근처에서의 혈관신생을 억제하고/거나, 암 세포 증식을 억제하고/거나, 종양 성장을 억제하고/거나, 전이를 방지하고/거나, 대상체의 삶을 연장하고/거나, 암-연관 통증을 감소시키고/거나, 전이의 수를 감소시키고/거나, 암의 재발 또는 재발생을 감소시킬 수 있다.

특정한 실시양태에서, 제제는 고위험 배선 돌연변이의 보인자에서 암 재발을 예방 또는 지연시키거나 또는 암 발병을 예방 또는 지연시키기 위해 대상체에게 투여된다. 특정한 실시양태에서, 제제는 보다 높은 치료 용량의 테모졸로미드 (TMZ) 및 벤질구아닌 또는 BCNU를 제공하기 위해 대상체에게 투여된다. 강한 골수억제 오프-타겟 효과로 인해, 유효 용량의 TMZ 및 벤질구아닌을 종양에 전달하는 것은 도전과제로 남아있다. 환자는 현재 급성 골수성 백혈병 (AML), 식도암, 두경부암, 고등급 신경교종, 골수이형성 증후군, 비소세포 폐암, NSCLC; 불응성 AML, 소세포 폐암, 역형성 성상세포종, 뇌 종양, 유방암 (예를 들어, 전이성), 결장직장암 (예를 들어, 전이성), 미만성 내인성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종 (GBM), 악성 신경교종, 흑색종, 전이성 악성 흑색종, 재발성 악성 흑색종, 비인두암, 전이성 유방암, 및 소아암과 연관된 치료를 위해 TMZ 및 벤질구아닌을 제공받을 수 있다.

MGMT-발현 종양을 갖는 환자는 MGMT P140k 생체내 선택 카세트와 조합된 활성 성분 (예컨대 CAR, TCR, 또는 항체)을 갖는 치료 대형-페이로드 아데노바이러스 벡터의 투여로부터 이익을 얻을 것이다. 생체외 접근법은 이러한 접근법의 적용가능성을 보여주었다. 특정한 실시양태에서, 치료량의 TMZ 및 벤질구아닌 또는 BCNU를 투여하여 종양 부담 또는 부피를 감소시킨다.

(IX-e) 점 돌연변이 상태 (예를 들어, 겸상 적혈구)의 치료

특정한 실시양태에서, 본원에 개시된 방법 및 제제는 점 돌연변이 상태를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 겸상 적혈구 질환, 낭성 섬유증, 테이-삭스병, 및/또는 페닐케톤뇨를 치료하기 위해 대상체에게 투여된다. 다양한 실시양태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병변의 교정 편집을 위한 CRISPR-Cas를 코딩한다. 다양한 실시양태에서, 본 개시내용의 트랜스포손 페이로드는 핵산 병변의 교정 편집을 위한 염기 편집제를 코딩한다.

(IX-f) 특정한 효소 결핍의 치료

특정한 실시양태에서, 본원에 개시된 방법 및 제제는 특정한 효소 결핍을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 제제는 후를러 증후군, 선택적 IgA 결핍, 과다 IgM, IgG 하위부류 결핍, 니만-픽병, 테이-삭스병, 고셔병, 파브리병, 크라베병, 글루코스혈증, 메이플 시럽뇨 질환, 페닐케톤뇨, 글리코겐 축적 질환, 프리드라이히 운동실조, 젤베거 증후군, 부신백질이영양증, 보체 장애, 및/또는 뮤코폴리사카라이드증을 치료하기 위해 대상체에게 투여된다.

특정한 실시양태에서, 본 개시내용의 방법은 면역화에 대한 1차 및 2차 항체 반응의 정규화를 필요로 하는 대상체에서 면역화에 대한 1차 및 2차 항체 반응을 정규화할 수 있다. 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 항원에 대한 부류 전환 및 기억 반응에서 기능하는 B-세포 및/또는 T-세포 시토카인 신호전달 프로그램을 회복시키는 것을 포함할 수 있다. 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 박테리오파지 면역화 검정에 의해 측정될 수 있다. 특정한 실시양태에서, B-세포 및/또는 T-세포 시토카인 신호전달 프로그램의 회복은 T-세포 의존성 신생항원 박테리오파지 ΨX174로의 면역화 후에 검정될 수 있다. 특정한 실시양태에서, 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 IgA, IgM, 및/또는 IgG의 수준의 증가를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 대조군 집단으로부터 유래된 참조 수준과 대등한 수준으로 증가시키는 것을 포함할 수 있다. 특정한 실시양태에서, 면역화에 대한 1차 및 2차 항체 반응을 정규화하는 것은 IgA, IgM, 및/또는 IgG의 수준의 증가를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 본원에 기재된 유전자 요법이 투여되지 않은, 이를 필요로 하는 대상체의 수준보다 더 큰 수준으로 증가시키는 것을 포함할 수 있다. IgA, IgM, 및/또는 IgG의 수준은 예를 들어 이뮤노글로불린 시험에 의해 측정될 수 있다. 특정한 실시양태에서, 이뮤노글로불린 시험은 IgG, IgA, IgM, 카파 경쇄, 람다 경쇄, 및/또는 중쇄에 결합하는 항체를 포함한다. 특정한 실시양태에서, 이뮤노글로불린 시험은 혈청 단백질 전기영동, 면역전기영동, 방사상 면역확산, 비탁측정법 및 탁도측정법을 포함한다. 상업적으로 입수가능한 이뮤노글로불린 시험 키트는 미니네프(MININEPH)™ (바인딩 사이트(Binding site), 영국 버밍햄), 및 다코(Dako) (덴마크) 및 데이드 베링(Dade Behring) (독일 마르부르크)으로부터의 이뮤노글로불린 시험 시스템을 포함한다. 특정한 실시양태에서, 이뮤노글로불린 수준을 측정하는데 사용될 수 있는 샘플은 혈액 샘플, 혈장 샘플, 뇌척수액 샘플, 및 소변 샘플을 포함한다.

특정한 실시양태에서, 본 개시내용의 방법은 SCID-X1을 치료하는데 사용될 수 있다. 특정한 실시양태에서, 본 개시내용의 방법은 SCID (예를 들어, JAK 3 키나제 결핍 SCID, 퓨린 뉴클레오시드 포스포릴라제 (PNP) 결핍 SCID, 아데노신 데아미나제 (ADA) 결핍 SCID, MHC 부류 II 결핍 또는 레콤비나제 활성화 유전자 (RAG) 결핍 SCID)를 치료하는데 사용될 수 있다. 특정한 실시양태에서, 치료 효능은 림프구 재구성, 개선된 클론 다양성 및 흉선세포증식, 감소된 감염, 및/또는 개선된 환자 결과를 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 개선된 위장 기능 (예를 들어, 감소된 설사), 감소된 상기도 증상, 구강의 감소된 진균 감염 (아구창), 폐렴의 감소된 발생률 및 중증도, 감소된 수막염 및 혈류 감염, 및 감소된 귀 감염 중 1종 이상을 통해 관찰될 수 있다. 특정한 실시양태에서, 본 개시내용의 방법으로 SCIDX-1을 치료하는 것은 γC-의존성 신호전달 경로에 기능성을 회복시키는 것을 포함한다. γC-의존성 신호전달 경로의 기능성은 각각 IL-21 및/또는 IL-2로의 시험관내 자극 후 이펙터 분자 STAT3 및/또는 STAT5의 티로신 인산화를 측정함으로써 검정될 수 있다. STAT3 및/또는 STAT5의 티로신 인산화는 세포내 항체 염색에 의해 측정될 수 있다.

(IX-i) 다른 용도

(IX-i-i) HIV (대표적인 감염원)

특정한 실시양태는 속발성 또는 후천성 면역 결핍, 예컨대 외상, 바이러스, 화학요법, 독소, 및 오염에 의해 유발된 면역 결핍의 치료를 포함한다. 이전에 나타낸 바와 같이, 후천성 면역결핍 증후군 (AIDS)은 바이러스, 인간 면역결핍 바이러스 (HIV)에 의해 유발된 2차 면역 결핍 장애의 예이며, 여기서 T 림프구의 고갈은 신체가 감염과 싸울 수 없게 만든다. 따라서, 또 다른 예로서, 유전자는 감염성 질환에 대한 치료상 유효한 반응을 제공하도록 선택될 수 있다. 특정한 실시양태에서, 감염성 질환은 인간 면역결핍 바이러스 (HIV)이다. 치료 유전자는, 예를 들어 면역 세포를 HIV 감염에 대해 저항성이 되게 하는 유전자일 수 있거나, 또는 면역 재구축, 면역 세포에 의해 발현되는 단백질을 코딩하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우기에 유리한 유전자, 감염원, 수용체 또는 보조수용체를 코딩하는 유전자; 수용체 또는 보조수용체에 대한 리간드를 코딩하는 유전자; 특정 전사 인자의 작용을 차단하기 위한 리보자임, 안티센스 RNA, 소형 간섭 RNA (siRNA) 또는 디코이 RNA를 코딩하는 유전자를 포함한, 바이러스 복제에 필수적인 바이러스 및 세포 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라카인 및 자살 유전자를 코딩하는 유전자를 통해 면역 세포가 바이러스를 효과적으로 중화시킬 수 있게 하는 것일 수 있다. 예시적인 치료 유전자 및 유전자 생성물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료 유효량은, 예를 들어 HIV에 대한 대상체의 면역을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 호전시키거나, 또는 대상체에서 HIV에 대한 선천성 또는 적응성 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산을 포함할 수 있고, AIDS의 예방을 발생시킬 수 있고/거나 대상체의 AIDS 또는 HIV 감염의 증상을 호전시킬 수 있거나, 또는 HIV 감염성 및/또는 병독성을 감소 또는 제거할 수 있다.

하기 예시적인 실시양태 및 실시예(들)는 본 개시내용의 특정한 실시양태를 입증하기 위해 포함된다. 관련 기술분야의 통상의 기술자는 본 개시내용에 비추어 본 개시내용의 취지 및 범주로부터 벗어나지 않으면서 본원에 개시된 구체적 실시양태에 대해 많은 변화가 이루어질 수 있고, 여전히 비슷하거나 유사한 결과를 수득할 수 있다는 것을 인식하여야 한다.

(X) 예시적인 실시양태.

1. (a) 아데노바이러스 캡시드; 및 (b) (i) 적어도 10 kb의 트랜스포손 페이로드; (ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 선형, 이중-가닥 DNA 게놈을 포함하는 아데노바이러스 공여자 벡터.

2. (a) 적어도 10 kb의 트랜스포손 페이로드; (b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및 (c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)를 포함하는 아데노바이러스 공여자 게놈.

3. (a) 실시양태 1의 아데노바이러스 공여자 벡터; 및 (b) (i) 아데노바이러스 캡시드; 및 (ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 지지 벡터를 포함하는 아데노바이러스 전위 시스템.

4. (a) 실시양태 2의 아데노바이러스 공여자 게놈; 및 (b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함하는 아데노바이러스 전위 시스템.

5. (a) 실시양태 2의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및 (b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산을 포함하는 아데노바이러스 생산 시스템.

6. 실시양태 1-5 중 어느 하나에 있어서, 트랜스포손 페이로드가 긴 LCR을 포함하고, 임의로 여기서 긴 LCR이 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR인 벡터, 게놈, 또는 시스템.

7. 실시양태 6에 있어서, 긴 LCR이 적어도 27 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.

8. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 표 1에 제시된 LCR을 포함하는 것인 벡터, 게놈, 또는 시스템.

9. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.

10. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.

11. 실시양태 1-6 중 어느 하나에 있어서, 트랜스포손 페이로드가 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.

12. 실시양태 1-11 중 어느 하나에 있어서, 트랜스포손 페이로드가 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질이 치료 단백질인 벡터, 게놈, 또는 시스템.

13. 실시양태 12에 있어서, 단백질이 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질을 포함하는 군으로부터 선택된 것인 벡터, 게놈, 또는 시스템.

14. 실시양태 12에 있어서, 단백질이 인자 VIII 대체 단백질인 벡터, 게놈, 또는 시스템.

15. 실시양태 12 또는 13에 있어서, 단백질을 코딩하는 핵산 서열이 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터가 β 글로빈 프로모터인 벡터, 게놈, 또는 시스템.

16. 실시양태 1-15 중 어느 하나에 있어서, 트랜스포손 역전된 반복부가 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부가 pT4 역전된 반복부인 벡터, 게놈, 또는 시스템.

17. 실시양태 3-15 중 어느 하나에 있어서, 트랜스포사제가 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제가 슬리핑 뷰티 100x (SB100x)인 벡터, 게놈, 또는 시스템.

18. 실시양태 1-17 중 어느 하나에 있어서, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.

19. 실시양태 3-18 중 어느 하나에 있어서, 아데노바이러스 지지 게놈이 레콤비나제를 코딩하는 핵산을 포함하는 것인 벡터, 게놈, 또는 시스템.

20. 실시양태 19에 있어서, 레콤비나제가 FLP 레콤비나제인 벡터, 게놈, 또는 시스템.

21. 실시양태 1-20 중 어느 하나에 있어서, 트랜스포손 페이로드가 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드가 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부가 SB 역전된 반복부이고, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.

22. 실시양태 1-21 중 어느 하나에 있어서, 트랜스포손 페이로드에 선택 카세트를 포함하고, 임의로 여기서 선택 카세트가 mgmt^P140K를 코딩하는 핵산 서열을 포함하는 것인 벡터, 게놈, 또는 시스템.

23. 실시양태 1-22 중 어느 하나에 있어서, 아데노바이러스 캡시드가 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드가 Ad35++ 캡시드인 벡터, 게놈, 또는 시스템.

24. 실시양태 5-23 중 어느 하나에 있어서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소가 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함하는 것인 아데노바이러스 생산 시스템.

25. 실시양태 24에 있어서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부가 LoxP 부위인 아데노바이러스 생산 시스템.

26. 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포.

27. 실시양태 1-25 중 어느 하나의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포로서, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된 것인 세포.

28. 실시양태 26 또는 27에 있어서, 조혈 줄기 세포인 세포.

29. 실시양태 5-25 중 어느 하나에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 HEK293 세포인 아데노바이러스-생산 세포.

30. 세포를 변형시키는 방법으로서, 세포를 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.

31. 대상체의 세포를 변형시키는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.

32. 대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.

33. 질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법으로서, 대상체에게 실시양태 1-25 중 어느 하나에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.

34. 실시양태 31-33 중 어느 하나에 있어서, 아데노바이러스 공여자 벡터가 대상체에게 정맥내로 투여되는 것인 방법.

35. 실시양태 31-34 중 어느 하나에 있어서, 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함하는 것인 방법.

36. 실시양태 35에 있어서, CXCR4 길항제가 AMD3100인 방법.

37. 실시양태 35 또는 36에 있어서, CXCR2 효능제가 GRO-β인 방법.

38. 실시양태 31-37 중 어느 하나에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하며, 대상체에게 선택제를 투여하는 것을 포함하는 방법.

39. 실시양태 38에 있어서, 선택 카세트가 mgmt^P140K를 코딩하고, 선택제가 O⁶BG/BCNU인 방법.

40. 실시양태 31-39 중 어느 하나에 있어서, CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.

41. 실시양태 31-39 중 어느 하나에 있어서, 조혈 줄기 세포 및/또는 적혈구 Ter119⁺ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.

42. 실시양태 31-41 중 어느 하나에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발하는 방법.

43. 실시양태 31-42 중 어느 하나에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발하는 방법.

44. 실시양태 31-43 중 어느 하나에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.

45. 실시양태 31-43 중 어느 하나에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.

46. 실시양태 31-45 중 어느 하나에 있어서, 대상체가 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.

47. 실시양태 31-45 중 어느 하나에 있어서, 대상체가 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.

48. 실시양태 47에 있어서, 대상체에서의 단백질의 발현이 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료하는 것인 방법.

(XI) 실험 실시예(들)

실시예 1. 대형 페이로드 아데노바이러스 벡터 유전자 요법.

서론. 혈색소병증, 예컨대 중증성 지중해빈혈 및 겸상 적혈구 빈혈의 유전자 요법이 성공적이기 위해, 전달된 유전자는 바람직하게는 통합 및 전사 침묵의 위치 효과 없이 적혈구 세포에서 높은 수준으로 발현된다. β-글로빈 유전자좌 제어 영역 (LCR)은 이러한 사용에 유익한 것으로 생각된다. 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 β-글로빈 LCR은 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 발현을 부여하는 것으로 밝혀졌다 (Grosveld et al., Cell 51:975-985, 1987). 그러나, 이러한 버전의 LCR은 렌티바이러스 벡터 (삽입 용량 8 kb)에 사용하기에는 너무 크고, 따라서 말단절단된 "미니" 또는 "마이크로" LCR 버전이 개발되었다. 예를 들어, 지중해빈혈 환자에서의 진행 중인 임상 시험에서, 2.7 kb 미니-LCR (HS2-HS4를 커버함) 및 266 bp β-글로빈 프로모터를 함유하는 렌티바이러스가 사용되고 있다 (Negre et al., Curr Gene Ther 15: 64-81, 2015). 이전에는 CD46 트랜스제닉 마우스 또는 CD46/Hbb^th3 지중해빈혈 마우스에서의 γ-글로빈의 발현을 위해 HS1 내지 HS4 및 β-글로빈 프로모터를 함유하는 5.9 kb β-글로빈 LCR 버전이 사용되었다 (Wang et al., J Clin Invest 129:598-615, 2019). 생체내 HSPC 형질도입/선택 접근법에 의하면, γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100%에서 달성된 반면, γ-글로빈 발현의 수준은 성체 마우스 α-글로빈의 것의 10-15%였고, 평균 통합된 벡터 카피수 (VCN)는 세포당 2-3 카피였다.

β₀/β₀ 지중해빈혈 또는 겸상 적혈구 빈혈의 완전한 치유를 위해, 일반적으로 적혈구에서 20%의 치료 글로빈 (γ- 또는 β-글로빈) 발현 수준이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood 130:1946-1948, 2017). 이러한 수준에 도달하는 하나의 방법은 HSPC 형질도입을 개선시킴으로써 또는 벡터 용량을 증가시킴으로써 VCN을 증가시키는 것이다. 그러나, 이러한 접근법은 과거 다른 문맥에서, 적어도 부분적으로 이용된 벡터 시스템의 무작위 통합 패턴으로 인해 독성의 위험을 증가시키는 것으로 관찰되었다. 본 실시예에서는, CD46-트랜스제닉 마우스의 생체내 HSPC 형질도입 후에 RBC당 γ-글로빈 발현을 증가시키기 위해 보다 강한 전사 요소, 즉 보다 긴 LCR 버전을 이용하였다.

본 발명자들은 백혈구분리반출술, 골수절제, 및 HSPC 이식을 필요로 하지 않는 신규 생체내 HSPC 형질도입 접근법을 개발하였다 (Richter et al., Blood, 128: 2206-2217, 2016). 접근법은 생체내 HSPC 형질도입에 적합한 새로운 벡터 플랫폼, 즉 헬퍼-의존성, 캡시드-변형된 아데노바이러스 벡터 (HDAd5/35++)를 수반한다. 이들 벡터의 특색은 i.v. 주사 후 비-조혈 조직의 감염은 피하면서 원시 HSC의 효율적인 형질도입을 가능하게 하는 CD46-친화도 증진된 섬유 및 최대 30 b의 삽입 용량을 포함한다. 제한된 접근성으로 인해, 골수에 국재화된 HSPC는 심지어 벡터가 골수 세포 상에 존재하는 수용체를 표적화하는 경우에도, HDAd5/35++ 벡터를 포함한 정맥내로 주사된 벡터에 의해 형질도입될 수 없다 (Ni et al., Hum Gene Ther, 16: 664-677, 2005 및 Ni et al., Cancer Gene Ther, 13: 1072-1081, 2006). 과립구-콜로니-자극 인자 (G-CSF) 및 CXCR4 길항제 AMD3100 (모조빌(Mozobil)™, 플레릭사(Plerixa)™)의 조합은 동물 모델 및 인간에서 원시 전구 세포를 효율적으로 가동화하는 것으로 제시되었다 (Fruehauf et al., Cytotherapy, 11: 992-1001, 2009 및 Yannaki et al., Hum Gene Ther, 24: 852-860, 2013). G-CSF/AMD3100을 사용하여 골수로부터의 HSPC를 말초 혈류 내로 가동화한 후, HDAd5/35++ 벡터를 정맥내 주사하였다. 이는 이전에 인간 CD46 트랜스제닉 마우스 (Richter et al., Blood, 128: 2206-2217, 2016; Li et al., Mol Ther Methods Clin Dev, 9: 390-401, 2018; Li et al., Blood, 131: 2915-2928. 2018; Wang et al., J Clin Invest, 129: 598-615. 2019; Wang et al., Blood Adv, 3: 2883-2894, 2019; 및 Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018), 인간화 마우스 (Richter et al., Blood, 128: 2206-2217, 2016) 및 레서스 마카크 (Harworth et al., ASCGT 21th Annual meeting, 2018, DOI: 10.1016/j.ymthe.2018.05.001)에서 제시되었다. 말초에서 형질도입된 HSPC는 다시 골수로 귀소하고, 여기서 이들은 장기간 지속된다. 증식 이점 없이, 생체내 형질도입된 HSPC는 골수에서 효율적으로 배출되지 않고 하류 분화에 기여하지 않는다. O⁶BG/BCNU로의 동물의 단기 처리는 mgmt^P140K 유전자-변형된 HSPC에 대한 증식 자극 및 말초 혈액 세포의 >80%에서의 후속적인 안정한 트랜스진 발현을 제공한다 (Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018).

HD-Ad5/35++ 게놈은 숙주 세포 게놈 내로 통합되지 않고, 세포 분열 시 상실된다. 유전자 요법 목적을 위해 및 생체내 형질도입된 HSPC를 장기간 추적하기 위해, HD-Ad5/35++ 벡터를 트랜스진 통합이 가능하도록 변형시켰다. 이는 과다활성 슬리핑 뷰티 트랜스포사제 시스템 (SB100)을 혼입시키는 것에 의해 수행되었다 (Zhang et al., PLoS One, 8: e75344, 2013; Hausl et al., Mol Ther, 18: 1896-1906, 2010; 및 Yant et al., Nat Biotechnol, 20: 999-1005, 2002). 제2 벡터로부터 트랜스로 공동-발현된 트랜스포사제는 트랜스진 카세트에 플랭킹된 특이적 DNA 서열 (역전된 반복부, "IR")을 인식하고, 염색체 DNA의 TA 디뉴클레오티드 내로의 통합을 촉발한다. 레트로바이러스 통합과 달리, SB100x-매개된 통합은 표적화된 유전자의 전사 상태에 의존하지 않는다 (Yant et al., Mol Cell Biol, 25: 2085-2094, 2005). 여러 연구는 SB100x-매개된 트랜스진 통합이 무작위이며, 원종양유전자의 활성화와 연관되지 않는다는 것을 입증하였다 (Richter et al., Blood, 128: 2206-2217, 2016; Wang et al., Mol Ther Methods Clin Dev, 8: 52-64, 2018; Zhang et al., PLoS One, 8: e75344, 2013; Hausl et al., Mol Ther, 18: 1896-1906, 2010; 및 Yant et al., Nat Biotechnol, 20: 999-1005, 2002). SB100x-기반 통합 시스템의 이점은 세포의 효율적인 상동 DNA 복구 기구에 의존하지 않는다는 것이다. 후자는 DNA 복구 및 재조합 효소의 낮은 활성을 나타내는 HSPC에서 중요하다 (Beerman et al., Cell Stem Cell, 15: 37-50, 2014). CD46-트랜스제닉 마우스 (Richter et al., Blood, 128: 2206-2217, 2016; Wang et al., J Clin Invest, 129: 598-615. 2019; Li et al., Mol Ther, 27: 2195-2212, 2019; Li et al., Mol Ther Methods Clin Dev, 9: 142-152, 2018; 및 Wang et al., J Virol, 79: 10999-11013, 2005) 및 인간 CD34+ 세포 (Li et al., Mol Ther, 27: 2195-2212, 2019)에서 HDAd35++-트랜스포손 벡터 및 SB100x/Flpe 발현 벡터로의 생체내 HSC 공동-감염은 유전자에 대한 선호도 없이 2개의 트랜스진 카피/세포의 무작위 트랜스진 통합을 발생시키는 것으로 입증되었다.

인간 게놈은 통상적으로 루프 형성을 통해 조절 영역 (즉, 전사 인자 결합 부위) 사이에서 장거리 상호작용을 갖는 3-D 구조로 조직화된다. 이들 상호작용의 대부분은 위상학적 회합 도메인 (TAD)의 콘텍스트에서 발생한다. TAD는 인핸서가 다른 조절 영역과 상호작용하여 전사를 제어하는 염색체 조직화의 기능적 단위로 간주된다. TAD/LCR 경계 인슐레이터는 인핸서 및 프로모터의 검색 공간을 제한하고 원치 않는 조절 접촉이 형성되는 것을 방지하는 것으로 생각된다. 이들 도메인의 양측의 경계는 상이한 포유동물 세포 유형 사이에서, 심지어 종에 걸쳐 보존된다.

현재 사용되는 렌티바이러스 및 rAAV 유전자 전달 벡터는 오직 소형 인핸서/프로모터만을 수용할 수 있으며, 이는 종종 트랜스진 발현의 준최적 수준 및 조직 특이성, 트랜스진 침묵, 및 벡터 통합 부위 주위의 조절 영역과의 비의도적 상호작용을 발생시킨다. 최악의 경우에, 후자는 원종양유전자의 활성화로 이어질 수 있다.

유전자 요법의 안전성 및 효능을 증가시키기 위해, TAD는 유전자 부가 전략에 사용되어야 한다. TAD의 중앙 크기는 880 kb이다. 고처리량 염색체 입체형태 포획 (3C) 검정 및 그의 후속 4C, 5C 및 Hi-C 프로토콜뿐만 아니라 섬유-Seq 검정의 추가의 진전으로, 조절 게놈의 조사는 빠른 속도로 진행될 것이고, 유전자 요법 목적을 위해, 단지 중요한 코어 요소만을 함유하는 TAD를 전달할 수 있다.

b-글로빈 유전자좌 제어 영역 (LCR)은 TAD의 정의에 속한다. 인간 β-글로빈 유전자 클러스터는 염색체 11에 있고, 100 kb에 걸쳐있다. β-글로빈 유전자좌는 시스-조절 요소 및 활성 염색질 허브 (ACH)로 불리는 활성 β-글로빈 유전자로 구성된 적혈구-특이적 공간 구조를 형성하는 것으로 제안되었다 (Tolhuis et al., Mol Cell, 10: 1453-1465, 2002). 코어 ACH는 발생상 보존되고, 글로빈 LCR로 불리는 상류 5' DNAse 과민성 영역 1 내지 5, 및 하류 3'HS1뿐만 아니라 적혈구-특이적 트랜스액팅 인자를 포함한다 (Kim et al., Mol Cell Biol, 27: 4551-65, 2007). 혈색소병증, 예컨대 중증성 지중해빈혈 및 겸상 적혈구 빈혈의 유전자 요법이 성공적이기 위해, 전달된 유전자는 통합 및 전사 침묵의 위치 효과 없이 적혈구 세포에서 높은 수준으로 발현되는 것이 필수적이다. 이를 달성하기 위해, β-글로빈 유전자좌 제어 영역 (LCR)이 필요한 것으로 생각된다 (Ellis et al., Clin Genet, 59: 17-24, 2001). 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 23 kb β-글로빈 LCR이 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 적혈구-특이적 위치 비의존성 발현을 부여한다는 것은 주목할 만하다 (Grosveld et al., Cell, 51: 975-985, 1987). 그러나, 이러한 버전의 LCR은 렌티바이러스 벡터 (삽입 용량 8 kb)에 사용하기에는 너무 크고, 따라서 말단절단된 "미니" 또는 "마이크로" LCR 버전이 개발되었다. 예를 들어, 지중해빈혈 환자에서의 진행 중인 임상 시험에서, 2.7 kb 미니-LCR (HS2-HS4를 커버함) 및 266 bp β-글로빈 프로모터를 함유하는 렌티바이러스가 사용되고 있다 (Negre et al., Curr Gene Ther, 15: 64-81, 2015). 이전의 생체내 HSPC 형질도입 연구에서, CD46 트랜스제닉 마우스 또는 CD46/Hbb^th3 지중해빈혈 마우스에서의 γ-글로빈의 발현을 위해 HS1 내지 HS4 및 β-글로빈 프로모터를 함유하는 5.9kb β-글로빈 LCR 버전이 사용되었다 (Wang et al., J Clin Invest 129:598-615, 2019). 이러한 생체내 HSPC 형질도입/선택 접근법에 의하면, γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100%에서 달성되었지만, γ-글로빈 발현의 수준은 성체 마우스 α-글로빈의 것의 오직 10-15%였고, 평균 통합된 벡터 카피수 (VCN)는 세포당 2-3 카피였다. β₀/β₀ 지중해빈혈 또는 겸상 적혈구 빈혈의 치유를 위해, 일반적으로 적혈구에서 20%의 수준 치료 글로빈 (γ- 또는 β-글로빈)이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood, 130: 1946-1948, 2017). 이러한 관문에 도달하는 하나의 방법은 HSPC 형질도입을 개선시킴으로써 또는 벡터 용량을 증가시킴으로써 VCN을 증가시키는 것이지만, 이는 이러한 벡터 시스템의 무작위 통합 패턴을 고려하면 증가된 유전자독성의 위험을 보유한다. 따라서, CD46-트랜스제닉 야생형 및 지중해빈혈 마우스의 생체내 HSPC 형질도입 후에 RBC당 γ-글로빈 발현을 증가시키기 위해 29 kb LCR 버전을 이용하는 것에 초점이 맞추어졌다.

결과. 정맥내로 주사된 HDAd5/35++ 벡터를 사용한 생체내 형질도입 연구를 위한 모델로서, 완전 인간 CD46 유전자좌를 함유하고 따라서 인간과 유사한 패턴 및 수준으로 hCD46을 발현하는 트랜스제닉 마우스 (hCD46tg 마우스)를 사용하였다 (Kemper et al., (2001) Clin Exp Immunol 124: 180-189).

긴 β-글로빈 LCR을 함유하는 HDAd5/35++ 벡터. 문헌 [Wang et al., (J. Clin Invest. 129(2):598-615, 2019)]에 기재된 연구에서는, 1.6 kb β-글로빈 프로모터 (Wang et al., J Clin Invest 129:598-615, 2019; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018)에 연결된 4.3 kb 미니 LCR (HS1 내지 HS4의 코어 요소를 포괄함; 문헌 [Lisowski et al., Blood 110:4175-4178, 2007])의 제어 하에 γ-글로빈을 발현하는 HDAd5/35++ 벡터를 사용하였다. 본 실시예에서는, γ-글로빈 유전자 발현을 최대화하기 위한 하기 요소를 함유하는 HDAd5/35++ 벡터를 구축하였다: i) 전장 HS5 내지 HS1 영역을 포함하는 21.5 kb LCR, ii) 1.6 kb β-글로빈 프로모터, iii) γ-글로빈 mRNA를 안정화시키기 위한 β-글로빈 3'UTR, 및 iv) 3' HS1 영역. 벡터를 HDAd-긴-LCR로 명명하였다 (도 1a). 통합을 매개하기 위해, LCR-벡터를 SB100x/Flpe 발현 HDAd 벡터와 조합하여 사용하였다 (도 1a).

다양한 실시양태에서, 3' HS1은 chr11 위치 5206867-5203839의 하기 핵산 서열을 갖는다. 다양한 실시양태에서, 3' HS1은 서열식별번호: 102에 제시된 바와 같은 하기 핵산 서열, 또는 서열식별번호: 102에 대해 적어도 80% 서열 동일성을 갖는 서열, 예를 들어 서열식별번호: 102에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는다.

생체외 HSPC 형질도입/이식 연구. HDAd-긴-LCR은 32.4 kb 트랜스포손을 함유하였다. SB 시스템은 대형 화물을 전달할 수 있는 것으로 밝혀졌지만 (Rostovskaya et al., Nucleic Acids Res 40: e150, 2012), 32.4 kb 트랜스포손의 염색체 통합을 매개할 수 있는지 여부는 공지되지 않았다. 따라서, 생체외 HSPC 형질도입을 형질도입 효능이 제어될 수 있는 설정에서 수행하였다. HSPC가 풍부화된 세포 분획인 CD46tg 마우스 골수 계통-음성 (Lin^-) 세포를 HDAd-긴-LCR + HDAd-SB (도 1a, 1b)로 생체외 형질도입하였다. 이어서, 생체외 형질도입된 세포를 치사 방사선조사된 C57Bl/6 마우스에 이식하였다. 제4주의 생착률은 CD46-양성 PBMC에 기초하여 >95%였다. 벡터 내 mgtm^P140K 돌연변이체 유전자의 존재는 형질도입된 세포의 O⁶BG/BCNU를 사용한 생체내 선택을 가능하게 한다 (Wang et al., Mol Ther Methods Clin Dev 8: 52-64, 2018). 이식 1개월 후에, 마우스를 4 라운드의 O⁶BG/BCNU 처리에 적용하여 통합된 γ-글로빈/mgmt 트랜스진 (도 1a)을 갖는 전구세포를 선택적으로 확장시켰다. 각각의 라운드의 생체내 선택에 의해, γ-글로빈-양성 말초 적혈구 (RBC)의 백분율이 증가하여, 연구 종료 시인 제20주에 >95%에 도달하였다 (도 1c). 제20주에, 동물을 희생시키고, 골수 단핵 세포 (MNC)를 분석하였다. qPCR에 의해 측정된 평균 VCN은 세포당 2.8 카피였다. γ-글로빈 발현은 유동 세포측정법에 의해 적혈구 Ter119⁺ 세포의 85.46(+/-5.9)% 및 14.54(+/-2.3)% 비-적혈구 (Ter119^-) 골수 MNC에서 검출되었다 (도 1d).

γ-글로빈 발현이 SB100x 통합된 트랜스진으로부터 기원하였음을 입증하기 위해, 이식 후 제20주에 수거한 골수 단핵 세포 (MNC)로부터의 게놈 DNA에 대해 역 PCR (iPCR) 분석을 수행하였다. iPCR 프로토콜은 SacI로의 게놈 DNA의 소화, 재-라이게이션/원형화 단계, 네스티드 PCR 및 벡터/염색체 접합부의 서열분석을 수반한다 (도 2a). (도 2b)는 3가지의 대표적인 PCR 생성물 및 염색체 4, 15, 및 X 상에서의 통합 부위의 국재화를 보여준다. 생성물의 서열분석은 벡터 IR/DR-염색체 접합부에서 TA 디-뉴클레오티드를 포함하는 SB100x 매개된 통합에 전형적인 벡터/염색체 접합부를 입증하였다 (도 2c). 요약하면, 생체외 HSPC 형질도입 연구에서, 긴 글로빈 LCR은 SB100x 통합된 트랜스포손으로부터 기원하는 높은-수준의 γ-글로빈 발현을 부여하였다.

짧은 LCR vs 긴 LCR을 함유하는 HDAd5/35++ 벡터를 사용한 CD46b 트랜스제닉 마우스에서의 생체내 HSPC 형질도입. HDAd-긴-LCR 및 미니LCR을 함유하는 이전에 사용된 벡터 (Wang et al., J Clin Invest 129: 598-615, 2019; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018) (본원에서 "HDAd-짧은-LCR"로 지칭됨)의 병렬 비교를 수행하였다 (도 3a). CD46-트랜스제닉 마우스를 G-CSF/AMD3100으로 가동화하고, 벡터를 정맥내로 주사하였다. 4 라운드의 O⁶BG/BCNU 선택을 생체내 형질도입 후 제5주에 개시하였고, 마우스를 20주 동안 추적하였다 (도 3b). 이어서, 제20주 골수 Lin^- 세포를 치사 방사선조사된 C57Bl/6 마우스 내로 이식하고, 2차 수용자를 추가로 16주 동안 모니터링하였다. 생체외 HSPC 형질도입 연구에서와 같이, γ-글로빈-양성 RBC의 백분율은 각각의 생체내 선택 라운드에 의해 증가하여 제20주에 둘 다의 벡터에 대해 >95%에 도달하였다 (도 3c). 제20주 샘플로부터의 RBC 용해물에 대해 수행된 HPLC는 HDAd-긴-LCR 벡터에 대해 유의하게 더 높은 γ-글로빈/성체 마우스 α-글로빈 백분율을 보여주었다 (도 3d). 이러한 차이는 또한 mRNA 수준에서도 반영되었다 (도 3e).

qPCR에 의해 제20주에 측정된 골수 MNC에서의 벡터 카피수는 세포당 2.5-3 카피였고 (도 4), 벡터들 사이에서 유의하게 상이하지 않았다. 이는 "짧은" 11.8 kb 트랜스포손의 통합이 "긴" 32.4 kb 트랜스포손의 통합만큼 효율적임을 나타내었다. 벡터로의 생체내 HSPC 형질도입은 대다수의 적혈구 세포에서의 γ-글로빈 발현에도 불구하고 혈액학적 이상을 유발하지 않았다 (제20주) (도 5a-5b). 세포 골수의 조성 (도 5c) 및 골수 Lin^- 세포의 콜로니 형성-잠재력 (도 5d)은 군 사이에서 유의하지 않았다.

제20주에 수거한 골수 Lin^- 세포를 또한 사용하여, 선형 증폭-매개된 PCR (LAM-PCR)을 사용한 게놈-전반 통합 분석에 이어 통합 접합부의 서열분석을 수행하였다 (도 6). 5마리의 마우스로부터 풀링된 게놈 DNA 샘플에서, 총 76개의 별개의 SB100x-매개된 통합 부위가 확인되었다 (도 7aa, 도 7ab). IR/DR/염색체 접합부는 TA 디뉴클레오티드를 함유하였다 (도 7b). 대다수의 통합은 유전자간 및 인트론 영역 내에 각각 82% 및 19%의 빈도로 존재하였다 (도 7c). 원종양유전자 내 또는 근처에서의 통합은 발견되지 않았다. 통합은 전체 마우스 게놈의 임의의 주어진 윈도우에서 우선적 통합 없이 무작위적이었다 (도 7d).

2차 수용자의 분석. 생체내 형질도입 및 SB100x-매개된 통합이 장기간 재증식 HSPC에서 발생하였음을 입증하기 위해, 생체내 HSPC 형질도입 후 제20주에 수거한 골수 Lin^- 세포를 치사 방사선조사된 C57Bl/6 마우스 (hCD46 트랜스진 부재) 내로 이식하였다. 2차 수용자에서 다계통 재구성을 구동하는 이식된 세포의 능력을 16주의 기간에 걸쳐 평가하였다. PBMC에서의 hCD46 발현에 기초한 생착률은 95%였고, 안정하게 유지되었다 (도 8a). 유동 세포측정법에 의해 측정된 RBC의 γ-글로빈 마킹은 90 내지 95%의 범위이고 안정하였다 (도 8b). γ-글로빈⁺ RBC의 백분율에서 2개의 벡터 사이에 유의한 차이가 존재하지 않았다. 평균 통합된 벡터 카피수는 또한 2개의 벡터 사이에서 유의하게 상이하지 않았다. γ-글로빈 발현 수준을 측정하기 위해, HPLC (도 8c) 및 qRT-PCR (도 8d, 8e)을 사용하였다. 둘 다의 분석에서, 마우스 성체 글로빈 쇄 대비 γ-글로빈의 백분율은 HDAd-긴-LCR 벡터에 대해 더 컸다. 이러한 벡터에 대한 γ-글로빈 수준은 마우스 α-글로빈의 20-25% 범위였고, 이는 이것이 혈색소병증에 대해 치유적일 것임을 암시한다. 보다 높은 γ-글로빈 발현 수준을 부여하는 것에 더하여, 긴 LCR은 또한 적혈구 (Ter119⁺) 분획 vs 비-적혈구 분획 (Ter119^-)에서의 γ-글로빈 발현 골수 세포의 유의하게 더 높은 백분율에 의해 제시된 바와 같이, 보다 엄격한 적혈구-특이적 발현을 제공하였다 (도 9a, 9b). 골수 MNC에서의 세포당 벡터 수 카피는 생체내 HSPC 형질도입 후 제16주에 수거한 경우 HDAd-짧은-LCR과 HADad-긴-LCR 사이에서 통계적으로 유의하지 않았다 (도 9c). "1차" 생체내 HSPC 형질도입된 마우스에서와 같이, 골수의 세포 조성 또는 말초 혈액에서의 혈액학적 파라미터에 대한 높은 수준 글로빈 발현의 효과는 2차 수용자에서 관찰되지 않았다 (도 10a-10d).

인간 CD34+ 형질도입, 시험관내 선택, 및 적혈구 분화 후 2개의 벡터의 비교. 마우스 적혈구 세포와 같은 이종 시스템에서의 인간 β-글로빈 LCR의 기능은 LCR 내에 결합하는 전사 인자의 보존의 결여로 인해 준최적일 수 있다. 따라서, 인간 세포에서의 시험관내 연구를 수행하였다 (도 11a). GCSF-가동화된 건강한 공여자로부터 수득한 인간 CD34+ 세포를 HDAd-긴-LCR + HDAd-SB 또는 HDAd-짧은-LCR + HDAd-SB로 4000 vp/세포의 총 MOI, 즉 대부분의 CD34+ 세포의 형질도입을 부여하는 MOI로 형질도입하였다 (Li et al., Mol Ther Methods Clin Dev 9: 390-401, 2018). 이어서, 형질도입된 세포를 통합된 트랜스진을 갖는 세포에 대한 적혈구 분화 (ED) 및 O⁶BG/BCNU 선택에 적용하였다. 형질도입된 세포의 18일에 걸친 확장 동안, 대부분의 에피솜 벡터는 상실된다. ED의 말미에, 유의하게 더 높은 백분율의 γ-글로빈+ 무핵 세포 (즉, 핵을 상실한 망상적혈구)가 유동 세포측정법에 의해 HDAd-긴-LCR + HDAd-SB 설정에 대해 발견되었다 (도 11b). HPLC 분석은 또한 HDAd-긴-LCR + HDAd-SB-형질도입된 세포에서 유의하게 더 높은 γ-글로빈 쇄 수준을 입증하였다 (도 11c).

예시적인 HDAd-긴-LCR 벡터 및 HDAd-짧은-LCR 벡터의 구조. HDAd-긴-LCR에서, 21.5 kb β-글로빈 LCR (chr11:5292319-5270789)의 제어 하의 γ-글로빈 유전자, 1.6 kb β-글로빈 프로모터 (chr11:5228631-5227023) 및 또한 β-글로빈 유전자좌로부터 유래된 3' HS1 영역 (chr11:5206867-5203839). 적혈구 세포에서의 RNA 안정화를 위해, β-글로빈 유전자 UTR을 g-글로빈 유전자의 3' 단부에 연결시켰다. 벡터는 또한 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 가능하게 하는 mgmt^p140k에 대한 발현 카세트를 함유한다. γ-글로빈 및 mgmt. 발현 카세트는 닭 글로빈 HS4 인슐레이터에 의해 분리된다. 32.4 kb LCR-γ-글로빈/mgtm 트랜스포손은 SB100x에 의해 인식되는 역전된 반복부 (IR) 및 Flpe 레콤비나제에 의한 트랜스포손의 원형화를 가능하게 하는 frt 부위에 플랭킹된다. HDAd-짧은-LCR에서, HDAd-긴-LCR에 존재하는 21.5 kb HS-HS5 LCR 및 3' HS1 대신에, 이 벡터는 DNase 과민성 부위 (HS) 1 내지 4의 코어 영역을 포함하는 4.3 kb 미니-LCR을 함유한다. 트랜스포손의 길이는 11.8 kb이다. (도 12a) hCD46tg 마우스를 가동화하고, HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR + HDAd-SB (4 x 10¹⁰ vp의 둘 다의 바이러스의 1:1 혼합물)를 IV 주사하였다. 5주 후, O⁶BG/BCNU 처리를 시작하였다. 각각의 사이클에서, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg으로 증가시켰다. O6BG 농도는 3가지 처리 모두에서 30 mg/kg이었다. 분석을 위해 동물을 희생시킨 제20주까지 마우스를 추적하였다. (도 12b)

중간성 지중해빈혈에 대한 마우스 모델에서의 연구: γ-글로빈 수준. 이들 연구를 위해 (CD46+/+) 마우스를 마우스 Hbb-베타1 및 -베타2 유전자 결실에 대해 이형접합인 Hbb^th3 마우스와 교배시켰다 (Yang et al., Proc Natl Acad Sci U S A, 92: 11608-11612, 1995). 생성된 Hbb^th3/CD46^+/+ 마우스는 중간성 지중해빈혈의 전형적인 표현형을 갖는다 (Wang et al., J Clin Invest, 129: 598-615. 2019). Hbb^th3/CD46^+/+ 마우스를 가동화하고, HDAd-긴-LCR 및 HDAd-짧은 LCR을 IV 주사하였다 (도 18a). 4주 후, O⁶BG/BCNU의 용량을 증가시키면서 4 라운드의 생체내 선택을 개시하였다. 말초 적혈구에서의 γ-글로빈 마킹은 HDAd-긴-LCR로 형질도입된 마우스의 경우 이미 제2 사이클의 생체내 선택 시 평균 40%였고, 제3 사이클의 생체내 선택 후에 모든 마우스에서 100%에 도달하였다 (도 18b). HDAd-짧은-LCR로 형질도입된 마우스의 경우, RBC에서 100% γ-글로빈 마킹에 도달하기 위해서는 4회의 생체내 선택 사이클이 필요하였다. 100% 마킹율에서, 인간 γ-글로빈 쇄 vs 성체 마우스 a-글로빈의 백분율 (HPLC에 의해 측정됨)은 시간 경과에 따라 증가하여 (대부분 아마도 질환 배경으로 인함) 처리 후 제21주까지 평균 20%에 도달하였다 (도 18c 및 18d). 이들 데이터는 i) 덜 강렬한 생체내 선택을 필요로 하고, ii) 이론상 SCA 및 중증성 지중해빈혈을 갖는 환자에서 치유적이어야 하는 γ-글로빈 발현 수준을 달성함으로써 HDAd-긴-LCR의 우월성을 입증한다.

중간성 지중해빈혈에 대한 마우스 모델에서의 연구: 혈액 파라미터의 교정. 표현형 교정이 상이한 시점에서 제시된다. 제14주의, 김사 염색 및 메이-그륀발트 염색으로 염색한 혈액 세포 형태를 제시한다 (도 21a). 처리 후 제21주에, 마우스를 희생시켰다. 처리된 CD46^+/+/Hbb^th3 마우스의 말초 혈액 도말표본에서 지중해빈혈 표현형의 역전이 나타나면, 저색소성의, 고도로 단편화된 부동변형적혈구증가성 기준선 RBC가 거의 정상색소성의, 잘 형상화된 RBC로 대체되었다 (도 21b, 좌측 패널). 망상적혈구를 제21주에 지중해빈혈 및 HDAd-긴-LCR로 처리된 마우스로부터의 혈액 도말표본에 대해 계수하였다 (도 21b, 우측 패널). 골수 시토스핀에서, 전적모구 및 호염기구성 적모구의 우세에 의해 나타내어지는 CD46^+/+/Hbb^th3 마우스의 골수에서의 적혈구 계통 성숙의 차단과 대조적으로, 대조군 및 처리된 CD46^+/+/Hbb^th3 마우스로부터의 시토스핀에서는 성숙 적모구가 우세하였고, 이는 다색성 및 정상색소성 적모구에 의해 나타내어졌다 (도 21c). 긴 LCR, 짧은 LCR, 및 대조군 CD46tg 벡터로 형질도입된 마우스의 정규화된 적혈구 파라미터를 제시한다 (도 22). 혈액 도말표본에서 계수된 망상적혈구의 백분율은 지중해빈혈 마우스에서의 평균 20%로부터 HDAd-긴-LCR로 처리된 마우스에서 제18주에 정상 값 (5%)으로 복귀하였다 (도 23a). 생체내 형질도입 후 제18주에서의 혈액 파라미터는 그의 대조군 CD46tg 대응물과 구별불가능하였으며, 이는 완전한 표현형 교정을 시사한다. 이는 백혈구 및 적혈구 계수뿐만 아니라 적혈구 특색 (Hb, HCT, MHCH, 및 RDW)에서의 정규화를 포함하였다 (도 23b). 또한, 제18주에 MCV 및 MCH 세포에서 정상, 기준선, 긴 LCR, 및 짧은 LCR 벡터 사이의 차이는 유의하지 않았다 (도 23b).

중간성 지중해빈혈에 대한 마우스 모델에서의 연구: 골수외 조혈 및 혈철증의 교정. 보상성 조혈의 측정가능한 특징인 비장 크기는 HDAd-긴-LCR로 처리된 동물에서 정상으로 감소되었다 (도 24a). Hbb^th3/CD46 마우스와 대조적으로, 골수외 적혈구생성의 병소는 비장 및 간 절편 상에서 관찰되지 않았다 (도 24b). 강한 실질 혈철증은 비처리된 CD46^+/+/Hbb^th3 마우스에서 현저한 반면, CD46tg 및 처리된 CD46^+/+/Hbb^th3 마우스에서는 배경 철 축적만을 검출할 수 있었다 (도 25).

Hbb^th3/CD46tg 마우스의 생체내 HSC 형질도입 후 제21주에 골수를 수거하였다. (도 26a) 골수 MNC에서의 세포당 벡터 카피수. 2개의 군 사이의 차이는 유의하지 않지만, 보다 큰 샘플 크기로 분석할 경우 유의해질 수 있다. (도 26b, 26c) γ-글로빈 발현의 적혈구 특이성. (도 26b) γ-글로빈 발현 적혈구 (Ter119⁺) 및 비-적혈구 (Ter119^-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.

아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46^+/+/Hbb^th-3 마우스로부터의 간 및 비장 절편에서의 헤마톡실린/에오신 염색에 의한 골수외 조혈 (도 27). 철 침착은 펄 염색에 의해 비장에서 헤모시데린의 세포질 청색 안료로서 제시된다.

요약하면, CD46-트랜스제닉 마우스를 사용한 생체외 및 생체내 HSPC 형질도입 연구뿐만 아니라 인간 HSPC를 사용한 시험관내 연구는 긴 LCR을 함유하는 벡터의 우월성을 입증하였다. SB100x-매개된 통합 빈도는 긴 트랜스포손에 의해 손상되지 않았다. 보다 높은 γ-글로빈 발현 수준을 부여하는 것에 더하여, 긴 LCR은 또한 보다 엄격한 적혈구-특이적 발현을 제공하였다. 중요하게는, HDAd-긴-LCR로의 처리 후에, 중간성 지중해빈혈에 대한 마우스 모델에서 완전한 치유를 달성하는데 덜 강렬한 O⁶BG/BCNU 선택이 요구되었다.

물질 및 방법.

성분 위치: HS5→HS1 (21.5kb): Chr11, 5292319→5270789 (서열식별번호: 6); β-프로모터: chr11, 5228631→5227018 (서열식별번호: 7); 및 3'HS1: Chr11, 5206867→5203839 (서열식별번호: 102).

HDAd 벡터: HDAd-SB 및 HDAd-짧은-LCR 벡터의 생성은 이전에 기재되었다 (Richter et al., Blood 128: 2206-2217, 2016; Li et al., Mol Ther Methods Clin Dev 9: 142-152, 2018). HDAd-긴-LCR 벡터의 생성을 위해, 상응하는 셔틀 플라스미드는 코스미드 벡터 pWE15 (스트라타진(Stratagene), 캘리포니아주 라호야)를 기초로 하였다. pWE.Ad5-SB-mgmt는 Ad5 5'ITR (뉴클레오티드 1 내지 436) 및 3'ITR (뉴클레오티드 35741 내지 35938), pBS-μLCR-γ-글로빈-mgmt로부터 유래된 인간 EF1α 프로모터-mgmt(p140k)-SV40pA-cHS4 카세트 (Wang et al., (2019) J Clin Invest 129: 598-615), SB100x-특이적 IR/DR 부위 및 FRT 부위를 함유한다. pAd.LCR-β-GFP (21.5-kb 인간 β-글로빈 LCR을 함유함 (Wang et al., (2005) J Virol 79: 10999-11013))에서의 GFP-BGHpA 단편을 인간 γ-글로빈 유전자 및 그의 3'UTR 영역으로 대체하였다 (Chr 11:5,247,139 → 5,249,804) (pAd-긴-LCR-β-γ-글로빈). 플라스미드 pAd-긴-LCR-β-γ-글로빈은 21.5-kb 인간 β-글로빈 LCR 및 3.0-kb 인간 β-글로빈 3'HS1을 함유한다. LCR-β-γ-글로빈-3'HS1을 함유하는 28.9-kb 단편을 EF1α-mgmt-SV40pA-cHS4의 카세트의 하류에 pWE.Ad5-SB-mgmt 내로 삽입하였다 (pWE.Ad5-SB-긴-LCR-γ-글로빈/mgmt). 완전한 긴-LCR-γ-글로빈/mgmt 카세트는 SB100x-특이적 IR/DR 부위 및 FRT 부위에 플랭킹되었다. 생성된 플라스미드를 기가팩(Gigapack) III 플러스 패키징 익스트랙트 (스트라타진, 캘리포니아주 라호야)을 사용하여 파지 내로 패키징하고, 증식시켰다. HD-Ad-긴-LCR-γ-글로빈/mgmt 바이러스를 생성하기 위해, 116개 세포에서의 구출을 위해 플라스미드로부터 I-CeuI 소화에 의해 바이러스 게놈을 방출시켰다. 단일 아미노산 변이 (76-이소류신 또는 76-트레오닌)를 갖는 인간 집단에서의 HBG1 유전자의 2종의 공지된 변이체가 존재한다. 유럽인에서 13% 내지 동아시아인에서 73%의 빈도 범위를 갖는 76-Ile HBG1 변이체를 사용하였다.

HDAd 바이러스를 생성하기 위해, Ad5/35++-Acr 헬퍼 바이러스를 사용하여 116개 세포에서의 구출을 위해 플라스미드로부터 FseI 소화에 의해 바이러스 게놈을 방출시켰다 (Palmer et al., Mol Ther 8: 846-852, 2003). 이러한 헬퍼 바이러스는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-증진된 Ad35++ 섬유 노브로 구성된 키메라 섬유를 함유하는 Ad5/35++ 헬퍼 벡터인 AdNG163-5/35++의 유도체이다 (Richter, et al., (2016) Blood 128: 2206-2217). SpCas9 활성을 억제하는 것으로 최근에 밝혀진 인간 코돈-최적화된 AcrIIA4-T2A-AcrIIA2 서열을 합성하고 (Li et al., Mol Ther Methods Clin Dev 9: 390-401, 2018), 셔틀 플라스미드 pBS-CMV-pA 내로 클로닝하였다 (pBS-CMV-Acr-pA). 후속적으로, 2.0-kb CMV-Acr-pA 카세트를 pBS-CMV-Acr-pA로부터 증폭시키고, 인-퓨전(In-Fusion) HD 클로닝 키트 (다카라(Takara))에 의해 pNG163-2-5/35++ (Richter et al., Blood 128: 2206-2217 2016)의 SwaI 부위에 삽입하였다. 이어서, 바이러스 게놈을 PacI 소화에 의해 방출시키고, Ad5/35++-Acr 헬퍼 바이러스를 구출하고, 293 세포에서 증식시켰다. Ad5/35++-Acr 헬퍼 바이러스는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-증진된 Ad35++ 섬유 노브로 구성된 키메라 섬유를 함유한다 (Wang et al., J Virol 82: 10567-10579, 2008). HDAd-SB의 생성은 이전에 기재되었다 (Richter et al., Blood 128: 2206-2217, 2016). 헬퍼 바이러스 오염 수준은 0.05% 미만이었다. 모든 제제에는 박테리아 내독소가 없었다.

CD34⁺세포 배양: G-CSF-가동화된 성체 공여자로부터의 CD34⁺ 세포를 동결된 스톡으로부터 회수하고, 10% 열-불활성화된 FCS, 1% BSA 0.1 mmol/l 2-메르캅토에탄올, 4 mmol/l 글루타민 및 페니실린/스트렙토마이신, Flt3 리간드 (Flt3L, 25 ng/ml), 인터류킨 3 (10 ng/ml), 트롬보포이에틴 (TPO) (2 ng/ml), 및 줄기 세포 인자 (SCF) (25 ng/ml)가 보충된 이스코브 변형 둘베코 배지 (IMDM)에서 밤새 인큐베이션하였다. 유동 세포측정법은 세포의 >98%가 CD34-양성임을 입증하였다. 시토카인 및 성장 인자는 페프로테크(Peprotech) (뉴저지주 록키 힐)로부터의 것이었다. CD34⁺ 세포를 저부착 12 웰 플레이트에서 바이러스로 형질도입하였다.

적혈구 시험관내 분화: 인간 HSPC의 적혈구 세포로의 분화를 문헌 [Douay et al., Methods Mol Biol 482: 127-140, 2009]에 기재된 프로토콜에 기초하여 수행하였다. 간략하게, 단계 1에서, 10⁴개 세포/ml의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 1 μM 히드로코르티손, 100 ng/ml SCF, 5 ng/ml IL-3, 3 U/ml 에리트로포이에틴 (Epo), 글루타민, 및 Pen-Strep가 보충된 IMDM에서 7일 동안 인큐베이션하였다. 단계 2에서, 1x10⁵개 세포/ml의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 100 ng/ml SCF, 3 U/ml Epo, 글루타민, 및 Pen/Strep가 보충된 IMDM에서 3일 동안 인큐베이션하였다. 단계 3에서, 1x10⁶개 세포/ml 세포의 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 3 U/ml Epo, 글루타민, 및 Pen/Strep가 보충된 IMDM에서 12일 동안 인큐베이션하였다.

형질도입된 CD34+ 세포의 시험관내 선택: 형질도입된 CD34+ 세포를 시험관내 분화 프로토콜의 단계 1에서 제3일에 O⁶BG/BCNU로 선택하였다. 간략하게, CD34+ 세포를 50 μM O⁶BG와 함께 1시간 동안 인큐베이션한 다음, 35 μM BCNU와 함께 추가로 2시간 동안 인큐베이션하였다. 이어서, 세포를 2회 세척하고, 신선한 단계 1 배지에 재현탁시켰다.

Lin^- 세포 배양: 계통 음성 세포를 전체 마우스 골수 세포로부터 밀테니 바이오테크(Miltenyi Biotech) (독일 베르기슈 글라트바흐)로부터의 계통 세포 고갈 키트를 사용하여 MACS에 의해 단리하였다. Lin^- 세포를 10% FCS, 10% BSA, Pen-Strep, 글루타민, 10 ng/ml 인간 TPO, 20 ng/ml 마우스 SCF 및 20 ng/ml 인간 Flt-3L이 보충된 IMDM에서 배양하였다.

글로빈 HPLC: 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 이원 펌프가 장착된 시마즈 프로미넌스 기기 (시마즈(Shimadzu), 일본 교토) 상에서 정량화하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 40%-60% 구배 혼합물을 비닥(Vydac) C4 역상 칼럼 (히크롬(Hichrom), 영국)을 사용하여 1 mL/분의 속도로 적용하였다.

유동 세포측정법: 세포를 1% FCS가 보충된 PBS 중에 1x10⁶개 세포/100 μL로 재현탁시키고, FcR 차단 시약 (밀테니 바이오테크, 캘리포니아주 오번)과 함께 10분 동안 얼음 상에서 인큐베이션하였다. 다음으로, 염색 항체 용액을 10⁶개 세포당 100 μL로 첨가하고, 암실에서 30분 동안 얼음 상에서 인큐베이션하였다. 인큐베이션 후, 세포를 FACS 완충제 (PBS, 1% FBS) 중에서 1회 세척하였다. 2차 염색을 위해, 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후에, 세포를 FACS 완충제 중에 재현탁시키고, LSRII 유동 세포측정기 (비디 바이오사이언시스(BD Biosciences), 캘리포니아주 산호세)를 사용하여 분석하였다. 전방 산란-면적 및 측방 산란-면적 게이트를 사용하여 파편은 배제하였다. 이어서, 전방 산란-높이 및 전방 산란-폭 게이트를 사용하여 단일 세포를 게이팅하였다. 이어서, 유동 세포측정 데이터를 플로우조 (버전 10.0.8, 플로우조, 엘엘씨(FlowJo, LLC))를 사용하여 분석하였다. LSK 세포의 유동 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일 (cat #: 130-092-613; 밀테니 바이오텍, 캘리포니아주 샌디에고) 및 c-Kit (cat #:12-1171-83) 및 Sca-1 (cat #: 25-5981-82)에 대한 항체, 뿐만 아니라 APC-접합된 스트렙타비딘으로 염색하였다. 이바이오사이언스(eBioscience) (캘리포니아주 샌디에고)로부터의 다른 항체는 항-마우스 LY-6A/E (Sca-1)-PE-시아닌7 (클론 D7), 항-마우스 CD117 (c-Kit)-PE (클론 2B8), 항-마우스 CD3-APC (클론 17A2; cat #:17-0032-82), 항-마우스 CD19-PE-시아닌7 (클론 eBio1D3; cat #: 25-0193-82), 및 항-마우스 Ly-66 (Gr-1)-PE, (클론 RB6-8C5; cat #: 12-5931-82)를 포함하였다. 항-마우스 Ter-119-APC (클론: Ter-119; cat #: 116211)는 바이오레전드(Biolegend) (캘리포니아주 샌디에고)로부터의 것이었다.

인간 γ-글로빈 발현을 검출하는 세포내 유동 세포측정법 및 실시간 역전사 PCR 방법에 대해, 문헌 [Wang et al., (J. Clin Invest. 129(2):598-615, 2019)]을 참조한다.

벡터 카피수의 측정: 골수 세포로부터의 총 DNA를 퀵-DNA 미니프렙 키트 (지모 리서치(Zymo Research))를 사용하여 추출하였다. HDAd-짧은 LCR-γ-글로빈/mgmt 바이러스로부터 추출된 바이러스 DNA를 연속 희석하고, 표준 곡선에 사용하였다. qPCR을 스텝원플러스(StepOnePlus) 실시간 PCR 시스템 (어플라이드 바이오시스템즈(Applied Biosystems)) 상에서 파워 SYBR 그린 PCR 마스터 믹스를 사용하여 삼중으로 수행하였다. 9.6 ng DNA (9600 pg/6 pg/세포 = 1600개 세포)를 10 μL 반응에 사용하였다. 하기 프라이머 쌍을 사용하였다: 인간 γ-글로빈 정방향 (서열식별번호: 86) 및 역방향 (서열식별번호: 87).

통합 부위 분석 (LAM-PCR). 절차의 도시에 대해, 도 6을 참조한다. 도 7d에 대한 무작위화 데이터를 포아송 회귀 삽입 모델 (PRIM)을 사용하여 생성하여, 마우스 참조 게놈 (mm9)의 각각의 염색체의 길이를 따라 비-중첩 20 킬로염기 윈도우에 대해 예상 삽입률을 계산하였다. PRIM 알고리즘은 각각의 윈도우 내의 TA 디뉴클레오티드의 수, 윈도우가 존재하는 염색체, 및 고유한 삽입의 총수에 기초하여 통계적 모델을 생성하였다. 각각의 윈도우에 대해, 예상 삽입 수를 계산하고, 관찰된 삽입 수와 비교하여 p-값을 생성하였다. 이어서, 본페로니-교정을 적용하여 삽입된 트랜스포손의 검출을 위한 풍부화를 보여주는 윈도우를 확인하였다. 이어서, TA를 함유하는 참조 게놈으로부터 무작위 서열을 생성하고, 보타이2(Bowtie2)를 사용하여 맵핑하고, 실제 통합 데이터에 대해 플롯팅하였다. R에서 ggplot2를 사용하여 계산 및 플롯을 만들었다. 호머(HOMER) 및 칩시커(ChIPseeker)를 사용하여 도면을 그렸다.

통합 부위 분석 (역 PCR). 총 골수 세포에서의 접합부를 다른 곳에 기재된 바와 같이 하되 변형을 가하여 역 PCR에 의해 분석하였다 (Wang et al., J Virol 79: 10999-11013, 2005). 간략하게, 골수 세포로부터의 게놈 DNA를 제조업체의 지침에 따라 퀵-DNA™ 미니프렙 키트 (지모 리서치)에 의해 단리하였다. 5-10 μg의 DNA를 SacI로 소화시키고, 분자내 반응을 촉진하는 조건 하에 재-라이게이션하였다. 라이게이션 혼합물을 페놀/클로로포름 추출 및 에탄올 침전으로 정제한 다음, KOD 핫 스타트 DNA 폴리머라제를 사용하는 네스티드 PCR에 사용하였다 (각각 30 사이클). 하기 프라이머를 사용하였다: EF1α p1 정방향 (서열식별번호: 88) 및 역방향 (서열식별번호: 89); EF1α p2 정방향 (서열식별번호: 90) 및 역방향 (서열식별번호: 91); 3'HS1 p1 정방향 (서열식별번호: 92) 및 역방향 (서열식별번호: 93); 및 3'HS1 p2 정방향 (서열식별번호: 94) 및 역방향 (서열식별번호: 95).

상기 표에서, 밑줄표시된 염기가 하류 클로닝에 사용된다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 정렬하여 통합 부위를 확인하였다.

동물: 동물을 수반하는 모든 실험은 제어 기관 가이드라인에 따라 및 실험 동물 복지국 (OLAW) 공중 보건 보증 (PHS) 정책, USDA 동물 복지법 및 규정, 실험 동물의 관리 및 사용에 대한 지침 및 동물 실험 윤리 제어 위원회 (IACUC) 정책에 따라 수행하였다.

완전한 인간 CD46 유전자좌를 함유하는 C57Bl/6-기반 트랜스제닉 마우스 모델 (hCD46tg)로 생체외 및 생체내 HSPC 형질도입 연구를 수행하였다. 이들 마우스는 인간과 유사한 패턴 및 수준으로 hCD46을 발현한다 (Kemper et al., Clin Exp Immunol 124: 180-189, 2001).

CD46+/+/Hbb^th3 마우스의 육종 및 스크리닝: 3 라운드의 역교배 후, CD46에 대한 Hbb^th3 마우스 동형접합성을 gDNA에 대한 PCR에 의해 [CD46F (서열식별번호: 96) 및 CD46R프라이머 (서열식별번호: 97) 사용], 뿐만 아니라 CD46 MFI 측정을 가능하게 하는 유동 세포측정법에 의해 확인하였다.

골수 Lin^- 세포 이식: 수용자는 6 - 8주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 방사선조사하였다. 방사선조사 4시간 후, 1x10⁶개 Lin^- 세포를 꼬리 정맥을 통해 정맥내로 주사하였다. 이 프로토콜을 생체외 형질도입 Lin^- 세포의 이식 및 2차 수용자 내로의 이식에 사용하였다.

HSPC 가동화 및 생체내 형질도입: 이 절차는 이전에 문헌 [Richter et al., Blood 128: 2206-2217, 2016]에 기재되었다. HSPC를 마우스에서 인간 재조합 G-CSF (5 μg/마우스/일, 4일) (암젠(Amgen), 캘리포니아주 싸우전드 오크스)의 s.c. 주사에 의해, 이어서 제5일에 AMD3100 (5 mg/kg) (시그마-알드리치(Sigma-Aldrich))의 s.c. 주사에 의해 가동화하였다. 또한, 동물에게 바이러스 주사 16시간 및 2시간 전에 덱사메타손 (10 mg/kg)을 i.p. 제공하였다. AMD3100의 30분 및 60분 후에, 동물에게 HDAd 벡터를 안와후 신경총을 통해 주사당 각각의 바이러스에 대해 4x10¹⁰ vp의 용량으로 정맥내로 주사하였다. 4주 후, O⁶BG/BCNU의 생체내 선택을 개시하였다.

2차 골수 이식: 수용자는 더 잭슨 래보러토리(the Jackson Laboratory)로부터의 6 - 8주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 방사선조사하였다. 생체내 형질도입된 CD46tg 마우스로부터의 골수 세포를 무균으로 단리하고, 계통-고갈된 세포를 MACS를 사용하여 단리하였다. 방사선조사 4시간 후에, 세포를 마우스당 1x106개 세포로 정맥내로 주사하였다. 제20주에, 2차 수용자를 희생시키고 혈액, 골수 및 비장으로부터의 CD46+ 세포를 MACS에 의해 단리하거나, 또는 상기 기재된 바와 같이 가동화 및 생체내 형질도입에 적용하였다. 모든 2차 수용자는 제4주에 시작된 면역억제를 제공받았다.

혈액학적 분석: 혈액 샘플을 EDTA-코팅된 튜브 내로 수집하고, 헤마베트(HemaVet) 950FS (드류 사이언티픽(Drew Scientific)) 상에서 분석을 수행하였다.

조직 분석: 2.5 μm 두께의 비장 및 간 조직 절편을 4% 포름알데히드 중에 적어도 24시간 동안 고정시키고, 탈수시키고, 파라핀에 포매시켰다. 헤마톡실린-에오신에 의한 염색을 골수외 조혈의 조직학적 평가에 사용하였다. 펄의 프러시안 블루 염색에 의해 조직 절편에서 헤모시데린을 검출하였다. 간략하게, 조직 절편을 증류수 중 동등 부피 (2%)의 페로시안화칼륨 및 염산 혼합물로 처리한 다음, 뉴트럴 레드로 대조염색하였다. 비장 크기를 비장 중량 (mg)/체중 (g)의 비로서 평가하였다.

혈액 분석 및 골수 시토스핀: 혈액 샘플을 EDTA-코팅된 튜브 내로 수집하고, 헤마베트 950FS (드류 사이언티픽, 코네티컷주 워터베리) 또는 프로사이트Dx(ProCyteDx)™ (이덱스(IDEXX), 메인주 웨스트브룩) 기계 상에서 분석을 수행하였다. 말초 혈액 도말표본을 제조하고, 메이-그륀발트/김사로 각각 5 및 15분 동안 염색하였다 (머크(Merck), 독일 다름슈타트). 골수 세포의 현탁액을 시토스핀 장치를 사용하여 슬라이드 상에서 원심분리하고, 메이-그륀발트/김사로 염색하였다. 혈액 도말표본 상의 망상적혈구를 계수한 조사자는 샘플 군 할당에 대해 맹검이었다. 동물 번호만이 슬라이드 상에 제시되었다 (동물당 5개의 슬라이드, 5개의 무작위 1 cm² 절편).

통계적 분석: 데이터는 평균 ± 평균의 표준 오차 (SEM)로서 제시된다. 다중 군의 비교를 위해, 다중 비교를 위한 본페로니 사후-검정과 함께 일원 및 이원 분산 분석 (ANOVA)을 이용하였다. 1종의 그룹화 변수에 대한 그룹 사이의 차이를 독립표본 양측 스튜던트 t-검정에 의해 결정하였다. 비-파라미터 분석을 위해 크루스칼-왈리스 검정을 사용하였다. 그래프패드 프리즘(GraphPad Prism) 버전 6.01 (그래프패드 소프트웨어 인크.(GraphPad Software Inc.), 캘리포니아주 라호야)을 사용하여 통계적 분석을 수행하였다. *p≤0.05, ** p≤0.0002, ***p≤0.00003. 0.05 미만의 P 값을 유의한 것으로 간주하였다.

논의. 이들 중 하나인 인간 β-글로빈 유전자 클러스터는 염색체 11에 있고, ~100 kb에 걸쳐 있다. β-글로빈 유전자좌는 시스-조절 요소 및 활성 염색질 허브 (ACH)로 불리는 활성 β-글로빈 유전자로 구성된 적혈구-특이적 공간 구조를 형성하는 것으로 제안되었다 (Tolhius et al., Mol Cell, 10:1453-1465, 2002). 코어 ACH는 발생상 보존되고, 글로빈 LCR로 불리는 상류 5' DNAse 과민성 영역 1 내지 5, 및 하류 3'HS1뿐만 아니라 적혈구-특이적 트랜스액팅 인자를 포함한다 (Kim et al., Mol Cell Biol., 27:4551-65, 2007). 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 23 kb β-글로빈 LCR 플러스 3 kb 3'HS1 영역이 트랜스제닉 마우스에서 시스-연결된 유전자에 대해 높은 수준의 적혈구-특이적 위치 비의존성 발현을 부여한다는 것은 주목할 만하다 (Grosveld, Cell, 51:975-985, 1987). 이러한 LCR의 제어 하에 트랜스진을 전달하기 위한 도구는 30+ kb HDAd 벡터로 이용가능하다.

많은 유전 질환의 교정은 치료 유전자의 높은 수준 및 조직-제한된 발현을 필요로 하며, 이는 LCR을 활용하는 것에 의해 달성될 수 있다 (Li et al., Blood 100: 3077-3086, 2002). β-중증성 지중해빈혈 및 겸상 적혈구 빈혈의 치유를 위해, HSPC에서의 약 20% 유전자 마킹 및 적혈구에서의 20% 치료-글로빈 쇄 (β- 또는 γ-글로빈) 생산이 요구되는 것으로 생각된다 (Fitzhugh et al., Blood 130: 1946-1948, 2017). 크기 제한으로 인해, 오직 말단절단된 형태의 β-글로빈 LCR만이 렌티바이러스 벡터에 사용될 수 있으며, 이는 교정 유전자 발현 수준에 대한 요건을 충족시키기 어렵게 만든다 (Uchida et al., Nat Commun 10: 4479, 2019). 렌티바이러스-매개된 HSPC 형질도입 후에 발현 수준을 증가시키기 위한 전략은 벡터 용량을 증가시켜 이에 따라 통합되는 트랜스진 카피의 수를 증가시키는 것이다. 그러나, 이러한 접근법은 유전자독성 및 종양발생성의 위험을 증진시킨다. 다른 시도는 글로빈 발현 카세트를 추가로 최적화하는데 집중된다 (Uchida et al., Nat Commun 10: 4479, 2019). 30 kb의 삽입 용량을 갖는 HDAd 벡터는 후자의 개념을 개발하기 위한 이상적인 도구이다. 본 실시예에서, 29 kb γ-글로빈 발현 카세트를 보유하는 HDAd5/35++ 벡터를 생성하고, CD46-트랜스제닉 마우스에서 시험관내 및 생체내 HSPC 형질도입 후에 시험하였다.

HDAd 벡터 시스템에서, γ-글로빈 카세트의 통합은 SB100x 트랜스포사제에 의해 매개된다. SB/트랜스포손 시스템을 사용한 비-바이러스 유전자 전달은 CD19 CAR T-세포 요법 (Kebriaei et al., J Clin Invest 126: 3363-3376, 2016), 연령-관련 황반 변성 (Hudecek et al., Crit Rev Biochem Mol Biol 52: 355-380, 2017; Thumann et al., Mol Ther Nucleic Acids 6: 302-314, 2017), 및 알츠하이머병 (Eyjolfsdottir et al., Alzheimers Res Ther 8: 30, 2016)에 임상적으로 사용되고 있다. HD-Ad 매개된 SB 유전자 전달은 카이(Kay) 및 에르하르트 그룹(Ehrhardt group)에 의해 개척되었다. 그의 연구에서, 트랜스포손은 비교적 작았다; 4 kb-6 kb (Hausl et al., Mol Ther 18: 1896-1906, 2010; Yant et al., Nat Biotechnol 20: 999-1005, 2002). 본 실시예는 SB100x가, 대등한 VCN (세포당 2-3 카피)에 기초하여, 11.8kb 트랜스포손의 효능과 대등한 효능으로 32.4kb 트랜스포손을 통합할 수 있다는 것을 처음으로 입증한다. 그 자체로 이러한 발견은 SB-매개된 통합의 효능이 SB 트랜스포손의 크기와 역으로 상관된다는 관찰과 모순된다 (Karsi et al., Mar Biotechnol (NY) 3: 241-245, 2001). 시스템은 크기 제한을 벗어나는 것으로 보인다. 제1로, 촉매 프라이밍된 트랜스포손/트랜스포사제 복합체를 형성하기 위해, 트랜스포손의 2개의 단부는 트랜스포사제 분자에 의해 물리적으로 근접하게 함께 유지되어야 한다 (Hudecek et al., Crit Rev Biochem Mol Biol 52: 355-380, 2017). 이러한 제한은 공동-발현된 Flpe 레콤비나제에 의해 인식되는 frt 측면을 HDAd 벡터 내로 도입하여 트랜스포손의 원형화를 유도하는 것에 의해 해결되었다 (Yant et al., Nat Biotechnol 20: 999-1005, 2002). 대형 구축물의 전위를 제한하는 제2 메카니즘은 자가-통합, 즉 트랜스포손 내부의 TA 디뉴클레오티드 내로의 통합으로 불리는 자살 전위 메카니즘이다 (Wang et al., PLoS Genet 10: e1004103, 2014). HDAd-짧은-LCR과 HDAd-긴-LCR 사이의 VCN에서의 보이지 않는 차이는 생체내 선택과 관련될 수 있으며, 이는 특정 수준의 mgtm^P140K 발현을 갖는 HSPC 및 전구세포, 즉 역치 VCN에 도달한 세포를 풍부화한다.

강력한 O⁶BG/BCNU 생체내 선택 시스템으로 인해, 말초 혈액 적혈구의 거의 100%가 γ-글로빈을 함유하였다. 이러한 생체내 선택 접근법은 골수에서의 세포 조성에 영향을 미치지 않지만, 백혈구감소증을 유발한다. 따라서, 세포독성 약물 BCNU를 수반하지 않는 대안적 접근법에 노력이 집중된다. 특히, 뮤린 지중해빈혈 모델에서의 연구에 의해 지지되는 바와 같이 (Wang et al., J Clin Invest 129: 598-615, 2019), 유전자-교정된 HSPC가 비-교정된 세포에 비해 증식 이점을 가질 것이기 때문에 (Perumbeti et al., Blood 114: 1174-1185, 2009) 혈색소병증을 갖는 환자에서 제약 생체내 선택은 필요하지 않을 수 있다.

1차 동물 및 2차 수용자에서 HDAd-짧은-LCR 및 HDAd-긴-LCR에 대한 대등한 VCN을 고려하면, RBC 및 골수 적혈구 전구세포에서의 γ-글로빈 수준 (HPLC 및 qRT-PCR에 의해 측정됨)은 긴 LCR을 함유하는 벡터에 대해 유의하게 더 높았다. 흥미롭게도, 2개의 벡터 사이의 차이는 2차 수용자에서 보다 현저하였다. 이는 형질도입된 장기간 재증식 HSPC로부터 유래된 RBC가 더 높은 γ-글로빈 수준을 갖는다는 것을 암시한다. 또한, HDAd-긴-LCR은 보다 강한 적혈구 특이성을 나타내었다. 이들 효과는 LCR의 염색질 개방 능력으로 인해 전사 인자에 대한 보다 우수한 접근을 발생시키는 HDAd-긴-LCR의 추가의 LCR 요소 (Li et al., Blood 100: 3077-3086, 2002), 및/또는 γ-글로빈 유전자의 증가된 전사를 발생시키는 추가의 전사 인자의 결합에 기인할 수 있다. LCR의 또 다른 특색, 즉 자율 조절 단위로서 작용하는 그의 능력이 주목할 만하며, 이는 무작위 통합 후 이웃 유전자의 보다 적은 전사활성화를 암시한다. 이와 관련하여, 보다 완전한 LCR 버전을 사용하는 것은 접근법의 잠재적 유전자독성을 감소시킨다.

요약하면, 본 실시예는 특히 마우스에서 생체내 HSPC 형질도입 후에 중증성 지중해빈혈 및 겸상 적혈구 빈혈에 대해 치유적인 것으로 생각되는 유전자 발현 역치를 충족시키는 γ-글로빈 수준을 부여하는 벡터를 기재한다.

실시예 2: SB 트랜스포사제 ITR

본 실시예는 GFP 및 MGMT^P140K 선택 마커를 코딩하는 트랜스포손 페이로드에 의한 표적 세포의 마킹을 비교하며, 여기서 트랜스포손 페이로드는 3개의 상이한 SB ITR에 플랭킹된다. 본 실시예는 mgmt/GFP 트랜스포손 페이로드가 (i) pT0 ITR; (ii) pT2 ITR; 또는 (iii) pT4 ITR에 플랭킹된 3개의 플라스미드를 포함하며, 플라스미드는 그 외에는 동일하였다. 본 실시예에서, 293 세포를 mgmt./GFP 트랜스포손 페이로드를 포함하는 3개의 플라스미드로, pSB100x를 코딩하는 지지 플라스미드의 존재 또는 부재 하에 형질감염시켰다. T2는 쿠퍼 랩(Cooper lab)에 의해 개발된 IR이며, 현재 CAR T-세포 요법에 임상적으로 사용된다 (Srour et al., Blood 235(11):862-865, 2020; PMID 31961918). T4는 이츠바크 랩(Izcvak lab)에 의해 개발된 IR의 또 다른 버전이다 (Kebriaei et al., Trends Genet. 33(11)852-870, 2017; PMID: 28964527). 본 발명자들은 T0, T2, 및 T4의 임의의 선행 병렬 비교를 알지 못한다.

세포를 선택의 존재 또는 부재 하에 17일 동안 배양하였다. 선택 하에 있지 않은 세포에 대해서는 제3일, 제12일, 및 제17일에, 및 선택 하에 있는 세포에 대해서는 제3일의 50 μM O⁶BG/BCNU의 단일 첨가에 의해 제17일에 배양 샘플을 채취하였다 (도 28 참조). 한 시리즈에서, 세포를 제3일, 제6일, 및 제12일에 1:10 계대배양하여 에피솜 플라스미드를 제거하였다. GFP 발현 (제17일에 분석됨)은 통합된 트랜스포손으로부터의 발현을 나타낸다. 또 다른 시리즈에서, O⁶BG/BCNU 선택 단계를 포함시켜 통합된 mgmt를 갖는 세포를 풍부화하였다.

세포를 유동 세포측정법에 의해 GFP에 대해 분석하였다. SB100x의 부재 하에, GFP 발현은 잔류 에피솜 플라스미드로부터 유래되고, 예상대로 차이가 관찰되지 않았다. 도 29는 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대한 배양 제12일 및 제17일의 GFP-발현 293 세포의 백분율을 보여준다. SB100x의 존재 하에, 통합이 발생하였다. GFP+ 세포의 백분율은 T0 및 T2에 대해 대등하였지만, T4에 대해서는 유의하게 더 높았다 (p<0.01). GFP MFI는 GFP 발현 수준, 즉 세포당 통합된 트랜스포손 카피의 수를 반영한다. 다시, T4에 대한 MFI는 유의하게 더 높았다. 또한 T0과 T2 사이에 유의한 차이가 존재하였다. 결론적으로, 모든 IR이 유전자 요법을 비롯한 본 개시내용의 방법 및 조성물에서 사용하기에 적합할 수 있지만, T4 IR이 SB100x 통합을 매개하는데 우수하다. 도 30은 각각의 T0, T2, 및 T4 플라스미드에 대한 SB100x 플라스미드의 존재 또는 부재 하에 배양된 세포에 대해 O⁶BG/BCNU로의 선택 하의 세포에 대한 배양 제17일의 GFP-발현 293 세포의 백분율을 보여준다. 저항성 세포의 상대 수. O6^BG/BCNU 선택은 트랜스포손 (GFP/mgtm) 통합이 발생하지 않은 세포를 사멸시켜야 한다. SB가 없는 생존 세포의 배경은 아마도 에피솜 벡터 때문일 것이다. SB의 존재 하에, T0 vs T2 및 T2 vs T4 사이의 차이는 유의하였고, 이는 다시 T4의 우월성을 강조한다. 예상된 바와 같이, GFP 발현은 O⁶BG/BCNU 선택에서 생존한 모든 세포에서 대등하여야 한다.

실시예 3: 효율적인 통합을 위해 조작된 트랜스포손

본 실시예는 표적 세포 게놈 내로 효율적으로 통합될 수 있는 예시적인 트랜스포손 페이로드를 제공한다. 예시된 트랜스포손은 2.8 내지 31.8 kb 범위의 길이를 갖고, 본 발명에 따라 제공된 범위의 트랜스포손 길이에 걸쳐 효율적인 통합이 관찰될 것이다. 본 실시예의 트랜스포손은 비제한적으로 SB100x를 포함하는 슬리핑 뷰티 트랜스포사제에 의해 표적화될 수 있는 슬리핑 뷰티 IR에 플랭킹된다. 본 실시예에 제공된 트랜스포손을 본 실시예의 보다 짧은 트랜스포손 (또는 다른 참조 트랜스포손)과 비교하면, 통합의 빈도 및/또는 효율에 기초하여, 길이 의존성을 입증하지 않을 것이고/거나 관련 기술분야의 통상의 기술자에 의해 예상되는 것보다 더 낮은 길이 의존성의 정도를 입증할 것이다. 다양한 실시양태에서, 예를 들어, 통합의 빈도 및/또는 효율은 표적 게놈당 트랜스포손 통합 사건의 수에 의해 및/또는 적어도 1개 (또는 적어도 2개, 또는 적어도 3개)의 트랜스포손 통합 사건을 포함하는 표적 게놈의 수에 의해 측정될 수 있다.

다양한 예시적인 트랜스포손 페이로드가 도 31-43에 제공된다. 도면에 제공된 특정 표현은 원형화된 플라스미드 포맷의 트랜스포손 페이로드를 포함한다. 관련 기술분야의 통상의 기술자는 트랜스포손 페이로드가 분자 생물학의 기술을 사용하여, 다른 콘텍스트에서, 예를 들어 바이러스 벡터 게놈에서 용이하게 이용될 수 있다는 것을 인지할 것이다.

본 실시예는 31.776 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 PWEAd5-PT4LCR-글로빈/mgmt 또는 pWEAd5-PT4-LCR-글로빈-mgmt로 지칭되는 핵산을 포함한다 (도 31). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 31.772 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 HDAd5-PT4-긴 LCR 글로빈-rhMGMT로 지칭되는 핵산을 포함한다 (도 32). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터, HS1-HS5를 포함하는 긴 LCR, 및 3'HS1과 작동가능하게 연결된 감마-글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 13.173 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 HDAd-Ad5-PT4-LCR-hACE2/mgmt로 지칭되는 핵산을 포함한다 (도 33). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 LCR과 작동가능하게 연결된 재조합 인간 ACE2 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 12.169 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pWEHCB-마이크로LCR-글로빈/mgmt로 지칭되는 핵산을 포함한다 (도 34). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) 베타 프로모터 및 HS1-HS4를 포함하는 마이크로 LCR과 작동가능하게 연결된 감마 글로빈 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 Ef1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 9.382 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pWEHCA-파코니-GFP로 지칭되는 핵산을 포함한다 (도 35). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) pgk 프로모터와 작동가능하게 연결된 FancA 코딩 서열 및 (ii) Ef1a 프로모터와 작동가능하게 연결된 GFP 코딩 서열을 포함한다.

본 실시예는 5.49 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-T4-rhMGMT-GFP로 지칭되는 핵산을 포함한다 (도 36). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 (i) PGK 프로모터와 작동가능하게 연결된 GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 3.797 kb의 길이를 갖는 트랜스포손을 포함하는 핵산을 포함한다 (도 37). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.

본 실시예는 3.709 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pBHCA-PT0-EF1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 38). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT0 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) eGFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.

본 실시예는 3.547 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA(Ad35)-PT4-EF1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 39). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.

본 실시예는 3.543 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-Ad5-PT4-Ef1a-mgmt/GFP로 지칭되는 핵산을 포함한다 (도 40). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 EF1a 프로모터와 작동가능하게 연결된 (i) GFP 코딩 서열 및 (ii) MGMT^P140K 코딩 서열을 포함한다.

본 실시예는 2.781 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA(Ad35)-PT4-EF1a-mgmt로 지칭되는 핵산을 포함한다 (도 41). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 2.777 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-T4-Ef1a-rhMGMT로 지칭되는 핵산을 포함한다 (도 42). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

본 실시예는 2.751 kb의 길이를 갖는 트랜스포손을 포함하는, 본원에서 pHCA-Ad5-PT4-Ef1a-mgmt로 지칭되는 핵산을 포함한다 (도 43). 트랜스포손 페이로드는 트랜스포손 역전된 반복부 (IR, 특히 pT4 슬리핑 뷰티 IR)에 플랭킹되고, 이는 다시 레콤비나제 직접 반복부 (DR, 특히 FRT DR)에 플랭킹된다. 트랜스포손은 MGMT^P140K 코딩 서열이 EF1a 프로모터와 작동가능하게 연결된 MGMT^P140K 선택 카세트를 포함한다.

(XII) 닫는 단락.

관련 기술분야의 통상의 기술자에 의해 이해되는 바와 같이, 본원에 개시된 각각의 실시양태는 그의 특정한 언급된 요소, 단계, 성분 또는 구성요소를 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어질 수 있다. 따라서, 용어 "비롯하다" 또는 "비롯한"은 "포함한다, 이루어진다, 또는 본질적으로 이루어진다"를 언급하는 것으로 해석되어야 한다. 연결 용어 "포함한다" 또는 "포함하다"는 명시되지 않은 요소, 단계, 성분, 또는 구성요소를, 심지어 많은 양으로 포함하나 이에 제한되지는 않고, 이를 허용함을 의미한다. 연결 어구 "이루어진"은 명시되지 않은 임의의 요소, 단계, 성분 또는 구성요소를 배제한다. 연결 어구 "본질적으로 이루어진"은 실시양태의 범주를 명시된 요소, 단계, 성분 또는 구성요소로, 및 실시양태에 실질적으로 영향을 미치지 않는 것으로 제한한다. 이와 관련하여 물질적 효과는 아데노바이러스 벡터가 대형 트랜스포손 페이로드를 운반하고/거나 대형 페이로드를 표적 게놈 내로 통합시키는 능력을 감소시키는 조성 또는 방법에서의 임의의 변화이다.

달리 나타내지 않는 한, 명세서 및 청구범위에 사용된 성분의 양, 특성, 예컨대 분자량, 반응 조건 등을 표현하는 모든 수는 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 달리 나타내지 않는 한, 명세서 및 첨부된 청구범위에 제시된 수치 파라미터는 본 발명에 의해 수득하고자 하는 목적하는 특성에 따라 달라질 수 있는 근사치이다. 최소한, 그리고 청구범위의 범주에 대한 균등론의 적용을 제한하려는 시도가 아닌 것으로서, 각각의 수치 파라미터는 적어도 보고된 유효 숫자의 수에 비추어 통상의 반올림 기술을 적용하여 해석되어야 한다. 추가의 명확성이 요구되는 경우에, 용어 "약"은 언급된 수치 값 또는 범위와 함께 사용되는 경우에 관련 기술분야의 통상의 기술자에 의해 그에 합리적으로 부여되는 의미를 가지며, 즉 언급된 값 또는 범위보다 다소 많거나 다소 적게, 언급된 값의 ±20%; 언급된 값의 ±19%; 언급된 값의 ±18%; 언급된 값의 ±17%; 언급된 값의 ±16%; 언급된 값의 ±15%; 언급된 값의 ±14%; 언급된 값의 ±13%; 언급된 값의 ±12%; 언급된 값의 ±11%; 언급된 값의 ±10%; 언급된 값의 ±9%; 언급된 값의 ±8%; 언급된 값의 ±7%; 언급된 값의 ±6%; 언급된 값의 ±5%; 언급된 값의 ±4%; 언급된 값의 ±3%; 언급된 값의 ±2%; 또는 언급된 값의 ±1%의 범위 내를 나타낸다.

본 발명의 넓은 범주를 제시하는 수치 범위 및 파라미터는 근사치이지만, 특정 실시예에 제시된 수치 값은 가능한 한 정확하게 보고된다. 그러나, 임의의 수치 값은 본질적으로 그의 각각의 시험 측정에서 발견되는 표준 편차로부터 필연적으로 발생하는 특정 오차를 함유한다.

본원에서 값의 범위에 대한 언급은 단지 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 약칭 방법으로서 제공되도록 의도된다. 본원에 달리 나타내지 않는 한, 각각의 개별 값은 본원에 개별적으로 인용된 것처럼 명세서에 포함된다. 본원에 기재된 모든 방법은 본원에 달리 나타내지 않는 한 또는 문맥상 명백하게 모순되지 않는 한, 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예 또는 예시적인 언어 (예를 들어, "예컨대")의 사용은 단지 본 발명을 보다 잘 예시하기 위해 의도되며, 달리 청구된 본 발명의 범주에 대한 제한을 제기하지 않는다. 본 명세서의 어떠한 용어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안된다.

본원에 개시된 본 발명의 대안적 요소 또는 실시양태의 그룹화는 제한으로 해석되어서는 안된다. 각각의 군 구성원은 개별적으로 또는 군의 다른 구성원 또는 본원에서 발견되는 다른 요소와의 임의의 조합으로 언급되고 청구될 수 있다. 군의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 군에 포함되거나 군으로부터 삭제될 수 있는 것으로 예상된다. 임의의 이러한 포함 또는 삭제가 발생하는 경우에, 명세서는 변형된 바와 같은 군을 함유하는 것으로 간주되며, 따라서 첨부된 청구범위에 사용된 모든 마쿠쉬 군의 기재된 설명을 충족시킨다.

본 발명을 수행하기 위해 본 발명자들에게 공지된 최적 방식을 비롯한 본 발명의 특정 실시양태가 본원에 기재된다. 물론, 이들 기재된 실시양태에 대한 변형은 상기 설명을 읽을 때 관련 기술분야의 통상의 기술자에게 명백해질 것이다. 본 발명자는 통상의 기술자가 적절한 경우에 이러한 변형을 사용할 것으로 예상하고, 본 발명자들은 본 발명이 본원에 구체적으로 기재된 것과 달리 실시되는 것을 의도한다. 따라서, 본 발명은 적용가능한 법에 의해 허용되는 바와 같은 본원에 첨부된 청구범위에 인용된 대상의 모든 변형 및 등가물을 포함한다. 더욱이, 그의 모든 가능한 변경에서 상기 기재된 요소의 임의의 조합은 본원에 달리 나타내지 않는 한 또는 문맥상 명백하게 모순되지 않는 한 본 발명에 의해 포괄된다.

또한, 본 명세서 전반에 걸쳐 특허, 인쇄된 간행물, 학술지 논문 및 다른 서면 텍스트 (본원에 참조된 자료)에 대한 수많은 참조가 이루어졌다. 각각의 참조된 자료는 그의 참조된 교시(들)에 대해 그 전문이 개별적으로 본원에 참조로 포함된다.

본원에 개시된 본 발명의 실시양태는 본 발명의 원리를 예시하는 것으로 이해되어야 한다. 사용될 수 있는 다른 변형이 본 발명의 범위 내에 있다. 따라서, 제한이 아닌 예로서, 본 발명의 대안적 구성이 본원의 교시에 따라 이용될 수 있다. 따라서, 본 발명은 정확하게 제시되고 기재된 바와 같은 것으로 제한되지 않는다.

본원에 제시된 상세사항은 단지 예로서 및 본 발명의 바람직한 실시양태의 예시적 논의를 위한 것이며, 본 발명의 다양한 실시양태의 원리 및 개념적 측면의 가장 유용하고 용이하게 이해되는 기재인 것으로 여겨지는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 근본적인 이해에 필요한 것보다 더 상세하게 본 발명의 구조적 세부사항을 나타내려는 시도는 이루어지지 않았으며, 설명은 도면 및/또는 실시예와 함께 본 발명의 여러 형태가 실제로 구현될 수 있는 방법을 관련 기술분야의 통상의 기술자에게 명백하게 한다.

본 개시내용에 사용된 정의 및 설명은 실시예(들)에서 명백하고 명료하게 변형되지 않는 한 또는 의미의 적용이 임의의 구성을 무의미하게 또는 본질적으로 무의미하게 만드는 경우에 임의의 미래 구성에서 통제되도록 의미되고 의도된다. 용어의 구성이 이를 무의미하게 또는 본질적으로 무의미하게 하는 경우에, 정의는 문헌 [Webster's Dictionary, 3rd Edition] 또는 관련 기술분야의 통상의 기술자에게 공지된 사전, 예컨대 문헌 [Oxford Dictionary of Biochemistry and Molecular Biology (Ed. Anthony Smith, Oxford University Press, Oxford, 2004)]으로부터 취해져야 한다.

서열의 요약

본원에 기재된 핵산 및/또는 아미노산 서열은 37 C.F.R. §1.822에 정의된 바와 같은 표준 문자 약어를 사용하여 제시된다. 각각의 핵산 서열의 단지 1개의 가닥이 제시되지만, 상보적 가닥이 적절한 경우에 실시양태에 포함되는 것으로 이해된다. 파일 크기가 136 KB인, 2021년 4월 9일 즈음에 생성된 "F053-0126PCT_SeqList.txt (Sequence Listing.txt)"라는 명칭의 컴퓨터 판독가능한 텍스트 파일은 본 출원에 대한 서열 목록을 함유하며, 그 전문이 본원에 참조로 포함된다. 첨부된 서열 목록에서:

서열식별번호: 1은 도 2c에 제시된 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr15, 6805206)의 뉴클레오티드 서열이다.

서열식별번호: 2는 도 2c에 제시된 5' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chrX, 16897322)의 뉴클레오티드 서열이다.

서열식별번호: 3은 도 2c에 제시된 3' 단부 벡터 서열, 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr4, 10207667)의 뉴클레오티드 서열이다.

서열식별번호: 4는 도 7b에 제시된 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (chr7, 79796094)의 뉴클레오티드 서열이다.

서열식별번호: 5는 도 7b에 제시된 슬리핑 뷰티 IR/DR 서열, 통합 접합부 (반복부 영역)의 뉴클레오티드 서열이다.

서열식별번호: 6은 인간 염색체 11의 긴 β-글로빈 LCR 위치 5292319-5270789 (21,531 bp)의 뉴클레오티드 서열이다:

서열식별번호: 7은 인간 염색체 11의 위치 5228631-5227018 (1614 bp)을 포함하는 전위가능한 트랜스진 삽입물의 뉴클레오티드 서열이다:

서열식별번호: 8은 Her2-특이적 CDRL1의 아미노산 서열이다: KASQDVSIGVA

서열식별번호: 9는 Her2-특이적 CDRL2의 아미노산 서열이다: ASYRYT

서열식별번호: 10은 Her2-특이적 CDRL3의 아미노산 서열이다: QQYYIYPYT

서열식별번호: 11은 Her2-특이적 CDRH1의 아미노산 서열이다: GFTFTDYTMD

서열식별번호: 12는 Her2-특이적 CDRH2의 아미노산 서열이다: DVNPNSGGSIYNQRFK

서열식별번호: 13은 Her2-특이적 CDRH3의 아미노산 서열이다: LGPSFYFDY

서열식별번호: 14는 PD-L1-특이적 CDRL1의 아미노산 서열이다: RASKGVSTSGYSYLH

서열식별번호: 15는 PD-L1-특이적 CDRL2의 아미노산 서열이다: LASYLES

서열식별번호: 16은 PD-L1-특이적 CDRL3의 아미노산 서열이다: QHSRDLPLT

서열식별번호: 17은 PD-L1-특이적 CDRH1의 아미노산 서열이다: NYYMY

서열식별번호: 18은 PD-L1-특이적 CDRH2의 아미노산 서열이다: GINPSNGGTNFNEKFKN

서열식별번호: 19는 PD-L1-특이적 CDRH3의 아미노산 서열이다: RDYRFDMGFDY

서열식별번호: 20은 아벨루맙-특이적 가변 중쇄의 아미노산 서열이다:

EVQLLESGGGLVQPGGSLRLSCAASGFTFSSYIMMWVRQAPGKGLEWVSSIYPSGGITFYADTVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARIKLGTVTTVDYWGQGTLVTVSS

서열식별번호: 21은 아벨루맙-특이적 가변 경쇄의 아미노산 서열이다:

QSALTQPASVSGSPGQSITISCTGTSSDVGGYNYVSWYQQHPGKAPKLMIYDVSNRPSGVSNRFSGSKSGNTASLTISGLQAEDEADYYCSSYTSSSTRVFGTGTKVTVL

서열식별번호: 22는 아벨루맙-특이적 CDRH1의 아미노산 서열이다: SGFTFSSYIMM

서열식별번호: 23은 아벨루맙-특이적 CDRH2의 아미노산 서열이다: SIYPSGGITFYADTVKG

서열식별번호: 24는 아벨루맙-특이적 CDRH3의 아미노산 서열이다: IKLGTVTTVDY

서열식별번호: 25는 아벨루맙-특이적 CDRL1의 아미노산 서열이다: TGTSSDVGGYNYVS

서열식별번호: 26은 아벨루맙-특이적 CDRL2의 아미노산 서열이다: DVSNRPS

서열식별번호: 27은 아벨루맙-특이적 CDRL3의 아미노산 서열이다: SSYTSSSTRV

서열식별번호: 28은 하기를 포함하는 아테졸리주맙-특이적 가변 중쇄의 아미노산 서열이다:

EVQLVESGGGLVQPGGSLRLSCAASGFTFSDSWIHWVRQAPGKGLEWVAWISPYGGSTYYADSVKGRFTISADTSKNTAYLQMNSLRAEDTAVYYCARRHWPGGFDYWGQGTLVTVSS

서열식별번호: 29는 아테졸리주맙-특이적 가변 경쇄의 아미노산 서열이다:

DIQMTQSPSSLSASVGDRVTITCRASQDVSTAVAWYQQKPGKAPKLLIYSASFLYSGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQQYLYHPATFGQGTKVEIK

서열식별번호: 30은 아테졸리주맙-특이적 CDRH1의 아미노산 서열이다: SGFTFSDSWIH

서열식별번호: 31은 아테졸리주맙-특이적 CDRH2의 아미노산 서열이다: WISPYGGSTYYADSVKG

서열식별번호: 32는 아테졸리주맙-특이적 CDRH3의 아미노산 서열이다: RHWPGGFDY

서열식별번호: 33은 아테졸리주맙-특이적 CDRL1의 아미노산 서열이다: RASQDVSTAVA

서열식별번호: 34는 아테졸리주맙-특이적 CDRL2의 아미노산 서열이다: SASFLYS

서열식별번호: 35는 아테졸리주맙-특이적 CDRL3의 아미노산 서열이다: QQYLYHPAT

서열식별번호: 36은 PSMA-특이적-특이적 CDRL1의 아미노산 서열이다: KASQDVGTAVD

서열식별번호: 37은 PSMA-특이적 CDRL2의 아미노산 서열이다: WASTRHT

서열식별번호: 38은 PSMA-특이적 CDRL3의 아미노산 서열이다: QQYNSYPLT

서열식별번호: 39는 PSMA-특이적 CDRH1의 아미노산 서열이다: GYTFTEYTIH

서열식별번호: 40은 PSMA-특이적 CDRH2의 아미노산 서열이다: NINPNNGGTTYNQKFED

서열식별번호: 41은 PSMA-특이적 CDRH3의 아미노산 서열이다: GWNFDY

서열식별번호: 42는 MUC16-특이적 CDRL1의 아미노산 서열이다: SEDIYSG

서열식별번호: 43은 MUC16-특이적 CDRL3의 아미노산 서열이다: GYSYSSTL

서열식별번호: 44는 MUC16-특이적 CDRH1의 아미노산 서열이다: TLGMGVG

서열식별번호: 45는 MUC16-특이적 CDRH2의 아미노산 서열이다: HIWWDDDKYYNPALKS

서열식별번호: 46은 MUC16-특이적 CDRH3의 아미노산 서열이다: IGTAQATDALDY

서열식별번호 47은 FOLR-특이적 CDRL1의 아미노산 서열이다: KASQSVSFAGTSLMH

서열식별번호: 48은 FOLR-특이적 CDRL2의 아미노산 서열이다: RASNLEA

서열식별번호: 49는 FOLR-특이적 CDRL3의 아미노산 서열이다: QQSREYPYT

서열식별번호: 50은 FOLR-특이적 CDRH1의 아미노산 서열이다: GYFMN

서열식별번호: 51은 FOLR-특이적 CDRH2의 아미노산 서열이다: RIHPYDGDTFYNQKFQG

서열식별번호: 52는 FOLR-특이적 CDRH3의 아미노산 서열이다: YDGSRAMDY

서열식별번호: 53은 아마툭시맙-특이적 가변 중쇄의 아미노산 서열이다:

QVQLQQSGPELEKPGASVKISCKASGYSFTGYTMNWVKQSHGKSLEWIGLITPYNGASSYNQKFRGKATLTVDKSSSTAYMDLLSLTSEDSAVYFCARGGYDGRGFDYWGSGTPVTVSS.

서열식별번호: 54는 아마툭시맙-특이적 가변 경쇄의 아미노산 서열이다:

DIELTQSPAIMSASPGEKVTMTCSASSSVSYMHWYQQKSGTSPKRWIYDTSKLASGVPGRFSGSGSGNSYSLTISSVEAEDDATYYCQQWSKHPLTFGSGTKVEIK

서열식별번호: 55는 아마툭시맙-특이적 CDRH1의 아미노산 서열이다: GYSFTGYTMN

서열식별번호: 56은 아마툭시맙-특이적 CDRH2의 아미노산 서열이다: LITPYNGASSYNQ

서열식별번호: 57은 아마툭시맙-특이적 CDRH3의 아미노산 서열이다: GGYDGRGFDY

서열식별번호: 58은 아마툭시맙-특이적 CDRL1의 아미노산 서열이다: SASSSVSYMH

서열식별번호: 59는 아마툭시맙-특이적 CDRL2의 아미노산 서열이다: DTSKLAS

서열식별번호: 60은 아마툭시맙-특이적 CDRL3의 아미노산 서열이다: QQWSKHPLT

서열식별번호: 61은 Nef의 아미노산 서열 (66-97)이다:

VGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGL

서열식별번호: 62는 Nef의 아미노산 서열 (116-145)이다:

HTQGYFPDWQNYTPGPGVRYPLTFGWLYKL

서열식별번호: 63은 Gag p17의 아미노산 서열 (17-35)이다:

EKIRLRPGGKKKYKLKHIV

서열식별번호: 64는 Gag p17-p24의 아미노산 서열 (253-284)이다:

NPPIPVGEIYKRWIILGLNKIVRMYSPTSILD

서열식별번호: 65는 Pol 325-355 (RT 158-188)이다:

AIFQSSMTKILEPFRKQNPDIVIYQYMDDLY

서열식별번호: 66은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:

ACTTAAGTGTATGTAAACTTCCGACTTCAACTGTAGGGTACCTGATTCTCTGGGCATCTCTGCCCACTACCATG

서열식별번호: 67은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:

ACTTAAGTGTATGTAAACTTCCGACTTCAACTGTAAATTTTCCACCTTTTTCAGTTTTCCTCGCCATATTTCATG

서열식별번호: 68은 슬리핑 뷰티의 IR/DR 코딩 서열의 뉴클레오티드 서열이다: ACTTAAGTGTATGTAAACTTCCGACTTCAACTG

서열식별번호: 69는 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:

서열식별번호: 70은 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:

서열식별번호: 71은 슬리핑 뷰티의 IR/DR을 코딩하는 서열이다:

서열식별번호: 72는 슬리핑 뷰티의 IR/DR 및 염색체 서열을 코딩하는 서열의 뉴클레오티드 서열이다:

서열식별번호: 73은 슬리핑 뷰티의 IR/DR을 코딩하는 서열의 뉴클레오티드 서열이다:

서열식별번호: 74는 슬리핑 뷰티 트랜스포사제 효소이다:

서열식별번호: 75는 SB100X인 과다활성 슬리핑 뷰티의 아미노산 서열이다:

서열식별번호: 76은 피기백™ (PB) 트랜스포사제의 아미노산 서열이다:

서열식별번호: 77은 프로그 프린스 트랜스포사제의 아미노산 서열이다:

서열식별번호: 78은 TcBuster 트랜스포사제의 아미노산 서열이다:

서열식별번호: 79는 Tol2 트랜스포사제의 아미노산 서열이다:

서열식별번호: 80은 SV40 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 81은 dESV40 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 82는 인간 텔로머라제 촉매 서브유닛 (hTERT) 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 83은 슈미트-루핀 A 균주로부터 유래된 RSV 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 84는 hNIS 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 85는 인간 글루코코르티코이드 수용체 1A (hGR 1/Ap/e) 프로모터의 뉴클레오티드 서열이다:

서열식별번호: 86은 인간 γ-글로빈 정방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 87은 인간 γ-글로빈 역방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 88은 EF1α p1 정방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 89는 EF1α p1 역방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 90은 EF1α p2 정방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 91은 EF1α p2 역방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 92는 3'HS1 p1 정방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 93은 3'HS1 p1 역방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 94는 3'HS1 p2 정방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 95는 3'HS1 p2 역방향 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 96은 CD46F 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 97은 CD46R 프라이머의 뉴클레오티드 서열이다:

서열식별번호: 98 - 삽입된 XhoI 부위 (위치 10655-10661)를 갖는 긴 β-글로빈 LCR:

서열식별번호: 99 (예시적인 ET3 서열)

서열식별번호: 100 (예시적인 β-글로빈 서열)

서열식별번호: 101 (예시적인 γ-글로빈 서열)

서열식별번호: 102 (예시적인 3'HS1 핵산 서열)

SEQUENCE LISTING <110> Fred Hutchinson Cancer Research Center University of Washington <120> INTEGRATION OF LARGE ADENOVIRUS PAYLOADS <130> F053-0126PCT / 20-148-WO-PCT <150> US 63/009,298 <151> 2020-04-13 <160> 102 <170> PatentIn version 3.5 <210> 1 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> 5 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chr15, 6805206) <400> 1 ccctgggatt ccccaaggca ggggcgagtc cttttgtatg aattactcaa atcgataact 60 agaaacttaa ttaacaacga gatcttataa tttgcatact tctgcctgct ggggactttc 120 cacaccctag ctgacacaag aatttgaaat acatccacag gtacacctcc aattgactca 180 aatgatgtca attagtctat cataatcttc taaagccatg acatcatttt aactggaatt 240 ttccaagctg tttaaaggca cagtcaactt agtgtatgta aacttctgac ccactggaat 300 tgtgatacag tgaattataa gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac 360 ttgtgtcatg cacaaagtag atgtcctaac tgacttgcca aaactattgt ttgttaacaa 420 gaaatttgtg gagtagttga aaaacgagtt ttaatgactc caacttaagt gtatgtaaac 480 ttccgacttc aactgtaaga atggcccatt catctatagt agcacacaat atttgcattt 540 gtgcgacagt ataagggaca attatgctat caggcatttt tccaaagtga gtaatcgaag 600 tttttatacc tttgtgtgcc atgtttgcta ccatggtggg ataatcttac acgcgttctc 660 gcgaccggcc aggaaagacg caacaaaccg gaatcttctg cggcaaaagc tttattgctt 720 <210> 2 <211> 607 <212> DNA <213> Artificial Sequence <220> <223> 5 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chrX, 16897322) <220> <221> misc_feature <222> (594)..(594) <223> n is a, c, g, or t <220> <221> misc_feature <222> (596)..(597) <223> n is a, c, g, or t <220> <221> misc_feature <222> (602)..(602) <223> n is a, c, g, or t <400> 2 tagaaactta attaacaacg agatcttata atttgcatac ttctgcctgc tggggacttt 60 ccacacccta gctgacacaa gaatttgaaa tacatccaca ggtacacctc caattgactc 120 aaatgatgtc aattagtcta tcataatctt ctaaagccat gacatcattt taactggaat 180 tttccaagct gtttaaaggc acagtcaact tagtgtatgt aaacttctga cccactggaa 240 ttgtgataca gtgaattata agtgaaataa tctgtctgta aacaattgtt ggaaaaatga 300 cttgtgtcat gcaaagtaga tgtcctaact gacttgccaa aactattgtt tgttaacaag 360 aaatttgtgg agtagttgaa aaacgagttt taatgactcc aacttaagtg tatgtaaact 420 tccgacttca actgtacaag tagaccaaat atccatatac ataaaagaaa aaaatagaaa 480 aaatttctag tgacagaaaa atgacaaaga acatactgtt tattactact attaagatgt 540 ttgcttccat tacactcata tgagtcatga tattttttct tcattttttt ctantnncac 600 tngaaat 607 <210> 3 <211> 520 <212> DNA <213> Artificial Sequence <220> <223> 3 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chr4, 10207667) <400> 3 gttgctagga atgagccaaa ttcatctgta ttaaacagtg ggagcttgtg gaaggctact 60 cgaaatgttt gacccaagtt aaacaattta aaggcaatgc taccaaatac taattgagtg 120 tatgttaact tctgacccac tgggaatgtg atgaaagaaa taaaagctga aatgaatcat 180 tctctctact attattctga tatttcacat tcttaaaata aagtggtgat cctaactgac 240 cttaagacag ggaatcttta ctcggattaa atgtcaggaa ttgtgaaaaa gtgagtttaa 300 atgtatttgg ctaaggtgta tgtaaacttc cgacttcaac tgtatatcct ccccgttgca 360 ccctcttgat gatgctgaga tgaacacaga tgctcactcc ttgagggctc taagcttatg 420 ctgacacaga cacaggtgct cacttctatg aatggcctaa gatttgagga catcatgagg 480 acaagtgtga taaaatcttg gaacaacctc ccagaggtct 520 <210> 4 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> Sleeping beauty IR/DR sequence, integration junction (chr7, 79796094) <400> 4 acttaagtgt atgtaaactt ccgacttcaa ctgtagggta cctgattctc tgggcatctc 60 tgcccactac catg 74 <210> 5 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Sleeping beauty IR/DR sequence, Integration junction (repeat region) <400> 5 acttaagtgt atgtaaactt ccgacttcaa ctgtaaattt tccacctttt tcagttttcc 60 tcgccatatt tcatg 75 <210> 6 <211> 21531 <212> DNA <213> Homo sapiens <400> 6 gatctctatc ccctcctgtt ttctctacgt tatttatatg ggtatcatca ccatcctgga 60 caacatcagg acagatatcc ctcaccaagc caatgttcct ctctatgttg gctcaaatgt 120 ccttgaactt tcctttcacc accctttcca cagtcaaaag gatattgtag tttaatgcct 180 cagagttcag cttttaagct tctgacaaat tattcttcct ctttaggttc tcctttatgg 240 aatcttctgt actgatggcc atgtccttta actactatgt agatatctgc tactacctgt 300 attatgcctc tacctttatt agcagagtta tctgtactgt tggcatgaca atcatttgtt 360 aatatgactt gcctttcctt tttctgctat tcttgatcaa atggctcctc tttcttgctc 420 ctctcatttc tcctgccttc acttggacgt gcttcacgta gtctgtgctt atgactggat 480 taaaaattga tatggactta tcctaatgtt gttcgtcata atatgggttt tatggtccat 540 tattatttcc tatgcattga tctggagaag gcttcaatcc ttttactctt tgtggaaaat 600 atctgtaaac cttctggttc actctgctat agcaatttca gtttaggcta gtaagcatga 660 ggatgcctcc ttctctgatt tttcccacag tctgttggtc acagaataac ctgagtgatt 720 actgatgaaa gagtgagaat gttattgata gtcacaatga caaaaaacaa acaactacag 780 tcaaaatgtt tctcttttta ttagtggatt atatttcctg acctatatct ggcaggactc 840 tttagagagg tagctgaagc tgctgttatg accactagag ggaagaagat acctgtggag 900 ctaatggtcc aagatggtgg agccccaagc aaggaagttg ttaaggagcc cttttgattg 960 aaggtgggtg cccccacctt acagggacag gacatctgga tactcctccc agtttctcca 1020 gtttcccttt ttcctaatat atctcctgat aaaatgtcta tactcacttc cccatttcta 1080 ataataaagc aaaggctagt tagtaagaca tcaccttgca ttttgaaaat gccatagact 1140 ttcaaaatta tttcatacat cggtctttct ttatttcaag agtccagaaa tggcaacatt 1200 acctttgatt caatgtaatg gaaagagctc tttcaagaga cagagaaaag aataatttaa 1260 tttctttccc cacacctcct tccctgtctc ttaccctatc ttccttcctt ctaccctccc 1320 catttctctc tctcatttct cagaagtata ttttgaaagg attcatagca gacagctaag 1380 gctggttttt tctaagtgaa gaagtgatat tgagaaggta gggttgcatg agccctttca 1440 gttttttagt ttatatacat ctgtattgtt agaatgtttt ataatataaa taaaattatt 1500 tctcagttat atactagcta tgtaacctgt ggatatttcc ttaagtatta caagctatac 1560 ttaactcact tggaaaactc aaataaatac ctgcttcata gttattaata aggattaagt 1620 gagataatgc ccataagatt cctattaata acagataaat acatacacac acacacacat 1680 tgaaaggatt cttactttgt gctaggaact ataataagtt cattgatgca ttatatcatt 1740 aagttctaat ttcaacacta gaaggcaggt attatctaaa tttcatactg gatacctcca 1800 aactcataaa gataattaaa ttgccttttg tcatatattt attcaaaagg gtaaactcaa 1860 actatggctt gtctaatttt atatatcacc ctactgaaca tgaccctatt gtgatatttt 1920 ataaaattat tctcaagtta ttatgaggat gttgaaagac agagaggatg gggtgctatg 1980 ccccaaatca gcctcacaat taagctaagc agctaagagt cttgcagggt agtgtaggga 2040 ccacagggtt aagggggcag tagaattata ctcccacttt agtttcattt caaacaatcc 2100 atacacacac agccctgagc acttacaaat tatactacgc tctatacttt ttgtttaaat 2160 gtataaataa gtggatgaaa gaatagatag atagatagac agatagatga tagatagaat 2220 aaatgcttgc cttcatagct gtctccctac cttgttcaaa atgttcctgt ccagaccaaa 2280 gtaccttgcc ttcacttaag taatcaattc ctaggttata ttctgatgtc aaaggaagtc 2340 aaaagatgtg aaaaacaatt tctgacccac aactcatgct ttgtagatga ctagatcaaa 2400 aaatttcagc catatcttaa cagtgagtga acaggaaatc tcctcttttc cctacatctg 2460 agatcccagc ttctaagacc ttcaattctc actcttgatg caacagacct tggaagcata 2520 caggagagct gaacttggtc aacaaaggag aaaagtttgt tggcctccaa aggcacagct 2580 caaacttttc aagccttctc taatcttaaa ggtaaacaag ggtctcattt ctttgagaac 2640 ttcagggaaa atagacaagg acttgcctgg tgcttttggt aggggagctt gcactttccc 2700 cctttctgga ggaaatattt atccccaggt agttcccttt ttgcaccagt ggttctttga 2760 agagacttcc acctgggaac agttaaacag caactacagg gccttgaact gcacactttc 2820 agtccggtcc tcacagttga aaagacctaa gcttgtgcct gatttaagcc tttttggtca 2880 taaaacattg aattctaatc tccctctcaa ccctacagtc acccatttgg tatattaaag 2940 atgtgttgtc tactgtctag tatccctcaa gtagtgtcag gaattagtca tttaaatagt 3000 ctgcaagcca ggagtggtgg ctcatgtctg taattccagc acttgagagg tagaagtggg 3060 aggactgctt gagctcaaga gtttgatatt atcctggaca acatagcaag acctcgtctc 3120 tacttaaaaa aaaaaaaaaa attagccagg catgtgatgt acacctgtag tcccagctac 3180 tcaggaggcc gaaatgggag gatcccttga gctcaggagg tcaaggctgc agtgagacat 3240 gatcttgcca ctgcactcca gcctggacag cagagtgaaa ccttgcctca cgaaacagaa 3300 tacaaaaaca aacaaacaaa aaactgctcc gcaatgcgct tccttgatgc tctaccacat 3360 aggtctgggt actttgtaca cattatctca ttgctgttca taattgttag attaattttg 3420 taatattgat attattccta gaaagctgag gcctcaagat gataactttt attttctgga 3480 cttgtaatag ctttctcttg tattcaccat gttgtaactt tcttagagta gtaacaatat 3540 aaagttattg tgagtttttg caaacacagc aaacacaacg acccatatag acattgatgt 3600 gaaattgtct attgtcaatt tatgggaaaa caagtatgta ctttttctac taagccattg 3660 aaacaggaat aacagaacaa gattgaaaga atacattttc cgaaattact tgagtattat 3720 acaaagacaa gcacgtggac ctgggaggag ggttattgtc catgactggt gtgtggagac 3780 aaatgcaggt ttataataga tgggatggca tctagcgcaa tgactttgcc atcactttta 3840 gagagctctt ggggacccca gtacacaaga ggggacgcag ggtatatgta gacatctcat 3900 tctttttctt agtgtgagaa taagaatagc catgacctga gtttatagac aatgagccct 3960 tttctctctc ccactcagca gctatgagat ggcttgccct gcctctctac taggctgact 4020 cactccaagg cccagcaatg ggcagggctc tgtcagggct ttgatagcac tatctgcaga 4080 gccagggccg agaaggggtg gactccagag actctccctc ccattcccga gcagggtttg 4140 cttatttatg catttaaatg atatatttat tttaaaagaa ataacaggag actgcccagc 4200 cctggctgtg acatggaaac tatgtagaat attttgggtt ccattttttt ttccttcttt 4260 cagttagagg aaaaggggct cactgcacat acactagaca gaaagtcagg agctttgaat 4320 ccaagcctga tcatttccat gtcatactga gaaagtcccc acccttctct gagcctcagt 4380 ttctcttttt ataagtagga gtctggagta aatgatttcc aatggctctc atttcaatac 4440 aaaatttccg tttattaaat gcatgagctt ctgttactcc aagactgaga aggaaattga 4500 acctgagact cattgactgg caagatgtcc ccagaggctc tcattcagca ataaaattct 4560 caccttcacc caggcccact gagtgtcaga tttgcatgca ctagttcacg tgtgtaaaaa 4620 ggaggatgct tctttccttt gtattctcac atacctttag gaaagaactt agcacccttc 4680 ccacacagcc atcccaataa ctcatttcag tgactcaacc cttgacttta taaaagtctt 4740 gggcagtata gagcagagat taagagtaca gatgctggag ccagaccacc tgagtgatta 4800 gtgactcagt ttctcttagt agttgtatga ctcagtttct tcatctgtaa aatggagggt 4860 tttttaatta gtttgttttt gagaaagggt ctcactctgt cacccaaatg ggagtgtagt 4920 ggcaaaatct cggctcactg caacttgcac ttcccaggct caagcggtcc tcccacctca 4980 acatcctgag tagctggaac cacaggtaca caccaccata cctcgctaat tttttgtatt 5040 tttggtagag atggggtttc acatgttaca caggatggtc tcagactccg gagctcaagc 5100 aatctgccca cctcagcctt ccaaagtgct gggattataa gcatgattac aggagtttta 5160 acaggctcat aagattgttc tgcagcccga gtgagttaat acatgcaaag agtttaaagc 5220 agtgacttat aaatgctaac tactctagaa atgtttgcta gtattttttg tttaactgca 5280 atcattcttg ctgcaggtga aaactagtgt tctgtacttt atgcccattc atctttaact 5340 gtaataataa aaataactga catttattga aggctatcag agactgtaat tagtgctttg 5400 cataattaat catatttaat actcttggat tctttcaggt agatactatt attatcccca 5460 ttttactaca gttaaaaaaa ctacctctca acttgctcaa gcatacactc tcacacacac 5520 aaacataaac tactagcaaa tagtagaatt gagatttggt cctaattatg tctttgctca 5580 ctatccaata aatatttatt gacatgtact tcttggcagt ctgtatgctg gatgctgggg 5640 atacaaagat gtttaaattt aagctccagt ctctgcttcc aaaggcctcc caggccaagt 5700 tatccattca gaaagcattt tttactcttt gcattccact gtttttccta agtgactaaa 5760 aaattacact ttattcgtct gtgtcctgct ctgggatgat agtctgactt tcctaacctg 5820 agcctaacat ccctgacatc aggaaagact acaccatgtg gagaaggggt ggtggttttg 5880 attgctgctg tcttcagtta gatggttaac tttgtgaagt tgaaaactgt ggctctctgg 5940 ttgactgtta gagttctggc acttgtcact atgcctatta tttaacaaat gcatgaatgc 6000 ttcagaatat gggaatatta tcttctggaa tagggaatca agttatatta tgtaacccag 6060 gattagaaga ttcttctgtg tgtaagaatt tcataaacat taagctgtct agcaaaagca 6120 agggcttgga aaatctgtga gctcctcacc atatagaaag cttttaaccc atcattgaat 6180 aaatccctat aggggatttc taccctgagc aaaaggctgg tcttgattaa ttcccaaact 6240 catatagctc tgagaaagtc tatgctgtta acgttttctt gtctgctacc ccatcatatg 6300 cacaacaata aatgcaggcc taggcatgac tgaaggctct ctcataattc ttggttgcat 6360 gaatcagatt atcaacagaa atgttgagac aaactatggg gaagcagggt atgaaagagc 6420 tctgaatgaa atggaaaccg caatgcttcc tgcccattca gggctccagc atgtagaaat 6480 ctggggcttt gtgaagactg gcttaaaatc agaagcccca ttggataaga gtagggaaga 6540 acctagagcc tacgctgagc aggtttcctt catgtgacag ggagcctcct gccccgaact 6600 tccagggatc ctctcttaag tgtttcctgc tggaatctcc tcacttctat ctggaaatgg 6660 tttctccaca gtccagcccc tggctagttg aaagagttac ccatgcagag gccctcctag 6720 catccagaga ctagtgctta gattcctact ttcagcgttg gacaacctgg atccacttgc 6780 ccagtgttct tccttagttc ctaccttcga ccttgatcct cctttatctt cctgaaccct 6840 gctgagatga tctatgtggg gagaatggct tctttgagaa acatcttctt cgttagtggc 6900 ctgcccctca ttcccacttt aatatccaga atcactataa gaagaatata ataagaggaa 6960 taactcttat tataggtaag ggaaaattaa gaggcatacg tgatgggatg agtaagagag 7020 gagagggaag gattaatgga cgataaaatc tactactatt tgttgagacc ttttatagtc 7080 taatcaattt tgctattgtt ttccatcctc acgctaactc cataaaaaaa cactattatt 7140 atctttattt tgccatgaca agactgagct cagaagagtc aagcatttgc ctaaggtcgg 7200 acatgtcaga ggcagtgcca gacctatgtg agactctgca gctactgctc atgggccctg 7260 tgctgcactg atgaggagga tcagatggat ggggcaatga agcaaaggaa tcattctgtg 7320 gataaaggag acagccatga agaagtctat gactgtaaat ttgggagcag gagtctctaa 7380 ggacttggat ttcaaggaat tttgactcag caaacacaag accctcacgg tgactttgcg 7440 agctggtgtg ccagatgtgt ctatcagagg ttccagggag ggtggggtgg ggtcagggct 7500 ggccaccagc tatcagggcc cagatgggtt ataggctggc aggctcagat aggtggttag 7560 gtcaggttgg tggtgctggg tggagtccat gactcccagg agccaggaga gatagaccat 7620 gagtagaggg cagacatggg aaaggtgggg gaggcacagc atagcagcat ttttcattct 7680 actactacat gggactgctc ccctataccc ccagctaggg gcaagtgcct tgactcctat 7740 gttttcagga tcatcatcta taaagtaaga gtaataattg tgtctatctc atagggttat 7800 tatgaggatc aaaggagatg cacactctct ggaccagtgg cctaacagtt caggacagag 7860 ctatgggctt cctatgtatg ggtcagtggt ctcaatgtag caggcaagtt ccagaagata 7920 gcatcaacca ctgttagaga tatactgcca gtctcagagc ctgatgttaa tttagcaatg 7980 ggctgggacc ctcctccagt agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca 8040 gctggttaga ctttttttaa tgaaagctta gctttcatta aagattaagc tcctaagcag 8100 ggcacagatg aaattgtcta acagcaactt tgccatctaa aaaaatctga cttcactgga 8160 aacatggaag cccaaggttc tgaacatgag aaatttttag gaatctgcac aggagttgag 8220 agggaaacaa gatggtgaag ggactagaaa ccacatgaga gacacgagga aatagtgtag 8280 atttaggctg gaggtaaatg aaagagaagt gggaattaat acttactgaa atctttctat 8340 atgtcaggtg ccattttatg atatttaata atctcattac atatggtaat tctgtgagat 8400 atgtattatt gaacatacta taattaatac taatgataag taacacctct tgagtactta 8460 gtatatgcta gaatcaaatt taagtttatc atatgaggcc gggcacggtg gctcatatat 8520 gggattacat gcctgtaatc ccagcacttt gggaggccaa ggcaattgga tcacctgagg 8580 tcaggagttc cagaccagcc tggccaacat ggtgaaaccc cttctctact aaaaaataca 8640 aaaaatcagc caggtgtggt ggcacgcgtc tataatccca gctactcagg aggctgaggc 8700 aggagaatca cttgaaccca ggaggtggag gttgcagtga gctaagattg caccactgca 8760 ctccagccta ggcgacagag tgagactcca tctcaaaaaa aaaaaaagaa gtttattata 8820 tgaattaact tagttttact cacaccaata ctcagaagta gattattacc tcatttattg 8880 atgaggagcc caatgtactt gtagtgtaga tcaacttatt gaaagcacaa gctaataagt 8940 agacaattag taattagaag tcagatggtc tgagctctcc tactgtctac attacatgag 9000 ctcttattaa ctggggactc gaaaatcaaa gacatgaaat aatttgtcca agcttacaga 9060 accaccaagt agtaaggcta ggatgtagac ccagttctgc tacctctgaa gacagtgttt 9120 tttccacagc aaaacacaaa ctcagatatt gtggatgcga gaaattagaa gtagatattc 9180 ctgccctgtg gcccttgctt cttactttta cttcttgtcg attggaagtt gtggtccaag 9240 ccacagttgc agaccatact tcctcaacca taattgcatt tcttcaggaa agtttgaggg 9300 agaaaaaggt aaagaaaaat ttagaaacaa cttcagaata aagagatttt ctcttgggtt 9360 acagagattg tcatatgaca aattataagc agacacttga gaaaactgaa ggcccatgcc 9420 tgcccaaatt accctttgac cccttggtca agctgcaact ttggttaaag ggagtgttta 9480 tgtgttatag tgttcattta ctcttctggt ctaacccatt ggctccgtct tcatcctgca 9540 gtgacctcag tgcctcagaa acatacatat gtttgtctag tttaagtttg tgtgaaattc 9600 taactagcgt caagaactga gggccctaaa ctatgctagg aatagtgctg tggtgctgtg 9660 ataggtacac aagaaatgag aagaaactgc agattctctg catctccctt tgccgggtct 9720 gacaacaaag tttccccaaa ttttaccaat gcaagccatt tctccatatg ctaactactt 9780 taaaatcatt tggggcttca cattgtcttt ctcatctgta aaaagaatgg aagaactcat 9840 tcctacagaa ctccctatgt cttccctgat gggctagagt tcctctttct caaaaattag 9900 ccattattgt atttccttct aagccaaagc tcagaggtct tgtattgccc agtgacatgc 9960 acactggtca aaagtaggct aagtagaagg gtactttcac aggaacagag agcaaaagag 10020 gtgggtgaat gagagggtaa gtgagaaaag acaaatgaga agttacaaca tgatggcttg 10080 ttgtctaaat atctcctagg gaattattgt gagaggtctg aatagtgttg taaaataagc 10140 tgaatctgct gccaacatta acagtcaaga aatacctccg aataactgta cctccaatta 10200 ttctttaagg tagcatgcaa ctgtaatagt tgcatgtata tatttatcat aatactgtaa 10260 cagaaaacac ttactgaata tatactgtgt ccctagttct ttacacaata aactaatctc 10320 atcctcataa ttctattagc taatacatat tatcatccta tatttcagag acttcaagaa 10380 gttaagcaac ttgctcaaga tcatctaaga agtaggtggt atttctgggc tcatttggcc 10440 cctcctaatc tctcatggca acatggctgc ctaaagtgtt gattgcctta attcatcagg 10500 gatgggctca tactcactgc agaccttaac tggcatcctc ttttcttatg tgatctgcct 10560 gaccctagta gacttatgaa atttctgatg agaaaggaga gaggagaaag gcagagctga 10620 ctgtgatgag tgatgaaggt gccttctcat ctgggtacca gtggggcctc taagactaag 10680 tcactctgtc tcactgtgtc ttagccagtt ccttacagct tgccctgatg ggagatagag 10740 aatgggtatc ctccaacaaa aaaataaatt ttcatttctc aaggtccaac ttatgttttc 10800 ttaattttta aaaaaatctt gaccattctc cactctctaa aataatccac agtgagagaa 10860 acattctttt cccccatccc ataaatacct ctattaaata tggaaaatct gggcatggtg 10920 tctcacacct gtaatcccag cactttggga ggctgaggtg ggtggactgc ttggagctca 10980 ggagttcaag accatcttgg acaacatggt gataccctgc ctctacaaaa agtacaaaaa 11040 ttagcctggc atggtggtgt gcacctgtaa tcccagctat tagggtggct gaggcaggag 11100 aattgcttga acccgggagg cggaggttgc agtgagctga gatcgtgcca ctgcactcca 11160 gcctggggga cagagcacat tataattaac tgttattttt tacttggact cttgtgggga 11220 ataagataca tgttttattc ttatttatga ttcaagcact gaaaatagtg tttagcatcc 11280 agcaggtgct tcaaaaccat ttgctgaatg attactatac tttttacaag ctcagctccc 11340 tctatccctt ccagcatcct catctctgat taaataagct tcagtttttc cttagttcct 11400 gttacatttc tgtgtgtctc cattagtgac ctcccatagt ccaagcatga gcagttctgg 11460 ccaggcccct gtcggggtca gtgccccacc cccgccttct ggttctgtgt aaccttctaa 11520 gcaaaccttc tggctcaagc acagcaatgc tgagtcatga tgagtcatgc tgaggcttag 11580 ggtgtgtgcc cagatgttct cagcctagag tgatgactcc tatctgggtc cccagcagga 11640 tgcttacagg gcagatggca aaaaaaagga gaagctgacc acctgactaa aactccacct 11700 caaacggcat cataaagaaa atggatgcct gagacagaat gtgacatatt ctagaatata 11760 ttatttcctg aatatatata tatatataca catatacgta tatatatata tatatatata 11820 tttgttgtta tcaattgcca tagaatgatt agttattgtg aatcaaatat ttatcttgca 11880 ggtggcctct atacctagaa gcggcagaat caggctttat taatacatgt gtatagattt 11940 ttaggatcta tacacatgta ttaatatgaa acaaggatat ggaagaggaa ggcatgaaaa 12000 caggaaaaga aaacaaacct tgtttgccat tttaaggcac ccctggacag ctaggtggca 12060 aaaggcctgt gctgttagag gacacatgct cacatacggg gtcagatctg acttggggtg 12120 ctactgggaa gctctcatct taaggataca tctcaggcca gtcttggtgc attaggaaga 12180 tgtaggcaac tctgatcctg agaggaaaga aacattcctc caggagagct aaaagggttc 12240 acctgtgtgg gtaactgtga aggactacaa gaggatgaaa aacaatgaca gacagacata 12300 atgcttgtgg gagaaaaaac aggaggtcaa ggggatagag aaggcttcca gaagaatggc 12360 tttgaagctg gcttctgtag gagttcacag tggcaaagat gtttcagaaa tgtgacatga 12420 cttaaggaac tatacaaaaa ggaacaaatt taaggagagg cagataaatt agttcaacag 12480 acatgcaagg aattttcaga tgaatgttat gtctccactg agcttcttga ggttagcagc 12540 tgtgagggtt ttgcaggccc aggacccatt acaggacctc acgtatactt gacactgttt 12600 tttgtattca tttgtgaatg aatgacctct tgtcagtcta ctcggtttcg ctgtgaatga 12660 atgatgtctt gtcagcctac ttggtttcgc taagagcaca gagagaagat ttagtgatgc 12720 tatgtaaaaa cttccttttt ggttcaagtg tatgtttgtg atagaaatga agacaggcta 12780 catgatgcat atctaacata aacacaaaca ttaagaaagg aaatcaacct gaagagtatt 12840 tatacagata acaaaataca gagagtgagt taaatgtgta ataactgtgg cacaggctgg 12900 aatatgagcc atttaaatca caaattaatt agaaaaaaaa cagtggggaa aaaattccat 12960 ggatgggtct agaaagacta gcattgtttt aggttgagtg gcagtgttta aagggtgata 13020 tcagactaaa cttgaaatat gtggctaaat aactagaata ctctttattt tttcgtatca 13080 tgaatagcag atatagcttg atggccccat gcttggttta acatccttgc tgttcctgac 13140 atgaaatcct taatttttga caaaggggct attcattttc attttatatt gggcctagaa 13200 attatgtaga tggtcctgag gaaaagttta tagcttgtct atttctctct ctaacatagt 13260 tgtcagcaca atgcctaggc tataggaagt actcaaagct tgttaaattg aattctatcc 13320 ttcttattca attctacaca tggaggaaaa actcatcagg gatggaggca cgcctctaag 13380 gaaggcaggt gtggctctgc agtgtgattg ggtacttgca ggacgaaggg tggggtggga 13440 gtggctaacc ttccattcct agtgcagagg tcacagccta aacatcaaat tccttgaggt 13500 gcggtggctc actcctgtaa tcacagcagt ttgggacgcc aaggtgggca gatcacttga 13560 ggtcaggagt tggacaccag cccagccaac atagtgaaac ctggtctctg cttaaaaata 13620 taaaaattag ctggacgtgg tgacgggagc ctgtaatcca actacttggg aggctgaggc 13680 aggagaatcg cttgaaccgg ggaggtggag tttgcactga gcagagatca tgccattgca 13740 ctccagcctc cagagcgaga ctctgtctaa agaaaaacga aaacaaacaa acaaacaaac 13800 aaacaaaacc catcaaattc cctgaccgaa cagaattctg tctgattgtt ctctgactta 13860 tctaccattt tccctcctta aagaaactgt gaacttcctt cagctagagg ggcctggctc 13920 agaagcctct ggtcagcatc caagaaatac ttgatgtcac tttggctaaa ggtatgatgt 13980 gtagacaagc tccagagatg gtttctcatt tccatatcca cccacccagc tttccaattt 14040 taaagccaat tctgaggtag agactgtgat gaacaaacac cttgacaaaa ttcaacccaa 14100 agactcactt tgcctagctt caaaatcctt actctgacat atactcacag ccagaaatta 14160 gcatgcacta gagtgtgcat gagtgcaaca cacacacaca ccaattccat attctctgtc 14220 agaaaatcct gttggttttt cgtgaaagga tgttttcaga ggctgacccc ttgccttcac 14280 ctccaatgct accactctgg tctaagtcac tgtcaccacc acctaaatta tagctgttga 14340 ctcataacaa tcttcctgct tctaccactg ccccactaca atttcttccc aatatactat 14400 ccaaattagt cttttcaaaa tgtaagtcat atatggtcac ctctttgttc aaagtcttct 14460 gatagtttcc tatatcattt ataataaaac caaatcctta caattctcta caatagttgt 14520 tcatgcatat attatgttta ttacagatac atatatatag ctctcatata aataaatata 14580 tatatttatg tgtatgtgtg tagagtgttt tttcttacaa ctctatgatg taggtattat 14640 tagtgtccca aattttataa tttaggactt ctatgatctc atcttttatt ctccccttca 14700 ccgaatctca tcctacattg gccttattga tattccttga aaattctaag catcttacat 14760 ctttagggta tttacatttg ccattcccta tgccctaaat atttaatcat agtttcatat 14820 aaatgggttc ctcatcatct atgggtactc tctcaggtgt taactttata gtgaggactt 14880 tcctgccata ctacttaaag tagcgatacc ctttcaccct gtcctaatca cactctggcc 14940 ttcatttcag tttttttttt ttctccatag cacctaatct cattggtata taacatgttt 15000 catttgctta tttaatgtca agctctttcc actatcaagt ccatgaaaac aggaacttta 15060 ttcctctatt ctgtttttgt gctgtattct tagcaatttt acaattttga atgaatgaat 15120 gagcagtcaa acacatatac aactataatt aaaaggatgt atgctgacac atccactgct 15180 atgcacacac aaagaaatca gtggagtaga gctggaagtg ctaagcctgc atagagctag 15240 ttagccctcc gcaggcagag ccttgatggg attactgagt tctagaattg gactcatttg 15300 ttttgtaggc tgagatttgc tcttgaaaac ttgttctgac caaaataaaa ggctcaaaag 15360 atgaatatcg aaaccagggt gttttttaca ctggaattta taactagagc actcatgttt 15420 atgtaagcaa ttaattgttt catcagtcag gtaaaagtaa agaaaaactg tgccaaggca 15480 ggtagcctaa tgcaatatgc cactaaagta aacattattt cataggtgtc agatatggct 15540 tattcatcca tcttcatggg aaggatggcc ttggcctgga catcagtgtt atgtgaggtt 15600 caaaacacct ctaggctata aggcaacaga gctccttttt tttttttctg tgctttcctg 15660 gctgtccaaa tctctaatga taagcatact tctattcaat gagaatattc tgtaagatta 15720 tagttaagaa ttgtgggagc cattccgtct cttatagtta aatttgagct tcttttatga 15780 tcactgtttt tttaatatgc tttaagttct ggggtacatg tgccatggtg gtttgctgca 15840 cccatcaacc cgtcatctac attaggtatt tctcctaatg ctatccttcc cctagccccc 15900 cacccccaac aggccccagt gtgtgatgtt cccctccctg tgtccatgga tcactggttt 15960 ttttttgttt tttttttttt tttaaagtct cagttaaatt tttggaatgt aatttatttt 16020 cctggtatcc taggacttgc aagttatctg gtcactttag ccctcacgtt ttgatgataa 16080 tcacatattt gtaaacacaa cacacacaca cacacacaca cacatatata tatatataaa 16140 acatatatat acataaacac acataacata tttatcgggc atttctgagc aactaatcat 16200 gcaggactct caaacactaa cctatagcct tttctatgta tctacttgtg tagaaaccaa 16260 gcgtggggac tgagaaggca atagcaggag cattctgact ctcactgcct ttagctaggc 16320 ccctccctca tcacagctca gcatagtcct gagctcttat ctatatccac acacagtttc 16380 tgacgctgcc cagctatcac catcccaagt ctaaagaaaa aaataatggg tttgcccatc 16440 tctgttgatt agaaaacaaa acaaaataaa ataagcccct aagctcccag aaaacatgac 16500 taaaccagca agaagaagaa aatacaatag gtatatgagg agactggtga cactagtgtc 16560 tgaatgaggc ttgagtacag aaaagaggct ctagcagcat agtggtttag aggagatgtt 16620 tctttccttc acagatgcct tagcctcaat aagcttgcgg ttgtggaagt ttactttcag 16680 aacaaactcc tgtggggcta gaattattga tggctaaaag aagcccgggg gagggaaaaa 16740 tcattcagca tcctcaccct tagtgacaca aaacagaggg ggcctggttt tccatatttc 16800 ctcatgatgg atgatctcgt taatgaaggt ggtctgacga gatcattgct tcttccattt 16860 aagccttgct cacttgccaa tcctcagttt taaccttctc cagagaaata cacatttttt 16920 attcaggaaa catactatgt tatagtttca atactaaata atcaaagtac tgaagatagc 16980 atgcataggc aagaaaaagt ccttagcttt atgttgctgt tgtttcagaa tttaaaaaag 17040 atcaccaagt caaggacttc tcagttctag cactagaggt ggaatcttag catataatca 17100 gaggtttttc aaaatttcta gacataagat tcaaagccct gcacttaaaa tagtctcatt 17160 tgaattaact ctttatataa attgaaagca cattctgaac tacttcagag tattgtttta 17220 tttctatgtt cttagttcat aaatacatta ggcaatgcaa tttaattaaa aaaacccaag 17280 aatttcttag aattttaatc atgaaaataa atgaaggcat ctttacttac tcaaggtccc 17340 aaaaggtcaa agaaaccagg aaagtaaagc tatatttcag cggaaaatgg gatatttatg 17400 agttttctaa gttgacagac tcaagtttta accttcagtg cccatcatgt aggaaagtgt 17460 ggcataactg gctgattctg gctttctact cctttttccc attaaagatc cctcctgctt 17520 aattaacatt cacaagtaac tctggttgta ctttaggcac agtggctccc gaggtcagtc 17580 acacaatagg atgtctgtgc tccaagttgc cagagagaga gattactctt gagaatgagc 17640 ctcagccctg gctcaaactc acctgcaaac ttcgtgagag atgaggcaga ggtacactac 17700 gaaagcaaca gttagaagct aaatgatgag aacacatgga ctcatagagg gaaacaacgc 17760 atactggggc ctatcagagg gtggagggtg agagaaggag aggatcagga aaaatcacta 17820 atggatgcta agcgtaatac ctgagtgatg agatcatcta tacaacaaac ccccttgaca 17880 ttcatttatc tatgtaacaa acctgcacat cctgtacatg tacccctgaa cttaaaataa 17940 aagttgaaaa caagaaagca acagtttgaa cacttgttat ggtctattct ctcattcttt 18000 acaattacac tagaaaatag ccacaggctt cctgcaaggc agccacagaa tttatgactt 18060 gtgatatcca agtcattcct ggataatgca aaatctaaca caaaatctag tagaatcatt 18120 tgcttacatc tatttttgtt ctgagaatat agatttagat acataatgga agcagaataa 18180 tttaaaatct ggctaattta gaatcctaag cagctctttt cctatcagtg gtttacaagc 18240 cttgtttata tttttcctat tttaaaaata aaaataaagt aagttatttg tggtaaagaa 18300 tattcattaa agtatttatt tcttagataa taccatgaaa aacattcagt gaagtgaagg 18360 gcctacttta cttaacaaga atctaattta tataattttt catactaata gcatctaaga 18420 acagtacaat atttgactct tcaggttaaa catatgtcat aaattagcca gaaagattta 18480 agaaaatatt ggatgtttcc ttgtttaaat taggcatctt acagttttta gaatcctgca 18540 tagaacttaa gaaattacaa atgctaaagc aaacccaaac aggcaggaat taatcttcat 18600 cgaatttggg tgtttctttc taaaagtcct ttatacttaa atgtcttaag acatacatag 18660 attttatttt actaatttta attatataga caataaatga atattcttac tgattacttt 18720 ttctgactgt ctaatctttc tgatctatcc tggatggcca taacacttat ctctctgaac 18780 tttgggcttt taatatagga aagaaaagca ataatccatt tttcatggta tctcatatga 18840 taaacaaata aaatgcttaa aaatgagcag gtgaagcaat ttatcttgaa ccaacaagca 18900 tcgaagcaat aatgagactg cccgcagcct acctgacttc tgagtcagga tttataagcc 18960 ttgttactga gacacaaacc tgggcctttc aatgctataa cctttcttga agctcctccc 19020 taccaccttt agccataagg aaacatggaa tgggtcagat ccctggatgc aagccaggtc 19080 tggaaccata ggcagtaagg agagaagaaa atgtgggctc tgcaactggc tccgagggag 19140 caggagagga tcaaccccat actctgaatc taagagaaga ctggtgtcca tactctgaat 19200 gggaagaatg atgggattac ccatagggct tgttttaggg agaaacctgt tctccaaact 19260 cttggccttg agatacctgg tccttattcc ttggactttg gcaatgtctg accctcacat 19320 tcaagttctg aggaagggcc actgccttca tactgtggat ctgtagcaaa ttccccctga 19380 aaacccagag ctgtatctta attggttaaa aaaaattata ttatctcaac gactgttctt 19440 ctctgagtag ccaagctcag cttggttcaa gctacaagca gctgagctgc tttttgtcta 19500 gtcattgttc ttttatttca gtggatcaaa tacgttcttt ccaaacctag gatcttgtct 19560 tcctaggcta tatattttgt cccaggaagt cttaatctgg ggtccacaga acactagggg 19620 gctggtgaag tttatagaaa aaaaatctgt atttttactt acatgtaact gaaatttagc 19680 attttcttct actttgaatg caaaggacaa actagaatga catcatcagt acctattgca 19740 tagttataaa gagaaaccac agatattttc atactacacc ataggtattg cagatctttt 19800 tgtttttgtt tttgtttgag atggagtttc gctcttattg cccaggctgg agtgcagtgg 19860 catgatttcg gctcactgca acctcccctt cctgcattca agcaattctc ctgccttggc 19920 ctcctgagta gctggggatt acaggcacct gccaccatgc cagtctaatt tttgtatttt 19980 tagtagagat ggggtttcgc catgttggcc aggctggtct tgaactcctg acctcagatg 20040 atctgcccgc cttggcctcc tgaagtgctg ggattatagg tgtgagccac cacgcctggc 20100 ccattgcaga tatttttaat tcacatttat ctgcatcact acttggatct taaggtagct 20160 gtagacccaa tcctagatct aatgctttca taaagaagca aatataataa atactatacc 20220 acaaatgtaa tgtttgatgt ctgataatga tatttcagtg taattaaact tagcactcct 20280 atgtatatta tttgatgcaa taaaaacata tttttttagc acttacagtc tgccaaactg 20340 gcctgtgaca caaaaaaagt ttaggaattc ctggttttgt ctgtgttagc caatggttag 20400 aatatatgct cagaaagata ccattggtta atagctaaaa gaaaatggag tagaaattca 20460 gtggcctgga ataataacaa tttgggcagt cattaagtca ggtgaagact tctggaatca 20520 tgggagaaaa gcaagggaga cattcttact tgccacaagt gttttttttt tttttttttt 20580 ttatcacaaa cataagaaaa tataataaat aacaaagtca ggttatagaa gagagaaacg 20640 ctcttagtaa acttggaata tggaatcccc aaaggcactt gacttgggag acaggagcca 20700 tactgctaag tgaaaaagac gaagaacctc tagggcctga acatacagga aattgtagga 20760 acagaaattc ctagatctgg tggggcaagg ggagccatag gagaaagaaa tggtagaaat 20820 ggatggagac ggaggcagag gtgggcagat catgaggtca agagatcgag accatcctgg 20880 caaacatggt gaaatcccgt ctctactaaa aataaaaaaa ttagctgggc atggtggcat 20940 gcgcctgtag tcccagctgc tcgggaggct gaggcaggag aatcgtttga acccaggagg 21000 cgaaggttgc agtgagctga gatagtgcca ttgcactcca gtctggcaac agagtgagac 21060 tccgtctcaa aaaaaaaaaa aaaagaaaga aagaaaagaa aaagaaaaaa gaaaaaataa 21120 atggatgtag aacaagccag aaggaggaac tgggctgggg caatgagatt atggtgatgt 21180 aagggacttt tatagaatta acaatgctgg aatttgtgga actctgcttc tattattccc 21240 ccaatcatta cttctgtcac attgatagtt aaataatttc tgtgaattta ttccttgatt 21300 ctaaaatatg aggataatga caatggtatt ataagggcag attaagtgat atagcatgag 21360 caatattctt caggcacatg gatcgaattg aatacactgt aaatcccaac ttccagtttc 21420 agctctacca agtaaagagc tagcaagtca tcaaaatggg gacatacaga aaaaaaaaag 21480 gacactagag gaataatata ccctgactcc tagcctgatt aatatatcga t 21531 <210> 7 <211> 1614 <212> DNA <213> Homo sapiens <400> 7 gatctctatt tatttagcaa taatagagaa agcatttaag agaataaagc aatggaaata 60 agaaatttgt aaatttcctt ctgataacta gaaatagagg atccagtttc ttttggttaa 120 cctaaatttt atttcatttt attgttttat tttattttat tttattttat tttgtgtaat 180 cgtagtttca gagtgttaga gctgaaagga agaagtagga gaaacatgca aagtaaaagt 240 ataacacttt ccttactaaa ccgacatggg tttccaggta ggggcaggat tcaggatgac 300 tgacagggcc cttagggaac actgagaccc tacgctgacc tcataaatgc ttgctacctt 360 tgctgtttta attacatctt ttaatagcag gaagcagaac tctgcacttc aaaagttttt 420 cctcacctga ggagttaatt tagtacaagg ggaaaaagta cagggggatg ggagaaaggc 480 gatcacgttg ggaagctata gagaaagaag agtaaatttt agtaaaggag gtttaaacaa 540 acaaaatata aagagaaata ggaacttgaa tcaaggaaat gattttaaaa cgcagtattc 600 ttagtggact agaggaaaaa aataatctga gccaagtaga agaccttttc ccctcctacc 660 cctactttct aagtcacaga ggctttttgt tcccccagac actcttgcag attagtccag 720 gcagaaacag ttagatgtcc ccagttaacc tcctatttga caccactgat taccccattg 780 atagtcacac tttgggttgt aagtgacttt ttatttattt gtatttttga ctgcattaag 840 aggtctctag ttttttatct cttgtttccc aaaacctaat aagtaactaa tgcacagagc 900 acattgattt gtatttattc tatttttaga cataatttat tagcatgcat gagcaaatta 960 agaaaaacaa caacaaatga atgcatatat atgtatatgt atgtgtgtat atatacacac 1020 atatatatat atattttttc ttttcttacc agaaggtttt aatccaaata aggagaagat 1080 atgcttagaa ccgaggtaga gttttcatcc attctgtcct gtaagtattt tgcatattct 1140 ggagacgcag gaagagatcc atctacatat cccaaagctg aattatggta gacaaaactc 1200 ttccactttt agtgcatcaa cttcttattt gtgtaataag aaaattggga aaacgatctt 1260 caatatgctt accaagctgt gattccaaat attacgtaaa tacacttgca aaggaggatg 1320 tttttagtag caatttgtac tgatggtatg gggccaagag atatatctta gagggagggc 1380 tgagggtttg aagtccaact cctaagccag tgccagaaga gccaaggaca ggtacggctg 1440 tcatcactta gacctcaccc tgtggagcca caccctaggg ttggccaatc tactcccagg 1500 agcagggagg gcaggagcca gggctgggca taaaagtcag ggcagagcca tctattgctt 1560 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atgg 1614 <210> 8 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 8 Lys Ala Ser Gln Asp Val Ser Ile Gly Val Ala 1 5 10 <210> 9 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 9 Ala Ser Tyr Arg Tyr Thr 1 5 <210> 10 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 10 Gln Gln Tyr Tyr Ile Tyr Pro Tyr Thr 1 5 <210> 11 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 11 Gly Phe Thr Phe Thr Asp Tyr Thr Met Asp 1 5 10 <210> 12 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 12 Asp Val Asn Pro Asn Ser Gly Gly Ser Ile Tyr Asn Gln Arg Phe Lys 1 5 10 15 <210> 13 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Her2-specific CDR <400> 13 Leu Gly Pro Ser Phe Tyr Phe Asp Tyr 1 5 <210> 14 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 14 Arg Ala Ser Lys Gly Val Ser Thr Ser Gly Tyr Ser Tyr Leu His 1 5 10 15 <210> 15 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 15 Leu Ala Ser Tyr Leu Glu Ser 1 5 <210> 16 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 16 Gln His Ser Arg Asp Leu Pro Leu Thr 1 5 <210> 17 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 17 Asn Tyr Tyr Met Tyr 1 5 <210> 18 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 18 Gly Ile Asn Pro Ser Asn Gly Gly Thr Asn Phe Asn Glu Lys Phe Lys 1 5 10 15 Asn <210> 19 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDR <400> 19 Arg Asp Tyr Arg Phe Asp Met Gly Phe Asp Tyr 1 5 10 <210> 20 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific variable heavy chain <400> 20 Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr 20 25 30 Ile Met Met Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 21 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific variable light chain <400> 21 Gln Ser Ala Leu Thr Gln Pro Ala Ser Val Ser Gly Ser Pro Gly Gln 1 5 10 15 Ser Ile Thr Ile Ser Cys Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr 20 25 30 Asn Tyr Val Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu 35 40 45 Met Ile Tyr Asp Val Ser Asn Arg Pro Ser Gly Val Ser Asn Arg Phe 50 55 60 Ser Gly Ser Lys Ser Gly Asn Thr Ala Ser Leu Thr Ile Ser Gly Leu 65 70 75 80 Gln Ala Glu Asp Glu Ala Asp Tyr Tyr Cys Ser Ser Tyr Thr Ser Ser 85 90 95 Ser Thr Arg Val Phe Gly Thr Gly Thr Lys Val Thr Val Leu 100 105 110 <210> 22 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 22 Ser Gly Phe Thr Phe Ser Ser Tyr Ile Met Met 1 5 10 <210> 23 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 23 Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val Lys 1 5 10 15 Gly <210> 24 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 24 Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr 1 5 10 <210> 25 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 25 Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr Asn Tyr Val Ser 1 5 10 <210> 26 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 26 Asp Val Ser Asn Arg Pro Ser 1 5 <210> 27 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDR <400> 27 Ser Ser Tyr Thr Ser Ser Ser Thr Arg Val 1 5 10 <210> 28 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific variable heavy chain <400> 28 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asp Ser 20 25 30 Trp Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Arg His Trp Pro Gly Gly Phe Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr Val Ser Ser 115 <210> 29 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific variable light chain <400> 29 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Ser Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Leu Tyr His Pro Ala 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 30 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 30 Ser Gly Phe Thr Phe Ser Asp Ser Trp Ile His 1 5 10 <210> 31 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 31 Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val Lys 1 5 10 15 Gly <210> 32 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 32 Arg His Trp Pro Gly Gly Phe Asp Tyr 1 5 <210> 33 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 33 Arg Ala Ser Gln Asp Val Ser Thr Ala Val Ala 1 5 10 <210> 34 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 34 Ser Ala Ser Phe Leu Tyr Ser 1 5 <210> 35 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDR <400> 35 Gln Gln Tyr Leu Tyr His Pro Ala Thr 1 5 <210> 36 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 36 Lys Ala Ser Gln Asp Val Gly Thr Ala Val Asp 1 5 10 <210> 37 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 37 Trp Ala Ser Thr Arg His Thr 1 5 <210> 38 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 38 Gln Gln Tyr Asn Ser Tyr Pro Leu Thr 1 5 <210> 39 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 39 Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His 1 5 10 <210> 40 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 40 Asn Ile Asn Pro Asn Asn Gly Gly Thr Thr Tyr Asn Gln Lys Phe Glu 1 5 10 15 Asp <210> 41 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific-CDR <400> 41 Gly Trp Asn Phe Asp Tyr 1 5 <210> 42 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific-CDR <400> 42 Ser Glu Asp Ile Tyr Ser Gly 1 5 <210> 43 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific-CDR <400> 43 Gly Tyr Ser Tyr Ser Ser Thr Leu 1 5 <210> 44 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific-CDR <400> 44 Thr Leu Gly Met Gly Val Gly 1 5 <210> 45 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific-CDR <400> 45 His Ile Trp Trp Asp Asp Asp Lys Tyr Tyr Asn Pro Ala Leu Lys Ser 1 5 10 15 <210> 46 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific-CDR <400> 46 Ile Gly Thr Ala Gln Ala Thr Asp Ala Leu Asp Tyr 1 5 10 <210> 47 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 47 Lys Ala Ser Gln Ser Val Ser Phe Ala Gly Thr Ser Leu Met His 1 5 10 15 <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 48 Arg Ala Ser Asn Leu Glu Ala 1 5 <210> 49 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 49 Gln Gln Ser Arg Glu Tyr Pro Tyr Thr 1 5 <210> 50 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 50 Gly Tyr Phe Met Asn 1 5 <210> 51 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 51 Arg Ile His Pro Tyr Asp Gly Asp Thr Phe Tyr Asn Gln Lys Phe Gln 1 5 10 15 Gly <210> 52 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific-CDR <400> 52 Tyr Asp Gly Ser Arg Ala Met Asp Tyr 1 5 <210> 53 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific variable heavy chain <400> 53 Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr 20 25 30 Thr Met Asn Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile 35 40 45 Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe 50 55 60 Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Ser Gly 100 105 110 Thr Pro Val Thr Val Ser Ser 115 <210> 54 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific variable light chain <400> 54 Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Tyr 35 40 45 Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu 65 70 75 80 Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Lys His Pro Leu Thr 85 90 95 Phe Gly Ser Gly Thr Lys Val Glu Ile Lys 100 105 <210> 55 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 55 Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn 1 5 10 <210> 56 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 56 Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln 1 5 10 <210> 57 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 57 Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr 1 5 10 <210> 58 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 58 Ser Ala Ser Ser Ser Val Ser Tyr Met His 1 5 10 <210> 59 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 59 Asp Thr Ser Lys Leu Ala Ser 1 5 <210> 60 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDR <400> 60 Gln Gln Trp Ser Lys His Pro Leu Thr 1 5 <210> 61 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Nef <400> 61 Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr 1 5 10 15 Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu 20 25 30 <210> 62 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Nef <400> 62 His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro 1 5 10 15 Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu 20 25 30 <210> 63 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Gag p17 <400> 63 Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys 1 5 10 15 His Ile Val <210> 64 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Gag p17-p24 <400> 64 Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu 1 5 10 15 Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp 20 25 30 <210> 65 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Pol <400> 65 Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys 1 5 10 15 Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr 20 25 30 <210> 66 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 66 acttaagtgt atgtaaactt ccgacttcaa ctgtagggta cctgattctc tgggcatctc 60 tgcccactac catg 74 <210> 67 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 67 acttaagtgt atgtaaactt ccgacttcaa ctgtaaattt tccacctttt tcagttttcc 60 tcgccatatt tcatg 75 <210> 68 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 68 acttaagtgt atgtaaactt ccgacttcaa ctg 33 <210> 69 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 69 cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60 gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120 atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180 aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtaaga 240 atggcccatt catctatagt agcacacaat atttgcattt gtgcgacagt ataagggaca 300 attatgctat caggcatttt tccaaagtga gtaatcgaag tttttatacc tttgtgtgcc 360 atgtttgcta 370 <210> 70 <211> 369 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 70 cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60 gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120 atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180 aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtacaa 240 gtagaccaaa tatccatata cataaaagaa aaaaatagaa aaaatttcta gtgacagaaa 300 aatgacaaag aacatactgc tttattacta ctattaagat gtttgcttcc attacactca 360 tatgagtca 369 <210> 71 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> IR/DR of Sleeping Beauty <400> 71 ttagtgtatg taaacttctg acccactgga attgtgatac agtgaattat aagtgaaata 60 atctgtctgt aaacaattgt tggaaaaatg acttgtgtca tgcacaaagt agatgtccta 120 actgacttgc caaaactatt gtttgttaac aagaaatttg tggagtagtt gaaaaacgag 180 ttttaatgac tccaacttaa gtgtatgtaa acttccgact tcaactg 227 <210> 72 <211> 371 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence of Sleeping Beauty <400> 72 caacttgagt gtatgttaac ttctgaccca ctgggaatgt gatgaaagaa ataaaagctg 60 aaatgaatca ttctctctac tattattctg atatttcaca ttcttaaaat aaagtggtga 120 tcctaactga ccttaagaca gggaatcttt actcggatta aatgtcagga attgtgaaaa 180 agtgagttta aatgtatttg gctaaggtgt atgtaaactt ccgacttcaa ctgtatatcc 240 tccccgttgc accctcttga tgatgctgag atgaacacag atgctcactc cttgagggct 300 ctaagcttat gctgacacag acacaggtgc tcacttctat gaatggccta agatttgagg 360 acatcatgag g 371 <210> 73 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> IR/DR of Sleeping Beauty <400> 73 ttgagtgtat gttaacttct gacccactgg gaatgtgatg aaagaaataa aagctgaaat 60 gaatcattct ctctactatt attctgatat ttcacattct taaaataaag tggtgatcct 120 aactgacctt aagacaggga atctttactc ggattaaatg tcaggaattg tgaaaaagtg 180 agtttaaatg tatttggcta aggtgtatgt aaacttccga cttcaactg 229 <210> 74 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Sleeping Beauty transposase enzyme <400> 74 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Lys Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 75 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Hyperactive Sleeping Beauty is SB100X <400> 75 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Ala Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 76 <211> 594 <212> PRT <213> Richoplusia ni <400> 76 Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln 1 5 10 15 Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp 20 25 30 His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile 35 40 45 Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu 50 55 60 Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn 65 70 75 80 Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His 85 90 95 Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu 100 105 110 Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile 115 120 125 Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile 130 135 140 Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg 145 150 155 160 Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile 165 170 175 Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn 180 185 190 His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr 195 200 205 Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu 210 215 220 Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val 225 230 235 240 Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile 245 250 255 Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu 260 265 270 Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro 275 280 285 Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys 290 295 300 Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn 305 310 315 320 Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val 325 330 335 His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile 340 345 350 Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val 355 360 365 Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn 370 375 380 Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro 385 390 395 400 Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu 405 410 415 Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys 420 425 430 Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr 435 440 445 Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg 450 455 460 Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn 465 470 475 480 Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val 485 490 495 Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser 500 505 510 Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu 515 520 525 Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser 530 535 540 Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr 545 550 555 560 Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys 565 570 575 Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser 580 585 590 Cys Phe <210> 77 <211> 340 <212> PRT <213> Rana pipiens <400> 77 Met Pro Arg Pro Lys Glu Ile Gln Glu Gln Leu Arg Lys Lys Val Ile 1 5 10 15 Glu Ile Tyr Gln Ser Gly Lys Gly Tyr Lys Ala Ile Ser Lys Ala Leu 20 25 30 Gly Ile Gln Arg Thr Thr Val Arg Ala Ile Ile His Lys Trp Arg Arg 35 40 45 His Gly Thr Val Val Asn Leu Pro Arg Ser Gly Arg Pro Pro Lys Ile 50 55 60 Thr Pro Arg Ala Gln Arg Arg Leu Ile Gln Glu Val Thr Lys Asp Pro 65 70 75 80 Thr Thr Thr Ser Lys Glu Leu Gln Ala Ser Leu Ala Ser Val Lys Val 85 90 95 Ser Val His Ala Ser Thr Ile Arg Lys Arg Leu Gly Lys Asn Gly Leu 100 105 110 His Gly Arg Val Pro Arg Arg Lys Pro Leu Leu Ser Lys Lys Asn Ile 115 120 125 Lys Ala Arg Leu Asn Phe Ser Thr Thr His Leu Asp Asp Pro Gln Asp 130 135 140 Phe Trp Asp Asn Ile Leu Trp Thr Asp Glu Thr Lys Val Glu Leu Phe 145 150 155 160 Gly Arg Cys Val Ser Lys Tyr Ile Trp Arg Arg Arg Asn Thr Ala Phe 165 170 175 His Lys Lys Asn Ile Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Val 180 185 190 Met Val Trp Gly Cys Phe Ala Ala Ser Gly Pro Gly Arg Leu Ala Val 195 200 205 Ile Lys Gly Thr Met Asn Ser Ala Val Tyr Gln Glu Ile Leu Lys Glu 210 215 220 Asn Val Arg Pro Ser Val Arg Val Leu Lys Leu Lys Arg Thr Trp Val 225 230 235 240 Leu Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Thr Glu 245 250 255 Trp Leu Lys Lys Asn Lys Met Lys Thr Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Met Leu Trp Tyr Asp Leu Lys Lys Ala 275 280 285 Val His Ala Arg Lys Pro Ser Asn Val Thr Glu Leu Gly Gln Phe Cys 290 295 300 Lys Asp Glu Trp Ala Lys Ile Pro Pro Gly Arg Cys Lys Ser Leu Ile 305 310 315 320 Ala Arg Tyr Arg Lys Arg Leu Val Ala Val Val Ala Ala Lys Gly Gly 325 330 335 Pro Thr Ser Tyr 340 <210> 78 <211> 636 <212> PRT <213> Tribolium castaneum <400> 78 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 79 <211> 649 <212> PRT <213> Oryzias latipes <400> 79 Met Glu Glu Val Cys Asp Ser Ser Ala Ala Ala Ser Ser Thr Val Gln 1 5 10 15 Asn Gln Pro Gln Asp Gln Glu His Pro Trp Pro Tyr Leu Arg Glu Phe 20 25 30 Phe Ser Leu Ser Gly Val Asn Lys Asp Ser Phe Lys Met Lys Cys Val 35 40 45 Leu Cys Leu Pro Leu Asn Lys Glu Ile Ser Ala Phe Lys Ser Ser Pro 50 55 60 Ser Asn Leu Arg Lys His Ile Glu Arg Met His Pro Asn Tyr Leu Lys 65 70 75 80 Asn Tyr Ser Lys Leu Thr Ala Gln Lys Arg Lys Ile Gly Thr Ser Thr 85 90 95 His Ala Ser Ser Ser Lys Gln Leu Lys Val Asp Ser Val Phe Pro Val 100 105 110 Lys His Val Ser Pro Val Thr Val Asn Lys Ala Ile Leu Arg Tyr Ile 115 120 125 Ile Gln Gly Leu His Pro Phe Ser Thr Val Asp Leu Pro Ser Phe Lys 130 135 140 Glu Leu Ile Ser Thr Leu Gln Pro Gly Ile Ser Val Ile Thr Arg Pro 145 150 155 160 Thr Leu Arg Ser Lys Ile Ala Glu Ala Ala Leu Ile Met Lys Gln Lys 165 170 175 Val Thr Ala Ala Met Ser Glu Val Glu Trp Ile Ala Thr Thr Thr Asp 180 185 190 Cys Trp Thr Ala Arg Arg Lys Ser Phe Ile Gly Val Thr Ala His Trp 195 200 205 Ile Asn Pro Gly Ser Leu Glu Arg His Ser Ala Ala Leu Ala Cys Lys 210 215 220 Arg Leu Met Gly Ser His Thr Phe Glu Val Leu Ala Ser Ala Met Asn 225 230 235 240 Asp Ile His Ser Glu Tyr Glu Ile Arg Asp Lys Val Val Cys Thr Thr 245 250 255 Thr Asp Ser Gly Ser Asn Phe Met Lys Ala Phe Arg Val Phe Gly Val 260 265 270 Glu Asn Asn Asp Ile Glu Thr Glu Ala Arg Arg Cys Glu Ser Asp Asp 275 280 285 Thr Asp Ser Glu Gly Cys Gly Glu Gly Ser Asp Gly Val Glu Phe Gln 290 295 300 Asp Ala Ser Arg Val Leu Asp Gln Asp Asp Gly Phe Glu Phe Gln Leu 305 310 315 320 Pro Lys His Gln Lys Cys Ala Cys His Leu Leu Asn Leu Val Ser Ser 325 330 335 Val Asp Ala Gln Lys Ala Leu Ser Asn Glu His Tyr Lys Lys Leu Tyr 340 345 350 Arg Ser Val Phe Gly Lys Cys Gln Ala Leu Trp Asn Lys Ser Ser Arg 355 360 365 Ser Ala Leu Ala Ala Glu Ala Val Glu Ser Glu Ser Arg Leu Gln Leu 370 375 380 Leu Arg Pro Asn Gln Thr Arg Trp Asn Ser Thr Phe Met Ala Val Asp 385 390 395 400 Arg Ile Leu Gln Ile Cys Lys Glu Ala Gly Glu Gly Ala Leu Arg Asn 405 410 415 Ile Cys Thr Ser Leu Glu Val Pro Met Phe Asn Pro Ala Glu Met Leu 420 425 430 Phe Leu Thr Glu Trp Ala Asn Thr Met Arg Pro Val Ala Lys Val Leu 435 440 445 Asp Ile Leu Gln Ala Glu Thr Asn Thr Gln Leu Gly Trp Leu Leu Pro 450 455 460 Ser Val His Gln Leu Ser Leu Lys Leu Gln Arg Leu His His Ser Leu 465 470 475 480 Arg Tyr Cys Asp Pro Leu Val Asp Ala Leu Gln Gln Gly Ile Gln Thr 485 490 495 Arg Phe Lys His Met Phe Glu Asp Pro Glu Ile Ile Ala Ala Ala Ile 500 505 510 Leu Leu Pro Lys Phe Arg Thr Ser Trp Thr Asn Asp Glu Thr Ile Ile 515 520 525 Lys Arg Gly Met Asp Tyr Ile Arg Val His Leu Glu Pro Leu Asp His 530 535 540 Lys Lys Glu Leu Ala Asn Ser Ser Ser Asp Asp Glu Asp Phe Phe Ala 545 550 555 560 Ser Leu Lys Pro Thr Thr His Glu Ala Ser Lys Glu Leu Asp Gly Tyr 565 570 575 Leu Ala Cys Val Ser Asp Thr Arg Glu Ser Leu Leu Thr Phe Pro Ala 580 585 590 Ile Cys Ser Leu Ser Ile Lys Thr Asn Thr Pro Leu Pro Ala Ser Ala 595 600 605 Ala Cys Glu Arg Leu Phe Ser Thr Ala Gly Leu Leu Phe Ser Pro Lys 610 615 620 Arg Ala Arg Leu Asp Thr Asn Asn Phe Glu Asn Gln Leu Leu Leu Lys 625 630 635 640 Leu Asn Leu Arg Phe Tyr Asn Phe Glu 645 <210> 80 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> SV40 promoter <400> 80 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240 aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300 gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcg 348 <210> 81 <211> 206 <212> DNA <213> Artificial Sequence <220> <223> dESV40 promoter <400> 81 gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc atcccgcccc 60 taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt tttatttatg 120 cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga ggcttttttg 180 gaggcctagg cttttgcaaa aagctt 206 <210> 82 <211> 463 <212> DNA <213> Homo sapiens <400> 82 ttggcccctc cctcgggtta ccccacagcc taggccgatt cgacctctct ccgctggggc 60 cctcgctggc gtccctgcac cctgggagcg cgagcggcgc gcgggcgggg aagcgcggcc 120 cagacccccg ggtccgcccg gagcagctgc gctgtcgggg ccaggccggg ctcccagtgg 180 attcgcgggc acagacgccc aggaccgcgc tccccacgtg gcggagggac tggggacccg 240 ggcacccgtc ctgccccttc accttccagc tccgcctcct ccgcgcggac cccgccccgt 300 cccgacccct cccgggtccc cggcccagcc ccctccgggc cctcccagcc cctccccttc 360 ctttaccgcg gccccgccct ctcctcgcgg cgcgagtttc aggcagcgct gcgtcctgct 420 gcgcacgtgg gaagccctgg ccccggccac ccccgccaga tct 463 <210> 83 <211> 648 <212> DNA <213> Schmidt-Ruppin A strain <400> 83 acgcgtcatg tttgacagct tatcatcgca gatccgtatg gtgcactctc agtacaatct 60 gctctgatgc cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg 120 agtagtgcgc gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga 180 agaatctgct tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatattcgc 240 gtatctgagg ggactagggt gtgtttaggc gaaaagcggg gcttcggttg tacgcggtta 300 ggagtcccct caggatatag tagtttcgct tttgcatagg gagggggaaa tgtagtctta 360 tgcaatactc ttgtagtctt gcaacatggt aacgatgagt tagcaacatg ccttacaagg 420 agagaaaaag caccgtgcat gccgattggt ggaagtaagg tggtacgatc gtgccttatt 480 aggaaggcaa cagacgggtc tgacatggat tggacgaacc actaaattcc gcattgcaga 540 gatattgtat ttaagtgcct agctcgatac aataaacgcc atttgaccat tcaccacatt 600 ggtgtgcacc tccaagctgg gtaccagctg ctagcaagct tgagatct 648 <210> 84 <211> 1740 <212> DNA <213> Homo sapiens <400> 84 gagtagctgg gattacaggc atgtgccacc acgcctcgct aatattagta tttttcatac 60 agacaagatc tcactatgtt gctcagggta gtctcgaatt ctgggactca aatgatcctc 120 ccacttcagc ctcccaaagt gctgggatta caggcataag ccatcatgcc cggcctctga 180 cgctgtttct ttcaaccccc aggatttcag attccaccag cttatggaga agggaaccaa 240 gttcgagatg cgtgattgcc cagaaagttg gaggctgagc tgagacttga acccagagac 300 cagaacctcc agaggtcaaa gtcctcctcc tgggtccccc agagaagggc cctgagatga 360 cagctcgttg gtcctcatgg aagcgtgacc cccccagtag actttctccc acacccaacc 420 ttggtttcct catctatatg atagggacaa gccagactct acctccctgg tggtcatggt 480 ctccgcttat tcgggttcat aaccttaaag gcccctcgca ccacctcagt gagccattta 540 tgcctggcac agggccaact ctcagtgcat atctgcaaag gaaccaatga atgagtgaat 600 gaagtgacaa atgaataaag gaataaatga atgaggcact tatcatgtac caggctttcg 660 ttaccacgtc ccatttattc ctctgaggca gggtctattt tatccttgtt acagatgggg 720 aaactaaggc ccagggagga gcaaagtctt ccccaagtat gtacccactc agaacttgag 780 ctctgaatgt ctcccaccca gcttagccca agagcggggt tcagtgatgc ccacccccta 840 aggctctaga gaaagggggt aggcccacat gccagtttgg gggtggtaaa gccaggtaag 900 ttttctttat gggtcccctg aaaccctgaa agtgaacccc agtcctgcat gaaagtgagc 960 tccccatagc tcaaggtatt caagcacaat acggctttga gtgctgaagc aggctgtgca 1020 ggcttggata gtgacatgcc ctctctgagc ctcaatttcc ccacctgtca acagcagaca 1080 gtgacagctg tgatcagggg atcacagtgc atggggatgg gtgggtgcat ggggatggag 1140 gggcatttgg gagccctccc cgataccacc ccctgcagcc acccagatag cctgtcctgg 1200 cctgtctgtc ccagtccagg gctgaaaggg tgcgggtcct gcccgcccct aggtctggag 1260 gcggagtcgc ggtgacccgg gagcccaata aatctgcaac ccacaatcac gagctgctcc 1320 cgtaagcccc aaggcgacct ccagctgtca gcgctgagca cagcgcccag ggagagggac 1380 agacagccgg ctgcatggga cagcggaacc cagagtgaga ggggaggtgg caggacagac 1440 agacagcagg ggcggacgca gagacagaca gcggggacag ggaggccgac acggacatcg 1500 acagcccata gattcctaac ccagggagcc ccggcccctc tcgccgcttc ccaccccaga 1560 cggagcgggg acaggctgcc gagcatcctc ccacccgccc tccccgtcct gcctcctcgg 1620 cccctgccag cttcccccgc ttgagcacgc agggcgtccg aggacgcgct gggcctccgc 1680 acccgccctc atggaggccg tggagaccgg ggaacggccc accttcggag cctgggacta 1740 <210> 85 <211> 1075 <212> DNA <213> Homo sapiens <400> 85 attagagatt gtaaattggg ctctgagctt cctaccaaca aaagcacaaa ggaaaatatg 60 atcactggta ttaaaaaaaa acacctatgg tttccaaaag attaaaacaa accagcagtt 120 ttatagaagc taacactaaa atctaaagga actacgttct atggagccac ttaatatgga 180 taaacacttt gacaatattc tttcaacaac tacagtaaca agtttcttag agtccatttc 240 tttttacatc cataatgaat tgtaaatctt ttctacttct taagtaaaac atcaccactt 300 aattctggta acttttccat attaactttt tagaacaatt gcaaacgtac cataaatgat 360 tgttgtcaca gtggtaacta tttgaccctg actgttattt tgtatatagc agcttttaaa 420 ataaaaaggc aacaagtttc taggcgtaat ttccacagat cttttatgta aaacaatgac 480 atcctttgca acttctgcca tttaatctat ctcaagcaag ctctctggaa acaaatctat 540 ttgaaagatt ctattgtaat tagaaatcag ggtaactgaa tgcactagat gaaaaccttc 600 tgactggggc caatgaagtc aataaagtca aaactgctgt gaatgctcaa ctgtctgcag 660 atcagatgtc ttgggatgga atccgttctc gaggccacca tcattaatat caatttggcc 720 atgtaataca agcctcactt gttccactgt tacaaatgtg cttaaaactg agctcattta 780 caatccaaat acatatgtag gatggtaacc aaggcatcac actaatttag gtattatgtt 840 ttagggggaa caaaaggtat gttaatattt tattcatctc caaattaact ataaattgtg 900 cattcttgca tagatcctcc ttgggaatga gaaattagga aaatccagtt gttaaaatga 960 atgcctaaaa tcaaaataaa atttgttttt ctggcacctg cttgatgaca cagactaata 1020 accaatgaca aaattccctt gaacccaagt tttcatttcc tcctattgtg tggtc 1075 <210> 86 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 86 gtgcttgaag gggaacaact ac 22 <210> 87 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 87 cctggcctcc agataactac ac 22 <210> 88 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 88 ccccctcgag gtcgacatgg ctagagactt atcgaaagca 40 <210> 89 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 89 attcgatatc aagctccaag atctgcacac tggtattt 38 <210> 90 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 90 ccccctcgag gtcgacgtac acgacatcac tttcccagt 39 <210> 91 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 91 attcgatatc aagctcacac tggtatttcg gtttttg 37 <210> 92 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 92 ccccctcgag gtcgacctac actctcagtc agcctatgga 40 <210> 93 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 93 attcgatatc aagcttaatc ccaaaaggct gatagtctc 39 <210> 94 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 94 ccccctcgag gtcgacacat ctctcacttt ctcatcacca 40 <210> 95 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 95 attcgatatc aagctaagta actgggatta caggagcac 39 <210> 96 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 96 aaagggcaaa taccttaagg ggtg 24 <210> 97 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 97 agcacttcga cctaaaaata gagat 25 <210> 98 <211> 21538 <212> DNA <213> Artificial Sequence <220> <223> long beta-globin LCR with inserted XhoI site <400> 98 gatctctatc ccctcctgtt ttctctacgt tatttatatg ggtatcatca ccatcctgga 60 caacatcagg acagatatcc ctcaccaagc caatgttcct ctctatgttg gctcaaatgt 120 ccttgaactt tcctttcacc accctttcca cagtcaaaag gatattgtag tttaatgcct 180 cagagttcag cttttaagct tctgacaaat tattcttcct ctttaggttc tcctttatgg 240 aatcttctgt actgatggcc atgtccttta actactatgt agatatctgc tactacctgt 300 attatgcctc tacctttatt agcagagtta tctgtactgt tggcatgaca atcatttgtt 360 aatatgactt gcctttcctt tttctgctat tcttgatcaa atggctcctc tttcttgctc 420 ctctcatttc tcctgccttc acttggacgt gcttcacgta gtctgtgctt atgactggat 480 taaaaattga tatggactta tcctaatgtt gttcgtcata atatgggttt tatggtccat 540 tattatttcc tatgcattga tctggagaag gcttcaatcc ttttactctt tgtggaaaat 600 atctgtaaac cttctggttc actctgctat agcaatttca gtttaggcta gtaagcatga 660 ggatgcctcc ttctctgatt tttcccacag tctgttggtc acagaataac ctgagtgatt 720 actgatgaaa gagtgagaat gttattgata gtcacaatga caaaaaacaa acaactacag 780 tcaaaatgtt tctcttttta ttagtggatt atatttcctg acctatatct ggcaggactc 840 tttagagagg tagctgaagc tgctgttatg accactagag ggaagaagat acctgtggag 900 ctaatggtcc aagatggtgg agccccaagc aaggaagttg ttaaggagcc cttttgattg 960 aaggtgggtg cccccacctt acagggacag gacatctgga tactcctccc agtttctcca 1020 gtttcccttt ttcctaatat atctcctgat aaaatgtcta tactcacttc cccatttcta 1080 ataataaagc aaaggctagt tagtaagaca tcaccttgca ttttgaaaat gccatagact 1140 ttcaaaatta tttcatacat cggtctttct ttatttcaag agtccagaaa tggcaacatt 1200 acctttgatt caatgtaatg gaaagagctc tttcaagaga cagagaaaag aataatttaa 1260 tttctttccc cacacctcct tccctgtctc ttaccctatc ttccttcctt ctaccctccc 1320 catttctctc tctcatttct cagaagtata ttttgaaagg attcatagca gacagctaag 1380 gctggttttt tctaagtgaa gaagtgatat tgagaaggta gggttgcatg agccctttca 1440 gttttttagt ttatatacat ctgtattgtt agaatgtttt ataatataaa taaaattatt 1500 tctcagttat atactagcta tgtaacctgt ggatatttcc ttaagtatta caagctatac 1560 ttaactcact tggaaaactc aaataaatac ctgcttcata gttattaata aggattaagt 1620 gagataatgc ccataagatt cctattaata acagataaat acatacacac acacacacat 1680 tgaaaggatt cttactttgt gctaggaact ataataagtt cattgatgca ttatatcatt 1740 aagttctaat ttcaacacta gaaggcaggt attatctaaa tttcatactg gatacctcca 1800 aactcataaa gataattaaa ttgccttttg tcatatattt attcaaaagg gtaaactcaa 1860 actatggctt gtctaatttt atatatcacc ctactgaaca tgaccctatt gtgatatttt 1920 ataaaattat tctcaagtta ttatgaggat gttgaaagac agagaggatg gggtgctatg 1980 ccccaaatca gcctcacaat taagctaagc agctaagagt cttgcagggt agtgtaggga 2040 ccacagggtt aagggggcag tagaattata ctcccacttt agtttcattt caaacaatcc 2100 atacacacac agccctgagc acttacaaat tatactacgc tctatacttt ttgtttaaat 2160 gtataaataa gtggatgaaa gaatagatag atagatagac agatagatga tagatagaat 2220 aaatgcttgc cttcatagct gtctccctac cttgttcaaa atgttcctgt ccagaccaaa 2280 gtaccttgcc ttcacttaag taatcaattc ctaggttata ttctgatgtc aaaggaagtc 2340 aaaagatgtg aaaaacaatt tctgacccac aactcatgct ttgtagatga ctagatcaaa 2400 aaatttcagc catatcttaa cagtgagtga acaggaaatc tcctcttttc cctacatctg 2460 agatcccagc ttctaagacc ttcaattctc actcttgatg caacagacct tggaagcata 2520 caggagagct gaacttggtc aacaaaggag aaaagtttgt tggcctccaa aggcacagct 2580 caaacttttc aagccttctc taatcttaaa ggtaaacaag ggtctcattt ctttgagaac 2640 ttcagggaaa atagacaagg acttgcctgg tgcttttggt aggggagctt gcactttccc 2700 cctttctgga ggaaatattt atccccaggt agttcccttt ttgcaccagt ggttctttga 2760 agagacttcc acctgggaac agttaaacag caactacagg gccttgaact gcacactttc 2820 agtccggtcc tcacagttga aaagacctaa gcttgtgcct gatttaagcc tttttggtca 2880 taaaacattg aattctaatc tccctctcaa ccctacagtc acccatttgg tatattaaag 2940 atgtgttgtc tactgtctag tatccctcaa gtagtgtcag gaattagtca tttaaatagt 3000 ctgcaagcca ggagtggtgg ctcatgtctg taattccagc acttgagagg tagaagtggg 3060 aggactgctt gagctcaaga gtttgatatt atcctggaca acatagcaag acctcgtctc 3120 tacttaaaaa aaaaaaaaaa attagccagg catgtgatgt acacctgtag tcccagctac 3180 tcaggaggcc gaaatgggag gatcccttga gctcaggagg tcaaggctgc agtgagacat 3240 gatcttgcca ctgcactcca gcctggacag cagagtgaaa ccttgcctca cgaaacagaa 3300 tacaaaaaca aacaaacaaa aaactgctcc gcaatgcgct tccttgatgc tctaccacat 3360 aggtctgggt actttgtaca cattatctca ttgctgttca taattgttag attaattttg 3420 taatattgat attattccta gaaagctgag gcctcaagat gataactttt attttctgga 3480 cttgtaatag ctttctcttg tattcaccat gttgtaactt tcttagagta gtaacaatat 3540 aaagttattg tgagtttttg caaacacagc aaacacaacg acccatatag acattgatgt 3600 gaaattgtct attgtcaatt tatgggaaaa caagtatgta ctttttctac taagccattg 3660 aaacaggaat aacagaacaa gattgaaaga atacattttc cgaaattact tgagtattat 3720 acaaagacaa gcacgtggac ctgggaggag ggttattgtc catgactggt gtgtggagac 3780 aaatgcaggt ttataataga tgggatggca tctagcgcaa tgactttgcc atcactttta 3840 gagagctctt ggggacccca gtacacaaga ggggacgcag ggtatatgta gacatctcat 3900 tctttttctt agtgtgagaa taagaatagc catgacctga gtttatagac aatgagccct 3960 tttctctctc ccactcagca gctatgagat ggcttgccct gcctctctac taggctgact 4020 cactccaagg cccagcaatg ggcagggctc tgtcagggct ttgatagcac tatctgcaga 4080 gccagggccg agaaggggtg gactccagag actctccctc ccattcccga gcagggtttg 4140 cttatttatg catttaaatg atatatttat tttaaaagaa ataacaggag actgcccagc 4200 cctggctgtg acatggaaac tatgtagaat attttgggtt ccattttttt ttccttcttt 4260 cagttagagg aaaaggggct cactgcacat acactagaca gaaagtcagg agctttgaat 4320 ccaagcctga tcatttccat gtcatactga gaaagtcccc acccttctct gagcctcagt 4380 ttctcttttt ataagtagga gtctggagta aatgatttcc aatggctctc atttcaatac 4440 aaaatttccg tttattaaat gcatgagctt ctgttactcc aagactgaga aggaaattga 4500 acctgagact cattgactgg caagatgtcc ccagaggctc tcattcagca ataaaattct 4560 caccttcacc caggcccact gagtgtcaga tttgcatgca ctagttcacg tgtgtaaaaa 4620 ggaggatgct tctttccttt gtattctcac atacctttag gaaagaactt agcacccttc 4680 ccacacagcc atcccaataa ctcatttcag tgactcaacc cttgacttta taaaagtctt 4740 gggcagtata gagcagagat taagagtaca gatgctggag ccagaccacc tgagtgatta 4800 gtgactcagt ttctcttagt agttgtatga ctcagtttct tcatctgtaa aatggagggt 4860 tttttaatta gtttgttttt gagaaagggt ctcactctgt cacccaaatg ggagtgtagt 4920 ggcaaaatct cggctcactg caacttgcac ttcccaggct caagcggtcc tcccacctca 4980 acatcctgag tagctggaac cacaggtaca caccaccata cctcgctaat tttttgtatt 5040 tttggtagag atggggtttc acatgttaca caggatggtc tcagactccg gagctcaagc 5100 aatctgccca cctcagcctt ccaaagtgct gggattataa gcatgattac aggagtttta 5160 acaggctcat aagattgttc tgcagcccga gtgagttaat acatgcaaag agtttaaagc 5220 agtgacttat aaatgctaac tactctagaa atgtttgcta gtattttttg tttaactgca 5280 atcattcttg ctgcaggtga aaactagtgt tctgtacttt atgcccattc atctttaact 5340 gtaataataa aaataactga catttattga aggctatcag agactgtaat tagtgctttg 5400 cataattaat catatttaat actcttggat tctttcaggt agatactatt attatcccca 5460 ttttactaca gttaaaaaaa ctacctctca acttgctcaa gcatacactc tcacacacac 5520 aaacataaac tactagcaaa tagtagaatt gagatttggt cctaattatg tctttgctca 5580 ctatccaata aatatttatt gacatgtact tcttggcagt ctgtatgctg gatgctgggg 5640 atacaaagat gtttaaattt aagctccagt ctctgcttcc aaaggcctcc caggccaagt 5700 tatccattca gaaagcattt tttactcttt gcattccact gtttttccta agtgactaaa 5760 aaattacact ttattcgtct gtgtcctgct ctgggatgat agtctgactt tcctaacctg 5820 agcctaacat ccctgacatc aggaaagact acaccatgtg gagaaggggt ggtggttttg 5880 attgctgctg tcttcagtta gatggttaac tttgtgaagt tgaaaactgt ggctctctgg 5940 ttgactgtta gagttctggc acttgtcact atgcctatta tttaacaaat gcatgaatgc 6000 ttcagaatat gggaatatta tcttctggaa tagggaatca agttatatta tgtaacccag 6060 gattagaaga ttcttctgtg tgtaagaatt tcataaacat taagctgtct agcaaaagca 6120 agggcttgga aaatctgtga gctcctcacc atatagaaag cttttaaccc atcattgaat 6180 aaatccctat aggggatttc taccctgagc aaaaggctgg tcttgattaa ttcccaaact 6240 catatagctc tgagaaagtc tatgctgtta acgttttctt gtctgctacc ccatcatatg 6300 cacaacaata aatgcaggcc taggcatgac tgaaggctct ctcataattc ttggttgcat 6360 gaatcagatt atcaacagaa atgttgagac aaactatggg gaagcagggt atgaaagagc 6420 tctgaatgaa atggaaaccg caatgcttcc tgcccattca gggctccagc atgtagaaat 6480 ctggggcttt gtgaagactg gcttaaaatc agaagcccca ttggataaga gtagggaaga 6540 acctagagcc tacgctgagc aggtttcctt catgtgacag ggagcctcct gccccgaact 6600 tccagggatc ctctcttaag tgtttcctgc tggaatctcc tcacttctat ctggaaatgg 6660 tttctccaca gtccagcccc tggctagttg aaagagttac ccatgcagag gccctcctag 6720 catccagaga ctagtgctta gattcctact ttcagcgttg gacaacctgg atccacttgc 6780 ccagtgttct tccttagttc ctaccttcga ccttgatcct cctttatctt cctgaaccct 6840 gctgagatga tctatgtggg gagaatggct tctttgagaa acatcttctt cgttagtggc 6900 ctgcccctca ttcccacttt aatatccaga atcactataa gaagaatata ataagaggaa 6960 taactcttat tataggtaag ggaaaattaa gaggcatacg tgatgggatg agtaagagag 7020 gagagggaag gattaatgga cgataaaatc tactactatt tgttgagacc ttttatagtc 7080 taatcaattt tgctattgtt ttccatcctc acgctaactc cataaaaaaa cactattatt 7140 atctttattt tgccatgaca agactgagct cagaagagtc aagcatttgc ctaaggtcgg 7200 acatgtcaga ggcagtgcca gacctatgtg agactctgca gctactgctc atgggccctg 7260 tgctgcactg atgaggagga tcagatggat ggggcaatga agcaaaggaa tcattctgtg 7320 gataaaggag acagccatga agaagtctat gactgtaaat ttgggagcag gagtctctaa 7380 ggacttggat ttcaaggaat tttgactcag caaacacaag accctcacgg tgactttgcg 7440 agctggtgtg ccagatgtgt ctatcagagg ttccagggag ggtggggtgg ggtcagggct 7500 ggccaccagc tatcagggcc cagatgggtt ataggctggc aggctcagat aggtggttag 7560 gtcaggttgg tggtgctggg tggagtccat gactcccagg agccaggaga gatagaccat 7620 gagtagaggg cagacatggg aaaggtgggg gaggcacagc atagcagcat ttttcattct 7680 actactacat gggactgctc ccctataccc ccagctaggg gcaagtgcct tgactcctat 7740 gttttcagga tcatcatcta taaagtaaga gtaataattg tgtctatctc atagggttat 7800 tatgaggatc aaaggagatg cacactctct ggaccagtgg cctaacagtt caggacagag 7860 ctatgggctt cctatgtatg ggtcagtggt ctcaatgtag caggcaagtt ccagaagata 7920 gcatcaacca ctgttagaga tatactgcca gtctcagagc ctgatgttaa tttagcaatg 7980 ggctgggacc ctcctccagt agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca 8040 gctggttaga ctttttttaa tgaaagctta gctttcatta aagattaagc tcctaagcag 8100 ggcacagatg aaattgtcta acagcaactt tgccatctaa aaaaatctga cttcactgga 8160 aacatggaag cccaaggttc tgaacatgag aaatttttag gaatctgcac aggagttgag 8220 agggaaacaa gatggtgaag ggactagaaa ccacatgaga gacacgagga aatagtgtag 8280 atttaggctg gaggtaaatg aaagagaagt gggaattaat acttactgaa atctttctat 8340 atgtcaggtg ccattttatg atatttaata atctcattac atatggtaat tctgtgagat 8400 atgtattatt gaacatacta taattaatac taatgataag taacacctct tgagtactta 8460 gtatatgcta gaatcaaatt taagtttatc atatgaggcc gggcacggtg gctcatatat 8520 gggattacat gcctgtaatc ccagcacttt gggaggccaa ggcaattgga tcacctgagg 8580 tcaggagttc cagaccagcc tggccaacat ggtgaaaccc cttctctact aaaaaataca 8640 aaaaatcagc caggtgtggt ggcacgcgtc tataatccca gctactcagg aggctgaggc 8700 aggagaatca cttgaaccca ggaggtggag gttgcagtga gctaagattg caccactgca 8760 ctccagccta ggcgacagag tgagactcca tctcaaaaaa aaaaaaagaa gtttattata 8820 tgaattaact tagttttact cacaccaata ctcagaagta gattattacc tcatttattg 8880 atgaggagcc caatgtactt gtagtgtaga tcaacttatt gaaagcacaa gctaataagt 8940 agacaattag taattagaag tcagatggtc tgagctctcc tactgtctac attacatgag 9000 ctcttattaa ctggggactc gaaaatcaaa gacatgaaat aatttgtcca agcttacaga 9060 accaccaagt agtaaggcta ggatgtagac ccagttctgc tacctctgaa gacagtgttt 9120 tttccacagc aaaacacaaa ctcagatatt gtggatgcga gaaattagaa gtagatattc 9180 ctgccctgtg gcccttgctt cttactttta cttcttgtcg attggaagtt gtggtccaag 9240 ccacagttgc agaccatact tcctcaacca taattgcatt tcttcaggaa agtttgaggg 9300 agaaaaaggt aaagaaaaat ttagaaacaa cttcagaata aagagatttt ctcttgggtt 9360 acagagattg tcatatgaca aattataagc agacacttga gaaaactgaa ggcccatgcc 9420 tgcccaaatt accctttgac cccttggtca agctgcaact ttggttaaag ggagtgttta 9480 tgtgttatag tgttcattta ctcttctggt ctaacccatt ggctccgtct tcatcctgca 9540 gtgacctcag tgcctcagaa acatacatat gtttgtctag tttaagtttg tgtgaaattc 9600 taactagcgt caagaactga gggccctaaa ctatgctagg aatagtgctg tggtgctgtg 9660 ataggtacac aagaaatgag aagaaactgc agattctctg catctccctt tgccgggtct 9720 gacaacaaag tttccccaaa ttttaccaat gcaagccatt tctccatatg ctaactactt 9780 taaaatcatt tggggcttca cattgtcttt ctcatctgta aaaagaatgg aagaactcat 9840 tcctacagaa ctccctatgt cttccctgat gggctagagt tcctctttct caaaaattag 9900 ccattattgt atttccttct aagccaaagc tcagaggtct tgtattgccc agtgacatgc 9960 acactggtca aaagtaggct aagtagaagg gtactttcac aggaacagag agcaaaagag 10020 gtgggtgaat gagagggtaa gtgagaaaag acaaatgaga agttacaaca tgatggcttg 10080 ttgtctaaat atctcctagg gaattattgt gagaggtctg aatagtgttg taaaataagc 10140 tgaatctgct gccaacatta acagtcaaga aatacctccg aataactgta cctccaatta 10200 ttctttaagg tagcatgcaa ctgtaatagt tgcatgtata tatttatcat aatactgtaa 10260 cagaaaacac ttactgaata tatactgtgt ccctagttct ttacacaata aactaatctc 10320 atcctcataa ttctattagc taatacatat tatcatccta tatttcagag acttcaagaa 10380 gttaagcaac ttgctcaaga tcatctaaga agtaggtggt atttctgggc tcatttggcc 10440 cctcctaatc tctcatggca acatggctgc ctaaagtgtt gattgcctta attcatcagg 10500 gatgggctca tactcactgc agaccttaac tggcatcctc ttttcttatg tgatctgcct 10560 gaccctagta gacttatgaa atttctgatg agaaaggaga gaggagaaag gcagagctga 10620 ctgtgatgag tgatgaaggt gccttctcat ctggctcgag ggtaccagtg gggcctctaa 10680 gactaagtca ctctgtctca ctgtgtctta gccagttcct tacagcttgc cctgatggga 10740 gatagagaat gggtatcctc caacaaaaaa ataaattttc atttctcaag gtccaactta 10800 tgttttctta atttttaaaa aaatcttgac cattctccac tctctaaaat aatccacagt 10860 gagagaaaca ttcttttccc ccatcccata aatacctcta ttaaatatgg aaaatctggg 10920 catggtgtct cacacctgta atcccagcac tttgggaggc tgaggtgggt ggactgcttg 10980 gagctcagga gttcaagacc atcttggaca acatggtgat accctgcctc tacaaaaagt 11040 acaaaaatta gcctggcatg gtggtgtgca cctgtaatcc cagctattag ggtggctgag 11100 gcaggagaat tgcttgaacc cgggaggcgg aggttgcagt gagctgagat cgtgccactg 11160 cactccagcc tgggggacag agcacattat aattaactgt tattttttac ttggactctt 11220 gtggggaata agatacatgt tttattctta tttatgattc aagcactgaa aatagtgttt 11280 agcatccagc aggtgcttca aaaccatttg ctgaatgatt actatacttt ttacaagctc 11340 agctccctct atcccttcca gcatcctcat ctctgattaa ataagcttca gtttttcctt 11400 agttcctgtt acatttctgt gtgtctccat tagtgacctc ccatagtcca agcatgagca 11460 gttctggcca ggcccctgtc ggggtcagtg ccccaccccc gccttctggt tctgtgtaac 11520 cttctaagca aaccttctgg ctcaagcaca gcaatgctga gtcatgatga gtcatgctga 11580 ggcttagggt gtgtgcccag atgttctcag cctagagtga tgactcctat ctgggtcccc 11640 agcaggatgc ttacagggca gatggcaaaa aaaaggagaa gctgaccacc tgactaaaac 11700 tccacctcaa acggcatcat aaagaaaatg gatgcctgag acagaatgtg acatattcta 11760 gaatatatta tttcctgaat atatatatat atatacacat atacgtatat atatatatat 11820 atatatattt gttgttatca attgccatag aatgattagt tattgtgaat caaatattta 11880 tcttgcaggt ggcctctata cctagaagcg gcagaatcag gctttattaa tacatgtgta 11940 tagattttta ggatctatac acatgtatta atatgaaaca aggatatgga agaggaaggc 12000 atgaaaacag gaaaagaaaa caaaccttgt ttgccatttt aaggcacccc tggacagcta 12060 ggtggcaaaa ggcctgtgct gttagaggac acatgctcac atacggggtc agatctgact 12120 tggggtgcta ctgggaagct ctcatcttaa ggatacatct caggccagtc ttggtgcatt 12180 aggaagatgt aggcaactct gatcctgaga ggaaagaaac attcctccag gagagctaaa 12240 agggttcacc tgtgtgggta actgtgaagg actacaagag gatgaaaaac aatgacagac 12300 agacataatg cttgtgggag aaaaaacagg aggtcaaggg gatagagaag gcttccagaa 12360 gaatggcttt gaagctggct tctgtaggag ttcacagtgg caaagatgtt tcagaaatgt 12420 gacatgactt aaggaactat acaaaaagga acaaatttaa ggagaggcag ataaattagt 12480 tcaacagaca tgcaaggaat tttcagatga atgttatgtc tccactgagc ttcttgaggt 12540 tagcagctgt gagggttttg caggcccagg acccattaca ggacctcacg tatacttgac 12600 actgtttttt gtattcattt gtgaatgaat gacctcttgt cagtctactc ggtttcgctg 12660 tgaatgaatg atgtcttgtc agcctacttg gtttcgctaa gagcacagag agaagattta 12720 gtgatgctat gtaaaaactt cctttttggt tcaagtgtat gtttgtgata gaaatgaaga 12780 caggctacat gatgcatatc taacataaac acaaacatta agaaaggaaa tcaacctgaa 12840 gagtatttat acagataaca aaatacagag agtgagttaa atgtgtaata actgtggcac 12900 aggctggaat atgagccatt taaatcacaa attaattaga aaaaaaacag tggggaaaaa 12960 attccatgga tgggtctaga aagactagca ttgttttagg ttgagtggca gtgtttaaag 13020 ggtgatatca gactaaactt gaaatatgtg gctaaataac tagaatactc tttatttttt 13080 cgtatcatga atagcagata tagcttgatg gccccatgct tggtttaaca tccttgctgt 13140 tcctgacatg aaatccttaa tttttgacaa aggggctatt cattttcatt ttatattggg 13200 cctagaaatt atgtagatgg tcctgaggaa aagtttatag cttgtctatt tctctctcta 13260 acatagttgt cagcacaatg cctaggctat aggaagtact caaagcttgt taaattgaat 13320 tctatccttc ttattcaatt ctacacatgg aggaaaaact catcagggat ggaggcacgc 13380 ctctaaggaa ggcaggtgtg gctctgcagt gtgattgggt acttgcagga cgaagggtgg 13440 ggtgggagtg gctaaccttc cattcctagt gcagaggtca cagcctaaac atcaaattcc 13500 ttgaggtgcg gtggctcact cctgtaatca cagcagtttg ggacgccaag gtgggcagat 13560 cacttgaggt caggagttgg acaccagccc agccaacata gtgaaacctg gtctctgctt 13620 aaaaatataa aaattagctg gacgtggtga cgggagcctg taatccaact acttgggagg 13680 ctgaggcagg agaatcgctt gaaccgggga ggtggagttt gcactgagca gagatcatgc 13740 cattgcactc cagcctccag agcgagactc tgtctaaaga aaaacgaaaa caaacaaaca 13800 aacaaacaaa caaaacccat caaattccct gaccgaacag aattctgtct gattgttctc 13860 tgacttatct accattttcc ctccttaaag aaactgtgaa cttccttcag ctagaggggc 13920 ctggctcaga agcctctggt cagcatccaa gaaatacttg atgtcacttt ggctaaaggt 13980 atgatgtgta gacaagctcc agagatggtt tctcatttcc atatccaccc acccagcttt 14040 ccaattttaa agccaattct gaggtagaga ctgtgatgaa caaacacctt gacaaaattc 14100 aacccaaaga ctcactttgc ctagcttcaa aatccttact ctgacatata ctcacagcca 14160 gaaattagca tgcactagag tgtgcatgag tgcaacacac acacacacca attccatatt 14220 ctctgtcaga aaatcctgtt ggtttttcgt gaaaggatgt tttcagaggc tgaccccttg 14280 ccttcacctc caatgctacc actctggtct aagtcactgt caccaccacc taaattatag 14340 ctgttgactc ataacaatct tcctgcttct accactgccc cactacaatt tcttcccaat 14400 atactatcca aattagtctt ttcaaaatgt aagtcatata tggtcacctc tttgttcaaa 14460 gtcttctgat agtttcctat atcatttata ataaaaccaa atccttacaa ttctctacaa 14520 tagttgttca tgcatatatt atgtttatta cagatacata tatatagctc tcatataaat 14580 aaatatatat atttatgtgt atgtgtgtag agtgtttttt cttacaactc tatgatgtag 14640 gtattattag tgtcccaaat tttataattt aggacttcta tgatctcatc ttttattctc 14700 cccttcaccg aatctcatcc tacattggcc ttattgatat tccttgaaaa ttctaagcat 14760 cttacatctt tagggtattt acatttgcca ttccctatgc cctaaatatt taatcatagt 14820 ttcatataaa tgggttcctc atcatctatg ggtactctct caggtgttaa ctttatagtg 14880 aggactttcc tgccatacta cttaaagtag cgataccctt tcaccctgtc ctaatcacac 14940 tctggccttc atttcagttt tttttttttc tccatagcac ctaatctcat tggtatataa 15000 catgtttcat ttgcttattt aatgtcaagc tctttccact atcaagtcca tgaaaacagg 15060 aactttattc ctctattctg tttttgtgct gtattcttag caattttaca attttgaatg 15120 aatgaatgag cagtcaaaca catatacaac tataattaaa aggatgtatg ctgacacatc 15180 cactgctatg cacacacaaa gaaatcagtg gagtagagct ggaagtgcta agcctgcata 15240 gagctagtta gccctccgca ggcagagcct tgatgggatt actgagttct agaattggac 15300 tcatttgttt tgtaggctga gatttgctct tgaaaacttg ttctgaccaa aataaaaggc 15360 tcaaaagatg aatatcgaaa ccagggtgtt ttttacactg gaatttataa ctagagcact 15420 catgtttatg taagcaatta attgtttcat cagtcaggta aaagtaaaga aaaactgtgc 15480 caaggcaggt agcctaatgc aatatgccac taaagtaaac attatttcat aggtgtcaga 15540 tatggcttat tcatccatct tcatgggaag gatggccttg gcctggacat cagtgttatg 15600 tgaggttcaa aacacctcta ggctataagg caacagagct cctttttttt ttttctgtgc 15660 tttcctggct gtccaaatct ctaatgataa gcatacttct attcaatgag aatattctgt 15720 aagattatag ttaagaattg tgggagccat tccgtctctt atagttaaat ttgagcttct 15780 tttatgatca ctgttttttt aatatgcttt aagttctggg gtacatgtgc catggtggtt 15840 tgctgcaccc atcaacccgt catctacatt aggtatttct cctaatgcta tccttcccct 15900 agccccccac ccccaacagg ccccagtgtg tgatgttccc ctccctgtgt ccatggatca 15960 ctggtttttt tttgtttttt tttttttttt aaagtctcag ttaaattttt ggaatgtaat 16020 ttattttcct ggtatcctag gacttgcaag ttatctggtc actttagccc tcacgttttg 16080 atgataatca catatttgta aacacaacac acacacacac acacacacac atatatatat 16140 atataaaaca tatatataca taaacacaca taacatattt atcgggcatt tctgagcaac 16200 taatcatgca ggactctcaa acactaacct atagcctttt ctatgtatct acttgtgtag 16260 aaaccaagcg tggggactga gaaggcaata gcaggagcat tctgactctc actgccttta 16320 gctaggcccc tccctcatca cagctcagca tagtcctgag ctcttatcta tatccacaca 16380 cagtttctga cgctgcccag ctatcaccat cccaagtcta aagaaaaaaa taatgggttt 16440 gcccatctct gttgattaga aaacaaaaca aaataaaata agcccctaag ctcccagaaa 16500 acatgactaa accagcaaga agaagaaaat acaataggta tatgaggaga ctggtgacac 16560 tagtgtctga atgaggcttg agtacagaaa agaggctcta gcagcatagt ggtttagagg 16620 agatgtttct ttccttcaca gatgccttag cctcaataag cttgcggttg tggaagttta 16680 ctttcagaac aaactcctgt ggggctagaa ttattgatgg ctaaaagaag cccgggggag 16740 ggaaaaatca ttcagcatcc tcacccttag tgacacaaaa cagagggggc ctggttttcc 16800 atatttcctc atgatggatg atctcgttaa tgaaggtggt ctgacgagat cattgcttct 16860 tccatttaag ccttgctcac ttgccaatcc tcagttttaa ccttctccag agaaatacac 16920 attttttatt caggaaacat actatgttat agtttcaata ctaaataatc aaagtactga 16980 agatagcatg cataggcaag aaaaagtcct tagctttatg ttgctgttgt ttcagaattt 17040 aaaaaagatc accaagtcaa ggacttctca gttctagcac tagaggtgga atcttagcat 17100 ataatcagag gtttttcaaa atttctagac ataagattca aagccctgca cttaaaatag 17160 tctcatttga attaactctt tatataaatt gaaagcacat tctgaactac ttcagagtat 17220 tgttttattt ctatgttctt agttcataaa tacattaggc aatgcaattt aattaaaaaa 17280 acccaagaat ttcttagaat tttaatcatg aaaataaatg aaggcatctt tacttactca 17340 aggtcccaaa aggtcaaaga aaccaggaaa gtaaagctat atttcagcgg aaaatgggat 17400 atttatgagt tttctaagtt gacagactca agttttaacc ttcagtgccc atcatgtagg 17460 aaagtgtggc ataactggct gattctggct ttctactcct ttttcccatt aaagatccct 17520 cctgcttaat taacattcac aagtaactct ggttgtactt taggcacagt ggctcccgag 17580 gtcagtcaca caataggatg tctgtgctcc aagttgccag agagagagat tactcttgag 17640 aatgagcctc agccctggct caaactcacc tgcaaacttc gtgagagatg aggcagaggt 17700 acactacgaa agcaacagtt agaagctaaa tgatgagaac acatggactc atagagggaa 17760 acaacgcata ctggggccta tcagagggtg gagggtgaga gaaggagagg atcaggaaaa 17820 atcactaatg gatgctaagc gtaatacctg agtgatgaga tcatctatac aacaaacccc 17880 cttgacattc atttatctat gtaacaaacc tgcacatcct gtacatgtac ccctgaactt 17940 aaaataaaag ttgaaaacaa gaaagcaaca gtttgaacac ttgttatggt ctattctctc 18000 attctttaca attacactag aaaatagcca caggcttcct gcaaggcagc cacagaattt 18060 atgacttgtg atatccaagt cattcctgga taatgcaaaa tctaacacaa aatctagtag 18120 aatcatttgc ttacatctat ttttgttctg agaatataga tttagataca taatggaagc 18180 agaataattt aaaatctggc taatttagaa tcctaagcag ctcttttcct atcagtggtt 18240 tacaagcctt gtttatattt ttcctatttt aaaaataaaa ataaagtaag ttatttgtgg 18300 taaagaatat tcattaaagt atttatttct tagataatac catgaaaaac attcagtgaa 18360 gtgaagggcc tactttactt aacaagaatc taatttatat aatttttcat actaatagca 18420 tctaagaaca gtacaatatt tgactcttca ggttaaacat atgtcataaa ttagccagaa 18480 agatttaaga aaatattgga tgtttccttg tttaaattag gcatcttaca gtttttagaa 18540 tcctgcatag aacttaagaa attacaaatg ctaaagcaaa cccaaacagg caggaattaa 18600 tcttcatcga atttgggtgt ttctttctaa aagtccttta tacttaaatg tcttaagaca 18660 tacatagatt ttattttact aattttaatt atatagacaa taaatgaata ttcttactga 18720 ttactttttc tgactgtcta atctttctga tctatcctgg atggccataa cacttatctc 18780 tctgaacttt gggcttttaa tataggaaag aaaagcaata atccattttt catggtatct 18840 catatgataa acaaataaaa tgcttaaaaa tgagcaggtg aagcaattta tcttgaacca 18900 acaagcatcg aagcaataat gagactgccc gcagcctacc tgacttctga gtcaggattt 18960 ataagccttg ttactgagac acaaacctgg gcctttcaat gctataacct ttcttgaagc 19020 tcctccctac cacctttagc cataaggaaa catggaatgg gtcagatccc tggatgcaag 19080 ccaggtctgg aaccataggc agtaaggaga gaagaaaatg tgggctctgc aactggctcc 19140 gagggagcag gagaggatca accccatact ctgaatctaa gagaagactg gtgtccatac 19200 tctgaatggg aagaatgatg ggattaccca tagggcttgt tttagggaga aacctgttct 19260 ccaaactctt ggccttgaga tacctggtcc ttattccttg gactttggca atgtctgacc 19320 ctcacattca agttctgagg aagggccact gccttcatac tgtggatctg tagcaaattc 19380 cccctgaaaa cccagagctg tatcttaatt ggttaaaaaa aattatatta tctcaacgac 19440 tgttcttctc tgagtagcca agctcagctt ggttcaagct acaagcagct gagctgcttt 19500 ttgtctagtc attgttcttt tatttcagtg gatcaaatac gttctttcca aacctaggat 19560 cttgtcttcc taggctatat attttgtccc aggaagtctt aatctggggt ccacagaaca 19620 ctagggggct ggtgaagttt atagaaaaaa aatctgtatt tttacttaca tgtaactgaa 19680 atttagcatt ttcttctact ttgaatgcaa aggacaaact agaatgacat catcagtacc 19740 tattgcatag ttataaagag aaaccacaga tattttcata ctacaccata ggtattgcag 19800 atctttttgt ttttgttttt gtttgagatg gagtttcgct cttattgccc aggctggagt 19860 gcagtggcat gatttcggct cactgcaacc tccccttcct gcattcaagc aattctcctg 19920 ccttggcctc ctgagtagct ggggattaca ggcacctgcc accatgccag tctaattttt 19980 gtatttttag tagagatggg gtttcgccat gttggccagg ctggtcttga actcctgacc 20040 tcagatgatc tgcccgcctt ggcctcctga agtgctggga ttataggtgt gagccaccac 20100 gcctggccca ttgcagatat ttttaattca catttatctg catcactact tggatcttaa 20160 ggtagctgta gacccaatcc tagatctaat gctttcataa agaagcaaat ataataaata 20220 ctataccaca aatgtaatgt ttgatgtctg ataatgatat ttcagtgtaa ttaaacttag 20280 cactcctatg tatattattt gatgcaataa aaacatattt ttttagcact tacagtctgc 20340 caaactggcc tgtgacacaa aaaaagttta ggaattcctg gttttgtctg tgttagccaa 20400 tggttagaat atatgctcag aaagatacca ttggttaata gctaaaagaa aatggagtag 20460 aaattcagtg gcctggaata ataacaattt gggcagtcat taagtcaggt gaagacttct 20520 ggaatcatgg gagaaaagca agggagacat tcttacttgc cacaagtgtt tttttttttt 20580 ttttttttta tcacaaacat aagaaaatat aataaataac aaagtcaggt tatagaagag 20640 agaaacgctc ttagtaaact tggaatatgg aatccccaaa ggcacttgac ttgggagaca 20700 ggagccatac tgctaagtga aaaagacgaa gaacctctag ggcctgaaca tacaggaaat 20760 tgtaggaaca gaaattccta gatctggtgg ggcaagggga gccataggag aaagaaatgg 20820 tagaaatgga tggagacgga ggcagaggtg ggcagatcat gaggtcaaga gatcgagacc 20880 atcctggcaa acatggtgaa atcccgtctc tactaaaaat aaaaaaatta gctgggcatg 20940 gtggcatgcg cctgtagtcc cagctgctcg ggaggctgag gcaggagaat cgtttgaacc 21000 caggaggcga aggttgcagt gagctgagat agtgccattg cactccagtc tggcaacaga 21060 gtgagactcc gtctcaaaaa aaaaaaaaaa agaaagaaag aaaagaaaaa gaaaaaagaa 21120 aaaataaatg gatgtagaac aagccagaag gaggaactgg gctggggcaa tgagattatg 21180 gtgatgtaag ggacttttat agaattaaca atgctggaat ttgtggaact ctgcttctat 21240 tattccccca atcattactt ctgtcacatt gatagttaaa taatttctgt gaatttattc 21300 cttgattcta aaatatgagg ataatgacaa tggtattata agggcagatt aagtgatata 21360 gcatgagcaa tattcttcag gcacatggat cgaattgaat acactgtaaa tcccaacttc 21420 cagtttcagc tctaccaagt aaagagctag caagtcatca aaatggggac atacagaaaa 21480 aaaaaaggac actagaggaa taatataccc tgactcctag cctgattaat atatcgat 21538 <210> 99 <211> 1468 <212> PRT <213> Artificial Sequence <220> <223> ET3SEQuence <400> 99 Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu 1 5 10 15 Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr 35 40 45 Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val 50 55 60 Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser 65 70 75 80 Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile 85 90 95 Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala 100 105 110 Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser 115 120 125 Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu 130 135 140 Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val 145 150 155 160 Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr 165 170 175 Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu 180 185 190 Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg 195 200 205 Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu 210 215 220 Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met 225 230 235 240 Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly 245 250 255 Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser 260 265 270 Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser 275 280 285 Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala 290 295 300 Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu 305 310 315 320 Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His 325 330 335 His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu 340 345 350 Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn 355 360 365 Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val 370 375 380 Ser Pro Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ala Gln Asn Ser Arg Pro Pro 755 760 765 Ser Ala Ser Ala Pro Lys Pro Pro Val Leu Arg Arg His Gln Arg Asp 770 775 780 Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr Asp 785 790 795 800 Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr Gly 805 810 815 Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg His 820 825 830 Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser Glu 835 840 845 Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro Arg 850 855 860 Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr Gln 865 870 875 880 Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly Pro 885 890 895 Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys Asn 900 905 910 Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Pro 915 920 925 Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln Pro 930 935 940 Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro 945 950 955 960 Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val 965 970 975 Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Ile 980 985 990 Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr Val 995 1000 1005 Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1010 1015 1020 Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys 1025 1030 1035 His Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe 1040 1045 1050 His Ala Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val 1055 1060 1065 Met Ala Gln Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly 1070 1075 1080 Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe 1085 1090 1095 Ser Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu 1100 1105 1110 Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Val 1115 1120 1125 Gly Ile Trp Arg Ile Glu Cys Leu Ile Gly Glu His Leu Gln Ala 1130 1135 1140 Gly Met Ser Thr Thr Phe Leu Val Tyr Ser Lys Lys Cys Gln Thr 1145 1150 1155 Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr 1160 1165 1170 Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu 1175 1180 1185 His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe 1190 1195 1200 Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly 1205 1210 1215 Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile 1220 1225 1230 Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln 1235 1240 1245 Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 1250 1255 1260 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro 1265 1270 1275 Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile 1280 1285 1290 Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser 1295 1300 1305 Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala 1310 1315 1320 Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp 1325 1330 1335 Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala 1340 1345 1350 Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp 1355 1360 1365 Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val 1370 1375 1380 Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser 1385 1390 1395 Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly 1400 1405 1410 Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val 1415 1420 1425 Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile 1430 1435 1440 His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val 1445 1450 1455 Leu Gly Cys Glu Ala Gln Asp Leu Tyr Val 1460 1465 <210> 100 <211> 147 <212> PRT <213> Artificial Sequence <220> <223> beta-globin <400> 100 Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp 1 5 10 15 Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu 20 25 30 Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp 35 40 45 Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His 50 55 60 Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp 65 70 75 80 Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys 85 90 95 Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val 100 105 110 Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln 115 120 125 Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His 130 135 140 Lys Tyr His 145 <210> 101 <211> 147 <212> PRT <213> Artificial Sequence <220> <223> gamma globin <400> 101 Met Gly His Phe Thr Glu Glu Asp Lys Ala Thr Ile Thr Ser Leu Trp 1 5 10 15 Gly Lys Val Asn Val Glu Asp Ala Gly Gly Glu Thr Leu Gly Arg Leu 20 25 30 Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Asp Ser Phe Gly Asn 35 40 45 Leu Ser Ser Ala Ser Ala Ile Met Gly Asn Pro Lys Val Lys Ala His 50 55 60 Gly Lys Lys Val Leu Thr Ser Leu Gly Asp Ala Thr Lys His Leu Asp 65 70 75 80 Asp Leu Lys Gly Thr Phe Ala Gln Leu Ser Glu Leu His Cys Asp Lys 85 90 95 Leu His Val Asp Pro Glu Asn Phe Lys Leu Leu Gly Asn Val Leu Val 100 105 110 Thr Val Leu Ala Ile His Phe Gly Lys Glu Phe Thr Pro Glu Val Gln 115 120 125 Ala Ser Trp Gln Lys Met Val Thr Ala Val Ala Ser Ala Leu Ser Ser 130 135 140 Arg Tyr His 145 <210> 102 <211> 3030 <212> DNA <213> Artificial Sequence <220> <223> 3'HS1 <400> 102 ccaggctcca ttattgatat agtcatgatc tcctctgttg gggatgaagt aggcaaattt 60 gaggcactaa tttacttctc acattctttt cttgaacaga aagatagaac tggaaattaa 120 tagtagtata taaattcaaa attttagctt taataacatt taatcagaca taaataatta 180 tggtaatgtg aatttcaata aataaatttt agttctaata taagtgtaac tgtgtaatat 240 tcatactttt tctgaaggct ttactaattt gatatggcat tactttttta ttgctgccaa 300 aactattctt attccactgt gtggtgatga gaaagtgaga gatgttctgg agatggtgat 360 tatagatagc ttccctgaag ccatagtaac cccctggaga aaaattggac ctggagtcta 420 gcagcctagg tatgggtact cgatttctta gaaagccttt acaatttcct ttatcttaaa 480 aataagggta ttgaagtaga attctagaat tttcagagga caacttaaaa tatgtgtaat 540 agttttaatt atttatcctc ataaatttaa ctgttcattt taatatattt aaggatgaat 600 tttttaaaaa gttgatttca taaaaacggg aatagaaaga tggttccata ggctgactga 660 gagtgtagag gagggatggg aagggaaaga agttgatctt cagttagact agaggaataa 720 gttttagtga tctctcacac tgcatagtga acacagttaa taatatatta tgtatttaaa 780 ttaaaaattg ctaaaaaata aatattttat gttctcacca caaaaaaagt tggaaggtga 840 ttcatatgct aattagcttg atagactctc tctacaatgt atatatagat caaacatcac 900 attgtatccc ataacatatt atatatatta tatatttata ttatatatta ttattgtatc 960 cattaatata tgcacttatt atttgccagg caaataaaaa atgtttttaa aatataaatt 1020 tatttgtaac ctccttttac ttttctgctt ggttttcttc tttcattcag tgtttaccag 1080 tttcttatag ttaattttat tttaagctgt ctcacatttt ctgaagaaaa gggaacatat 1140 taaagccaac aaaacaaata cactatcttg catgagatga tttatgtcat ggtacaatca 1200 aatgctataa atcttataaa aacttctcaa atggttagat ggctacagtt gaacagatgg 1260 accatgtcat atatttttta taatgcttct aaggtatggc taatttttaa aaaatatttt 1320 agtaatgatg ggaatattat ttatagaaat cttataaaat atataatgaa atatgtaata 1380 aagtctagat aaatgtgtat atacataata tatatttatt acataatata taatatataa 1440 tgtatattta tatattacat gcattatata ttaaatataa tacattttat atattatata 1500 ttaaaatatg taataatatg ttattaaata tatacaataa tctattacat tttatgctta 1560 tataatatat aataaatata tagtatataa taaatataca ctatatattt gtatctatat 1620 atgtttataa agtcattcct ctaattaggt cataaccatt caggtaaact ggaaatttaa 1680 gcctacttca ggtttgtggt aaatagattc tctctgaact agcatattca gaatcattaa 1740 acagtcagtt ctttggacaa gtcttataga atgttcttac ctcttcagcc atcccaagac 1800 tcttgagggc ctgacctcgc ttacactaaa gcagatctgc cttatgcatc actgaagtag 1860 ggagggaaga aagtttgatg aactacttct gacccctagt ggtgtccaga aaagaccatt 1920 aaaggaatga cctttaaagg atggacatac aattttttgt ccaaggcagg acatgtgtgg 1980 gtgtctttca gtaattatgt tctaagaaca gcaaaaactc cactgccttg gcaaatagga 2040 atgttttagt tctatagaat tataaagaag ctgtctttta aacacaatat actttctcta 2100 tgtctttgga acaatgacta ttggtcatta ccctatttta aagtaagcaa gtaatcacac 2160 agggaattat tctgaaaaga cagaaaaaaa aaaaaaacca agagatttct gcatatgtag 2220 gtcagtttta atcagagggc atcagaaaag actcctgaaa gaatgacctg gttattataa 2280 tcacagattt gctttccaag tcaacattcc agacagtgct cagaggggat acgaaaaccc 2340 ttttatttct ccagactcaa attcactgct atttgtcttc tctatttatt ttattatagg 2400 cattgttctg gttgctggga actcagactg agataccata cactgactct cagatagcat 2460 aacacaacat gatgtcttgg aaaactgtaa atctttttgt tttttaaata caggtggagc 2520 atctggcaca cctgacatat tgatcttgtt tttctttaaa tcttcattta tttaccttat 2580 caaaactatg ctctttcatc ctacctttca aaacatattt taaaaaatcc tccaacatgt 2640 attttgctct ggtaatccca aaaggctgat agtctctatg gtggcaacat ggataatact 2700 gttccccatc tagatggtct catttcttct gtatctagtc tgaagaagcc tgaatgaaag 2760 tagattttta agctttgtag ctagtctgaa gcctttgtag tcagtctgaa gaaacctgca 2820 tgaaaataga tttttttttt cctttgggac agagtcttgc tctgtcgccc agactggagt 2880 gcaatggcgc gatctcggct cactgcaact tccacctccc aggatcaagc aattctcctg 2940 cctcagtctc ccaagtaact gggattacag gagcacactg ccatgcccag ctaattattt 3000 tttgtgtttt agtagagaca gggtttcacc 3030

Claims

(a) 아데노바이러스 캡시드; 및
(b) (i) 적어도 10 kb의 트랜스포손 페이로드;
(ii) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및
(iii) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)
를 포함하는 선형 이중 가닥 DNA 게놈
을 포함하는 아데노바이러스 공여자 벡터.
(a) 적어도 10 kb의 트랜스포손 페이로드;
(b) 트랜스포손 페이로드에 플랭킹된 트랜스포손 역전된 반복부 (IR); 및
(c) 트랜스포손 역전된 반복부에 플랭킹된 레콤비나제 직접 반복부 (DR)
를 포함하는 아데노바이러스 공여자 게놈.
(a) 제1항의 아데노바이러스 공여자 벡터; 및
(b) (i) 아데노바이러스 캡시드; 및
(ii) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈
을 포함하는 아데노바이러스 지지 벡터
를 포함하는 아데노바이러스 전위 시스템.
(a) 제2항의 아데노바이러스 공여자 게놈; 및
(b) 트랜스포사제를 코딩하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈
을 포함하는 아데노바이러스 전위 시스템.
(a) 제2항의 아데노바이러스 공여자 게놈을 포함하는 핵산; 및
(b) 조건부 패키징 요소를 포함하는 아데노바이러스 헬퍼 게놈을 포함하는 핵산
을 포함하는 아데노바이러스 생산 시스템.
제1항 내지 제5항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 긴 LCR을 포함하고, 임의로 여기서 긴 LCR이 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR인 벡터, 게놈, 또는 시스템.
제6항에 있어서, 긴 LCR이 적어도 27 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 표 1에 제시된 LCR을 포함하는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 적어도 15 kb, 적어도 16 kb, 적어도 17 kb, 적어도 18 kb, 적어도 19 kb, 적어도 20 kb, 적어도 21 kb, 적어도 22 kb, 적어도 23 kb, 적어도 24 kb, 적어도 25 kb, 적어도 30 kb, 적어도 35 kb, 적어도 38 kb, 또는 적어도 40 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 10 kb-35 kb, 10 kb-30 kb, 15 kb-35 kb, 15 kb-30 kb, 20 kb-35 kb, 또는 20 kb-30 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제6항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 10 kb-32.4 kb, 15 kb-32.4 kb, 또는 20 kb-32.4 kb의 길이를 갖는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제11항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 단백질을 코딩하는 핵산 서열을 포함하고, 임의로 여기서 단백질이 치료 단백질인 벡터, 게놈, 또는 시스템.
제12항에 있어서, 단백질이 β 글로빈 대체 단백질 및 γ-글로빈 대체 단백질로 이루어진 군으로부터 선택된 것인 벡터, 게놈, 또는 시스템.
제12항에 있어서, 단백질이 인자 VIII 대체 단백질인 벡터, 게놈, 또는 시스템.
제12항 또는 제13항에 있어서, 단백질을 코딩하는 핵산 서열이 프로모터와 작동가능하게 연결되고, 임의로 여기서 프로모터가 β 글로빈 프로모터인 벡터, 게놈, 또는 시스템.
제1항 내지 제15항 중 어느 한 항에 있어서, 트랜스포손 역전된 반복부가 슬리핑 뷰티 (SB) 역전된 반복부이고, 임의로 여기서 SB 역전된 반복부가 pT4 역전된 반복부인 벡터, 게놈, 또는 시스템.
제3항 내지 제15항 중 어느 한 항에 있어서, 트랜스포사제가 슬리핑 뷰티 (SB) 트랜스포사제이고, 임의로 여기서 트랜스포사제가 슬리핑 뷰티 100x (SB100x)인 벡터, 게놈, 또는 시스템.
제1항 내지 제17항 중 어느 한 항에 있어서, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
제3항 내지 제18항 중 어느 한 항에 있어서, 아데노바이러스 지지 게놈이 레콤비나제를 코딩하는 핵산을 포함하는 것인 벡터, 게놈, 또는 시스템.
제19항에 있어서, 레콤비나제가 FLP 레콤비나제인 벡터, 게놈, 또는 시스템.
제1항 내지 제20항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 β-글로빈 긴 LCR을 포함하고, 트랜스포손 페이로드가 β-글로빈 프로모터와 작동가능하게 연결된 β-글로빈을 코딩하는 핵산 서열을 포함하고, 역전된 반복부가 SB 역전된 반복부이고, 레콤비나제 직접 반복부가 FRT 부위인 벡터, 게놈, 또는 시스템.
제1항 내지 제21항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하고, 임의로 여기서 선택 카세트가 mgmt^P140K를 코딩하는 핵산 서열을 포함하는 것인 벡터, 게놈, 또는 시스템.
제1항 내지 제22항 중 어느 한 항에 있어서, 아데노바이러스 캡시드가 CD46에 대한 증가된 친화도를 위해 변형되고, 임의로 여기서 아데노바이러스 캡시드가 Ad35++ 캡시드인 벡터, 게놈, 또는 시스템.
제5항 내지 제23항 중 어느 한 항에 있어서, 아데노바이러스 헬퍼 게놈 조건부 패키징 요소가 레콤비나제 직접 반복부에 플랭킹된 패키징 서열을 포함하는 것인 아데노바이러스 생산 시스템.
제24항에 있어서, 조건부 패키징 요소의 패키징 서열에 플랭킹된 레콤비나제 직접 반복부가 LoxP 부위인 아데노바이러스 생산 시스템.
제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 포함하는 세포.
제1항 내지 제25항 중 어느 한 항의 트랜스포손 페이로드를 그의 게놈에 포함하는 세포로서, 여기서 세포의 게놈에 존재하는 트랜스포손 페이로드는 트랜스포손 역전된 반복부에 플랭킹된 것인 세포.
제26항 또는 제27항에 있어서, 조혈 줄기 세포인 세포.
제5항 내지 제25항 중 어느 한 항에 따른 아데노바이러스 생산 시스템을 포함하는 아데노바이러스-생산 세포로서, 임의로 HEK293 세포인 아데노바이러스-생산 세포.
세포를 변형시키는 방법으로서, 세포를 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템과 접촉시키는 것을 포함하는 방법.
대상체의 세포를 변형시키는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
대상체로부터의 세포의 단리 없이 대상체의 세포를 변형시키는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
질환 또는 상태의 치료를 필요로 하는 대상체에서 질환 또는 상태를 치료하는 방법으로서, 대상체에게 제1항 내지 제25항 중 어느 한 항에 따른 벡터, 게놈, 또는 시스템을 투여하는 것을 포함하는 방법.
제31항 내지 제33항 중 어느 한 항에 있어서, 아데노바이러스 공여자 벡터가 대상체에게 정맥내로 투여되는 것인 방법.
제31항 내지 제34항 중 어느 한 항에 있어서, 대상체에게 가동화 작용제를 투여하는 것을 포함하며, 임의로 여기서 가동화 작용제는 과립구-콜로니 자극 인자 (G-CSF), CXCR4 길항제, 및 CXCR2 효능제 중 1종 이상을 포함하는 것인 방법.
제35항에 있어서, CXCR4 길항제가 AMD3100인 방법.
제35항 또는 제36항에 있어서, CXCR2 효능제가 GRO-β인 방법.
제31항 내지 제37항 중 어느 한 항에 있어서, 트랜스포손 페이로드가 선택 카세트를 포함하며, 대상체에게 선택제를 투여하는 것을 포함하는 방법.
제38항에 있어서, 선택 카세트가 mgmt^P140K를 코딩하고, 선택제가 O⁶BG/BCNU인 방법.
제31항 내지 제39항 중 어느 한 항에 있어서, CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
제31항 내지 제39항 중 어느 한 항에 있어서, 조혈 줄기 세포 및/또는 적혈구 Ter119⁺ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 트랜스포손 페이로드의 적어도 1개의 카피의 통합 및/또는 발현을 유발하는 방법.
제31항 내지 제41항 중 어느 한 항에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2개의 카피의 통합을 유발하는 방법.
제31항 내지 제42항 중 어느 한 항에 있어서, 트랜스포손 페이로드의 적어도 1개의 카피를 포함하는 세포의 게놈에서 트랜스포손 페이로드의 평균 적어도 2.5개의 카피의 통합을 유발하는 방법.
제31항 내지 제43항 중 어느 한 항에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 20%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
제31항 내지 제43항 중 어느 한 항에 있어서, 트랜스포손 페이로드에 의해 코딩된 단백질의 발현을 참조 수준의 적어도 약 25%인 수준으로 유발하고, 임의로 여기서 참조가 대상체 또는 참조 집단에서의 내인성 참조 단백질의 발현인 방법.
제31항 내지 제45항 중 어느 한 항에 있어서, 대상체가 중간성 지중해빈혈을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 β 글로빈 대체 단백질 및/또는 γ-글로빈 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
제31항 내지 제45항 중 어느 한 항에 있어서, 대상체가 혈우병을 앓고 있는 대상체이며, 여기서 트랜스포사제 페이로드는 β-글로빈 LCR HS1 내지 HS5를 포함하는 β-글로빈 긴 LCR 및 β 글로빈 프로모터와 작동가능하게 연결된 인자 VIII 대체 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
제47항에 있어서, 대상체에서의 단백질의 발현이 중간성 지중해빈혈의 적어도 1종의 증상을 감소시키고/거나 중간성 지중해빈혈을 치료하는 것인 방법.