본원에서는, 세포에서 ARSA 유전자 기능을 복원할 수 있는 아데노-관련 바이러스(AAV) 조성물, 및 ARSA 유전자 기능의 감소와 연관된 질환(예를 들어, MLD)을 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, 아데노-관련 바이러스 조성물을 제조하기 위한 패키징 시스템이 제공된다.
따라서, 일 양태에서, 본 개시는 세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현시키는 방법을 제공하며, 방법은, (a) AAV 캡시드 단백질(예를 들어, 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는, 재조합 아데노-연관 바이러스(rAAV)로 세포를 형질도입하는 단계를 포함한다.
특정 구현예에서, 세포는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 중추 신경계 및/또는 말초 신경계의 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 세포는 척수, 운동 피질, 감각 피질, 해마, 피각, 소뇌, 선택적으로 소뇌 핵, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 세포는 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질의 세포, 말초 신경계의 감각 뉴런, 슈반(Schwann) 세포, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 세포이다. 특정 구현예에서, 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포를 형질도입하기에 효과적인 양으로 대상체에게 투여된다.
또 다른 양태에서, 본 개시는 이염색 백색질장애(MLD)를 앓고 있는 대상체를 치료하는 방법을 제공하며, 방법은 (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드(예를 들어, 클레이드 F 캡시드 단백질), 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다.
특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14, 62, 또는 72에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 58, 25 및 32에 제시된 5'로부터 3'까지의 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 42에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 스터퍼(stuffer) 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 스터퍼 서열 3'을 추가로 포함한다. 소정의 구현예에서, 스터퍼 서열은 폴리아데닐화 서열에 대해 3'이다.
소정의 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 및 75로 이루어진 군으로부터 선택되는 서열을 포함한다.
특정 구현예에서, 전달 게놈은 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 26과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 27과 적어도 95%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 57과 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 이염색 백색질장애는 아릴술파타아제 A(ARSA) 유전자 돌연변이와 연관된다. 특정 구현예에서, 대상체는 인간 대상체이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
또 다른 양태에서, 본 개시는, (a) AAV 캡시드 단백질을 포함하는 AAV 캡시드(예를 들어, 클레이드 F 캡시드 단백질), 및 (b) 침묵적으로 변형된 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈을 포함하는 rAAV를 제공한다.
특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 23에 제시된 아미노산 서열을 암호화한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 14에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 침묵적으로 변형된 ARSA 코딩 서열은 서열번호 62 또는 72에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전사 조절 요소는 시토메갈로바이러스(CMV) 인핸서 요소, 닭-β-액틴(CBA) 프로모터, 작은 닭-β-액틴(SmCBA) 프로모터, 칼모둘린 1(CALM1) 프로모터, 프로테오리피드 단백질 1(PLP1) 프로모터, 신경교 섬유소 산성 단백질(GFAP) 프로모터, 시냅신 2(SYN2) 프로모터, 메탈로티오네인 3(MT3) 프로모터, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 하나 이상의 요소를 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 서열과 적어도 90% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 25, 32, 36, 54, 55 및 58로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 58, 25 및 32에 제시된 5'로부터 3'까지의 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전사 조절 요소는 서열번호 36에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 전달 게놈은 침묵적으로 변형된 ARSA 코딩 서열에 대한 폴리아데닐화 서열 3'을 추가로 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다. 특정 구현예에서, SV40 폴리아데닐화 서열은 서열번호 42에 제시된 뉴클레오티드 서열을 포함한다.
소정의 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 및 75로 이루어진 군으로부터 선택되는 서열을 포함한다.
특정 구현예에서, 전달 게놈은 게놈의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 게놈의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 추가로 포함한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 95%의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 95%의 서열 동일성을 갖는다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 47, 48, 49, 68, 69, 및 76으로 이루어진 군으로부터 선택되는 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (b) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (c) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (d) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (e) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 95% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다.
특정 구현예에서, (a) 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; (b) 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이고; (c) 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; (d) 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; (e) 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이고; (f) 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; (g) 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; (h) 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 또는 (i) 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다.
특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
또 다른 양태에서, 본 개시는 본원에 기술된 rAAV를 포함하는 약학적 조성물을 제공한다.
또 다른 양태에서, 본 개시는 서열번호 14, 62 및 72에 제시된 핵산 서열을 포함하는 폴리뉴클레오티드를 제공한다.
또 다른 양태에서, 본 개시는 rAAV의 제조를 위한 패키징 시스템을 제공하며, 여기에서 패키징 시스템은 (a) 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; (b) 제41항 내지 제71항 중 어느 한 항의 AAV의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 및 (c) 제41항 내지 제71항 중 어느 한 항의 AAV의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 패키징 시스템은 제1 뉴클레오티드 서열 및 제2 뉴클레오티드 서열을 포함하는 제1 벡터, 및 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다.
특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 특정 구현예에서, 제4 뉴클레오티드 서열은 제3 벡터 내에 포함된다. 특정 구현예에서, 제4 뉴클레오티드 서열은 아데노바이러스, 포진 바이러스, 우두 바이러스, 및 거대세포 바이러스(CMV)로 이루어진 군으로부터 선택된 바이러스 유래의 하나 이상의 유전자를 포함한다.
특정 구현예에서, 제1 벡터, 제2 벡터, 및/또는 제3 벡터는 플라스미드이다.
또 다른 양태에서, 본 개시는 rAAV의 재조합 제조 방법을 제공하며, 방법은 rAAV가 생산되는 조건 하에서 본원에 기술된 패키징 시스템을 세포에 도입하는 단계를 포함한다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 세포에서 아릴술파타아제 A(ARSA) 폴리펩티드를 발현하기 위한 방법에 사용하기 위한, 본원에 기술된 rAAV를 제공한다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 이염색 백색질장애(MLD)를 앓고 있는 대상체를 치료하기 위한 방법에 사용하기 위한, 본원에 기술된 rAAV를 제공한다.
본원에서는, 세포에서 ARSA 유전자 기능을 복원할 수 있는 아데노-관련 바이러스(AAV) 조성물, 및 ARSA 유전자 기능의 감소와 연관된 질환(예를 들어, MLD)을 치료하기 위해 이를 사용하는 방법이 제공된다. 또한, 아데노-관련 바이러스 조성물을 제조하기 위한 패키징 시스템이 제공된다.
I. 정의
본원에서 사용되는 용어 "복제-결함 아데노-연관 바이러스"는 Rep 및 Cap 유전자가 결여된 게놈을 포함하는 AAV를 지칭한다.
본원에서 사용되는 용어 "ARSA 유전자"는 아릴술파타아제 A 유전자를 지칭한다. 인간 ARSA 유전자는 National Center for Biotechnology Information (NCBI) 유전자 ID 410에 의해 식별된다. ARSA mRNA의 예시적인 뉴클레오티드 서열은 서열번호 14로서 제공된다. ARSA 폴리펩티드의 예시적인 아미노산 서열은 서열번호 23으로서 제공된다.
본원에서 사용되는 용어 "전달 게놈"은, 전달 게놈이 세포 내로 도입될 때 코딩 서열의 발현을 매개하는 외인성 전사 조절 요소에 작동 가능하게 연결된 코딩 서열을 포함하는 재조합 AAV 게놈을 지칭한다. 특정 구현예에서, 전달 게놈은 세포의 염색체 DNA에 통합되지 않는다. 당업자는 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소를 포함하는 전달 게놈의 부분이 ARSA 코딩 서열의 전사 방향에 대해 센스 또는 안티센스 배향에 있을 수 있음을 이해할 것이다.
본원에서 사용되는 용어 "클레이드(Clade) F 캡시드 단백질"은 본원에서 서열번호 1의 아미노산 1 내지 736, 138 내지 736, 및 203 내지 736에서 각각 제시된 VP1, VP2 또는 VP3 아미노산 서열과 적어도 90%의 동일성을 갖는 AAV VP1, VP2 또는 VP3 캡시드 단백질을 지칭한다.
본원에서 사용되는, 2개의 뉴클레오티드 서열 사이 또는 2개의 아미노산 서열 사이의 "백분율 동일성"은 정렬된 서열 쌍 사이의 일치되는 수에 100을 곱하고, 내부 갭을 포함하는 정렬된 영역의 길이를 나눔으로써 계산된다. 동일성 채점은 완벽한 일치만을 계산하며, 아미노산의 서로 유사한 정도는 고려하지 않는다. 내부 갭만이 길이에 포함되고, 서열 단부에서의 갭은 포함되지 않는다.
본원에서 사용되는 "ARSA 유전자 돌연변이와 연관된 질환 또는 장애"는 ARSA 유전자의 돌연변이에 의해 야기되거나, 이에 의해 악화되거나, 또는 이와 유전적으로 연결된 임의의 질환 또는 장애를 지칭한다. 특정 구현예에서, ARSA 유전자 돌연변이와 연관된 질환 또는 장애는 이염색 백색질장애(MLD)이다.
본원에서 사용되는 용어 "암호화 서열"은, 시작 코돈에서 시작하여 정지 코돈에서 끝나는, 폴리펩티드를 암호화하는 상보적 DNA(cDNA)의 부분을 지칭한다. 유전자는 대안적 스플라이싱, 대안적 번역 개시, 및 모집단 내 변이로 인해 하나 이상의 코딩 서열을 가질 수 있다. 코딩 서열은 야생형이거나 코돈-변형될 수 있다. 예시적인 야생형 ARSA 코딩 서열은 서열번호 24에 제시되어 있다.
본원에서 사용되는 용어 "침묵적으로 변형된"은 코딩 서열 또는 스터퍼-삽입 코딩 서열에 의해 암호화된 폴리펩티드의 아미노산 서열을 변화시키지 않는 (예를 들어, 뉴클레오티드 치환에 의한) 유전자의 코딩 서열 또는 스터퍼-삽입 코딩 서열의 변형을 지칭한다. 이러한 침묵 변형은 코딩 서열이 세포 내로 형질도입될 때 코딩 서열의 번역 효율을 증가시킬 수 있고/있거나 내인성 유전자의 상응하는 서열과의 재조합을 방지할 수 있다는 점에서 유리하다.
본 개시에서, ARSA 유전자에서의 뉴클레오티드 위치는 시작 코돈의 제1 뉴클레오티드에 대해 지정된다. 시작 코돈의 제1 뉴클레오티드는 위치 1이고; 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 5'는 음의 수를 가지며; 시작 코돈의 제1 뉴클레오티드에 대한 뉴클레오티드 3'는 양의 수를 갖는다. 인간 ARSA 유전자의 예시적인 뉴클레오티드 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426) 뉴클레오티드 374이고, 인간 ARSA 유전자의 예시적인 뉴클레오티드 3은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 376이다. 시작 코돈에 인접한 뉴클레오티드 5'는 뉴클레오티드 -1이다.
본 개시에서, ARSA 유전자 내의 엑손 및 인트론은, NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 374인, 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손에 대해 특정된다. 시작 코돈의 제1 뉴클레오티드를 포함하는 엑손은 엑손 1이다. 엑손 3'에서 엑손 1은 5'에서 3'까지: 엑손 2, 엑손 3 등이다. 인트론 3'에서 엑손 1은 5'에서 3'까지: 인트론 1, 인트론 2 등이다. 따라서, ARSA 유전자는 5'에서 3'까지: 엑손 1, 인트론 1, 엑손 2, 인트론 2, 엑손 3 등을 포함한다. 인간 ARSA 유전자의 예시적인 엑손 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 374 내지 597이다. 인간 ARSA 유전자의 예시적인 인트론 1은 NCBI 기준 서열: NG_009260.2(영역: 5028 - 10426)의 뉴클레오티드 598 내지 746이다.
본원에서 사용되는 용어 "전사 조절 요소" 또는 "TRE"는 RNA 중합효소에 의해 작동 가능하게 연결된 뉴클레오티드 서열의 전사를 조절(예를 들어, 제어, 증가, 또는 감소)하여 RNA 분자를 형성하는 시스-작용 뉴클레오티드 서열, 예를 들어, DNA 서열을 지칭한다. TRE는 전사 인자와 같은 하나 이상의 트랜스-작용 분자에 의존하여 전사를 조절한다. 따라서, 하나의 TRE는, 예를 들어, 상이한 유형의 세포에 존재할 때, 상이한 트랜스-작용 분자와 접촉할 경우 상이한 방식으로 전사를 조절할 수 있다. TRE는 하나 이상의 프로모터 요소 및/또는 인핸서 요소를 포함할 수 있다. 당업자는, 유전자 내의 프로모터 및 인핸서 요소가 위치상 근접할 수 있고, 용어 "프로모터"는 프로모터 요소 및 인핸서 요소를 포함하는 서열을 지칭할 수 있음을 이해할 것이다. 따라서, 용어 "프로모터"는 서열에서의 인핸서 요소를 배제하지 않는다. 프로모터 및 인핸서 요소는 동일한 유전자 또는 종으로부터 유래될 필요가 없으며, 각각의 프로모터 또는 인핸서 요소의 서열은 게놈 내의 상응하는 내인성 서열과 동일하거나 실질적으로 동일할 수 있다.
본원에서 사용되는 용어 "작동 가능하게 연결된"은 TRE와 전사될 코딩 서열 사이의 연결을 설명하는 데 사용된다. 일반적으로, 유전자 발현은 하나 이상의 프로모터 및/또는 인핸서 요소를 포함하는 TRE의 조절 하에 배치된다. 코딩 서열의 전사가 TRE에 의해 제어되거나 영향을 받는 경우, 코딩 서열은 TRE에 "작동 가능하게 연결"된다. TRE의 프로모터 및 인핸서 요소는 원하는 전사 활성이 수득되는 한, 코딩 서열로부터 임의의 배향 및/또는 거리에 있을 수 있다. 특정 구현예에서, TRE는 코딩 서열로부터 상류에 있다.
본원에서 사용되는 용어 "리보좀 스키핑 요소"는 하나의 mRNA 분자의 번역으로부터 2개의 펩티드 사슬의 생성을 야기할 수 있는 짧은 펩티드 서열을 암호화하는 뉴클레오티드 서열을 지칭한다. 특정 구현예에서, 리보솜 스키핑 요소는 X1X2EX3NPGP의 컨센서스 모티프를 포함하는 펩티드를 암호화하며, 여기에서 X1은 D 또는 G이고, X2는 V 또는 I이고, X3은 임의의 아미노산이다(서열번호 34). 특정 구현예에서, 리보솜 스키핑 요소는 토세아(Thosea) 아시그나 바이러스 2A 펩티드(T2A), 돼지 테스코바이러스-1 2A 펩티드(P2A), 발-구강 질환 바이러스 2A 펩티드(F2A), 말 비염 A 바이러스 2A 펩티드(E2A), 세포질 다면체증 바이러스 2A 펩티드(BmCPV 2A), 또는 B. mori 2A 펩티드의 플라셰리(flacherie) 바이러스(BmIFV 2A)를 암호화한다. T2A 펩티드 및 P2A 펩티드의 예시적인 아미노산 서열은 서열번호 37 및 38에 각각 제시되어 있다. T2A 요소 및 P2A 요소의 예시적인 뉴클레오티드 서열은 서열번호 66 및 63에 각각 제시되어 있다. 특정 구현예에서, 리보솜 스키핑 요소는 N 말단에서 Gly-Ser-Gly의 서열을 추가로 포함하는 펩티드를 암호화하되, 선택적으로 Gly-Ser-Gly의 서열은 GGCAGCGGA의 뉴클레오티드 서열에 의해 암호화된다. 이론에 구속되지 않고, 리보솜 스키핑 요소는: 제1 펩티드 사슬의 번역의 종료 및 제2 펩티드 사슬의 번역 재개시에 의해; 또는 암호화된 펩티드의 고유한 프로테아제 활성에 의해 또는 환경(예를 들어, 세포액)에서의 또 다른 프로테아제에 의해 리보솜 스키핑 요소에 의해 암호화된 펩티드 서열에서의 펩티드 결합의 절단에 의해 기능하는 것으로 가정된다.
본원에서 사용되는 용어 "리보솜 스키핑 펩티드"는 리보솜 스키핑 요소에 의해 암호화된 펩티드를 지칭한다.
본원에서 사용되는 용어 "폴리아데닐화 서열"은 RNA로 전사될 때 폴리아데닐화 신호 서열을 구성하는 DNA 서열을 지칭한다. 폴리아데닐화 서열은 (예를 들어, ARSA 유전자로부터 유래된) 천연이거나 외인성일 수 있다. 외인성 폴리아데닐화 서열은 포유류 또는 바이러스 폴리아데닐화 서열(예를 들어, SV40 폴리아데닐화 서열)일 수 있다.
본원에서 사용되는 "외인성 폴리아데닐화 서열"은 ARSA 유전자(예를 들어, 인간 ARSA 유전자)의 내인성 폴리아데닐화 서열과 동일하지 않거나 실질적으로 동일하지 않은 폴리아데닐화 서열을 지칭한다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 동일한 종(예를 들어, 인간)에서의 비-ARSA 유전자의 폴리아데닐화 서열이다. 특정 구현예에서, 외인성 폴리아데닐화 서열은 상이한 종(예를 들어, 바이러스)의 비폴리아데닐화 서열이다.
본원에서 사용되는, 대상체에게 AAV를 투여하는 맥락에서의 용어 "유효량"은 원하는 예방 효과 또는 치료 효과를 달성하는 AAV의 양을 지칭한다.
II.
아데노-연관 바이러스 조성물
일 양태에서, ARSA 유전자 기능이 감소되거나 달리 결함이 있는 세포에서 ARSA 폴리펩티드를 발현하는데 유용한 신규 재조합 AAV(예를 들어, 복제-결함 AAV) 조성물이 본원에 제공된다. 특정 구현예에서, 본원에 개시된 rAAV는, 캡시드 단백질(예를 들어, 클레이드 F 캡시드 단백질)을 포함하는 AAV 캡시드; 및 ARSA 코딩 서열(예를 들어, 침묵적으로 변형된 ARSA 코딩 서열)에 작동 가능하게 연결되어 AAV로 형질도입된 세포에서 ARSA의 염색체 외 발현을 가능하게 하는 전사 조절 요소를 포함하는 전달 게놈을 포함한다.
AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, 또는 AAV9 혈청형으로부터의 캡시드 단백질을 포함하되 이들로 한정되지 않는, 당업계에 공지된 임의의 캡시드로부터의 캡시드 단백질이 본원에 개시된 rAAV 조성물에 사용될 수 있다. 예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함한다.
예를 들어, 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하며, 여기에서: 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고; 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 68에 상응하는 캡시드 단백질 중의 아미노산은 V이고; 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고; 서열번호 16의 아미노산 151에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 160에 상응하는 캡시드 단백질 중의 아미노산은 D이고; 서열번호 16의 아미노산 206에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고; 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이고; 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고; 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고; 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이고; 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고; 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 590에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G 또는 Y이고; 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이고; 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이고; 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이고; 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이고; 또는, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 2에 상응하는 캡시드 단백질 중의 아미노산은 T이고, 서열번호 16의 아미노산 312에 상응하는 캡시드 단백질 중의 아미노산은 Q이다. 특정 구현예에서, 서열번호 16의 아미노산 65에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 Y이다. 특정 구현예에서, 서열번호 16의 아미노산 77에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 690에 상응하는 캡시드 단백질 중의 아미노산은 K이다. 특정 구현예에서, 서열번호 16의 아미노산 119에 상응하는 캡시드 단백질 중의 아미노산은 L이고, 서열번호 16의 아미노산 468에 상응하는 캡시드 단백질 중의 아미노산은 S이다. 특정 구현예에서, 서열번호 16의 아미노산 626에 상응하는 캡시드 단백질 중의 아미노산은 G이고, 서열번호 16의 아미노산 718에 상응하는 캡시드 단백질 중의 아미노산은 G이다. 특정 구현예에서, 서열번호 16의 아미노산 296에 상응하는 캡시드 단백질 중의 아미노산은 H이고, 서열번호 16의 아미노산 464에 상응하는 캡시드 단백질 중의 아미노산은 N이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 681에 상응하는 캡시드 단백질 중의 아미노산은 M이다. 특정 구현예에서, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 687에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 346에 상응하는 캡시드 단백질 중의 아미노산은 A이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이다. 특정 구현예에서, 서열번호 16의 아미노산 501에 상응하는 캡시드 단백질 중의 아미노산은 I이고, 서열번호 16의 아미노산 505에 상응하는 캡시드 단백질 중의 아미노산은 R이고, 서열번호 16의 아미노산 706에 상응하는 캡시드 단백질 중의 아미노산은 C이다. 특정 구현예에서, 캡시드 단백질은 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 2, 3, 4, 6, 7, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 203 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; (b) 서열번호 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 138 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질; 및 (c) 서열번호 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 또는 17의 아미노산 1 내지 736으로 이루어진 아미노산 서열을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 8의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 8의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 8의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 11의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 11의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 11의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 13의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 13의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 13의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 서열과 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 하나 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736의 아미노산 서열을 포함하는 캡시드 단백질 중 2개 이상을 포함한다. 특정 구현예에서, AAV 캡시드는, (a) 서열번호 16의 아미노산 203 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; (b) 서열번호 16의 아미노산 138 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질; 및 (c) 서열번호 16의 아미노산 1 내지 736으로 이루어진 아미노산을 갖는 캡시드 단백질을 포함한다.
본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 특정 구현예에서, 전달 게놈은 TRE 및 ARSA 코딩 서열의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 TRE 및 ARSA 코딩 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다.
특정 구현예에서, ARSA 코딩 서열은 ARSA 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 23을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 ARSA 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 23을 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 24에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 23을 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다(예를 들어, 서열번호 14, 62, 또는 72에 제시된 서열을 가짐).
특정 구현예에서, ARSA 코딩 서열은 ARSA 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, ARSA 코딩 서열은 야생형 ARSA 단백질(예를 들어, 인간 ARSA 단백질)의 아미노산 서열을 암호화한다. 특정 구현예에서, ARSA 코딩 서열은 돌연변이 ARSA 단백질(예를 들어, 인간 ARSA 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 ARSA 폴리펩티드는 야생형 ARSA 폴리펩티드의 기능적 균등물이다. 즉, 야생형 ARSA 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 ARSA 폴리펩티드는 야생형 ARSA 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 및/또는 SUMF1을 암호화하는 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 술파타아제 변형 인자 1(SUMF1) 유전자는, 기질 술파타아제 내의 시스테인 잔기를 활성 부위 3-옥소알라닌 잔기로 산화시킴으로써 황산 에스테르의 가수분해를 촉매하는 효소를 암호화하며, 이는 C-알파-포르밀글리신으로도 알려져 있다. SUMF1과 연관된 질환은 다수의 술파타아제 결핍증 및 이염색 백색질장애를 포함한다.
특정 구현예에서, SUMF1 코딩 서열은 SUMF1 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 29를 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 SUMF1 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 29를 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 64에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 29를 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다.
특정 구현예에서, SUMF1 코딩 서열은 SUMF1 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, SUMF1 코딩 서열은 야생형 SUMF1 단백질(예를 들어, 인간 SUMF1 단백질(hSUMF1))의 아미노산 서열을 암호화한다. 특정 구현예에서, SUMF1 코딩 서열은 돌연변이 SUMF1 단백질(예를 들어, 인간 SUMF1 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 SUMF1 폴리펩티드는 야생형 SUMF1 폴리펩티드의 기능적 균등물이다. 즉, 야생형 SUMF1 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 SUMF1 폴리펩티드는 야생형 SUMF1 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 전달 게놈은 hARSA 및 hSUMF1 둘 모두를 발현하도록 설계되고, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열은 리보솜 스키핑 요소에 의해 분리된다. 당업계에 공지된 임의의 리보솜 스키핑 요소, 예를 들어 본원의 다른 곳에서 기술된 리보솜 스키핑 요소가 사용될 수 있다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSUMF1을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열은 서열번호 30에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 본원에 개시된 AAV 조성물에 유용한 전달 게놈은 대체로 ARSA 및/또는 SapB를 암호화하는 코딩 서열에 작동 가능하게 연결된 전사 조절 요소(TRE)를 포함한다. 프로사포신(Prosaposin, PSAP) 유전자는 사포신 A, B, C, 및 D를 포함하는 4개의 주요 절단 산물을 생성하도록 단백질분해 처리되는 고도로 보존된 전전구단백질(preproprotein)을 암호화한다. 전구체 단백질의 각 도메인은 시스테인 잔기 및 당질화 부위의 배치와 거의 동일한 대략 80개 아미노산 잔기 길이이다. 사포신 A 내지 D는 이들이 짧은 올리고당기를 갖는 글리코스핑고리피드(glycosphingolipid)의 이화작용을 용이하게 하는 리소좀 구획에 주로 국소화된다. 전구체 단백질은 분비 단백질 및 일체형 막 단백질로서 존재하며, 신경영양 활성을 갖는다. 이 유전자의 돌연변이는 고셰병(Gaucher) 및 이염색 백색질장애와 연관이 있다. 사포신 B(SapB)는, ARSA에 의한 갈락토-세레브로사이드(galacto-cerebroside) 술페이트, 베타-갈락토시다아제(galactosidase)에 의한 GM1 강글리오사이드(ganglioside), 및 알파-갈락토시다아제 A에 의한 글로보트리아오실세라마이드(globotriaosylceramide)의 가수분해를 자극하는 것으로 나타났다. SapB는 스핑고리피드(sphingolipid) 가수분해효소의 기질과 함께 가용화 복합체를 형성하는 것으로 나타났다.
특정 구현예에서, SapB 코딩 서열은 SapB 유전자의 코딩 서열의 전부 또는 실질적으로 전부를 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 33을 암호화하는 뉴클레오티드 서열을 포함하고, 선택적으로 SapB 코딩 서열에 대해 외인성 폴리아데닐화 서열 3'을 추가로 포함할 수 있다. 특정 구현예에서, 서열번호 33을 암호화하는 뉴클레오티드 서열은 야생형이다(예를 들어, 서열번호 73에 제시된 서열을 가짐). 특정 구현예에서, 서열번호 33를 암호화하는 뉴클레오티드 서열은 침묵적으로 변형된다.
특정 구현예에서, SapB 코딩 서열은 SapB 단백질의 아미노산 서열의 전부 또는 실질적으로 전부를 포함하는 폴리펩티드를 암호화한다. 특정 구현예에서, SapB 코딩 서열은 야생형 SapB 단백질(예를 들어, 인간 SapB 단백질(hSapB))의 아미노산 서열을 암호화한다. 특정 구현예에서, SapB 코딩 서열은 돌연변이 SapB 단백질(예를 들어, 인간 SapB 단백질)의 아미노산 서열을 암호화하며, 여기에서 돌연변이 SapB 폴리펩티드는 야생형 SapB 폴리펩티드의 기능적 균등물이다. 즉, 야생형 SapB 폴리펩티드로서 기능할 수 있다. 특정 구현예에서, 기능적으로 균등한 SapB 폴리펩티드는 야생형 SapB 폴리펩티드에서 발견되지 않은 적어도 하나의 특성, 예를 들어, 단백질 분해에 저항하는 능력을 추가로 포함한다.
특정 구현예에서, 전달 게놈은 hARSA 및 hSapB 둘 모두를 발현하도록 설계되고, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열을 포함한다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열은 리보솜 스키핑 요소에 의해 분리된다. 당업계에 공지된 임의의 리보솜 스키핑 요소, 예를 들어 본원의 다른 곳에서 기술된 리보솜 스키핑 요소가 사용될 수 있다. 특정 구현예에서, hARSA를 암호화하는 제1 코딩 서열 및 hSapB을 암호화하는 제2 코딩 서열을 포함하는 뉴클레오티드 서열은 서열번호 74에 제시된 뉴클레오티드 서열을 포함한다.
전달 게놈은 임의의 포유류 세포(예를 들어, 인간 세포)에서 ARSA, SUMF1, 및/또는 SapB를 발현하는데 사용될 수 있다. 따라서, TRE는 임의의 포유류 세포(예를 들어, 인간 세포)에서 활성일 수 있다. 특정 구현예에서, TRE는 광범위한 인간 세포에서 활성이다. 이러한 TRE는, 거대세포바이러스(CMV) 프로모터/인핸서(예를 들어, 서열번호 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), SV40 프로모터, 닭 베타 액틴(CBA) 프로모터(예를 들어, 서열번호 59 또는 25와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), smCBA 프로모터(예를 들어, 서열번호 55와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 신장 인자 1 알파(EF1α) 프로모터(예를 들어, 서열번호 40과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 전사 인자 결합 부위를 포함하는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 포스포글리세레이트 키나아제(PGK1) 프로모터, 인간 유비퀴틴 C(Ubc) 프로모터, 인간 베타 액틴 프로모터, 인간 뉴런 특이적 에놀라아제(enolase)(ENO2) 프로모터, 인간 베타-글루쿠로니다제(glucuronidase)(GUSB) 프로모터, 토끼 베타-글로빈 요소(예를 들어, 서열번호 60과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 인간 칼모듈린(calmodulin) 1(CALM1) 프로모터(예를 들어, 서열번호 54와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함), 및/또는 인간 메틸-CpG 결합 단백질 2(MeCP2) 프로모터를 포함하는 구성 프로모터 및/또는 인핸서 요소를 포함할 수 있다. 이들 TRE 중 어느 하나는 효율적인 전사를 유도하기 위해 임의의 순서로 조합될 수 있다. 예를 들어, 전달 게놈은 CMV 인핸서, CBA 프로모터, 및 집합적으로 CAG 프로모터로 지칭되는 토끼 베타-글로빈 유전자의 엑손 3의 스플라이스 수용체를 포함할 수 있다(예를 들어, 서열번호 28과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함). 예를 들어, 전달 게놈은 CMV 인핸서 및 CBA 프로모터, 및 이에 이어지는 집합적으로 CASI 프로모터 영역으로 지칭되는 스플라이스 공여자 및 스플라이스 수용자를 포함할 수 있다(예를 들어, 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함함).
대안적으로, TRE는 조직-특이적 TRE일 수 있다. 즉, 이는 특정 조직(들) 및/또는 기관(들)에서 활성이다. 조직-특이적 TRE는 하나 이상의 조직-특이적 프로모터 및/또는 인핸서 요소, 및 선택적으로 하나 이상의 구성 프로모터 및/또는 인핸서 요소를 포함한다. 당업자는 조직-특이적 프로모터 및/또는 인핸서 요소가 당업계에 공지된 방법에 의해 조직에서 특이적으로 발현된 유전자로부터 단리될 수 있음을 이해할 것이다.
특정 구현예에서, TRE는 뇌-특이적(예를 들어, 뉴런-특이적, 신경교세포-특이적, 성상교세포-특이적, 희소돌기교세포-특이적, 미세교세포-특이적 및/또는 중추 신경계-특이적)이다. 예시적인 뇌-특이적 TRE는, 제한 없이, 인간 신경교 섬유소 산성 단백질(GFAP) 프로모터, 인간 시냅신 1(SYN1) 프로모터, 인간 시냅신 2(SYN2) 프로모터, 인간 메탈로티오네인 3(MT3) 프로모터, 및/또는 인간 프로테오리피드 단백질 1(PLP1) 프로모터로부터의 하나 이상의 요소를 포함할 수 있다. 더 많은 뇌-특이적 프로모터 요소가 WO2016/100575A1에 개시되어 있으며, 이는 그 전체가 참조로서 본원에 통합된다.
특정 구현예에서, 전달 게놈은 2개 이상의 TRE를 포함하고, 전술한 TRE 중 적어도 하나를 선택적으로 포함한다. 당업자는 이들 TRE 중 임의의 것이 임의의 순서로 조합될 수 있고, 구성 TRE 및 조직-특이적 TRE의 조합이 효율적이고 조직-특이적인 전사를 유도할 수 있음을 이해할 것이다.
특정 구현예에서, 전달 벡터는 비암호화 스터퍼 서열을 추가로 포함한다(예를 들어, 서열번호 39와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 뉴클레오티드 서열을 포함함). 비암호화 스터퍼 서열은 효율적인 DNA 패키징을 위한 적절한 한계 내에서 벡터의 크기를 유지하기 위해 사용될 수 있으며, 따라서 DNA 패키징의 효율을 증가시키기 위해 사용될 수 있다. 당업자는 스터퍼 서열의 성질이 벡터의 기능에 영향을 미칠 수 있다는 것을 인식할 것이고, 따라서 사용하기에 가장 적합한 스터퍼 서열을 선택할 것이다.
특정 구현예에서, 전달 벡터는 ARSA 코딩 서열에 인트론 5'을 추가로 포함하거나 이에 삽입된다. 이러한 인트론은, 예를 들어, 전사 침묵을 감소시키고 핵에서 세포질로 mRNA를 내보내는 것을 향상시킴으로써 이식유전자 발현을 증가시킬 수 있다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: 비암호화 엑손, 인트론, 및 ARSA 코딩 서열을 포함한다. 특정 구현예에서, 인트론 서열은 ARSA 코딩 서열에 삽입되며, 여기에서 선택적으로, 인트론은 2개의 천연 엑손을 연결하는 뉴클레오티드 간 결합에 삽입된다. 특정 구현예에서, 인트론은 천연 엑손 1 및 엑손 2를 연결하는 뉴클레오티드간 결합에 삽입된다.
인트론은 ARSA 유전자의 천연 인트론 서열, 상이한 종으로부터의 인트론 서열 또는 동일한 종으로부터의 상이한 유전자, 및/또는 합성 인트론 서열을 포함할 수 있다. 당업자는 합성 인트론 서열이 당업계에 공지된 임의의 컨센서스 스플라이싱 모티프를 도입함으로써 RNA 스플라이싱을 매개하도록 설계될 수 있음을 이해할 것이다(예를 들어, Sibley 등, (2016) Nature Reviews Genetics, 17, 407-21, 이는 그 전체가 본원에 참조로서 통합됨). 예시적인 인트론 서열은 Lu 등, (2013) Molecular Therapy 21(5): 954-63, 및 Lu 등, (2017) Hum. Gene Ther. 28(1): 125-34에서 제공되며, 이는 그 전체가 참조로서 본원에 통합된다. 특정 구현예에서, 전달 게놈은 SV40 인트론(예를 들어, 서열번호 31과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함)을 포함한다. 특정 구현예에서, 전달 게놈은 SV40 인트론(예를 들어, 서열번호 31에 제시된 뉴클레오티드 서열을 포함함) 또는 마우스의 미세 바이러스(MVM) 인트론(예를 들어, 서열번호 35에 제시된 뉴클레오티드 서열을 포함함)를 포함한다. 특정 구현예에서, 전달 게놈은, 부분적으로 전사되지 않은 닭 ACTB(cACTB) 프로모터, 모든 cACTB 엑손 1, 부분적으로 cACTB 인트론 1, 부분적으로 토끼 HBB2(rHBB2) 인트론 2, 및 부분적으로 rHBB2 엑손 3을 포함하는, 닭 및 토끼 서열의 조합을 포함하는 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32). 특정 구현예에서, 전달 게놈은 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함). 특정 구현예에서, 전달 게놈은 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 32에 제시된 뉴클레오티드 서열을 포함함).
특정 구현예에서, 전달 게놈은 CMV 인핸서, CBA 프로모터, 및 키메라 인트론 서열을 포함한다(예를 들어, 서열번호 36과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함함). 특정 구현예에서, 전달 게놈은 서열번호 36을 포함하는 TRE를 포함한다.
특정 구현예에서, 본원에서 개시된 전달 게놈은 전사 종결자(예를 들어, 폴리아데닐화 서열)를 추가로 포함한다. 특정 구현예에서, 전사 종결자는 ARSA 코딩 서열에 대해 3'이다. 전사 종결자는 전사를 효과적으로 종료하는 임의의 서열일 수 있고, 당업자는 이러한 서열이 ARSA 코딩 서열의 전사가 필요한 세포에서 발현되는 임의의 유전자로부터 단리될 수 있음을 이해할 것이다. 특정 구현예에서, 전사 종결자는 폴리아데닐화 서열을 포함한다. 특정 구현예에서, 폴리아데닐화 서열은 인간 ARSA 유전자의 내인성 폴리아데닐화 서열과 동일하거나 실질적으로 동일하다. 특정 구현예에서, 폴리아데닐화 서열은 외인성 폴리아데닐화 서열이다. 특정 구현예에서, 폴리아데닐화 서열은 SV40 폴리아데닐화 서열이다(예를 들어, 서열번호 31, 42, 43, 또는 45에 제시된 뉴클레오티드 서열, 또는 이에 상보적인 뉴클레오티드 서열을 포함함). 특정 구현예에서, 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 및 폴리아데닐화 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58 중 어느 하나와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 폴리아데닐화 서열은 서열번호 42, 43, 및 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
특정 구현예에서, TRE는 서열번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 14에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 5'에서 3'까지 서열번호 58에 제시된 서열, 서열번호 25에 제시된 서열, 및 서열번호 32에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열번호 54에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 62에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 55에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 62에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다.
특정 구현예에서, TRE는 서열번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열번호 72에 제시된 서열을 포함하고/하거나; 폴리아데닐화 서열은 서열번호 42에 제시된 서열을 포함한다. 특정 구현예에서, TRE는 5'에서 3'까지 서열번호 58에 제시된 서열, 서열번호 25에 제시된 서열, 및 서열번호 32에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 hSUMF1 코딩 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 2A 요소, 및 hSUMF1 코딩 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 62와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 2A 요소는 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; hSUMF1 서열은 서열번호 64와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, hSUMF1 코딩 서열을 추가로 포함하는 전달 게놈은 5'에서 3'까지: 서열번호 54 또는 55에 제시된 서열을 포함하는 TRE, 서열번호 62에 제시된 서열을 포함하는 hARSA 코딩 서열, 서열번호 63에 제시된 서열을 포함하는 2A 요소, 및 서열번호 64에 제시된 서열을 포함하는 hSUMF1 코딩 서열을 포함한다. 특정 구현예에서, hARSA-2A-hSUMF1 코딩 서열은 서열번호 30에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 hSapB 코딩 서열을 추가로 포함한다. 특정 구현예에서, 전달 게놈은 5'에서 3'까지: TRE, ARSA 코딩 서열, 2A 요소, 및 hSapB 코딩 서열을 포함한다. 특정 구현예에서, TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 2A 요소는 서열번호 63과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; hSapB 서열은 서열번호 73과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, hSapB 코딩 서열을 추가로 포함하는 전달 게놈은 5'에서 3'까지: 서열번호 36에 제시된 서열을 포함하는 TRE, 서열번호 72에 제시된 서열을 포함하는 hARSA 코딩 서열, 서열번호 63에 제시된 서열을 포함하는 2A 요소, 및 서열번호 74에 제시된 서열을 포함하는 hSapB 코딩 서열을 포함한다. 특정 구현예에서, hARSA-2A-hSapB 코딩 서열은 서열번호 74에 제시된 서열을 포함한다.
특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75와 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 41, 44, 46, 65, 67, 또는 75에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 44에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 44에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 본원에서 개시된 전달 게놈은 TRE의 5' 역위 말단 반복(5' ITR) 뉴클레오티드 서열 5', 및 ARSA 코딩 서열의 3' 역위 말단 반복(3' ITR) 뉴클레오티드 서열 3'을 포함한다. 임의의 AAV 혈청형 또는 이의 변이체로부터의 ITR 서열은 본원에 개시된 전달 게놈에 사용될 수 있다. 5' 및 3' ITR은 동일한 혈청형의 AAV 또는 상이한 혈청형의 AAV로부터 유래할 수 있다. 본원에 개시된 전달 게놈에 사용하기 위한 예시적인 ITR은 서열번호 18 내지 21, 26 및 27에 제시되어 있다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 또는 3' ITR 둘 모두는 AAV2로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 18과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 19와 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 전달 게놈은 서열번호 41, 44, 46, 65, 67, 또는 75 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 18의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 19의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 또는 3' ITR은 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 또는 3' ITR 둘 모두는 AAV5로부터 유래한다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖거나, 3' ITR 뉴클레오티드 서열은 서열번호 21과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR 뉴클레오티드 서열은 서열번호 20과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖고, 3' ITR 뉴클레오티드 서열은 서열번호 21과 적어도 90%(예를 들어, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)의 서열 동일성을 갖는다. 특정 구현예에서, 전달 게놈은 서열번호 46 내지 50 중 어느 하나에 제시된 뉴클레오티드 서열, 서열번호 20의 서열을 갖는 5' ITR 뉴클레오티드 서열, 및 서열번호 21의 서열을 갖는 3' ITR 뉴클레오티드 서열을 포함한다.
특정 구현예에서, 5' ITR 뉴클레오티드 서열 및 3' ITR 뉴클레오티드 서열은 서로 실질적으로 상보적이다(예를 들어, 5' 또는 3' ITR에서의 1, 2, 3, 4 또는 5 뉴클레오티드 위치에서의 불일치를 제외하고 서로 상보적임).
특정 구현예에서, 5' ITR 또는 3' ITR은 Rep 단백질("비-분해성 ITR")에 의한 분해능을 감소시키거나 폐지하도록 변형된다. 특정 구현예에서, 비-분해성 ITR은 말단 분해능 부위의 뉴클레오티드 서열에 삽입, 결실, 또는 치환을 포함한다. 이러한 변형은 전달 게놈이 감염된 세포에서 복제된 후 AAV의 자가-상보성, 이중-가닥 DNA 게놈의 형성을 가능하게 한다. 예시적인 비-분해성 ITR 서열은 당업계에 공지되어 있다(예를 들어, 미국 특허 제7,790,154호 및 제9,783,824호에 제공된 것들을 참조하며, 이들은 그 전체가 참조로서 본원에 통합됨). 특정 구현예에서, 5' ITR은 서열번호 26과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 26과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 27과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 27과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 27에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 27에 제시된 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 5' ITR은 서열번호 26에 제시된 뉴클레오티드 서열로 이루어지고, 3' ITR은 서열번호 19에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 3' ITR은 야생형 AAV2 게놈 서열로부터 유래된 추가의 뉴클레오티드 서열의 측면에 위치한다. 특정 구현예에서, 3' ITR은 야생형 AAV2 ITR에 인접한 야생형 AAV2 서열로부터 유래된 추가의 37 bp 서열의 측면에 위치한다. 예를 들어, Savy 등, Human Gene Therapy Methods (2017) 28(5): 277-289 참조(이는 그 전체가 본원에 참조로서 통합됨). 특정 구현예에서, 추가의 37 bp 서열은 3' ITR의 내부에 있다. 특정 구현예에서, 37 bp 서열은 서열 번호 56에 제시된 서열로 이루어진다. 특정 구현예에서, 3' ITR은 서열번호 57과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR은 서열 번호 57에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 57과 적어도 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열로 이루어진다. 특정 구현예에서, 3' ITR의 뉴클레오티드 서열은 서열번호 57에 제시된 뉴클레오티드 서열로 이루어진다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: 5' ITR; 5'에서 3'까지: 본원에 개시된 바와 같은, TRE, 선택적으로 비암호화 엑손 및 인트론, ARSA 코딩 서열, 및 폴리아데닐화 서열을 포함하는 내부 요소; 비-분해성 ITR; 내부 요소에 상보적인 뉴클레오티드 서열; 및 3' ITR을 포함한다. 이러한 전달 게놈은 감염 후 및 복제 전에 AAV의 자가-상보성, 이중-가닥 DNA 게놈을 형성할 수 있다.
특정 구현예에서, 전달 게놈은 5'에서 3'까지: 5' ITR, TRE, ARSA 코딩 서열, 폴리아데닐화 서열, 및 3' ITR을 포함한다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 또는 26과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고; 폴리아데닐화 서열은 서열번호 42, 43, 및 45와 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖고/갖거나; 3' ITR은 서열번호 19, 21, 27, 또는 57과 적어도 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다. 특정 구현예에서, 5' ITR은 서열번호 18, 20, 및 26으로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어지고; TRE는 서열번호 25, 32, 36, 54, 55, 및/또는 58로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고; ARSA 코딩 서열은 서열번호 14, 24, 62, 또는 72에 제시된 서열을 포함하고; 폴리아데닐화 서열은 서열번호 42, 43, 및 45로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하고/하거나; 3' ITR은 서열번호 19, 21, 27, 또는 57로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 5' ITR은 서열 번호 18에 제시된 서열을 포함하거나 이로 이루어지고; TRE는 서열 번호 36에 제시된 서열을 포함하고; ARSA 코딩 서열은 서열 번호 14, 24, 62 또는 72에 제시된 서열을 포함하고; 폴리아데닐화 서열은 서열 번호 42에 제시된 서열을 포함하고/하거나; 3' ITR은 서열번호 19에 제시된 서열을 포함하거나 이로 이루어진다.
특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 또는 76과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 47, 48, 49, 68, 69, 또는 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 47, 48, 49, 68, 69, 또는 76에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다. 특정 구현예에서, 전달 게놈의 뉴클레오티드 서열은 서열번호 48에 제시된 뉴클레오티드 서열을 포함한다.
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, rAAV는 다음을 포함한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에서 제시된 뉴클레오티드 서열을 포함하는 전달 게놈.
또 다른 양태에서, 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에서 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 44 또는 48에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 44 또는 48에 제시된 핵산 서열로 이루어진다.
또한, 서열번호 14, 62, 또는 72에 제시된 핵산 서열과 적어도 80%(예를 들어, 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%) 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에서 제공된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 핵산 서열로 이루어진다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14에 제시된 핵산 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14에 제시된 핵산 서열로 이루어진다.
또 다른 양태에서, 본 개시는 약학적으로 허용 가능한 부형제, 보조제, 희석제, 비히클 또는 담체, 또는 이들의 조합과 함께 본원에 개시된 바와 같은 AAV를 포함하는 약학적 조성물을 제공한다. "약학적으로 허용 가능한 담체"는, 조성물의 활성 성분과 조합될 때, 성분이 생물학적 활성을 유지할 수 있게 하고 의도하지 않은 면역 반응과 같은 파괴적인 생리학적 반응을 일으키지 않는 임의의 물질을 포함한다. 약학적으로 허용 가능한 담체는 물, 인산염 완충 식염수, 유화액, 예컨대 오일/물 유화액, 및 습윤제를 포함한다. 이러한 담체를 포함하는 조성물은 Remington's Pharmaceutical Sciences, 현재 판, Mack Publishing Co., Easton Pa. 18042, USA; A. Gennaro (2000) "Remington: The Science and Practice of Pharmacy", 제20판, Lippincott, Williams, & Wilkins; Pharmaceutical Dosage Forms and Drug Delivery Systems (1999) H. C. Ansel 등, 제7판, Lippincott, Williams, & Wilkins; 및 Handbook of Pharmaceutical Excipients (2000) A. H. Kibbe 등, 제3판, Amer. Pharmaceutical Assoc.에 제시된 것들과 같은 공지된 종래의 방법에 의해 제형화된다.
또 다른 양태에서, 본 개시는 인간 ARSA 단백질 또는 이의 단편을 암호화하는 코딩 서열을 포함하는 폴리뉴클레오티드를 제공하며, 여기에서 코딩 서열은 야생형 인간 ARSA 유전자와 100% 미만(예를 들어, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 또는 50% 미만)의 동일성을 갖도록 침묵적으로 변형된다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 서열을 포함한다. 특정 구현예에서, 폴리뉴클레오티드는 서열번호 14, 62 또는 72에 제시된 서열로 이루어진다. 폴리뉴클레오티드는 DNA, RNA, 변형된 DNA, 변형된 RNA, 또는 이들의 조합을 포함할 수 있다. 특정 구현예에서, 폴리뉴클레오티드는 발현 벡터이다.
III.
사용 방법
또 다른 양태에서, 본 개시는 세포에서 ARSA 폴리펩티드를 발현시키는 방법을 제공한다. 방법은 대체로 본원에 개시된 바와 같은 rAAV로 세포를 형질도입하는 단계를 포함한다. 이러한 방법은 ARSA 발현을 복원하는 데 매우 효율적이다. 따라서, 특정 구현예에서, 본원에 개시된 방법은 본원에 개시된 rAAV로 세포를 형질도입하는 단계를 포함한다.
본원에 개시된 방법은 ARSA 유전자에서 돌연변이를 보유하는 임의의 세포에 적용될 수 있다. 당업자는 활성 내인성 ARSA를 필요로 하는 세포가 특히 관심 대상임을 이해할 것이다. 따라서, 특정 구현예에서, 방법은 내인성 ARSA 활성을 상실한 임의의 세포에 적용된다. 특정 구현예에서, 방법은 뉴런 및/또는 신경교세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 ARSA를 필요로 하는 뉴런 및/또는 신경교세포이다. 특정 구현예에서, 방법은 중추 신경계의 세포 및/또는 말초 신경계의 세포에 적용된다. 특정 구현예에서, 특정 관심 대상은 활성 내인성 ARSA를 필요로 하는 중추 신경계 및/또는 말초 신경계의 세포이다. 특정 구현예에서, 특정 관심 대상은 전뇌, 중뇌, 후뇌, 척수, 및 이들의 임의의 조합의 세포이다. 특정 구현예에서, 특정 관심 대상은 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 뇌의 교뇌 및 수질의 세포, 척수의 상행근막, 및 이들의 임의의 조합이다. 특정 구현예에서, 특정 관심 대상은, 활성 내인성 ARSA를 필요로 하는, 척수, 운동 피질, 감각 피질, 시상, 해마, 피각, 소뇌(예를 들어, 소뇌 핵), 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 중추 신경계 영역의 세포이다. 특정 구현예에서, 특정 관심 대상은 중추 신경계(CNS)에서의 운동 뉴런 및 성상교세포 프로파일, CNS에서의 희소돌기교세포(상행 섬유), CNS에서의 대뇌 피질의 세포 집단, 및 말초 신경계(PNS)의 감각 뉴런이다. 특정 구현예에서, 특정 관심 대상은 척수의 배측 근막 내에 있는 것과 같은 희소돌기교세포이다. 특정 구현예에서, 특정 관심 대상은, 성상교세포, 희소돌기교세포, 슈반 세포, 및 이의 임의의 조합을 포함하지만 이에 한정되지 않는, 중추 신경계에서의 신경교 프로파일이다. 특정 구현예에서, 특정 관심 대상은 운동 뉴런, 성상교세포, 희소돌기교세포, 중추 신경계의 대뇌 피질 세포, 말초 신경계의 감각 뉴런, 말초 신경계의 신경교세포(예를 들어, 슈반 세포), 및 이의 임의의 조합이다.
본원에 개시된 방법은 연구 목적을 위해 시험관 내에서 수행될 수 있거나, 치료 목적을 위해 생체 외 또는 생체 내에서 수행될 수 있다.
특정 구현예에서, 형질도입될 세포는 포유류 대상체에 존재하고, AAV는 대상체에서 세포를 형질도입하기에 효과적인 양으로 대상체에게 투여된다. 따라서, 특정 구현예에서, 본 개시는 ARSA 유전자 돌연변이와 연관된 질환 또는 장애를 갖는 대상체를 치료하기 위한 방법을 제공하며, 방법은 대체로 본원에 개시된 바와 같은 rAAV의 유효량을 대상체에게 투여하는 단계를 포함한다. 대상체는 ARSA 돌연변이를 갖는 인간 대상체, 비인간 영장류 대상체(예를 들어, 시노몰구스(cynomolgus)) 또는 설치류 대상체(예를 들어, 마우스)일 수 있다. ARSA 유전자 돌연변이와 연관된 임의의 질환 또는 장애는 본원에 개시된 방법을 사용하여 치료될 수 있다. 적절한 질환 또는 장애는, 제한 없이, 이염색 백색질장애를 포함한다.
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR); 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 다음의 유전적 요소를 5'에서 3'까지 포함하는 전달 게놈: 5' ITR 요소(예를 들어, 서열번호 18의 5' ITR), 인핸서 요소(예를 들어, 서열번호 58의 인핸서 요소), 프로모터 서열(예를 들어, 서열번호 25의 프로모터 서열), 키메라 인트론 서열(예를 들어, 서열번호 32의 키메라 인트론 서열), 침묵적으로 변형된 인간 ARSA 코딩 서열(예를 들어, 서열번호: 14의 hARSA 코딩 서열), SV40 폴리아데닐화 서열(예를 들어, 서열 번호 42의 SV40 폴리아데닐화 서열),및 3' ITR 요소(예를 들어, 서열번호 19의 3' ITR).
특정 구현예에서, 전술한 방법은 다음을 포함하는 rAAV를 사용한다: (a) 서열번호 16의 아미노산 203 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; (b) 서열번호 16의 아미노산 138 내지 736의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에 제시된 뉴클레오티드 서열을 포함하는 전달 게놈; 및/또는 (c) 서열번호 16의 아미노산 서열을 포함하는 AAV 캡시드 단백질, 및 서열번호 41, 44, 46, 47, 48, 49, 65, 67, 68, 69, 75, 또는 76 중 어느 하나에서 제시된 뉴클레오티드 서열을 포함하는 전달 게놈.
본원에 개시된 방법은 생체 내 및 시험관 내 모두에서 높은 효율로 세포에서 ARSA 단백질을 발현할 수 있다는 점에서 특히 유리하다. 특정 구현예에서, ARSA 단백질의 발현 수준은 ARSA 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 ARSA 단백질의 발현 수준의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 100%이다. 특정 구현예에서, ARSA 단백질의 발현 수준은 ARSA 유전자 내에 돌연변이를 갖지 않는 동일한 유형의 세포에서의 내인성 ARSA 단백질의 발현 수준보다 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10배 더 높다. ELISA, 웨스턴 블롯팅, 면역 염색, 및 질량 분광분석을 포함하되 이들로 한정되지 않는, ARSA 단백질의 발현 수준을 결정하는 임의의 방법이 사용될 수 있다.
특정 구현예에서, 본원에 개시된 AAV 조성물로 세포를 형질도입하는 것은 본원에 제공된 바와 같이 또는 당업자에게 공지된 임의의 형질도입 방법에 의해 수행될 수 있다. 특정 구현예에서, 세포는 50,000; 100,000; 150,000; 200,000; 250,000; 300,000; 350,000; 400,000; 450,000; 또는 500,000의 감염 다중도(MOI)로 또는 세포의 최적 형질도입을 제공하는 임의의 MOI로 AAV와 접촉될 수 있다.
본원에 개시된 AAV 조성물은 정맥내, 경막내, 복강내, 피하, 근육내, 비강내, 국소 또는 피부내 경로를 포함하되 이들로 한정되지 않는 임의의 적절한 경로에 의해 대상체에게 투여될 수 있다. 특정 구현예에서, 조성물은 정맥내 주사 또는 피하 주사를 통해 투여되도록 제형화된다.
IV.
AAV 패키징 시스템
또 다른 양태에서, 본 개시는 본원에 개시된 재조합 아데노-연관 바이러스(rAAV)의 재조합 제조를 위한 패키징 시스템을 제공한다. 이러한 패키징 시스템은 대체로, 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드; 본원에 개시된 바와 같은 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드; 및 본원에 개시된 바와 같은 rAAV 게놈 중 어느 하나를 포함하는 제3 뉴클레오티드 서열을 포함하되, 패키징 시스템은 캡시드 내에 전달 게놈을 둘러싸서 AAV를 형성하도록 세포 내에서 작동한다.
특정 구현예에서, 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 및 AAV 캡시드 단백질을 암호화하는 제2 뉴클레오티드, 및 rAAV 게놈을 포함하는 제3 뉴클레오티드 서열을 포함하는 제2 벡터를 포함한다. 본원에 기술된 패키징 시스템의 맥락에서 사용되는 바와 같이, "벡터"는 핵산을 세포 내로 도입하기 위한 비히클인 핵산 분자를 지칭한다(예를 들어, 플라스미드, 바이러스, 코스미드, 인공 염색체 등).
임의의 AAV Rep 단백질은 본원에 개시된 패키징 시스템에 사용될 수 있다. 패키징 시스템의 특정 구현예에서, Rep 뉴클레오티드 서열은 AAV2 Rep 단백질을 암호화한다. 적절한 AAV2 Rep 단백질은 Rep 78/68 또는 Rep 68/52를 포함하되 이에 한정되지 않는다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질을 암호화하는 뉴클레오티드 서열은 서열번호 22의 AAV2 Rep 아미노산 서열과 최소 백분율 서열 동일성을 갖는 단백질을 암호화하는 뉴클레오티드 서열을 포함하되, 최소 백분율 서열 동일성은 AAV2 Rep 단백질의 아미노산 서열 길이에 걸쳐 적어도 70%(예를 들어, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 100%)이다. 패키징 시스템의 특정 구현예에서, AAV2 Rep 단백질은 서열번호 22에 제시된 아미노산 서열을 갖는다.
패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 추가로 포함한다. 패키징 시스템의 특정 구현예에서, 패키징 시스템은 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함하는 제3 벡터, 예를 들어 헬퍼 바이러스 벡터를 추가로 포함한다. 제3 벡터는 독립적인 제3 벡터이거나, 제1 벡터와 일체화되거나, 제2 벡터와 일체화될 수 있다.
패키징 시스템의 특정 구현예에서, 헬퍼 바이러스는 아데노바이러스, 포진 바이러스(단순 포진 바이러스(HSV)를 포함함), 수두 바이러스(예를 들어, 우두 바이러스), 거대세포 바이러스(CMV), 및 바큘로바이러스로 이루어진 군으로부터 선택된다. 헬퍼 바이러스가 아데노바이러스인 패키징 시스템의 특정 구현예에서, 아데노바이러스 게놈은 El, E2, E4 및 VA로 이루어진 군으로부터 선택된 하나 이상의 아데노바이러스 RNA 유전자를 포함한다. 헬퍼 바이러스가 HSV인 패키징 시스템의 특정 구현예에서, HSV 게놈은 UL5/8/52, ICPO, ICP4, ICP22 및 UL30/UL42로 이루어진 군으로부터 선택된 하나 이상의 HSV 유전자를 포함한다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 플라스미드 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 제1 플라스미드 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 제2 플라스미드 내에 함유된다.
패키징 시스템의 특정 구현예에서, 제1, 제2 및/또는 제3 벡터는 하나 이상의 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제1 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다. 특정 구현예에서, 제2 벡터 및 제3 벡터는 재조합 헬퍼 바이러스 내에 함유된다.
또 다른 양태에서, 본 개시는 본원에 기술된 바와 같은 AAV의 재조합 제조 방법을 제공하며, 방법은 본원에 기술된 바와 같은 rAAV를 형성하도록 캡시드 내에 rAAV 게놈을 둘러싸도록 작동되는 조건 하에서 본원에 기술된 바와 같은 패키징 시스템으로 세포를 형질감염시키거나 형질도입하는 단계를 포함한다. rAAV의 재조합 제조를 위한 예시적인 방법은 다음을 포함한다: 일시적 형질감염(예를 들어, 본원에 기재된 바와 같은 제1, 및 제2, 및 선택적으로 제3 벡터를 함유하는 하나 이상의 형질감염 플라스미드를 사용함), 바이러스 감염(예를 들어, 본원에 개시된 바와 같은 제1, 제2, 선택적으로 제3 벡터를 함유하는 하나 이상의 재조합 헬퍼 바이러스, 예컨대 아데노바이러스, 폭스바이러스(예를 들어, 우두 바이러스), 포진 바이러스(HSV, 거대세포 바이러스, 또는 바큘로바이러스를 포함함)를 사용함), 및 안정한 생산자 세포주 형질감염 또는 감염(예를 들어, 하나 이상의 AAV Rep 단백질을 암호화하는 Rep 뉴클레오티드 서열 및/또는 본원에 기재된 바와 같은 하나 이상의 캡시드 단백질을 암호화하는 Cap 뉴클레오티드 서열을 함유하는 포유동물 또는 곤충 세포와 같은 안정한 생산자 세포, 및 플라스미드 또는 재조합 헬퍼 바이러스의 형태로 전달되는 본원에 기술된 전달 게놈을 사용함).
따라서, 본 개시는 재조합 AAV(rAAV)의 제조를 위한 패키징 시스템을 제공하며, 여기에서 패키징 시스템은 하나 이상의 AAV Rep 단백질을 암호화하는 제1 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 캡시드 단백질을 암호화하는 제2 뉴클레오티드 서열; 본원에 기술된 AAV 중 어느 하나의 rAAV 게놈 서열을 포함하는 제3 뉴클레오티드 서열; 및 선택적으로 하나 이상의 헬퍼 바이러스 유전자를 포함하는 제4 뉴클레오티드 서열을 포함한다.
V. 실시예
본원에 개시된 재조합 AAV 벡터는 시험관 내 및 생체 내에서 매우 효율적인 유전자 전달을 매개한다. 다음의 실시예는 본원에 개시된 바와 같은 AAV 기반 벡터를 사용하여 (이염색 백색질장애와 같은 특정 인간 질환에서 돌연변이된) ARSA 유전자의 발현을 효율적으로 복원하는 것을 입증한다. 이들 실시예는 예시로서 제공되며, 제한하는 것이 아니다.
실시예 1: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA(hARSA)의 발현을 위한 인간 ARSA 전달 벡터 T-001, pHMI-5000, pHMI-5003, 및 pHMI-hARSA1-TC-002를 제공한다.
a) T-001
도 1a에 나타낸 바와 같은 ARSA 전달 벡터 TC-001은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 야생형 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
b) pHMI-5000
도 1b에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5000은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
c) pHMI-5003
도 1c에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5003은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; SV40 폴리아데닐화 서열; 비암호화 스터퍼 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 1에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
d) pHMI-hARSA1-TC-002
도 1d에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-hARSA1-TC-002는 5'에서 3'까지 pHMI-5000과 동일한 유전적 요소를 포함한다. 이들 요소의 서열은 표 1에 제시되어 있다. pHMI-hARSA1-TC-002와 pHMI-5000 간의 차이는 벡터 백본 서열에 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
본원에 개시된 벡터는 AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 캡시드에 패키징 수 있지만, 이에 한정되지 않는다. 패키징된 바이러스 입자는 야생형 동물 또는 ARSA-결핍 동물에 투여될 수 있다.
실시예 2: ARSA(-/-) 마우스 모델에서의 ARSA 유전자 전달
마우스에서 ARSA 유전자 전달의 효과를 연구하기 위해, ARSA(-/-) 마우스 모델을 생성하였다. ARSA(-/-) 마우스 모델은 네오마이신 카세트를 마우스 ARSA 유전자의 엑손 4 내로 삽입하여 생산된 ARSA 녹-아웃 마우스이다(Hess 등, Proc. Natl. Acad. Sci. U.S.A. 1996, 93(25):14821-14826 참조, 그 전체는 참조로서 본원에 통합됨). ARSA(-/-) 마우스는 인간과 비교하여 유사하지만 보다 경미한 이염색 백색질장애(MLD)를 나타낸다. ARSA(-/-) 마우스는 광범위한 탈수초(demyelination)의 증상을 나타내지 않는다.
MLD를 조사하기 위해 다양한 바이오마커가 사용될 수 있다. 예를 들어, 뇌에서 술파타이드의 수준을 측정할 수 있다. 동물이 나이가 들면서 축적이 증가한다는 희소돌기교세포(C24:0) 및 뉴런(C18:0) 술파타이드의 증가가 보고되었다. 수초 및 림프구 단백질(MAL) mRNA 전사체의 수준을 측정할 수 있다. MAL은 희소돌기교세포 및 슈반 세포에 의해 발현되고, 신경교세포-축삭 접합부를 안정화시키고, MLD의 병리에 관여한다. MAL 전사체의 수준은 ARSA(-/-) 마우스에서 감소되는 것으로 보고되었다. 리소좀-연관 막 단백질(LAMP-1)은 MLD를 조사하는 데 사용될 수 있는 또 다른 바이오마커이다. LAMP-1 면역 반응성은 항-LAMP-1 항체를 사용하여 ARSA(-/-) 및 야생형 마우스에서 척수 조직에 대한 면역조직화학에 의해 조사되었으며, ARSA(-/-) 마우스에서 LAMP-1 면역 반응성의 증가를 나타냈다. 도 2a는 ARSA(-/-) 마우스의 척수 조직 상에서의 면역조직화학(IHC)에 의해 조사된 LAMP-1 면역 반응성으로부터 유도된 총 픽셀 강도의 정량화를 나타낸다. 비히클 대조군 또는 AAVHSC15 캡시드에 패키징된 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 항-LAMP-1 항체를 사용하여 IHC를 수행하였다. 도 2a에 나타낸 바와 같이, 투여(4e13 vg/kg의 pHMI-5000이 AAVHSC15 캡시드에 패키징됨) 후 12주차에, 비히클 대조군이 투여된 ARSA(-/-) 동물과 비교하여 LAMP-1 수준의 유의한 감소가 검출되었다.
뇌 조직을 칭량하고, Precellys 비드 균질화기 중 250 uL의 물 중에서 균질화시키고, Pierce BCA 단백질 분석 정량화를 위해 균질물의 10 uL 분취액을 제거하였다. 760 uL의 아세토니트릴을 각 균질물에 첨가하고, 혼합물을 두 번째로 균질화하였다. 균질물을 14,000 x g에서 15분 동안 원심분리하고, 원심분리된 정화된 상청액을 제거하고, RapidFire-MS 분석을 위해 75% 아세토니트릴에서 5회 희석하였다. C19:0 술파타이드(Matreya cat# 1888)를 내부 표준으로서 사용하였고, Sciex API4000 삼중 사중극자 질량 분광계 상의 MRM 모드에서 C18:0, C18:1, C24:0 및 C24:1 술파타이드와 함께 모니터링하였다. 각각의 분석물의 농도를 계산하기 위해 사용된 각각의 샘플에 대한 고유 표준 곡선을 생성하기 위해, 8가지 상이한 농도의 C19:0 술파타이드 IS를 각 샘플에 8회 주입하였다. 도 2b는 시간 경과에 따른 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스의 뇌에서의 C18:0 술파타이드의 수준을 나타낸다. 대조군은 야생형 동물(ARSA(+/+)) 및 이형접합체 동물(ARSA(+/-))의 혼합체였다. 도 2b에 나타낸 바와 같이, ARSA(-/-) 마우스의 뇌에서의 C18:0 술파타이드의 수준은 시간이 지남에 따라 축적되는 반면, 대조군 마우스의 뇌에서의 C18:0 술파타이드의 수준은 시간이 지남에 따라 크게 변하지 않은 채로 남아 있다. 도 2b의 데이터는 2마리의 대조군 마우스 및 2마리의 ARSA(-/-) 마우스의 분석으로부터 생성되었다. ARSA 결핍 마우스에서 술파타이드 축적에 대한 ARSA 유전자 전달의 효과를 조사하기 위해, AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-hARSA1-TC-002로 ARSA(-/-) 마우스를 치료하였다(도 2c). 도 2c에 나타낸 바와 같이, 투여 후 7개월차에, 비히클 대조군으로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스에서 뇌 술파타이드 수준의 유의한 감소가 관찰되었다.
AAVHSC15 캡시드로 패키징된 4e13 vg/kg 및 6e13 vg/kg의 pHMI-5000, 또는 비히클 대조군으로 치료한 후 7개월차에, ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형 수준을 결정하였다(도 2d). 술파타이드 이소형 수준은 동일한 연령의 야생형 대조군 동물에 대한 배수로서 제시된다. 도 2d에 나타낸 바와 같이, 투여 후 7개월차에, 비히클 대조군으로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스의 3개의 뇌 영역 모두에서 뇌 술파타이드 수준의 유의한 감소가 관찰되었다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다.
AAVHS15 캡시드로 패키징된 4e13 vg/kg의 pHMI-5000, 또는 비히클 대조군으로 치료한 후 52주차에, ARSA(-/-) 마우스의 전뇌, 중뇌 및 후뇌에서의 C18:0 및 C18:1 술파타이드 이소형 수준(도 2e), C24:0 및 C24:1 술파타이드 이소형 수준(도 2f), 및 총 술파타이드 이소형 수준(도 2g)을 결정하였다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다.
도 3a는 대조군 마우스(WT/Het) 및 ARSA(-/-) 마우스에서 4주차에서의 MAL 전사체의 수준을 나타낸다. 대조군은 야생형 동물(ARSA(+/+)) 및 이형접합체 동물(ARSA(+/-))의 혼합체였다. 트리졸(Trizol) 추출 후 Qiagen RNEasy 컬럼 정제로 마우스 총 RNA를 제조하였다. 전사체를 생산하기 위해 ThermoFisher 고용량 cDNA 키트를 사용하는 cDNA 합성을 위한 템플릿으로서 RNA를 사용하였다. 마우스 HPRT1에 대해 정규화된 카피수로 마우스 수초 및 림프구 단백질(MAL)에 특이적인 액적(droplet) 디지털 PCR 및 프라이머/프로브 세트를 사용하여 MAL 전사체를 평가하였다. 도시된 바와 같이, 4주차에, MAL 전사체의 수준은 이형접합성 마우스와 비교하여 ARSA(-/-) 마우스에서 감소된다. 도 3의 데이터는 5마리의 대조군 마우스 및 6마리의 ARSA(-/-) 마우스의 분석으로부터 생성되었다. ARSA 결핍 마우스에서 MAL 전사물의 수준에 대한 ARSA 유전자 전달의 효과를 조사하기 위해, AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000으로 ARSA(-/-) 마우스를 치료하였다(도 3b). 도 3b에 나타낸 바와 같이, 투여 후 3개월차에, 야생형 마우스 및 비히클로 치료한 ARSA(-/-) 마우스와 비교하여 치료한 ARSA(-/-) 마우스의 MAL 전사체의 수준의 유의한 증가가 관찰되었다.
AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000으로 치료한 ARSA(-/-) 마우스에서 MAL 전사체 카피수의 수준을 결정하였다(도 3c). 도 3c는 투여 후 12 또는 52주차에, 야생형 마우스, 또는 비히클 대조군 또는 AAVHSC15 캡시드에 패키징된 4e13 vg/kg의 pHMI-5000을 투여한 ARSA(-/-) 마우스에서 검출된 MAL 전사체 카피수를 나타낸다. 사용된 방법 및 물질은 전술한 바와 동일하였다. 데이터는 페어링되지 않은 T-검정을 사용하여 분석하였다. 도 3c에서, 동물 군 간의 통계적 유의성은 다음과 같다: 12주 비히클 대 치료한 동물, p = 0.0012; 12주 치료한 동물 대 야생형 동물, p < 0.0001; 52주 비히클 대 치료한 동물, p = 0.0004; 및 52주 치료한 동물 대 야생형 동물, 유의하지 않음.
hARSA 활성의 치료적 수준이 달성될 수 있는지의 여부를 조사하기 위해, AAV9 캡시드에 패키징된 전달 벡터 T-001(PCT 공개번호 WO2002/052052 참조, 그 전체는 참조로서 본원에 통합됨)을 ARSA(-/-) 마우스에 투여하였다. 미치료 대조군 ARSA(-/-) 마우스, 및 AAV9 캡시드로 패키징된 전달 벡터 T-001을 투여한 ARSA(-/-) 마우스로부터 수득한 뇌 절편의 항-ARSA 면역 반응성은, 치료적 수준(10%)의 hARSA 효소 활성이 체중 킬로그램당(vg/kg) 2e13 벡터 게놈의 투여량에서 달성되었음을 나타낸다. 치료한 ARSA(-/-) 마우스로부터 수득한 뇌 절편의 항-ARSA 면역 반응성은 또한 뇌에서 ARSA 효소 활성의 투여량 의존적 증가를 나타낸다.
실시예 3: ARSA(-/-) 마우스 모델에서의 ARSA 유전자 전달
본 실시예는 인간 ARSA 전달 벡터 pHMI-5000의 사용에 관한 실험 데이터를 제공한다. 본원에 기술된 바와 같이, 전달 벡터 pHMI-5000은 ARSA 단백질의 유의하게 개선된 발현을 나타내는 것으로 나타난, 침묵적으로 변형된 인간 ARSA 코딩 서열을 포함한다.
도 4는 뇌에서 형질도입된 세포당 벡터 게놈의 수와 cDNA의 ng당 hARSA의 카피수 사이의 상관 관계를 나타내는 플롯이다. 마우스 게놈 DNA는 Qiagen의 QIAamp Fast DNA 조직 키트를 사용하여 제조하였다. VG 수는 내인성 마우스 게놈 서열에 대해 정규화된 코돈 최적화된 인간 ARSA 벡터 게놈의 코딩 영역에 특이적인 액적 디지털 PCR 및 프라이머/프로브 세트에 의해 결정하였다. 마우스 총 RNA를 본원에 기술된 바와 같이 제조하고, ARSA 전사체를 액적 디지털 PCR을 사용하여 평가하고, 마우스 GUSB에 대해 정규화된 카피수로 VG 수를 결정하기 위해 사용한 동일한 프라이머/프로브 세트를 사용하였다. 도시된 바와 같이, AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000을 사용하여 형질도입된 세포의 경우, 형질도입된 세포당 검출된 벡터 게놈의 수는 cDNA의 ng당 hARSA의 카피 수와 강력하게 상관된다(R2 = 0.9332).
AAVHSC15와 AAV9 캡시드 매개 전달 간의 비교에서, AAVHSC15는 뇌에서 AAV9를 유의하게 능가한다는 것을 발견하였다. 도 5는 AAV9 또는 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000에 대해 2e13 vg/kg의 투여량으로 뇌에서 형질도입된 세포당 벡터 게놈의 수를 나타낸다. 도시된 바와 같이, AAV9 캡시드와 비교하여, 전달 벡터 pHMI-5000이 AAVHSC15 캡시드에 패키징되었을 경우, 세포당 벡터 게놈 수가 10배 더 높은 것으로 관찰되었다. 도 6은 표시된 투여량으로 AAV9 또는 AAVHSC15 캡시드 중 하나로 패키징된 전달 벡터 pHMI-5000에 대해 측정된 정상 인간 ARSA 효소 활성 수준의 백분율을 나타낸다. 도7은 4e13 vg/kg으로 AAV9 또는 AAVHSC15 캡시드 중 하나에 패키징된 전달 벡터 pHMI-5000을 투여한 마우스의 형질도입된 뇌 세포당 벡터 게놈의 수를 나타낸다.
AAVHSC15 캡시드에 패키징된 pHMI-5000은 AAV9 캡시드에 패키징된 pHMI-5000에 비해 더 강력하고 더 광범위한 뇌 및 척수 발현 프로파일을 나타냈다. 항-ARSA 면역 반응성 실험은, 각각의 경우 3e13 vg/kg의 투여량에서, AAV9 캡시드로 패키징된 pHMI-5000을 정맥내 투여한 마우스에 비해, AAVHSC15 캡시드로 패키징된 pHMI-5000을 정맥내 투여한 마우스의 뇌 절편에서 훨씬 더 높은 수준이 검출되었음을 나타낸다.
뇌에서의 hARSA의 생체분포에 대한 투여 경로의 효과를 평가하기 위해, AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000을 각각 4e13 vg/kg 및 4e12 vg/kg의 투여량으로 정맥내(IV) 및 경막내(IT) 경로를 통해 투여하였다. 항-ARSA 면역 반응성은 AAVHSC15에 패키징된 pHMI-5000의 IV 투여 후 ARSA(-/-) 마우스의 주요 중추 신경계 영역에 존재하였다. 항-마우스 ARSA(mARSA) 또는 인간 ARSA(hARSA)는 운동 및 감각 피질, 해마(CA3 영역), 피각 및 소뇌를 포함하여 이에 한정되지 않는 곳에서 광범위하게 검출되었다. 도 8은 AAVHSC15에 패키징된 전달 벡터 pHMI-5000의 IV 또는 IT 투여 후, 후뇌 및 중뇌에서의 정상 인간 ARSA 효소 활성의 백분율 정량화를 나타낸다.
AAVHSC15 캡시드에 패키징된 pHMI-5000을 4e13 vg/kg으로 4주 동안 투여한 ARSA(-/-) 마우스에서, 생물학적으로 관련 있는 hARSA의 분포는 뇌의 주요 생리학적 영역뿐만 아니라 중추 신경계(CNS)의 주둥이-꼬리 축(rostro-caudal axis) 전체에 걸쳐 검출되었다. hARSA는 항-hARSA 항체를 이용하여 검출되었으며, 척수, 운동 피질, 시상, 해마, 소뇌핵에서 검출되었다. hARSA는 또한, CNS에서의 운동 뉴런 및 성상교세포 프로파일; CNS에서의 희소돌기교세포(상행 섬유에서 높은 검출); CNS에서의 대뇌 피질의 세포 집단; 및 말초 신경계(PNS)의 감각 뉴런 및 슈반 세포에서 검출된다. 유사한 생물학적 분포는 이르면 치료 후 2주차에 검출될 수 있다.
AAVHSC15 캡시드에 2e13 vg/kg으로 패키징된 pHMI-5000이 투여된 마우스에서, 4e13 vg/kg 이상의 투여량이 투여된 마우스에서 관찰된 것과 동일한 조직학적 분포가 관찰되었다. 이들 실험에서, hARSA는 리소좀의 전형적인 점모양 패턴으로 세포 세포질에서 검출되었다.
도 9a 및 9b에 도시된 바와 같이, 인간 ARSA 효소 활성의 생리학적 수준은 치료한 ARSA(-/-) 마우스의 뇌에서 투여 후 4주차에 회복되었다. hARSA 효소 활성을 평가하기 위해 ARSA(-/-) 마우스로부터의 뇌 용해물을 사용하였다. 투여량-범위 확인 연구는 hARSA 효소 활성이 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 IV 투여의 투여량과 상관 관계가 있음을 나타냈다. 효소 활성은 치료된 동물에서 검출되었지만, 비히클 대조군 동물에서는 검출되지 않았다. 시험된 투여량에 대해, 효소 활성 수준(약 40 내지 145%)은 이전의 임상에서 결정된 바와 같은(Patil 및 Maegawa, Drug Des. Devel. Ther. 2013, 7:729-745 참조), 약 10 내지 15%의 치료 목표를 훨씬 초과하였다. 도 9a는 ARSA(-/-) 마우스에 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000의 정맥내 투여에 의해 달성된 정상 hARSA 활성의 백분율을 나타낸다. 도시된 바와 같이, hARSA 활성의 투여량 의존적 반응이 달성되었다. 도 9b는 표시된 투여량으로 AAVHSC15 캡시드에 패키징된 전달 벡터 pHMI-5000를 투여한 ARSA(-/-) 마우스의 뇌에서의 세포당 벡터 게놈의 수를 나타낸다. 1e13 vg/kg, 4e13 vg/kg, 및 6e13 vg/kg 투여량의 경우, n = 5마리 마우스. 2e13 vg/kg 투여량의 경우, n = 4마리 마우스. 모든 마우스는 5주령 수컷이었다. 도 9c에서, 가용성 기질 p-니트로카테콜-술페이트(pNCS)으로부터 술페이트의 절단을 측정하는 비색 아릴술파타아제 A-특이적 분석을 사용하여 ARSA 효소 활성을 평가하였다. 경쟁 효소로부터 술페이트의 비-특이적 절단은 알리술파타아제 A-특이적 면역침전 단계의 사용에 의해 제거된다. 뇌에서의 정상적인 인간 ARSA 효소 활성은 2마리의 정상적인 인간 수컷 및 암컷 각각의 전두엽 피질에서의 ARSA 효소 활성의 분석에 의해 결정된다. 인간 전두엽 피질 샘플을 BioiVT로부터 구매하고, 각각의 ARSA 효소 활성 분석 플레이트 상에서 시험 샘플과 함께 3회 실행하였다. 데이터는, 시간당 단백질 mg당, 탈황된 pNCS(ng 단위)의 평균 양의 백분율로서 표현된다. 도 9c는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 1회 정맥내 4e13 vg/kg 투여량이 (점선으로 표시된 바와 같이) 치료 후 1주일차부터 치료 후 12주차까지, 설정된 10 내지 15%의 인간 치료 목표를 초과하는 수준으로 신생아 ARSA(-/-) 마우스의 뇌에서 hARSA 효소 활성을 검출하였음을 나타낸다. 투여 후 1, 2, 3, 4 및 12주차에 물질을 수집하였다. 각 시점에 대해 n = 6마리의 마우스, 8주령의 3마리의 수컷 및 3마리의 암컷.
도 9d에서, 트리졸(Trizol) 추출 후 Qiagen RNEasy 컬럼 정제로 마우스 총 RNA를 제조하였다. 전사체를 생산하기 위해 ThermoFisher 고용량 cDNA 키트를 사용하는 cDNA 합성을 위한 템플릿으로서 RNA를 사용하였다. ARSA 전사체를 코돈 최적화된 인간 ARSA 전사체에 특이적인 액적 디지털 PCR 및 프라이머/프로브 세트를 사용하여 평가하였으며, 카피수는 마우스 GUSB에 대해 정규화되었다. 도 9d는 AAVHSC15 캡시드에 패키징된 pHMI-5000의 1회 정맥내 4e13 vg/kg 투여량이 성체 ARSA(-/-) 마우스의 뇌에서 정상적인 수준의 hARSA 효소 활성을 (hARSA 전사 분석을 통해) 이르게는 치료 후 1주차에 검출되었음을 나타낸다. hARSA 효소 활성의 피크 수준은 투여 후 2 내지 3주 사이에 관찰되었으며, 이어서 정상-상태 고평부는 10 내지 15%의 설정된 인간 치료 목표를 초과하는 수준으로 치료 후 52주차까지 유지되었다. 투여 후 1, 2, 3, 4, 8, 12, 26, 및 52주차에 물질을 수집하였다. 도 9e는 AAVHSC15 캡시드에 포장된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서 게놈 DNA ug 당 벡터 게놈의 수를 나타낸다. 투여 후 1, 2, 3, 8, 12, 26, 및 52주차에 물질을 수집하였다. 도 9f는 AAVHSC15 캡시드에 포장된 pHMI-5000의 단일 정맥 내 4e13 vg/kg 투여량을 투여한 ARSA(-/-) 마우스의 뇌에서의 RNA ng 당 ARSA 전사체의 카피수를 나타낸다. 투여 후 4, 8, 12, 26, 및 52주차에 물질을 수집하였다.
실시예 4: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 hARSA의 발현을 위한 인간 ARSA 전달 벡터 TC-013.pHMIA2 및 TC-015.pKITR을 제공한다. hARSA를 발현하는 것에 더하여, 이들 벡터는 또한 인간 SUMF1를 발현하도록 설계된다. hARSA 및 hSUMF1의 코딩 서열은 2A 요소에 의해 분리된다. 특정 구현예에서, 리보솜 스키핑 요소(예를 들어, 2A 요소)는 N 말단에서 Gly-Ser-Gly의 서열을 추가로 포함하는 펩티드를 암호화하되, 선택적으로 Gly-Ser-Gly의 서열은 GGCAGCGGA의 뉴클레오티드 서열에 의해 암호화된다. 이론에 구속되지 않고, 리보솜 스키핑 요소는: 제1 펩티드 사슬의 번역의 종료 및 제2 펩티드 사슬의 번역 재개시에 의해; 또는 암호화된 펩티드의 고유한 프로테아제 활성에 의해 또는 환경(예를 들어, 세포액)에서의 또 다른 프로테아제에 의해 리보솜 스키핑 요소에 의해 암호화된 펩티드 서열에서의 펩티드 결합의 절단에 의해 기능하는 것으로 가정된다.
a) TC-013.pHMIA2
도 10a에 나타낸 바와 같은 ARSA 전달 벡터 TC-013.pHMIA2는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CALM1 프로모터를 포함하는 전사 조절 요소; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 침묵적으로 변형된 SUMF1 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질 및 인간 SUMF1 단백질을 발현할 수 있다.
b) TC-015.pKITR
도 10b에 나타낸 바와 같은 ARSA 전달 벡터 TC-015.pKITR은 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, smCBA 프로모터를 포함하는 전사 조절 요소; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 침묵적으로 변형된 SUMF1 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 2에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질 및 인간 SUMF1 단백질을 발현할 수 있다.
본원에 개시된 벡터는 AAVHSC5, AAVHSC7, AAVHSC15 또는 AAVHSC17 캡시드와 같은 AAV 캡시드에 패키징 수 있지만, 이에 한정되지 않는다. 패키징된 바이러스 입자는 야생형 동물 또는 ARSA-결핍 동물에 투여될 수 있다.
뇌에서의 hARSA 발현에 대한 프로모터의 효과를 평가하기 위해, 전달 벡터 pHMI-5000, TC-013.pHMIA2, 및 TC-015.pKITR을 AAVHSC15 캡시드에 패키징하고, ARSA(-/-) 마우스에게 투여했다. hARSA 발현 및 효소 활성은 세포수 당 유사한 바이러스 게놈을 갖는, 4e13 vg/kg의 투여량으로 투여된 pHMI-5000 벡터(닭-β-액틴(CBA) 프로모터), 및 8e13 vg/kg의 투여량으로 투여된 TC-015.pKITR(smCBA 프로모터)을 사용하여 뇌에서 검출되었다. CBA 프로모터는 시험된 다른 프로모터와 비교하여 가장 낮은 투여량에서 hARSA의 가장 높은 발현을 초래한다. 도 11은, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 투여된, pHMI-5000(CBA 프로모터), TC-013.pHMIA2(CALM1 프로모터), 및 TC-015.pKITR(smCBA 프로모터)에 대한 세포당 형질도입된 바이러스 게놈의 수를 나타낸다(각 벡터에 대해 n = 5마리 마우스). 도 12는, 각각의 경우 AAVHSC15 캡시드로 패키징되고 4e13 vg/kg의 투여량으로 투여된, pHMI-5000(CBA 프로모터), 및 TC-015.pKITR(smCBA 프로모터)에 대해 검출된 정상 인간 ARSA 효소 활성의 백분율을 나타낸다(각 벡터에 대해 n = 5마리 마우스). 도 13은 hARSA의 발현이, AAVHSC15 캡시드에 패키징되고 4e13 vg/kg의 투여량으로 투여된 pHMI-5000(CBA 프로모터), 및 AAVHSC15 캡시드에 패키징되고 8e13 vg/kg의 투여량으로 투여된 TC-015.pKITR(smCBA 프로모터)에 대한 웨스턴 블롯의 항-hARSA 항체를 사용하여 마우스의 뇌에서 검출될 수 있음을 나타낸다(각 벡터에 대해 n = 5마리 마우스).
실시예 5: 인간 ARSA 전달 벡터
본 실시예는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 hARSA의 발현을 위한 인간 ARSA 전달 벡터 pHMI-5004를 제공한다. hARSA를 발현하는 것에 더하여, 이 벡터는 또한 인간 사포신 B(SapB)를 발현하도록 설계된다. hARSA 및 SapB의 코딩 서열은 2A 요소에 의해 분리된다.
도 14에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5004는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; 2A 요소; 야생형 인간 SapB 코딩 서열; 및 3' ITR 요소. 이들 요소의 서열은 표 3에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 및/또는 SapB 단백질을 발현할 수 있다.
실시예 6: 비인간 영장류에서의 ARSA 유전자 전달
비인간 영장류에서 AAVHSC 매개 ARSA 유전자 전달의 단일 투여의 효과를 조사하기 위해, 6마리의 수컷 미처리 어린 시노몰구스 원숭이에게 표 4 및 5에 제시된 실험 설계에 따라 투여하였다.
도 15에 나타낸 바와 같은 ARSA 전달 벡터 pHMI-5005는 5'에서 3'까지 다음의 유전적 요소를 포함한다: 5' ITR 요소, CMV 인핸서 요소를 포함하는 전사 조절 요소, 닭-β-액틴 프로모터, 및 키메라 인트론 서열; 침묵적으로 변형된 인간 ARSA 코딩 서열; V5 태그; 및 3' ITR 요소. 이들 요소의 서열은 표 6에 제시되어 있다. 이 벡터는 벡터가 형질도입되는 세포(예를 들어, 인간 세포 또는 마우스 세포)에서 인간 ARSA 단백질을 발현할 수 있다.
pHMI-5005는 V5-태그 ARSA 전달 벡터이다. AAVHSC15 캡시드에 패키징된 pHMI-5005를 표 4 및 표 5에 제시된 실험 설계에 따라 비인간 영장류(NHP)에 투여하였다. 0일차에, 투여는, 요측/복재 정맥을 통한 1 내지 2분의 저속 볼루스 정맥내 주사(IV), 또는 소뇌연수조(cisterna magna, CM) 내로의 직접 주사로 수행되었다. 생존력 확인은 사망 및 빈사 상태의 징후에 대해 1일 2회 수행하였다. 임상 관찰은 매일 아침 및 투여 완료 후(15분) 투여 당일 및 투여 후 4시간에 수행하였다. 혈액학 및 임상 화학을 위한 혈액은 투여 직전 및 투여 후 1, 2 및 4주차에 채취하였다. 뇌척수액(CSF) 및 혈액 채취 후 28일 및 29일차에 부검 시, 동물을 1.0 L의 저온 식염수로 관류시켜 혈구를 제거하였다. 부검 시, 뇌, 간, 척수(자궁경부 및 요추), 경부 및 요추 후근 신경절(DRG), 삼차 신경절, 신장, 좌골 신경, 말초 림프절, 비장, 심장, 폐 및 고환을 채취하였다.
생물학적 분석을 위해, 투여 직전 및 제1, 2 및 4주차에 V5 Elisa를 위한 혈청을 채취한다(0.5 mL 전혈, 혈청으로 처리/2개의 분취량으로 분할됨). 0.5 mL의 CSF를 (CM 투여된 3군 동물로부터) 투여 전에 수집하고 (모든 동물로부터) 부검시 1 내지 2 mL를 채취하였다. 15 mL의 말초 혈액 단핵 세포(PBMC)를 부검 전에 전혈로부터 채취하였다.
도 16은 AAVHSC15 캡시드에 패키징된 pHMI-5005를 투여한 NHP에서 알라닌 아미노전이효소(ALT)의 수준 상승을 나타낸다. ALT 상승은 투여 후 14일차에 베이스라인 수준으로 회복되었다.
AAVHSC15에 패키징된 4e13 vg/kg의 pHMI-5005를 1회 IV 투여한 NHP(2군 동물)를 투여 후 28일 및 29일차에 희생시켰다. 희생된 2군 동물의 중추신경계(CNS) 및 뇌척수액(CSF)에서 인간 ARSA 효소 활성 수준이 검출되었다(도 17). 도 17에 도시된 바와 같이, hARSA 활성은 점선으로 표시된 바와 같이, 치료 임계치를 초과하는 수준(야생형 인간 뇌 수준의 15%)에서 검출되었다. 동물 18C27(2군)의 CNS 및 말초 신경계(PNS)에서의 면역형광 염색은 (V5-태그 검출을 통해) hARSA의 존재를 확인하고, 배근 신경절, 척수 운동 뉴런, 및 소뇌를 포함하는 특정 영역에서의 존재를 확인한다.
*
*
*
본 발명은 본원에 기술된 특정 구현예에 의해 그 범위가 제한되지 않는다. 실제로, 기술된 것들에 더하여, 본 발명의 다양한 변형은 전술한 설명 및 첨부 도면으로부터 당업자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범주 내에 속하는 것으로 의도된다.
본원에 인용된 모든 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)는 각각의 개별 참조(예를 들어, 간행물 또는 특허 또는 특허 출원)가 모든 목적을 위해 그 전체가 참조로서 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 그 전체가 모든 목적을 위해 본원에 참조로서 포함된다. 다른 구현예는 다음의 청구범위 내에 있다.