본 발명은 유전체 DNA를 정확하게 편집하기 위해 유전체 편집의 새로운 도구를 개발할 수 있기 위해서, 세포내 번역을 가능하게 하는 가능한 구조가 있는 DNA dependent RNA Polymerase(DdRp) mRNA(캡된 CM_DdRp mRNA)를 포함하는 DdRp RNA 발현 카세트; 및 DdRp에 의해 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 유전체 편집 시스템을 구성하는 자가전사 RNA/DNA 시스템에 적합한 신규의 기술을 제공하는 것이다.
본 발명은 본 발명의 auto_DdRp 발현 카세트의 산물인 DdRp에 의해 생성되는 전시체의 안정성 및 번역의 효율을 위해 전사체에 5'Cap 구조를 제공하는 방법을 제공한다.
본 발명은 의학적 용도를 위한, 적어도 하나의 유전체 편집 도구의 발현을 증가시키는 적어도 하나의 염기서열 변형(SM)을 포함하는 유전체 편집 도구를 코딩하는 DNAge("SM_DNAge") 및 이를 포함하는 DNAge 발현 카세트를 제공한다.
본 발명의 RNA/DNA 시스템에서 상기 유전체 편집 도구를 코딩하는 SM_DNAge 절편을 포함하는 DNAge 발현 카세트의 약학적 조성물 및 부품 키트(kit of parts)를 제공하며, 바람직하게 유전자 치료 및/또는 유전적 백신 접종 분야에서 사용하기 위한 것이다.
본 발명의 RNA/DNA 시스템은 캡된 CM_DdRp mRNA 또는 캡된 CM/SM_DdRp mRNA 발현 카세트와 유전체 편집 도구를 코딩하는 DNAge 절편을 포함하는 DNAge 발현 카세트로 유전체 편집 도구의 발현을 증가시키는 방법을 제공한다.
본 발명의 목적은 자가전사 RNA/DNA 시스템의 제공에 의해 해결되며, 여기서 표적 조직 또는 표적 세포에서 유전체 편집 도구의 발현은 추가적으로 증가될 수 있다.
명확성 및 가독성을 위해 다음의 정의가 제공된다. 이들 정의에 대해 언급된 임의의 기술적 특징은 본 발명의 각각 및 모두에서 이해될 수 있다. 이들에서 추가의 정의 및 설명이 특히 제공될 수 있다. 본 발명에서 핵산 서열이 보고된 곳에서, 이들 서열은 일반적으로 특정 RNA 또는 DNA 서열뿐만 아니라 이의 상응하는 DNA 또는 RNA 대응물(counterpart) 각각 모두를 포함한다. 예를 들어, DNA 서열이 제공된 곳에서, 통상의 기술자는 상응하는 RNA 서열은 우라실 잔기에 의한 티민 교환에 의해 수득되고 반대로도 같은 것을 알고 있다.
세포: 세포는 유전체 편집에 적합한 임의의 유기체에서 기원하는 세포를 포함한다. 예시적인 유기체로는, 비-제한적으로, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소, 고양이와 같은 포유류; 닭, 오리, 거위와 같은 가금류; 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩, 아라비돕시스 등과 같은 외떡잎 식물 및 쌍떡잎 식물 등의 식물이 있다.
유전체: 유전체는 핵에 존재하는 유전체 DNA 뿐만 아니라 세포 하위 구성 성분 (예, 미토콘드리아, 색소체)에 존재하는 기관 DNA를 포괄한다. 세포의 유전체은 세포 또는 유기체의 유전자 물질을 지칭한다. 세포 또는 유기체의 유전자 물질은 종종 하나 이상의 유전자를 포함한다. 특정 실시양태에서, 유전자는 하나 이상의 핵산을 포함하거나 이로 구성된다. 유전자는 폴리펩티드 쇄를 생성하는데 수반되는 DNA의 절편을 의미하며, 코딩 영역(예: 엑손), 유전자 생성물의 전사/해독 및 전사/해독의 조절에 수반되는 코딩 영역 이전 및 이후의 영역(리더 및 트레일러) 및 개개의 코딩 절편(엑손) 사이의 개재 서열(인트론)을 포함할 수 있다. 유전자는 반드시 펩티드를 생성하는 것은 아닐 수 있거나 유전자 서열에서의 유전적 차이(예컨대, 유전자의 코딩 및 비-코딩 부분에서의 돌연변이)에 기인하여 절두되거나 비-기능적인 단백질을 생성할 수 있다. 예컨대, 비-기능적 유전자는 슈도유전자일 수 있다. 유전자는 기능적 또는 비-기능적이든 간에 종종 참조 유전체의 유전자에 대한 상동성에 의해 확인될 수 있다. 예컨대, 대상체의 임의의 특정 유전자(예: 관심 유전자, 상대 유전자, 슈도유전자 등)는 당업자에 의해 또 다른 대상체 유전체에서 또는 참조 유전체에서 확인될 수 있다. 이배체 대상체에서, 유전자는 종종 대립유전자의 쌍(예: 2개의 대립유전자)을 포함한다. 따라서, 본 발명에서의 방법, 시스템 또는 공정은 유전자의 하나 또는 둘 모두의 대립유전자에 적용될 수 있다. 일부 실시양태에서, 본 발명의 방법, 시스템 또는 공정은 유전자의 각각의 대립유전자에 적용된다.
유전자 치료: 유전자 치료는 일반적으로 펩타이드 또는 단백질을 코딩하는 핵산에 의한 환자의 신체 또는 환자의 신체의 분리된 요소(element), 예를 들어 분리된 조직/세포의 치료를 의미한다. 이는 일반적으로 a) 핵산, 바람직하게는 본원에 정의된 바와 같은 RNA 및 DNA 분자를 - 어떤 투여 경로에 의해 - 직접 환자에게 또는 생체 내(in vivo)/생체 외(ex vivo) 또는 시험관 내(in vitro) 환자의 세포의 형질전환을 초래하는 시험관 내에서(in vitro) 환자의 분리된 세포/조직에 투여; b) 도입된 핵산 분자의 전사 및/또는 번역; 그리고 선택적으로 c) 핵산이 직접 환자에게 투여되지 않았다면, 환자에게 분리된, 형질전환된 세포의 재투여의 단계 중 적어도 하나를 포함할 수 있다.
발현 카세트(Expression Cassette): 발현 카세트는 재조합 벡터와 같이 유기체에서 대상 뉴클레오티드 서열을 발현시키기에 적합한 벡터를 의미하며 본 발명에서 편의상 "구조체"라고 할 수도 있다. 발현은 기능성 산물의 생성을 의미한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사 (예, 전사하여 mRNA 또는 기능성 RNA를 생성함) 및/또는 RNA를 단백질 전구체 또는 성숙한 단백질로 번역하는 것을 의미할 수 있다. 발현 카세트는 재조합 벡터와 같이 유기체에서 대상 뉴클레오티드 서열을 발현시키기에 적합한 벡터를 의미한다. "발현"은 기능성 산물의 생성을 의미한다. 예를 들어, 뉴클레오티드 서열의 발현은 뉴클레오티드 서열의 전사 (예, 전사하여 mRNA 또는 기능성 RNA를 생성함) 및/또는 RNA를 단백질 전구체 또는 성숙한 단백질로 번역하는 것을 의미할 수 있다. 발현 카세트는 선형의 핵산 단편, 환형의 플라스미드, 바이러스 벡터 또는 번역될 수 있는 RNA (예, mRNA) 및 리보 핵 단백질 (RNP) 복합체를 포함한 다양한 형태 또는 이들의 조합을 포함한다. 바이러스 벡터는 렌티 바이러스, 아데노 관련 바이러스 발현 등이 상업화되었다. 발현 카세트는 서로 다른 소스로부터 유래될 수 있는 대상 뉴클레오티드 서열 및 조절 서열, 또는 동일한 소스로부터 유래되지만 통상 천연적으로 발견되는 방식과는 다른 방식으로 정렬된 대상 뉴클레오티드 서열 및 조절 서열을 포함할 수 있다.
상류: 상류는 핵산 분자의 제2 요소에 대한 핵산 분자의 제1 요소의 상대적인 위치를 나타내며, 여기서 두 핵산 분자는 동일한 핵산 분자에 포함되며, 제1 요소는 핵산 분자의 제2 요소보다 5' 말단에 위치한다. 그 후 제2 요소는 해당 핵산 분자의 제1 요소의 하류인 것으로 지칭한다. 제2 요소의 상류에 위치한 요소는 해당 제2 요소의 5'에 있는 것과 동의어라고 할 수 있다. 이중가닥 핵산 분자의 경우, 상류 및 하류와 같은 표시는 (+) 가닥에 대해 부여된다.
조절서열: 조절 서열 또는 조절 인자는 상호 호환적으로 사용되며, 조합된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는, 코딩 서열의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-코딩 서열)에 위치하는, 뉴클레오티드 서열을 지칭한다. 조절 서열은, 비-제한적으로, 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인지 서열을 포함할 수 있다.
프로모터: 프로모터는 다른 핵산 단편의 전사를 통제할 수 있는 핵산 단편을 지칭한다. 본 발명에서, 프로모터는 세포로부터 유래되거나 또는 유래되지 않던 간에 세포에서 유전자의 전사를 통제할 수 있는 프로모터이다. 프로모터는 구성적인 프로모터 (constitutive promoter) 또는 조직-특이적인 프로모터 또는 발생-조절성 프로모터 (developmentally-regulated promoter) 또는 유도성 프로모터일 수 있다. 코어 프로모터는 프로모터에 포함되는 핵산 서열을 의미한다. 코어 프로모터는 전형적으로 전사를 적절히 개시하는데 필요한 프로모터의 최소 부분이다. 코어 프로모터는 전형적으로 전사 개시 부위 및 RNA 중합효소에 대한 결합 부위를 포함한다.
중합효소; 일반적으로 중합효소는 단량체 빌딩 블록으로부터 중합체 분자의 합성을 촉매할 수 있는 분자 실체를 지칭한다. "RNA 중합효소"는 리보뉴클레오타이드 빌딩 블록으로부터 RNA 분자의 합성을 촉매할 수 있는 분자 실체이다. "DNA 중합효소"는 데옥시리보뉴클레오타이드 빌딩 블록으로부터 DNA 분자의 합성을 촉매할 수 있는 분자 실체이다. DNA 중합효소 및 RNA 중합효소의 경우, 분자 실체는 전형적으로 단백질 또는 복수의 단백질의 집합체 또는 복합체이다. 전형적으로, DNA 중합효소는 전형적으로 DNA 분자인 주형 핵산을 기반으로 DNA 분자를 합성한다. 전형적으로, RNA 중합효소는 주형 핵산을 기반으로 RNA 분자를 합성하고, 주형 핵산은 DNA 분자(RNA 중합효소가 DNA 의존성 RNA 중합효소, DdRP인 경우)이거나 RNA 분자이다(RNA 중합효소가 RNA 의존성 RNA 중합효소인 DdRp인 경우).
DNA 의존성 RNA 중합효소(DNA dependent RNA Polymerase, DdRp): DdRp는 RNAP(RNA Polymerase, RNA 중합효소)의 동의어이고, 진핵생물의 핵에 있는 DdRp는 RNAP I, RNAP II 및 RNAP III이고 이들은 구조적으로 서로 매우 다르며 각각 다른 유전자 세트를 전사하다 (다른 중합효소는 미토콘드리아와 엽록체에 있다). 그러나 세 가지 모두 서로 관련된 두 개의 큰 서브유닛과 박테리아 RNAP의 가장 큰 두 개의 서브유닛을 가지고 있다. 또한, 이러한 세 가지 효소 모두에서 또는 RNAP I과 RNAP III 사이에서만 공통적으로 발견되는 여러 작은 서브유닛이 있다.
진핵 DdRp는 박테리아 RNAP와 마찬가지로 전사 개시에 필요한 특수 보조 인자가 필요하다. 그러나 박테리아의 경우와 달리 진핵 개시인자는 프로모터 요소를 중합효소 홀로엔자임의 일부가 아닌 독립적으로 인식한다. 특히 RNAP II에 의해 전사된 유전자에서 많은 다른 개시인자가 관련되며, 일부 개시인자는 그 자가로 매우 복잡한 단백질이다. 정제된 진핵 RNA 중합효소만으로는 프로모터에서 선택적으로 전사를 시작할 수 없다. '홀로엔자임'이라는 용어는 때때로 진핵 RNAP를 지칭하는 데 사용되지만, 이 경우에는 박테리아 '핵심' 효소와 비슷한 것을 의미하며 프로모터에서 전사할 수 없다. 그러나 박테리아 핵심 효소와 달리 진핵 세포 전체 효소는 RNA의 전사 또는 처리와 관련된 많은 다른 단백질을 포함할 수 있다.
RNAP I는 nucleolus(인, 핵소체)에서 발견되며 대부분의 세포 RNA가 합성되는 큰 리보솜 RNA를 코딩하는 유전자만을 전사하다. 효모에서 효소는 13 개의 서브유닛 (그리고 거의 600kDa의 질량)을 가지고 있다. 더 작은 서브유닛 중 5 개는 효모 RNAP II 및 III에서도 발견되고 나머지 2 개는 효모 RNAP III에서 발견된다.
RNAP II는 세포에 있는 대부분의 유전자인 단백질을 코딩하는 유전자를 전사하다. 또한 대부분의 작은 핵 RNA (snRNA)를 코딩하는 유전자를 전사하다. 대부분의 유기체는 12-subunit RNAP II (질량 약 550kDa)를 가지고 있는 것으로 보이다. 그러나 완전한 활성을 위해서는 몇 가지 다른 단백질이 필요하며 RNAP 홀로엔자임은 4000 kDa의 질량을 가질 수 있다.
RNAP III는 주로 transfer RNA 및 5S RNA를 코딩하는 유전자를 전사하지만 다른 작은 RNA를 코딩하는 일부 유전자도 전사하다. RNAP III에는 거의 700 kDa의 질량을 가진 14 개 이상의 별개의 서브유닛이 있다. RNAP I 및 RNAP II에 대한 프로모터는 대부분 전사 시작 부위의 상류에 있지만 (원핵생물 프로모터의 경우처럼) RNAP III에 대한 일부 프로모터는 시작 부위의 하류에 있다.
이러한 효소에 의해 형성된 전체 신장 복합체는 박테리아 RNAP와 유사하다. 이러한 효소가 프로모터를 찾는 메커니즘은 박테리아가 사용하는 메커니즘과는 상당히 다르지만, 전사 개시의 전체 메커니즘은 매우 유사하다. 그러나 진핵 생물의 종결에 대해서는 잘 알려져 있지 않다.
DdRp는 박테리오파지 (박테리아 바이러스)의 단일 서브유닛 중합효소에서 진핵생물의 12-15 개의 서브유닛 복합체에 이르기까지 서브유닛 복잡성 범위가 다양하다(표 1).
많은 파지가 더 작은 단일 서브유닛 RNA 폴리머라제를 코딩하는 파지 (예 : T7)의 경우처럼 숙주 세포의 폴리머라제와 자가적으로 코딩된 RNA 폴리머라제를 활용한다. 이러한 중합효소 중 일부는 현재 박테리아 세포에서 대량 생산이 비교적 쉽고, 프로모터 영역을 인식하기 위해 추가 단백질 보조인자가 필요하지 않으며, 박테리아 숙주 RNA 중합효소보다 최소 2배 빠른 속도로 전사체를 합성하기 때문에 생명공학의 주요 시약으로 사용된다. 다중 서브유닛 진핵생물의 핵 중합효소는 전사를 위한 템플릿의 적절한 위치를 찾기 위해 매우 많은 보조 단백질 인자를 필요로 하는 반면, 흥미롭게도 단일 서브유닛 박테리오파지 RNA 중합효소 자가는 올바른 유전자를 인식하고 정제된 DNA의 올바른 위치에서 시작할 수 있다,
박테리아 RNA 중합효소는 효소의 촉매 코어에 있는 3 개의 비동일 단백질의 4 개의 서브유닛을 포함하며, 이 핵심 복합체는 전사를 촉진하는 특정 서열을 인식하고 비 프로모터 부위에 대한 결합을 감소시키는 하나의 추가 보조인자 (시그마라고 함)를 필요로 한다. 박테리아의 각 종에는 여러 가지 시그마 인자가 있다.
DNA-dependent RNA polymerase의 서브유닛
Source |
Number of subunits in core |
Sizes (kDa) |
Bacteriophage T3, T7, <SP6 a |
1 |
~100 |
Bacteriophage N4 a,b |
1 |
320 |
3 |
40, 30, 15 |
Eubacteria, for example, Escherichia coli |
4 |
150, 145, 45 |
Archaebacteria, for example, Sulfolobus acidocaldarius |
13 |
122, 101, 44, 30, 27, 13.8, 12, 11.8, 10, 9.7, 9.7, 7.5, 5.5 |
Saccharomyces cerevisiae RNAP I |
14 |
190, 135, 49, 43, 40, 34.5, 27, 23, 19, 14.5, 14, 12.2, 10, 10 |
Saccharomyces cerevisiae RNAP II |
12 |
191, 140, 35, 25.4, 25, 19, 17.9, 16.5, 14.2, 13, 8.3, 7.7 |
Saccharomyces cerevisiae RNAP III |
13-17 |
160, 128, 82, 53, 40, 37, 34, 31, 27, 25, 23, 19, 17, 14.5, 11, 10, 10 |
Human and yeast mitochondria |
1 |
140 |
Spinach and mustard chloroplast c |
1 |
110 |
4 |
154, 120, 78, 38 |
13 |
141, 110, 36, 26, and others not yet fully characterized |
Vaccinia virus |
8 |
147, 132, 35, 30, 22, 19, 18, 7 |
Baculovirus a |
4 |
98, 55, 53, 46 |
a, 바이러스는 전사의 시간적 조절을 위해 자가적으로 암호화된 RNA 중합 효소뿐만 아니라 숙주 RNA 중합 효소를 사용한다.
b, 바이러스는 하나 이상의 RNA 중합 효소를 암호화한다.
c, 하나 이상의 RNA 중합 효소가 사용된다.
Bacillus subtilis 파지 SP01 및 coliphage T4와 같은 일부 박테리오파지의 게놈은 바이러스 DNA 템플릿의 전사를 위해 박테리아 RNA 중합효소 촉매 코어를 리디렉션하는 자가로 시그마 인자를 코딩한다. 박테리아 효소의 촉매 코어는 이 모든 전사에 대해 동일하게 사용된다. 또한, 많은 박테리오파지는 프로모터 인식 후 전사 주기의 후속 단계를 수정하기 위해 다른 바이러스 코딩 및 숙주 코딩 조절 단백질을 활용하다.
박테리오파지 N4는 숙주 중합효소와 자가 게놈에 의해 코딩된 다른 두 중합효소를 모두 사용하다(표 1). 바이러스 중합효소 중 하나는 매우 큰 단일 서브유닛 효소로, 더 작은 단일서브유닛 박테리오파지 코딩 중합효소와 달리 단일 가닥 DNA 결합 단백질인 숙주 보조인자 ssb가 필요하다. ssb 단백질은 이 320kDa 중합효소가 바이러스 DNA에서 특이한 헤어핀 구조를 인식하도록 한다. 이는 추가 바이러스 RNA의 합성을 허용하여 새로운 바이러스 입자의 복제및 조립을 가능하게 한다.
원핵 바이러스와 마찬가지로 진핵 바이러스는 자신의 중합효소 (예 : 우두, 바큘로 바이러스)를 코딩하는 것부터 숙주 세포기구를 사용하는 것까지 전사 전략의 전체 스펙트럼을 사용하다. 여러 진핵 바이러스는 RNA 의존성 RNA 중합효소(RdRp)도 코딩하다 (예: C 형 간염 바이러스, 소아마비 바이러스). 바이러스로 코딩된 단백질 인자는 또한 전사주기의 여러 위치에서 숙주 세포의 전사를 조절하다.
진핵 DdRp는 핵과 세포 기관에서 발견될 수 있다. 미토콘드리아에서 발견되는 중합효소와 엽록체에서 발견되는 하나의 중합효소는 작은 단일 서브유닛 박테리오파지 RNA 중합효소와 유사하다. 엽록체에는 두 개의 다른 RNA 중합효소가 있으며, 그중 하나는 박테리아 효소와 매우 유사하다(표 1). 핵 RNA 중합효소는 생화학적으로 분리된 세 가지 별개의 복합체로 제공되며, 원래는 각각 전사하는 유전자의 종류에 따라 분류되었다. 최근에는 RNA 합성을 조절하기 위해 작용하는 서브유닛과 부속 단백질 인자에 의해 정의되었다. Termed RNA 중합효소 I, II 및 III (또는 각각 A, B 및 C)은 각각 12 개 이상의 서브유닛을 가지고 있다(표 1). RNA 중합효소 I은 리보솜의 서브유닛에 대한 구조적 RNA를 코딩하는 유전자를 전사하다. RNA 중합효소 II는 단백질과 작은 RNA의 하위 집합을 코딩하는 유전자를 전사하다. RNA 중합효소 III는 리보솜 5S RNA, tRNA 및 기타 작은 RNA의 하위 집합을 코딩하는 유전자를 전사한다.
DdRp에 의한 전사: 박테리오파지 T3, T7 또는 SP6의 DNA-의존성 RNA 중합효소는 상대적으로 작은 (~ 100 kDa) 단일 서브유닛 RNA 중합효소의 계열로, 전사의 모든 단계, 즉 시작, 신장 또는 종료에 대한 추가 단백질 인자를 필요로 하지 않는다. 이러한 중합효소는 대장균에서 쉽게 과발현된다. 그들은 매우 활동적이며 덜 자주 종결되며 (E. coli RNA 중합효소와 비교하여) 자신의 프로모터에서 매우 엄격하게 전사를 한다. 이러한 특성은 이러한 중합효소를 다양한 실험 전략을 사용하여 시험관 내 RNA 합성에 매우 편리한 도구로 만들었다. 박테리오파지 T7 (T7 RNAP)의 RNA 중합효소는 아마도 가장 일반적으로 사용되며 상업적으로 이용 가능하지만 대량의 RNA 합성을 위해 사내에서 정제하는 것이 더 경제적이다.
<도 1>에서처럼, 박테리오파지 RNAP는 특정 서열에서 RNA 전사를 시작하고 종료하다(특정 효율로). 그러나 시험관 내 준비 RNA 생산을 위한 가장 간단한 실험 설정은 RNA 합성이 특정 T7 프로모터에서 시작되고 RNAP가 DNA 템플릿의 물리적 끝에서 떨어질 때 끝나는 소위 유출 전사이다. 이 설정은 화학적으로 합성될 수 있는 DNA 프로모터 및 템플릿 서열의 편리한 준비를 할 수 있다. 더욱이, DNA 주형이 완전 염기쌍일 필요는 없다는 것이 밝혀졌다. 대부분 또는 전체 코딩 가닥은 단일 가닥으로 유지될 수 있다. -15에서 -3까지의 위치에 걸친 최소 염기쌍 영역 (+1은 전사 잔기의 시작을 나타냄)은 T7 RNAP를 사용한 완전 효율적인 전사에 여전히 충분하다. 이것은 프로모터 인식 과정의 일부로서 전사 기포를 형성한다는 개념과 일치하다. 개방 프로모터가 있는 T7 RNAP의 결정 구조에서 주형 및 비 주형 가닥은 위치 -4에서 시작하여 하류에서 풀린다. 이 특성은 모든 RNA 서열의 전사를 위한 단일 범용 DNA 상단 가닥을 준비 할 수 있게 한다. 매번 하단 코딩 DNA 가닥만 재설계하면 된다.
<도 1>에서처럼, 천연 T7 RNAP 프로모터 서열은 위치 -17에서 위치 +6까지 강력하게 보존된다. 그럼에도 불구하고 RNA는 수율이 감소할 수 있지만 위치가 +1에서 +6으로 화학적 변형된 프로모터에서도 전사된다. 일반적으로 GG 또는 GA로 시작하는 RNA 서열에서 가장 효율적인 수율이 달성된다. 수율을 향상시키려면 전사 반응 조건을 각 RNA 서열에 최적화해야 한다. 여기에는 다양한 MgCl2 농도와 상대적인 양의 T7 RNAP, 주형 및 NTP가 포함된다. 올바른 RNA 단편과 여러 가지 더 짧은 중단 산물 외에도 시험관내 전사인 T7 RNAP는 종종 주 전사체의 3' 말단에 비주형 뉴클레오티드를 통합하여 소위 'n+1 생성물'을 생성한다. 그런 다음 원하는 RNA 산물을 잘못된 크기의 전사체와 DNA 템플릿, 사용하지 않은 NTP 및 RNAP에서 분리해야 한다.
<도 1>에서처럼, T7 RNAP을 사용하는 시험관내 전사를 통해 거의 모든 길이와 서열을 가진 RNA를 제조할 수 있다. 그러나 더 큰 RNA의 경우, 올리고 뉴클레오티드 길이를 가진 주형의 수율이 기하급수적으로 감소하기 때문에 화학적으로 합성된 DNA 주형을 사용하는 것이 실용성이 떨어진다. 50-100 nt보다 큰 템플릿의 경우 대체 방법은 선형화된 high-copy DNA plasmid (예 : pUC18.31) 내에서 설계된 완전 이중 가닥 DNA 템플릿을 사용하는 것이다. 대형 RNA를 준비하는 또 다른 잠재적인 합병증은 RNA 변성이다. PAGE 정화중에 진행된다. RNA는 이러한 정제후에 본래의 형태로 다시 접혀 져야하며, 때때로 문제가 될 수 있다.
DdRp 프로모터: 박테리오파지 T7, T3 및 SP6에 의해 코딩된 DdRp는 중합효소-프로모터 상호 작용 연구에 특히 적합하다. 각 파지 효소는 추가 단백질 인자가 없는 상태에서 전사 과정의 모든 단계를 수행할 수 있는 = 100kDa의 단일 종의 단백질로 구성된다. 박테리오파지 T7은 각각 단일 서브유닛 DdRp를 코딩하는 박테리아 바이러스 그룹의 원형이다. 이 클래스의 다른 구성원으로는 coliphages 콜리 파지 T3 및 BA14, Salmonella phage 살모넬라 파지 SP6, Pseudomonasphage 슈도모나스 파지 gh-1 및 Klebsiella phage 파지 K11 등이 있다. 파지 DdRp는 대규모 RNA 합성, 핵산 증폭을 포함한 다양한 응용 분야에서 유용하며 원핵 및 진핵 세포 모두에서 효율적인 발현 시스템의 기초로 입증되었다.
<도 2>에서처럼, 높은 수준의 구조적 유사성에도 불구하고 (아미노산 서열의 보존으로 판단할 때) 파지 DdRp는 자신의 프로모터 서열에 대해 정교하게 특이적으로 작용한다. 각각의 파지 프로모터는 -17에서 +6까지 확장되는 공통 23 개- 염기 쌍 컨센서스 서열과 관련이 있다 (그림 1 참조). -7에서 +1까지 확장되는 핵심 뉴클레오티드 서열은 세 가지 프로모터 유형 전반에 걸쳐 매우 보존되어 있으며, 이는 이 영역이 중합효소의 공유된 특징과 공통적인 방식으로 상호 작용함을 의미한다. 프로모터 서열은 -8에서 -12까지 영역에서 크게 다르며, 이는 이 영역의 염기쌍이 특정 프로모터 인식에 중요하다는 것을 시사한다. 합성 파지 프로모터를 사용한 연구에 따르면 T3 및 T7 효소에 대한 프로모터 특이성의 주요 결정자는 위치 -10 및 -11의 염기 쌍을 포함한다. T7 프로모터 서열의 이 두 위치에서 T3 잔기의 치환은 T7 중합효소에 의한 인식을 방지하고 T3 RNA 중합효소에 의한 전사를 가능하게 한다. 이러한 결정 인자의 인식을 담당하는 T3 및 T7 RNA 중합효소의 도메인이 국소화되었으며, 예비 결정학적 데이터는 중합효소의 이 영역이 추정 DNA 결합 틈 내에 위치함을 의미한다.
핵산 분자: 핵산 분자는 핵산 성분을 포함하는 분자이다. 핵산 분자는 DNA 또는 RNA를 나타낸다. "폴리뉴클레오타이드"와 동의어로 사용된다. 핵산 분자는 뉴클레오타이드 단량체를 포함하거나 이로 이루어진 폴리머이며, 당/포스페이트-백본의 포스포디에스테르 결합에 의해 서로 공유 결합으로 연결되어 있다.
핵산은 DNA(예: 상보성 DNA(cDNA), 유전체 DNA(gDNA) 등), RNA(예: 메시지 RNA(mRNA), 짧은 억제성 RNA(siRNA), 리보좀 RNA(rRNA), tRNA, microRNA, 및/또는 DNA 또는 RNA 유사체(예: 염기 유사체, 슈가 유사체 및/또는 비-천연 골격 등 함유), RNA/DNA 하이브리드 및 폴리아미드 핵산(PNA)으로부터의 임의의 조성물 중 하나 이상의 핵산(예: 핵산의 세트 또는 서브세트)를 지칭하며, 이들 모두는 단일- 또는 이중-가닥 형태일 수 있으며, 달리 제한이 없는 한 천연 발생 뉴클레오티드와 유사한 방식으로 기능할 수 있는 천연 뉴클레오티드의 공지된 유사체를 포함할 수 있다.
데옥시리보뉴클레오티드, 리보뉴클레오티드 및 천연 뉴클레오티드의 공지된 유사체를 포함하는 핵산을 포함한다. 핵산은 등가물로서 이의 유도체 또는 변이체, 뉴클레오티드 유사체로부터 합성된 RNA 또는 DNA의 적합한 유사체, 단일-가닥("센스" 또는 "안티센스", "플러스" 가닥 또는 "마이너스" 가닥, "전방" 판독 프레임 또는 "후방" 판독 프레임) 및 이중-가닥 폴리뉴클레오티드를 포함할 수 있다. 핵산은 단일 또는 이중 가닥일 수 있다. 핵산은 2개 이상, 3개 이상, 4개 이상 또는 5개 이상의 인접 뉴클레오티드의 임의의 길이의 것일 수 있다. 핵산은 서열(예컨대, 핵산 서열, 예컨대 서열)로서 당업계에 공지된 특정한 5'로부터 3' 순서의 뉴클레오티드를 포함할 수 있다.
핵산은 천연 발생일 수 있고/있거나 합성 또는 변경될 수 있다. 예컨대, 핵산은 앰플리콘일 수 있다. 핵산은 핵산 라이브러리, 예컨대 gDNA, cDNA 또는 RNA 라이브러리로 부터의 것일 수 있다. 핵산은 합성(예컨대, 화학적으로 합성)되거나 (예컨대, 시험관내에서 폴리머라제연장에 의해, 예컨대 증폭에 의해, 예컨대 PCR에 의해) 생성될 수 있다. 핵산은 플라스미드, 파아지, 바이러스, 자가 복재 서열(ARS), 동원체, 인공 유전체, 유전체, 또는 시험관내에서 또는 호스트 세포, 세포, 세포 핵 또는 세포의 세포질에서 전사하거나 전사될 수 있는 다른 핵산이거나 이로부터의 것일 수 있다.
본 발명에서 기술되는 공정 또는 방법에 대해 제공되는 핵산은 1 내지 1000, 1 내지 500, 1 내지 200, 1 내지 100, 1 내지 50, 1 내지 20 또는 1 내지 10개 샘플로부터의 핵산을 포함할 수 있다. 올리고뉴클레오티드는 비교적 짧은 핵산이다. 올리고뉴클레오티드는 약 2 내지 150, 2 내지 100, 2 내지 50 또는 2 내지 약 35개 핵산 길이로부터의 것일 수 있다. 올리고뉴클레오티드는 18 내지 30, 20 내지 28 또는 21 내지 26개 뉴클레오티드 길이이다. 올리고뉴클레오티드는 단일 가닥이다. 올리고뉴클레오티드는 프라이머이다. 프라이머는 종종 선택된 상보적 핵산에 하이브리드화하도록 구성되며 하이브리드화후 폴리머라제에 의해 연장되도록 구성된다.
DNA: DNA는 데옥시리보핵산에 대한 일반적인 약자이다. 이는 핵산 분자, 즉, 뉴클레오타이드로 이루어진 폴리머이다. 이러한 뉴클레오타이드는 보통 - 그들 스스로에 의해 - 당 성분(sugar moiety), 염기 성분 및 포스페이트 성분으로 구성된 데옥시아데노신-모노포스페이트, 데옥시티미딘-모노포스페이트, 데옥시구아노신-모노포스페이트 및 데옥시사이티딘-모노포스페이트 단량체이며, 특유의 백본 구조에 의해 중합된다. 백본구조는, 일반적으로, 단량체에 근접한 첫 번째 뉴클레오타이드의 당 성분 즉, 데옥시리보오스와 두 번째 포스페이트 성분 사이의 포스포디에스테르 결합에 의해 형성된다. 단량체의 특정 순서, 즉, 당/포스페이트-백본에 연결된 염기의 순서는 DNA-서열이라고 한다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태(double stranded form)에서, 첫 번째 가닥의 뉴클레오타이드는 일반적으로 두 번째 가닥의 뉴클레오타이드와 예를 들어, A/T-염기쌍 및 G/C-염기쌍으로 혼성화(hybridize)된다.
RNA, mRNA: RNA는 리보핵산에 대한 일반적인 약자이다. 이는 핵산 분자 즉, 뉴클레오타이드로 이루어진 폴리머이다. 이들 뉴클레오타이드는 보통 소위 백본을 따라 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 사이티딘-모노포스페이드 단량체이다. 백본은 단량체에 근접한 첫 번째 당, 즉 리보오스, 및 두 번째 포스페이트 성분 사이에서 포스포디에스테르 결합에 의해 형성된다. 단량체의 특정 연쇄는 RNA-서열이라고 한다.
RNA는 리보뉴클레오타이드 잔기를 포함하는 분자에 관한 것이고, 완전히 또는 대체로 리보뉴클레오타이드 잔기로 이루어진 분자에 관한 것이다. 용어 "리보뉴클레오타이드"는 β-D-리보푸라노실기의 2'-위치에 수산기를 갖는 뉴클레오타이드에 관한 것이다. "RNA"는 이중가닥 RNA, 단일가닥 RNA, 분리된 RNA, 예컨대 부분적으로 또는 완전히 정제된 RNA, 본질적으로 순수한 RNA, 합성 RNA, 및 재조합적으로 발생된 RNA, 예컨대 하나 이상의 뉴클레오타이드의 부가, 결실, 치환 및/또는 변경에 의해 자연-발생 RNA와 상이한 변형된 RNA를 포함한다. 이러한 변경은 예를 들어, RNA의 하나 이상의 뉴클레오타이드에서, RNA의 말단(들)에 또는 내부적으로, 비-뉴클레오타이드 물질을 첨가하는 것을 포함할 수 있다. 또한, RNA 분자의 뉴클레오타이드는 비-표준 뉴클레오타이드, 예컨대 비-천연 발생 뉴클레오타이드 또는 화학적으로 합성된 뉴클레오타이드 또는 데옥시뉴클레오타이드도 포함할 수 있다. 이들 변경된 RNA는 유사체, 특히 자연성 발생 RNA의 유사체로 지칭할 수 있다.
RNA는 단일가닥 또는 이중가닥일 수 있다. 본 발명에서는, 단일가닥 RNA가 바람직하다. 용어 "단일가닥 RNA"는 일반적으로 상보적인 핵산 가닥(전형적으로 상보적인 RNA 가닥; 즉 상보적인 RNA 분자가 없음)이 RNA 분자와 결합되어 있지 않은 실시형태를 지칭한다.
보통 RNA는 DNA-서열의 전사에 의해, 예를 들어, 세포 내부에서 합성 가능할 수 있다. 진행 세포에서, 전사는 일반적으로 핵 또는 미토콘드리아 내부에서 수행된다. 생체 내에서(In vivo), 보통 DNA의 전사는 보통 mRNA로 약칭하는 소위 전령-RNA로 가공되어야 하는 소위 미성숙 RNA(premature RNA)로 된다. 예를 들어, 진핵 유기체에서 미성숙 RNA의 가공은 스플라이싱(splicing), 5'캡핑(capping), 아데닐산중합반응(polyadenylation), 핵 또는 미토콘드리아로부터 유출(export) 등의 다양한 상이한 전사 후-변형을 포함한다. 이들 가공의 합(sum)은 RNA의 성숙이라고 한다.
성숙 전령 RNA는 보통 특정 펩타이드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오타이드 서열을 제공한다. 일반적으로, 성숙 mRNA(mature mRNA)는 5'캡(cap), 선택적으로 5'UTR, 오픈 리딩 프레임, 선택적으로 3'UTR 및 폴리(A) 서열을 포함한다. 전령 RNA 이외에, 여러 비-코딩 유형의 RNA가 존재하며, 이는 전사 및/또는 번역의 조절과 관련될 수 있다.
핵산 및 아미노산 서열에 관한 "변이체"는 임의의 변이체, 특히 돌연변이체, 바이러스 균주, 스플라이스 변이체, 입체배좌체, 이소형체, 대립형질 변이체, 종 변이체 및 종 상동체, 특히 자연적으로 존재하는 것들을 포함한다. 대립형질 변이체는 유전자의 정상 서열에서의 변경에 관한 것이고, 그 중요성은 종종 불분명하다. 완전한 유전자 시퀀싱은 종종 주어진 유전자에 대한 수많은 대립형질 변이체를 동정한다. 핵산 분자와 관련하여, "변이체"는 축퇴성 핵산 서열을 포함하며, 여기서 본 발명에 따른 축퇴성 핵산은 유전 암호의 축퇴성 때문에 코돈 서열에서 기준 핵산과 상이한 핵산이다. 종 상동체는 주어진 핵산 또는 아미노산 서열과는 다른 종의 기원을 갖는 핵산 또는 아미노산 서열이다. 바이러스 상동체는 주어진 핵산 또는 아미노산 서열과는 다른 바이러스의 기원을 갖는 핵산 또는 아미노산 서열이다.
핵산 변이체는 기준 핵산과 비교하여 단일 또는 다중 뉴클레오타이드 결실, 첨가, 돌연변이, 및/또는 삽입을 포함한다. 결실은 기준 핵산으로부터 하나 이상의 뉴클레오타이드를 제거하는 것을 포함한다.
첨가 변이체는 하나 이상의 뉴클레오타이드, 예컨대 1, 2, 3, 5, 10, 20, 30, 50개 이상의 뉴클레오타이드의 5' 및/또는 3'말단 융합체를 포함한다. 돌연변이는 치환을 포함할 수 있으나, 이에 한정되는 것은 아니며, 여기서 서열 중 적어도 하나의 뉴클레오타이드가 제거되고 적어도 하나의 다른 뉴클레오타이드가 그 자리에 삽입된다(예컨대 전환 및 전이). 돌연변이는 일염기 부위, 가교 부위, 및 화학적으로 변경되거나 변형된 염기를 포함한다. 삽입은 기준 핵산 내에 하나 이상의 뉴클레오타이드를 첨가하는 것을 포함한다.
특정 핵산 서열의 변이체는 상기 특정 서열의 하나 이상의 기능적 특성을 가지며, 상기 특정 서열, 예를 들어 특정 핵산 서열과 동일한 또는 유사한 특성을 나타내는 핵산 서열과 기능적으로 동등하다.
유도체(derivative)는 뉴클레오타이드 염기, 당 또는 포스페이트 상에서 핵산의 여하한 화학적 유도화를 포함한다. "유도체"는 또한 자연적으로 발생하지 않는 뉴클레오타이드들 및 뉴클레오타이드 유사체들을 함유하는 핵산도 포괄한다. 핵산의 유도체화는 바람직하게는 그의 안정성을 증가시킨다.
핵산 서열로부터 유래된 핵산 서열은 그것이 유래된 핵산의 변이체인 핵산을 지칭한다. 바람직하게는 RNA 분자 내 특정 서열을 대체하는 경우, 특정 서열에 대한 변이체인 서열은 RNA 안정성 및/또는 번역 효율을 유지한다.
"폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 또는 "핵산 단편"은 상호 호환적으로 합성, 비-천연 또는 변형된 뉴클레오티드 염기를 선택적으로 포함하는, 단일 가닥 또는 이중 가닥의 RNA 또는 DNA로 된 폴리머를 지칭하기 위해 사용된다. 핵산 분자의 서열은 일반적으로 특정하고 개별적인 순서, 즉 이의 뉴클레오타이드의 연속인 것으로 이해된다. 단백질 또는 펩타이드의 서열은 일반적으로 순서, 즉, 이의 아미노산의 연쇄(succession)인 것으로 이해된다.
서열 상동성: 둘 이상의 서열은 만약 그들이 뉴클레오타이드 또는 아미노산의 동일한 길이 및 순서를 나타낸다면 동일하다(상동성이 있다). 상동성의 백분율은 일반적으로 두 서열이 동일한 정도(extent)를 설명하며, 즉, 이는 일반적으로 그들의 서열 위치가 참조 서열(reference sequence)의 뉴클레오타이드와 상응하는 뉴클레오타이드의 백분율을 설명한다. 동일의 정도를 결정하기 위하여, 비교되는 서열은 동일한 길이, 즉, 비교될 서열의 가장 긴 서열의 길이를 나타내는 것으로 간주된다. 이는 8개 뉴클레오타이드로 이루어진 첫 번째 서열은 첫 번째 서열을 포함하는 10개 뉴클레오타이드로 이루어진 두 번째 서열과 80% 동일한 것을 의미한다. 다시 말하면, 본 발명에서, 서열의 동일은 바람직하게는 동일한 길이를 가지는 둘 이상의 서열에서 동일한 위치를 가지는 서열의 뉴클레오타이드의 백분율과 관련된다. 갭(gap)은 보통 정렬에서 이들의 실제위치와 관계없이, 비-동일 위치로 간주된다.
안정화된 핵산 분자: 안정화된 핵산 분자는 핵산 분자이며, 바람직하게는, 변형이 없는 핵산 분자보다, 예를 들어, 환경적 인자 또는 엑소- 또는 엔도뉴클레아제와 같은 효소 분해(digest)에 의한 붕괴(disintegration) 또는 분해(degradation)에 더 안정한, 그렇게 화학적 변형된 DNA 또는 RNA 분자이다. 안정화된 핵산 분자는 원핵 또는 진핵 세포, 인간 세포와 같은 포유동물 세포와 같은 세포에서 안정화되는 것이다. 안정화 효과는 또한 세포의 외부, 예를 들어, 버퍼 용액 등에서, 예를 들어, 안정화된 핵산 분자를 포함하는 약학적 조성물을 제조하는 공정에서 발휘될 수 있다.
이종 서열(Heterologous sequence): 일반적으로 두 서열은, 그들이 동일한 유전자로부터 이끌어낼 수 있는 것이 아니라면, '이종(heterologous)'으로 이해된다. 즉, 이종 서열은 동일한 유기체(organism)로부터 이끌어낼 수 있을 수 있지만, 그들은 동일한 mRNA에서와 같이, 동일한 핵산에서 자연적으로(자연에서) 발생하지 않는다.
발현: RNA의 생산 또는 RNA 및 단백질의 생산을 포함한다. 이것은 또한 핵산의 부분적 발현을 포함한다. 뿐만 아니라, 발현은 일시적이거나 안정한 것일 수 있다. RNA와 관련하여, "발현" 또는 "번역"이라는 용어는 세포의 리포좀 내에서 메신저 RNA의 한 가닥이 아미노산 서열의 어셈블리를 지시하여 펩티드 또는 단백질을 만드는 프로세스에 관한 것이다. 유전자는 하나 이상의 세포 생성물을 생산하고/하거나 하나 이상의 세포 간 또는 세포 내 기능을 달성하기 위한 특정 핵산 서열을 지칭한다. 보다 구체적으로, 상기 용어는 특정 단백질 또는 기능적 또는 구조적 RNA 분자를 코딩하는 핵산을 포함하는 핵산 섹션(전형적으로 DNA이지만, RNA 바이러스의 경우에는 RNA이다)에 관한 것이다. mRNA는 메신저-RNA를 의미하며 전형적으로 DNA 주형을 이용하여 생성되고 펩티드 또는 단백질을 코딩하는 전사체에 관한 것이다. 전형적으로, mRNA는 5'UTR, 단백질 코딩 영역, 3'UTR, 및 폴리(A) 서열을 포함한다. mRNA는 DNA 주형으로부터 시험관내 전사에 의해 생성될 수 있다. 시험관내 전사 방법론은 통상의 기술자에게 잘 알려져 있는 것이다. 예를 들어, 시험관내 전사 키트가 시중에 다양하게 판매되고 있다. 본 발명에 따르면, mRNA는 변형 및 캡핑을 안정화시킴으로서 변형시킬 수도 있다.
오픈 리딩 프레임(Open reading frame): 일반적으로 펩타이드 또는 단백질로 번역될 수 있는 여러 뉴클레오타이드 트리플렛(triplets)의 서열일 수 있다. 오픈 리딩 프레임은 이의 5'말단 및 보통 다중 3개 뉴클레오타이드 길이를 나타내는 후속 영역(subsequent region)에 바람직하게는 시작 코돈, 즉, 보통 아미노산 메티오닌을 코딩하는 이후의 세 뉴클레오타이드의 조합(ATG 또는 AUG)을 함유한다. ORF는 바람직하게는 정지-코돈(예를 들어, TAA, TAG, TGA)에 의하여 종결된다. 일반적으로, 이는 오직 오픈 리딩 프레임의 정지-코돈이다. 따라서, 본 발명에서 오픈 리딩 프레임은 바람직하게는 시작 코돈(예를 들어, ATG 또는 AUG)으로 시작하고 바람직하게는 정지 코돈(예를 들어, TAA, TGA, 또는 TAG 또는 UAA, UAG, UGA, 각각)으로 종결되는 3으로 나뉘어질 수 있는 다수의 뉴클레오타이드로 이루어지는 뉴클레오타이드 서열이다. 오픈 리딩 프레임은 분리될 수 있거나 더 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 포함될 수 있다. 오픈리딩 프레임은 또한 "단백질 코딩 영역"으로 불리울 수 있다.
바이시스트로닉 RNA, 멀티시스트로닉 RNA(Bicistronic RNA, multicistronic RNA): 바이시스트로닉 또는 멀티시스트로닉 RNA는 일반적으로 두 개의(바이시스트로닉) 또는 그 이상의(멀티시스트로닉) 오픈 리딩 프레임(ORF)를 가질 수 있는 RNA, 바람직하게는 mRNA 이다. 오픈 리딩 프레임은 펩타이드 또는 단백질로 번역될 수 있는 코돈의 서열이다.
용어 "폴리(A) 서열" 또는 "폴리(A) 꼬리"는 전형적으로 RNA 분자의 3'말단에 위치하는 연속되거나 중단된 아데닐레이트 잔기 서열을 지칭한다. 연속적인 서열은 연속적인 아데닐레이트 잔기를 특징으로 한다. 사실상, 연속적인 폴리(A) 서열이 전형적인 것이다. 폴리(A) 서열은 전사 후 주형-독립적 RNA 중합효소에 의해 RNA의 자유 3'말단에 세포 핵에서 진핵세포 전사 중에 부착되지만, 통상적으로 진핵세포 DNA에서 암호화되지 않은 반면, 본 발명은 DNA에 의해 코딩된 폴리(A) 서열을 포함한다.
RNA, 예를 들어 mRNA와 같은 핵산은 펩티드 또는 단백질을 코딩할 수 있다. 따라서, 전사 가능한 핵산 서열 또는 그의 전사체는 펩티드 또는 단백질을 코딩하는 오픈 리딩 프레임(ORF)을 포함할 수 있다.
G/C 화학적 변형: G/C-화학적 변형된 핵산은 야생형 서열과 비교하여 증가된 수의 구아노신 및/또는 사이토신 뉴클레오타이드를 포함하는 화학적 변형된 야생형 서열에 기반한, RNA 분자일 수 있다. 이러한 증가된 수는 구아노신 또는 사이토신 뉴클레오타이드를 함유하는 코돈에 의해 아데노신 또는 티미딘 뉴클레오타이드를 함유하는 코돈의 치환에 의해 생성될 수 있다. 풍부한 G/C 함량이 DNA 또는 RNA의 코딩 영역에 발생하면, 이는 유전적 코드의 퇴화(degeneracy)를 사용한다. 따라서, 코돈 치환은 바람직하게는 코딩된 아미노산 잔기를 변형하지 않지만, 오로지 핵산 분자의 G/C 함량을 증가시킨다.
참조 RNA(Unmodified reference RNA): 자연에 존재하는 것과 같은 야생형 RNA 서열에 상응하는 RNA. 예를 들어, 비화학적 변형된 참조 mRNA는 자연적으로 발생하는 뉴클레오타이드를 포함하는 mRNA 서열에 상응하며, 자연적으로 발생하는 변형, 및/또는 자연적으로 발생하는 비번역 영역을 포함하는 뉴클레오타이드를 포함하고, 예컨대, 자연적으로 발생하는 5'캡(CAP) 구조 m7GpppN, 만약 자연적으로 발생하는 mRNA 서열에 존재한다면, 선택적으로 자연적으로 발생하는 5'UTR을 포함하고, 만약 자연적으로 발생하는 mRNA 서열 및 대략 30개 아데노신을 갖는 폴리 A 서열에 존재한다면, 야생형 오픈 리딩 프레임은, 선택적으로 자연적으로 발생하는 3'UTR을 포함한다.
키메라 효소: 키메라 효소는 자연에서 발견되는 천연 효소가 아닌 효소를 지칭한다. 따라서, 키메라 효소는, 자연에서 발견된 것과는 상이한 방식으로 배열된, 상이한 공급원(예: 상이한 효소)으로부터 유래된 촉매 도메인 또는 동일한 공급원(예: 동일한 효소)으로부터 유래된 촉매 도메인을 포함할 수 있다. 키메라 효소는 단량체성(즉, 단일 단위) 효소 뿐만 아니라 올리고머성(즉, 복수 단위) 효소, 특히 헤테로-올리고머성 효소를 포함한다. 단량체성 효소는 단지 하나의 폴리펩티드 쇄로 이루어진 단일-단위 효소와 관련된다.
단백질: 일반적으로 단백질은 하나 이상의 펩타이드 또는 폴리펩타이드를 포함한다. 일반적으로 단백질은 생물학적 기능을 발휘하는 단백질을 위해 요구될 수 있는 3차원 형태로 접힌다.
"폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 본 발명에서 상호 호환적으로 아미노산 잔기들로 된 폴리머를 지칭하기 위해 사용된다. 이들 용어는 하나 이상의 아미노산 잔기가 대응되는 천연 아미노산의 인공적인 화학 유사체인 아미노산 폴리머 뿐만 아니라 천연 아미노산 폴리머에도 적용된다. 용어 "폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 또한 비-제한적인 예로, 당화, 지질 결합, 황산화, 글루탐산 잔기의 감마-카르복시화, 하이드록시화 및 ADP-화라이보실화 (ribosylation) 등의 변형을 포함한다.
펩타이드: 일반적으로 펩타이드 또는 폴리펩타이드는 펩타이드 결합에 의해 연결된 아미노산 단량체의 폴리머이다. 이는 일반적으로 50 단량체 단위 미만으로 함유한다. 그렇지만, 용어 펩타이드는 50 단량체 단위를 초과하여 갖는 분자를 위한 권리를 포기하는 것은 아니다. 긴 펩타이드는 폴리펩타이드라고도 불리우며, 일반적으로 50 내지 600 단량체 단위를 갖는다.
"분리된 분자"는 다른 분자, 예컨대 다른 세포 물질이 실질적으로 존재하지 않는 분자를 의미한 다. "분리된 핵산"이라는 용어는 핵산이 (i) 시험관내, 예를 들면 중합효소 연쇄 반응(PCR)에 의해 증폭되거나, (ii) 클로닝에 의해 재조합적으로 생산되거나, (iii) 예를 들면 절단 및 겔-전기천공 분획화에 의해 정제되거나, 또는 또는 (iv) 예를 들어 화학 합성법에 의해 합성된 핵산을 의미한다. 분리된 핵산은 재조합 기술에 의해 조작 가능한 핵산이다.
"인델"은 핵산에서 이중 가닥 브레이크 (DSB) 부위에 삽입되거나 결실된 다수의 뉴클레오티드로 이루어진 삽입/결실 돌연변이를 지칭한다.
"녹다운(knockdown)"은 특정 유전자 생성물 (예컨대, 단백질, mRNA 또는 둘 다)의 발현 감소를 지칭한다. 단백질의 녹다운은 (예컨대, 혈청 또는 세포 배지에서) 조직 또는 세포 집단에 의해 분비된 단백질을 검출하거나 관심있는 조직 또는 세포 집단으로부터 단백질의 총 세포량을 검출함으로써 측정될 수 있다. mRNA의 녹다운을 측정하는 방법은 공지되어 있으며, 관심 조직 또는 세포 집단으로부터 단리된 mRNA의 시퀀싱(sequencing)을 포함한다. "녹다운"은 특정 유전자 생성물의 발현의 일부 손실, 예를 들어, 전사된 mRNA의 양의 감소 또는 세포 집단(조직에서 발견되는 것과 같은 생체 내 집단 포함)에 의해 발현되거나 분비된 단백질의 양의 감소를 지칭할 수 있다.
녹아웃(knockout은 세포에서 특정 단백질의 발현 손실을 지칭한다. 녹아웃은 (예컨대, 혈청 또는 세포 배지에서) 조직 또는 세포 집단으로부터 단백질 분비량을 검출하거나 단백질 조직 또는 세포 집단의 총 세포량을 검출함으로써 측정될 수 있다. 본 개시내용의 방법은 (예컨대, 조직에서 발견되는 것과 같은 생체 내 집단을 포함하는 세포 집단에서) 표적 단백질 하나 이상의 세포를 "녹아웃"시킨다. 일부 실시양태에서, 녹아웃은 예를 들어, 인델에 의해 생성된 표적 단백질의 돌연변이체의 형성이 아니라, 세포에서 표적 단백질 발현의 완전한 손실이다.
형질전환(Transfection): 용어 "형질전환"은 핵산 분자, DNA 또는 RNA(예를 들어, mRNA) 분자의 세포, 바람직하게는 진핵 세포 내로의 도입을 말한다. 본 발명에서, 용어 "형질전환"은 세포, 바람직하게는 포유동물 세포(mammalian cell)와 같은 진핵 세포 내로 핵산 분자를 도입하는 통상의 기술자에게 알려진 임의의 방법을 포함한다. 이러한 방법은, 예를 들어, 전기천공법(electroporation), 예를 들어, 양이온성 지질 및/또는 리포좀(liposome)에 기반한 리포펙션(lipofection), 칼슘 포스페이트 침전(calcium phosphate precipitation), 나노입자 기반의 형질전환, 바이러스 기반의 형질전환, 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 폴리머에 기반한 형질전환을 포함한다. 바람직하게, 도입은 비-바이러스성이다.
벡터: 가장 일반적인 의미로 사용되며, 예를 들어 상기 핵산을 원핵 및/또는 진핵 대상세포내로 도입시킬 수 있고, 적절한 경우, 유전체 내로 일체화할 수 있는, 여하한 중간체 운반체이 이에 포괄된다. 이러한 벡터는 바람직하게는 세포 내에서 전사 및/또는 발현된다. 벡터는 플라스미드, 파지미드, 바이러스 유전체 및 이들의 분획을 포함한다. 핵산 분자 (예, 플라스미드, 선형의 핵산 단편, RNA 등) 또는 단백질을 유기체에 "도입"하는 것은, 핵산 또는 단백질을 사용해 핵산 또는 단백질이 세포에서 기능하도록 유기체의 세포를 형질전환하는 것을 의미한다. 본 발명에서, "형질전환"은 안정적인 형질전환 및 일시적인 형질전환을 모두 포함한다. "안정적인 형질전환"은 외인성 뉴클레오티드 서열을 유전체에 도입하여, 외래 유전자의 안정적인 유전을 달성하는 것을 의미한다. 안정적으로 형질전환되면, 외인성 핵산 서열이 유기체 및 이의 연속 후속 세대의 유전체에 안정적으로 삽입된다. "일시적인 형질전환"은 핵산 분자 또는 단백질이 세포에 도입되어, 외인성 유전자가 안정적으로 유전되지 않으면서 그 기능을 수행하는 것을 의미한다. 일시적인 형질전환의 경우, 외인성 핵산 서열이 유전체에 삽입되지 않는다.
담체/폴리머 담체: 본 발명에서, 담체는 일반적으로 또 다른 화합물(화물(cargo))의 수송 또는 복합화를 용이하게 하는 화합물일 수 있다. 폴리머 담체는 일반적으로 폴리머를 형성하는 담체이다. 담체는 이의 화물과 공유 또는 비-공유 상호작용에 의하여 연관될 수 있다. 담체는 표적 세포 내로 핵산, 예를 들어, RNA 또는 DNA를 수송할 수 있다. 담체는 양이온성 성분일 수 있다.
양이온성 성분: 용어 "양이온성 성분"은 일반적으로 전하를 띤(charged) 분자를 말하며, 이는 일반적으로 1 내지 9, 바람직하게는 9 미만(예를 들어 5 내지 9), 또는 8 미만(예를 들어 5 내지 8), 또는 7 미만(예를 들어, 5 내지 7)의, 가장 바람직하게는 예를 들어 7.3 내지 7.4의 생리학적 pH 값의 양전하를(양이온) 띤다. 따라서, 양이온성 성분은 임의의 양전하를 띤 화합물 또는 폴리머, 바람직하게는 생리학적 조건하에서, 특히 생체 내(in vivo) 생리학적 조건 하에서 양전하를 띤, 양이온성 펩타이드 또는 단백질일 수 있다. '양이온성 펩타이드 또는 단백질'은 적어도 하나의 양전하를 띤 아미노산 또는 하나 이상의 양전하를 띤 아미노산, 예를 들어 Arg, His, Lys 또는 Orn 로부터 선택된 것을 함유할 수 있다. 따라서, '다중양이온성' 화합물 또한 주어진 조건하에서 하나 이상의 양전하를 보이는 범위 내이다.
비히클(Vehicle): 비히클은 일반적으로 약학적 활성 화합물(pharmaceutically active compound)과 같은 화합물을 저장, 운반, 및/또는 투여하기 위한 적절한 물질로 이해된다. 예를 들어, 이는 약학적 활성 화합물을 저장, 운반 및/또는 투여하기 위한 적절한 생리학적으로 허용가능한 지질일 수 있다.
약학적 유효량(Pharmaceutically effective amount): 본 발명에서, 약학적 유효량은 일반적으로 발현된 펩타이드 또는 단백질의 병리학적 수준을 대체하는, 또는 결여 유전자 산물(lacking gene product)을 치환하는, 예를 들어, 병리학적 상황의 경우에 면역 반응과 같은 약학적 효과를 유도하기 위하여 충분한 양으로 이해된다.
본 발명에서 기술되는 유전체 편집 RNA/DNA 시스템의 전달체은 하나 이상의 폴리펩티드(예: 독소, 리간드, 수용체, 시토카인, 항체 등 또는 이의 조합)와 융합 또는 연합된다. 본 발명에서 기술되는 유전체 편집 시스템의 전달체는 당업계에 공지된 반감기 연장 비히클을 포함할 수도 있다. 이러한 비히클은, 이로 제한됨이 없이, 폴리에틸렌 글리콜, 글리코겐(예: 항원 결합 단백질의 당화) 및 덱스트란을 포함한다.
본 발명의 유전체 편집 전략은 예를 들어 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단을 위한 유망한 방법이 있다. 현재 사용되는 유전체 편집은 아연 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN), 클러스터링된 일정 간격 분포의 짧은 팔린드롬 반복물(CRISPR)-연합된(Cas) 뉴클레아제, 알고너트 엔도뉴클레아제및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 이용한 방법들이 많은 실험실에 의해 효과적으로 사용되고 있다.
본 발명의 유전체 편집 전략은 예를 들어 살아있는 세포 또는 유기체의 특정 유전자좌에 표적화된 유전체 서열 변화를 도입함으로써 유전자 기능을 연구하고 질환을 퇴치하기 위한 강력한 수단을 위한 유망한 방법이 있다.
유전체 편집 목적으로 하나 이상의 폴리펩티드를 코딩하는 유전체 편집 도구의 도입은 수년 동안 생물 의학 연구의 목표였다. 종래 기술에서는 표적 세포 또는 유기체로 유전체 편집 도구 전달에 대한 접근법을 개시하고 있지만, 핵산 분자 및/또는 전달 시스템의 유형이 다르다. 데옥시리보핵산(DNA) 분자의 사용과 관련된 안전 문제에 의해 영향을 받으면서, 최근 몇 년간 리보핵산(RNA) 분자가 주목을 받고 있다. 네이키드된 RNA의 형태로, 또는 복합체 또는 포장된 형태로, 예를 들면, 비바이러스성 또는 바이러스성 운반체에 단일가닥 RNA 또는 이중가닥 RNA의 투여를 포함하는 다양한 접근법이 제안되어왔다.
바이러스 및 바이러스성 전달 운반체에서, 유전체 편집 도구는 전형적으로 단백질 및/또는 지질 (바이러스 입자)에 의해 캡슐화된다. 예를 들어, RNA 바이러스 유래의 조작된 RNA 바이러스 입자는 유전체 편집을 하기 위한 전달 운반체로서 제안되어왔다.
본 발명의 유전자 편집 RNA/DNA 시스템의 다른 실시형태 및 장점이 이하에서 설명된다.
본 발명의 유전체 편집 RNA/DNA 시스템은, 세포 내 적어도 하나의 내인성 유전체 편집을 하고 전사가 가능한 구성 성분이 있는 유전체 편집 RNA/DNA 시스템(도 3)으로서,
세포내 번역이 가능한 구조를 갖추고 화학적 변형된 뉴클레오타이드(CM)를 포함하는 DNA dependent RNA Polymerase(DdRp) mRNA(캡된 CM_DdRp mRNA)를 포함하는 DdRp RNA 발현 카세트; 및
DdRp에 의해 트랜스로 전사될 수 있는 유전체 편집 도구를 코딩하는 DNAge 발현 카세트;를 포함하는 RNA/DNA 시스템을 제공하고,
여기서, 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 유전체 편집을 수행하는 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트 및 가이드 핵산를 코딩하는 DNAsg 발현 카세트로 구성될 수 있다.
본 발명의 유전체 편집 RNA/DNA 시스템은 적어도 2개의 핵산 발현 카세트를 포함한다. 따라서, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상의 핵산 분자를 포함할 수 있다.
상기 표적을 달성하기 위한 본 발명의 다른 하나로,
상기 RNA/DNA 시스템은 추가적으로 상기 DdRp mRNA의 자가전사를 위해서 DdRp가 결합할 수 있는 프로모터와 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 RNA/DNA 시스템을 제공한다.
상기 표적을 달성하기 위한 본 발명의 다른 하나로,
캡된 CM_DdRp mRNA를 포함하는 DdRp RNA 발현 카세트; 및
DdRp mRNA의 자가전사를 위해서 DdRp가 결합할 수 있는 프로모터와 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 및 상기 DdRp에 의해 전사되는 유전체 편집 도구를 코딩하는 DNAge를 포함하는 auto_(DdRp+DNAge) 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성되는 것을 특징으로 하는 발현 RNA/DNA 시스템을 제공한다.
여기서, 상기 캡된 CM_DdRp mRNA, auto_DdRp 발현 카세트, DNAge 발현 카세트 또는 auto_(DdRp+DNAge) 발현 카세트는 염기서열 변형(SM)을 적어도 하나를 포함할 수 있다.
본 발명의 목적을 발성하기 위해서, <표 1>의 DdRp에서 한 개의 서브유닛으로 구성되고 효소 활성에 다른 보조요소가 필요없는 박테리오파지 T7, T3 및 SP6에 의해 코딩된 DdRp를 선정하였다.
본 발명의 auto_DdRp 발현카세트의 DdRp는 DdRp 그 자가, 또는 RNA 트리포스파타제(RNA triphosphatase)의 촉매 도메인, 구아닐릴트랜스퍼라제(guanylyltransferase)의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제(N7-guanine methyltransferase) 및 DdRp(DNA-dependant RNA polymerase)의 촉매 도메인을 포함하는 키메라 효소일 수 있으며, 진핵세포 번역 장치에 의해 고도로 해독 가능한 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성하여 제공하는 방법을 제공할 수도 있다.
본 발명에서 T7 RNA 폴리머라제(polymerase)는 박테리오파지 T7 유래의 약 20 염기쌍으로 구성된 파지 고유의 프로모터 배열을 인식하는 RNA 중합효소로, 5'말단에서 3'말단 방향으로 DNA로부터 RNA의 합성을 촉매하는 효소이다. 구체적으로, 다양한 세포 내 보조인자(cofactor)들을 필요로 하는 진핵생물의 RNA 폴리머라제와는 다르게, T7 RNA 폴리머라제는 추가적인 세포 내 보조인자가 없이도 전사를 일으킬 수 있다는 장점이 있다. 또한, 진핵생물의 세포 내에는 T7 프로모터에 특이성을 가지는 다른 RNA 폴리머라제가 존재하지 않기 때문에 T7 프로모터/T7 RNA 폴리머라제를 이용하는 전사 시스템은 세포 내 다른 전사시스템의 간섭을 받지도 않을 뿐만 아니라, 다른 전사 시스템에 간섭을 일으키지도 않는다. 반면, T7 프로모터와 동일한 RNA 폴리머라제 III 타입에 속하는 다른 프로모터들, 예를 들면 U1 프로모터 혹은 H1 프로모터들은 세포 내에 이미 존재하고 있기 때문에 T7 프로모터가 갖는 이러한 간섭을 일으키지 않는 특성을 가지지 못하며, 본 발명 전사 시스템상 전사를 제어하기에 적당하지 못하다. 보다 구체적으로, 본 발명의 T7 RNA 폴리머라제 mRNA 단편은 서열번호 1의 염기서열로 구성되는 것일 수 있으나, 이에 제한되지 않는다.
또한, 본 발명의 T7 RNA 폴리머라제 mRNA를 포함하는 DdRp RNA 발현 카세트는 5'cap 구조를 추가로 포함하는 것일 수 있다. 상기 5'cap 구조는 대부분의 진핵세포와 바이러스의 mRNA의 5'말단에 존재하는 7-메틸구아노신(7-methylguanosine)을 의미하는 것으로, mRNA가 라이보핵산분해효소(ribonuclease, RNase)에 의해 분해되는 것을 막아주며, 세포질에서는 번역개시인자와 결합하여 리보솜 결합 위치로 작용할 수 있다. 일반적으로 세포질 내 전사체(cytoplasmic transcript)는 핵 전사체(nuclear transcript)가 필수적으로 가지는 5'cap 구조가 없기 때문에 리보솜에 의한 번역 효율이 떨어진다는 문제점을 가진다. 이에, 본 발명은 5'cap 구조를 갖는 T7 RNA 폴리머라제 mRNA 단편을 사용하여 세포내 안정성 및 세포질 내 번역 효율을 높일뿐 만 아니라, 기존에 핵-의존적 mRNA 발현을 위해 사용된 발현 카세트 DNA의 낮은 핵막 투과의 한계점을 극복하여, 세포질 내에 효과적으로 초기 T7 RNA 폴리머라제를 제공할 수 있는 것을 특징으로 한다.
본 발명에서는, 5′-cap 구조 및 CM를 포함하는 T7 RNA 폴리머라제 mRNA 을 포함하는 DdRp RNA 발현 카세트를 합성하기 위해, 먼저 T7 프로모터-T7 폴리머라제 서열을 갖는 dsDNA 단편을 화학합성법에 의하여 합성하고(Bioneer), 이러한 T7 프로모터-T7 폴리머라제 DNA 단편에 대하여 5′cap 구조를 갖고 CM를 포함하는 T7 폴리머라제 mRNA를 시험관 내에서 합성하였다. 상기 5′cap 구조 및 CM를 포함하는 T7 폴리머라제 mRNA는 생체내 안정성을 확보하여 오랜 동안 존재할 수 있다.
본 발명의 DdRp에 의해 전사되는 RNA를 코딩하는 DdRp RNA 발현 카세트는 T7프로모터, RNA를 코딩하는 DNA, 폴리 아데닌 꼬리(poly A tail) 및 T7 종결서열,을 포함하며, 이들이 작동 가능하게 연결되어 구성된 것일 수 있다.
본 발명에서 상기 T7 RNA 폴리머라제 mRNA를 포함하는 RNA 발현카세트의 산물에 의해 상기 T7 프로모터가 있는 T7 RNA 폴리머라제 mRNA를 코딩하는 auto_DdRp DNA 발현카세트 또는 T7 프로모터가 있는 DNAge 발현카세트도 전사되어 증폭되는 것으로, 특정 RNA의 발현에 제한없이 포함될 수 있다. 본 발명에 있어서, T7 RNA 폴리머라제는 T7 프로모터에 대한 특이성이 매우 높으며, T7 프로모터 하류의 DNA만을 전사할 수 있다.
따라서, 본 발명에서 T7 RNA 폴리머라제를 사용함으로써 세포 내에 다른 프로모터와 반응하지 않고 오직 T7 프로모터를 갖는 mRNA를 코딩하는 DNA에 결합 및 전사를 수행하게 되고, 높은 효율로 RNA를 전사하여 증폭할 수 있다.
기존 발현 카세트, plasmid 또는 바이러스 시스템은 핵 의존성으로 핵에 있는 도구를 사용하여 전사를 하여 기존 발현 카세트는 핵까지 이동해야 한다. 그런데, 세포막을 통해 도입된 발현 카세트의 1% 미만이 핵으로 이동하는 단점이 있다.
본 발명의 발현 발현 RNA/DNA 시스템은 <도 3>에서 제시하는 내용처럼 세포질에서 전사 도구를 구성하여 사용함으로써 핵으로 이동 효율의 단점을 극복하고자한다.
<도 4>에서처럼, 본 발명의 유전체 편집 RNA/DNA 시스템은 다양한 구성성분을 조합하여 여러 형태의 발현 카세트를 설계, 제조할 수 있으며
본 발명은 2개의 핵산 발현 카세트로, DdRp RNA 발현 카세트; 및 유전체 편집 도구를 코딩하는 DNAge 발현 카세트 중 어느 하나를 포함하는 시스템을 제공한다.
본 발명은 3개의 핵산 발현 카세트로, DdRp RNA 발현 카세트, 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트 및 sgRNA를 코딩하는 DNAsg 발현 카세트를 각각 별도로 구성하는 DNAge 발현 카세트를 포함하는 시스템을 제공할 수도 있다.
본 발명의 유전체 편집 RNA/DNA 시스템을 구성하는 DdRp RNA 발현 카세트는 세포질에 있는 RNA에서 단백질 합성에 필요한 도구를 통해 DdRp를 합성한다. 본 발명의 DNAge 발현 카세트에 있는 프로모터에 합성된 DdRp가 결합하여 세포질에서 유전체 편집에 필요한 도구를 전사 및 합성한다. 핵 비의존성으로 합성된 유전체 편집 도구는 유전체 편집이 가능한 복합체를 형성하고 핵으로 이동하여 효율적으로 유전체 편집이 진행할 수 있다. 따라서, 본 발명의 유전체 편집 RNA/DNA 시스템에 의해 도입 대상세포 또는 대상 유기체에서 유전체 편집이 가능해진다.
기존 유전체 편집 방법은 CRISPR plasmid 방법, Cas 단백질과 sgRNA를 코딩하는 mRNA 방법, 그리고 Cas 단백질과 sgRNA로 이루어진 ribonucleoprotein(RNP) 복합체 방법이 있다. Cas 단백질과 sgRNA를 코딩하는 DNA 절편을 포함하는 CRISPR/Cas9 plasmid 유전체 편집 방법에서 유전체 편집 도구를 코딩하는 CRISPR/Cas9 plasmid는 핵 의존성으로 핵에 있는 도구를 사용하여 전사를 하여 CRISPR/Cas9 plasmid는 핵까지 이동해야 한다. 그런데, 세포막을 통해 도입된 CRISPR/Cas9 plasmid의 1% 미만이 핵으로 이동하는 단점이 있어,
<도 5>에서처럼, 본 발명의 유전체 편집 RNA/DNA 시스템은 세포질에서 전사 도구를 구성하여 사용함으로써 이런 문제를 극복하고자한다.
본 발명은 본 발명에 따른 DdRp RNA 발현 카세트 및 DNAge 발현 카세트, 또는 이들 모두를 코딩하는 핵산 서열을 포함하는 DNA를 제공한다.
여기서, 상기 DdRp RNA 발현 카세트는 RNA 가닥에 존재하며, DNAge 발현 카세트는 서로 다른 DNA 가닥에 존재하면서, 상기 DNAge 발현 카세트는 DdRp에 의한 트랜스(trans action)로 전사될 수 있다.
바람직하게, 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 DNAen 및 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA를 코딩하는 DNAsg포함하는 군에서 선택되어진 1종 이상이다.
여기서, 상기 DNAge 발현 카세트에 상기 선택된 유전체의 특정 표적화 염기서열에 관련된 DNA와 함께, 추가적으로 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA를 세포내로 주입될 수도 있거나, 또는 대신에 외부에서 인공적으로 합성된 선택된 유전체의 특정 표적화 염기서열에 관련된 DNA를 세포내로 주입될 수도 있다.
본 발명은 본 발명에 따른 DdRp RNA 발현 카세트, 그리고 DNAge 발현 카세트를 포함하는 유전체 편집 RNA/DNA 시스템에 추가적으로 상기 DdRp에 의해 전사되는 DdRp를 코딩하는 DNA 절편이 포함된 auto-DdRp 발현 카세트를 제공할 수 있다. auto-DdRp 발현 카세트는 DdRp RNA 발현 카세트로부터 합성된 DdRp에 의해 상기 DdRp가 결합하는 프로모터 하류에 있는 DdRp DNA 절편이 반복적인 자가전사를 하는 DdRp 발현 루프(loop)를 실행할 수 있다.
본 발명은 본 발명에 따른 DdRp RNA 발현 카세트, auto-DdRp 발현 카세트 및 DNAge 발현 카세트, 또는 이들 모두를 코딩하는 핵산 서열을 포함하는 DNA를 제공한다.
또한 auto-DdRp 발현 카세트에 포함되는 DdRp는 그 자체이거나 5*?**?*Cap 구조 형성을 촉매하는 기능을 보유한 DdRp 키메라효소일 수도 있다.
하기에서 DdRp RNA 발현 카세트 및 DNAge 발현 카세트는 각각 별도 제작하여 공동 형질주입할 수 있으며, 이 때는 이를 auto_(DdRp+DNAge) 발현 카세트로 대신할 수도 있다.
본 발명은 이하 단계를 포함하는 세포에서 자가전사 RNA/DNA 시스템에 의한 유전체 편집을 위한 방법을 제공한다.
(a) DdRp RNA 발현 카세트를 수득하는 단계,
(b) DdRp에 의해 트랜스로 전사될 수 있는 DNAge 발현 카세트를 수득하는 단계, 및
(c) DdRp RNA 발현 카세트 및 DNAge 발현 카세트를 세포 내에 함께 접종하는 단계를 포함하고,
여기서 DdRp RNA 발현 카세트는 DdRp의 번역을 유도하기 위한 5'캡을 포함하고, 추가적으로 auto_DdRp 발현 카세트를 수득하는 단계를 실시하고 및 단계 (c)에서 함께 접종할 수 있다.
상기 방법에서, DdRp RNA 발현 카세트 및/또는 DNAge 발현 카세트는 본 발명의 자가전사 RNA/DNA 시스템에 대해 상기 정의된 바와 같다.
본 발명은 본 발명의 자가전사 RNA/DNA 시스템을 포함하는 세포를 제공한다. 세포는 본 발명에 따른 방법에 따라 접종된다. 세포는 본 발명의 방법에 의해 수득 가능하다. 세포는 유기체의 일부일 수도 있다.
본 발명은 이하 단계를 포함하는 대상체에서 자가전사 RNA/DNA 시스템에 의한 유전체 편집을 위한 방법을 제공한다.
(a) DdRp RNA 발현 카세트를 수득하는 단계,
(b) DdRp에 의해 트랜스로 전사될 수 있는 DNAge 발현 카세트를 수득하는 단계, 및
(c) DdRp RNA 발현 카세트 및 DNAge 발현 카세트로 구성된 유전체 편집 RNA/DNA 시스템을 대상체에게 투여하는 단계를 포함하고,
여기서 DdRp RNA 발현 카세트는 DdRp의 번역을 유도하기 위한 5'캡을 포함하고, 추가적으로 auto_DdRp 발현 카세트를 수득하는 단계를 실시하고 및 단계 (c)에서 함께 접종할 수 있다.
상기 방법에서, DdRp RNA 발현 카세트 및/또는 DNAge 발현 카세트는 본 발명의 유전체 편집 RNA/DNA 시스템에 대해 상기 정의된 바와 같다.
Ⅰ. DdRp RNA 발현 카세트
본 발명의 자가전사 RNA/DNA 시스템은 DNA dependent RNA Polymerase(DdRp) mRNA를 포함하는 RNA 발현 카세트; 및
상기 DdRp에 의해 전사되는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하는 DNAge 발현 카세트;를 포함하고, 이들이 작동 가능하게 연결되어 구성된 것이다.
상기 DdRp RNA 발현 카세트는
(1) 5' UTR,
(2) DdRp를 코딩하는 오픈 리딩 프레임, 및
(3) 3'UTR을 포함한다.
상기 DdRp에 핵국지화신호(Nuclear localization signals, NLS)가 위치할 수도 있다. NLS가 없는 DdRp는 대부분 세포질에 남아있는 반면, NLS를 포함하는 단백질은 핵에 국한하여 분포한다. NLS가 없는 DdRp는 세포질 또는 NLS를 포함하는 하이브리드 DdRp는 핵에서 효소적으로 활성화되어 염색체 또는 플라스미드 DNA에 배치된 T7 프로모터에서 선택적으로 전사를 시작하고 특정 T7 종결서열에서 중지할 수 있다.
세포 번역이 가능한 구조
DdRp를 발현시키기 위한 DdRp RNA 발현 카세트는 5'캡을 포함한다.
용어 "5'cap", "캡", "캡된" 및 ""5'cap 구조"는 일부 진핵세포의 1차 전사체, 예컨대 전구체 메신저 RNA의 5' 말단에서 발견되는 디뉴클레오타이드를 지칭하는 것으로 동의어로 사용된다. 5'cap은 5' 트리포스페이트 결합(또는 특정 캡 유사체의 경우 화학적 변형된 트리포스페이트 결합)에서 5'을 통해 mRNA 분자의 첫 번째 뉴클레오타이드에 (임의로 화학적 변형된) 구아노신이 결합된 구조이다. 용어는 종래의 cap 또는 cap 유사체를 지칭할 수 있다.
예를 들어, RNA를 5'캡과 함께 제공하는 것은 상기 5'캡의 존재 하에 DNA 주형의 시험관내 전사에 의해 달성될 수 있으며, 여기서 상기 5'캡은 생성된 RNA 가닥에 공동-전사적으로 혼입되거나, RNA는 예를 들어 시험관내 전사에 의해 생성될 수 있으며, 5'cap은 캡핑효소, 예를 들어 종두증 바이러스의 캡핑효소를 사용하여 전사 후 RNA에 부착될 수 있다. 캡핑된 RNA에서, (캡핑된) RNA 분자의 제1 염기의 3' 위치는 인산디에스터 결합을 통해 RNA 분자의 후속 염기("제2 염기")의 5' 위치에서 연결된다.
"종래의 5'캡"이란 용어는 자연성 발생적인 5'캡을 의미하고, 바람직하게는 7-메틸구아노신 캡을 의미한다. 7-메틸구아노신 캡에서, 캡의 구아노신은 화학적 변형된 구아노신이며, 여기서 변형은 7-위치에서의 메틸화로 이루어진다.
DdRp의 번역이 DdRp mRNA 상의 5'캡에 의해 유도된다. DdRp mRNA 상의 5'캡이 DdRp의 발현뿐만 아니라 시스템 전체의 성능에 매우 긍정적인 영향을 미친다. 트랜스로 코딩된 목적 RNA의 효율적인 생산을 달성할 수 있다.
본 발명의 DdRp mRNA는 내부 리보솜 진입 부위 (IRES) 요소를 포함하지 않는다. 일반적으로, 내부 리보솜 진입 부위, 약칭 IRES는 DdRp mRNA 서열의 5' 말단과 다른 위치, 예컨대 DdRp mRNA 서열의 중앙에서의 위치로부터의 메신저 RNA (mRNA)로부터의 번역 개시를 가능하게 하는 뉴클레오타이드 서열로 mRNA 서열의 중간에 위치한다.
본 발명에서 5'캡으로 IRES의 치환은 DdRp mRNA 분자에 의해 코딩되는 폴리펩티드의 서열에 영향을 미치지 않는 RNA 분자의 특정 변형이다(비-폴리펩티드-서열 개질성 변형). 예를 들어, 진핵세포 메신저 RNA의 경우, 비-폴리펩티드-서열 개질성 변형은 특정 비번역된 영역의 선택, 인트론의 도입, 예를 들어 토끼 베타-글로빈 인트론 II 서열), 또는 코딩 서열의 침묵 변형, 예를 들어 코딩된 폴리펩티드 서열의 변형없이(침묵 변형) 대상세포 또는 대상 유기체에서 우선 코돈 사용법에 적응하는 것에 의한 것을 포함한다.
본 발명에 따른 에 의해 코딩되는 표적 단백질의 생산은 캡이 DdRp mRNA 상에 존재할 때 효율적이다.
진핵세포 mRNA에서 5'캡의 존재는 그 중에서도 특히 mRNA의 핵내 방출 조절과 가공, 특히 5′ 근위부 인트론 절제의 촉진에서 중요한 역할을 하는 것으로 여겨진다. 본 발명의 DdRp mRNA는 전형적으로 핵으로부터 배출되거나 가공될 필요가 없다. 그럼에도 불구하고, DdRp mRNA 상에 5'캡이 존재하는 것이 유리하다.
진핵세포 mRNA의 경우, 5'캡은 또한 일반적으로 mRNA의 효율적인 번역에 관여한다고 일반적으로 기술되어 있다: 일반적으로 진핵세포에서 번역은 IRES가 없는 한 메신저 RNA (mRNA) 분자의 5' 말단에서만 개시된다.
진핵세포는 핵 내 전사 중에 5'캡을 갖는 RNA를 제공할 수 있다. 새로 합성된 mRNA는 통상적으로 전사체가 20 내지 30개의 뉴클레오타이드의 길이에 도달할 때 5'캡 구조로 변형된다. 먼저, 5'말단 뉴클레오타이드 pppN(ppp는 트리포스페이트를 나타내고, N은 임의의 뉴클레오사이드를 나타냄)은 RNA 5'트리포스파타아제및 구아닐릴 전이효소 활성을 갖는 캡핑효소에 의해 세포에서 5' GpppN으로 전환된다. 이어서, GpppN은 (구아닌-7)-메틸 전이효소 활성을 갖는 제2 효소에 의해 세포에서 메틸화되어 모노-메틸화된 m7GpppN 캡을 형성할 수 있다.
본 발명에서 사용된 5'캡은 자연성 5'캡이다.
본 발명에서, 자연성 5'캡 디뉴클레오타이드는 전형적으로 비-메틸화 캡 디뉴클레오타이드 (G(5')ppp(5')N; GpppN이라고도 함) 및 메틸화된 캡 디뉴클레오타이드 ((m7G(5')ppp(5')N; m7GpppN이라고도 함)로 이루어진 군으로부터 선택된다.
본 발명의 DdRp mRNA는 대상세포의 캡핑 장치에 의존하지 않는다. 대상세포 내로 형질주입되는 경우, 본 발명의 DdRp mRNA는 전형적으로 세포 핵, 즉 전형적인 진핵세포에서 캡핑이 일어나는 부위에 국한되지 않는 것으로 여겨진다.
종래 기술 에서 IRES와 유사하게, DdRp mRNA 상의 5'캡은 DdRp의 번역 개시를 유발하는데 유용하다. 진핵세포 번역 개시 인자 elF4E는 캡핑된 mRNA를 리보솜과 결합시키는 데 관여하는 것으로 생각될 수 있다. 5'캡의 존재가 성능을 상당히 증가시킨다. 따라서, 본 발명의 DdRp mRNA는 5'캡을 포함한다.
5'캡의 존재는 또한 본 발명의 트랜스-복제시스템에서 예기치 않은 상승적인 효과를 제공한다. 캡핑된 DdRp mRNA가 RNA에 대해 트랜스로 제공될 때 캡핑된 DdRp mRNA가 목적 단백질의 생산을 유발하는 것이 보다 효율적이다. 따라서, 트랜스로 5'캡 및 복제의 상승 효과, 즉 시스로 복제하는 것보다 우수한 효과가 있다.
본 발명의 캡핑된 RNA는 시험관내에서 제조될 수 있으므로 대상세포의 캡핑 장치에 의존하지 않는다. 시험관내에서 캡핑된 RNA를 형성하는데 가장 빈번하게 사용되는 방법은 모든 4개의 리보뉴클레오사이드 트리포스페이트 및 캡 디뉴클레오타이드 예컨대 m7G(5')ppp(5')G (m7GpppG라고도 함)의 존재 하에 박테리아 또는 박테리오파지 RNA 중합효소로 DNA 주형을 전사하는 것이다.
RNA 중합효소는 다음 주형 뉴클레오사이드 트리포스페이트 (pppN)의 α-포스페이트에서 m7GpppG의 구아노신 부분의 3'OH에 의한 친핵성 공격으로 전사를 개시하여 중간체 m7GpppGpN (여기서 N은 RNA 분자의 제2염기이다)를 형성한다. 경쟁하는 GTP-개시된 생성물 pppGpN의 형성은 시험관내 전사 동안 캡 대 GTP의 몰비가 5 내지 10으로 설정함으로써 억제된다.
5'캡은 5'캡 유사체이다. 이들 실시형태는 RNA가 시험관내 전사에 의해 수득되는 경우, 예를 들어 시험관내 전사된 RNA (IVT-RNA)인 경우에 특히 적합하다. 캡 유사체는 초기에 시험관내 전사에 의해 RNA 전사체의 대규모 합성을 용이하게 하기 위해 기술하였다.
이전에 기재된 조작된 복제시스템과 대조적으로, 본 발명의 DdRp mRNA는 바람직하게는 캡 유사체를 포함한다. 따라서, 본 발명의 시스템의 DdRp의 번역은 바람직하게는 캡 유사체에 의해 유도된다.
이상적으로, 보다 높은 번역 효율 및/또는 생체내 분해에 대한 증가된 내성 및/또는 시험관내 분해에 대한 증가된 내성과 관련된 캡 유사체가 선택된다. 따라서, 본 발명은 임의의 변형을 함유하지 않고 천연 캡 [(m7G(5')ppp(5')G; m7GpppG라고도하며, 시판된 ScriptCap m7G 캡핑 시스템 (Epicentre Biotechnologies사에 의해 첨가할 수 있음)]을 포함하는 발현을 제시하고 있다.
UTR
"Untranslated Region(비번역 영역)" 또는 "UTR"은 전사되지만 아미노산 서열로 번역되지 않는 영역에 관한 것이거나 또는 mRNA 분자와 같은 RNA 분자 내의 상응하는 영역에 관한 것이다.
본 발명의 DdRp RNA 발현 카세트에서, 용어 "3'UTR"은 DdRp에 대한 DdRp 코딩영역의 3'에 위치하는 영역에 관한 것이고, 용어 "5'UTR" 이는 DdRp 코딩영역의 5'에 위치하는 영역에 관한 것이다.
3'UTR은 존재하는 경우 단백질 코딩 영역의 종결 코돈의 하류에 유전자의 3'말단에 위치하지만, 용어 "3'UTR"은 바람직하게는 폴리(A) 꼬리를 포함하지 않는다. 따라서, 3'UTR은 폴리(A) 꼬리의 상류, 예를 들어 폴리(A) 꼬리에 직접 인접하여 있다(존재한다면).
5'UTR은 존재하는 경우 단백질 코딩 영역의 시작코돈의 상류에 유전자의 5' 말단에 위치한다. 5'UTR은 5'캡의 하류, 예를 들어 5'캡 바로 옆에 있다(존재한다면).
5' 및/또는 3'UTR은 오픈 리딩 프레임과 기능적으로 연결될 수 있어서, 이들 영역이 오픈 리딩 프레임과 관련되어 안정성 및/또는 상기 오픈 리딩 프레임을 포함하는 RNA의 번역 효율이 증가된다.
UTR은 RNA 기반 게놈 편집 도구의 운반을 이용한 효과적인 게놈 편집의 전제조건인 RNA의 안정성 및 번역 효율에 관여한다. 특정 5' 및/또는 3' 비번역 영역(UTR)을 선택함으로써, 5'캡 및/또는 3' 폴리(A)-꼬리에 관한 구조적 변형 이외에, 둘 모두 개선될 수 있다.
UTR 내의 서열 요소는 일반적으로 번역 효율 (주로 5'UTR) 및 RNA 안정성 (주로 3'UTR)에 영향을 미치는 것으로 이해된다. 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR이 존재하는 것이 바람직하다. 독립적으로 또는 부가적으로, 핵산 서열의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 3'UTR이 존재하는 것이 바람직하다.
바람직하게는, DdRp mRNA는 DdRp가 유래된 에 대해 이종 또는 고유하지 않은 5'UTR 및/또는 3'UTR을 포함한다. 이것은 원하는 번역 효율 및 RNA 안정성에 따라 비번역 영역을 설계할 수 있게 한다.
본 발명의 3'UTR은 엑소리보뉴클레아제의 장벽으로 작용하거나 RNA 안정성을 증가시키는 것으로 알려진 단백질(예컨대 RNA-결합 단백질)과 상호작용하는 스템-루프 구조를 제공하기 위해 폴딩할 수 있는 하나 이상의 역반복을 포함할 수 있다.
인간 베타-글로빈 3'UTR, 특히 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본은 높은 전사 안정성 및 번역 효율에 기여한다.
따라서, 본 발명의 DdRp mRNA는 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본을 포함한다. 따라서, 그것은 5'→3' 방향으로 (a) 선택적으로 5'UTR; (b) DdRp를 코딩하는 오픈 리딩 프레임; (c) 3'UTR; 인간 베타-글로빈 3'UTR의 2개의 연속적인 동일한 사본, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편을 포함하는 상기 3'UTR을 포함한다.
본 발명의 DdRp mRNA는 의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화하지만 인간 베타-글로빈 3'UTR, 이의 단편, 또는 인간 베타-글로빈 3'UTR의 변이체 또는 이의 단편이 아닌, 3'UTR을 포함한다.
본 발명의 DdRp mRNA는 의 번역 효율 및/또는 안정성을 증가시키기 위해 활성화한 5'UTR을 포함한다.
본 발명에 따른 UTR-함유 RNA는 예를 들어, 시험관내 전사에 의해 제조될 수 있다. 이들은 5'UTR 및/또는 3'UTR을 갖는 RNA의 전사를 허용하는 방식으로 본 발명의 핵산 분자(예컨대 DNA)의 발현을 유전적으로 변형시킴으로써 달성될 수 있다.
3'UTR은 일반적으로 mRNA의 단백질 코딩 영역(즉, 오픈 리딩 프레임) 및 폴리(A) 서열 사이에 위치한 mRNA의 일부이다. mRNA의 3'UTR은 아미노산 서열내로 번역되지 않는다. 3'UTR은 일반적으로 유전자 발현 과정 중 각각의 mRNA 내로 전사되는 유전자에 의해 코딩된다. 게놈 서열은 먼저 선택적인 인트론을 포함하는 미성숙 mRNA로 전사된다. 그 이후, 미성숙 mRNA는 성숙 과정을 거쳐 성숙 mRNA로 되도록 추가로 처리된다. 이러한 성숙 과정은 5'캡핑(capping), 추가적인 인트로을 절단하기 위한 미성숙 mRNA 스플라이싱(splicing) 및 미성숙 mRNA 3'말단의 아데닐산중합반응 및 추가적인 엔도-(endo-) 또는 엑소(exo)뉴클레아제절단 등과 같은 3'말단의 변형을 포함한다. 본 발명에서, 3'UTR은 단백질 코딩 영역의 정지 코돈의 3'에, 바람직하게는 단백질 코딩 영역의 정지 코돈의 3' 바로 옆에 위치한 성숙 mRNA의 서열에 상응하며, 폴리(A) 서열의 5'측면, 바람직하게는 폴리(A) 서열의 5' 바로 옆 뉴클레오타이드까지 이어진다. 본 발명에서, 용어 "유전자의 3'UTR", 예컨대 "알파 또는 베타 글로빈의 3'UTR"은 이러한 유전자로부터 유래된 성숙 mRNA의 3'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수득된 mRNA에 상응하는 서열이다. 용어 "유전자의 3'UTR"은 3'UTR의 DNA 서열 및 RNA 서열을 포함한다.
5'UTR은 일반적으로 전령 RNA(mRNA)의 특정 부분(section)으로 이해된다. 이는 mRNA의 오픈 리딩 프레임의 5'에 위치한다. 일반적으로, 5'UTR은 전사 시작부(transcriptional start site)와 함께 시작하고 오픈 리딩 프레임의 시작 코돈의 하나의 뉴클레오타이드 전에 종료된다. 5'UTR은 조절 요소라고도 불리우는 유전자 발현을 조절하기 위한 요소를 포함할 수 있다. 이와 같은 조절 요소는 리보솜 결합부 또는 5'말단 올리고피리미딘관(Oligopyrimidine Tract)일 수 있다.
5'UTR은 5'캡(cap)의 첨가에 의해 전사 후 변형될 수 있다. 본 발명에서, 5'UTR은 5'캡(cap) 및 시작 코돈 사이에 위치한 성숙 mRNA의 서열에 상응한다. 5'UTR은 5'캡(cap)의 3'에 위치한 뉴클레오타이드로부터, 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드로부터, 단백질 코딩 영역의 시작 코돈의 5'에 위치한 뉴클레오타이드까지, 단백질 코딩 영역의 시작 코돈의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 서열에 상응한다. 성숙 mRNA의 5'캡(cap)의 3' 바로 옆에 위치한 뉴클레오타이드는 일반적으로 전사 시작부에 상응한다. 5'UTR 서열이 5'UTR 서열을 정의하기 위해 사용되는 mRNA 서열과 같은 RNA 서열 또는 이와 같은 RNA 서열에 상응하는 DNA 서열일 수 있다. 본 발명에서, 유전자의 5'UTR은 이러한 유전자로부터 유래된 성숙 mRNA의 5'UTR에 상응하는 서열, 즉, 유전자의 전사 및 미성숙 mRNA의 성숙에 의해 수득된 mRNA에 상응하는 서열이다. 유전자의 5'UTR은 5'UTR의 DNA 서열 및 RNA 서열을 포함한다.
5'말단 올리고피리미딘관(Oligopyrimidine Tract, TOP)은 일반적으로 핵산 분자의 5'말단 영역, 예컨대 특정 mRNA 분자의 5'말단 영역 또는 특정 유전자의 기능성 독립체 예를 들어, 전사영역의 5'말단 영역에 위치한 피리미딘 뉴클레오타이드의 스트레치(stretch)이다. 서열은 보통 전사 시작부에 상응하는 사이티딘과 함께 시작하고, 보통 약 3 내지 30개의 피리미딘 뉴클레오타이드의 스트레치가 이어진다. 피리미딘 스트레치 그리하여 5' TOP는 TOP의 다운스트림에 위치한 제1 퓨린 뉴클레오타이드의 5'의 하나의 뉴클레오타이드로 종료된다. 5'말단 올리고피리미딘관을 함유하는 전령 RNA는 종종 TOP mRNA로서 언급된다. 따라서, 이와 같은 전령 RNA를 제공하는 유전자는 TOP 유전자로서 언급된다. TOP 서열은 예를 들어, 유전자 및 펩타이드 신장 인자를 코딩하는 mRNA 및 리보솜 단백질에서 발견된다.
본 발명에서, TOP 모티프(motif)는 상기 정의된 바와 같은 5'TOP에 상응하는 핵산서열이다. 따라서, 본 발명에서, TOP 모티프는 바람직하게 3 내지 30개 뉴클레오타이드 길이를 갖는 피리미딘 뉴클레오타이드 스트레치이다. TOP-모티프는 적어도 3개 피리미딘 뉴클레오타이드, 적어도 4개 피리미딘 뉴클레오타이드, 적어도 5개 피리미딘 뉴클레오타이드, 적어도 6개 뉴클레오타이드, 적어도 7개 뉴클레오타이드, 적어도 8개 피리미딘 뉴클레오타이드로 이루어지고, 여기서 피리미딘 뉴클레오타이드의 스트레치는 사이토신 뉴클레오타이드와 함께 이의 5'말단에서 시작한다.
TOP 유전자 및 TOP mRNA에서, TOP-모티프는 바람직하게 전사 시작부와 함께 이의 5'말단에서 시작하고 상기 유전자 또는 mRNA에 제1 퓨린 잔기의 5'의 하나의 뉴클레오타이드로 종료된다. 본 발명의 의미에서 TOP 모티프는 5'UTR을 나타내는 서열의 5'말단에 위치하거나 5'UTR을 코딩하는 서열의 5'말단에 위치한다. 따라서, 만약 이러한 스트레치가 각각의 서열의 5'말단, 예컨대 본 발명에 따른 SM_mRNAi, 본 발명에 따른 SM_mRNAi의 5'UTR 요소, 또는 본원에 설명된 바와 같은 TOP 유전자의 5'UTR로부터 유래된 핵산 서열에 위치한다면 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 "TOP 모티프"이라 한다. 다시 말해서, 5'UTR 또는 5'UTR 요소의 5'말단에 위치하지 않고, 5'UTR 또는 5'UTR 요소 내 어디든 위치한 3개 이상의 피리미딘 뉴클레오타이드의 스트레치는 "TOP 모티프"로서 언급되지 않는다.
TOP 유전자는 일반적으로 5' 말단 올리고피리미딘관의 존재를 특징으로 한다. 더욱이, 대부분의 TOP 유전자는 성장-연관 번역 조절을 특징으로 한다. 그러나, 조직 특이적 번역 조절을 갖는 TOP 유전자도 알려져 있다. 상기 정의된 바와 같이, TOP 유전자의 5'UTR은 TOP 유전자로부터 유래된 성숙 mRNA의 5'UTR의 서열에 상응하며, 바람직하게 5'캡(CAP)의 3'에 위치한 뉴클레오타이드로부터 시작 코돈의 5'에 위치한 뉴클레오타이드까지 이어진다. TOP 유전자의 5'UTR은 일반적으로 임의의 시작 코돈, 업스트림(upstream) AUGs(uAUGs) 또는 업스트림 오픈 리딩 프레임(uORFs)을 포함하지 않는다. 거기에서, 업스트림 AUGs 및 업스트림오픈 리딩 프레임은 일반적으로 번역되어야 할 오픈 리딩 프레임의 시작 코돈(AUG)의 5'에 나타나는 AUGs 및 오픈 리딩 프레임으로 이해된다.
TOP 유전자의 5'UTR은 일반적으로 상대적으로 짧다. TOP 유전자의 5'UTR 길이는 20개 뉴클레오타이드 내지 500개 뉴클레오타이드까지 달라질 수 있으며, 일반적으로 약 200개 뉴클레오타이드 미만이고, 약 150개 뉴클레오타이드 미만이며, 약 100개 뉴클레오타이드 미만이다. 본 발명의 의미에서, TOP 유전자의 5'UTR 예시는 위치 5의 뉴클레오타이드로부터 시작 코돈(예를 들어, ATG)의 5' 바로 옆에 위치한 뉴클레오타이드까지 이어지는 핵산 서열이다. 특히 TOP 유전자의 5'UTR의 절편은 5'TOP 모티프가 결여된 TOP 유전자의 5'UTR이다. 'TOP 유전자의 5'UTR'은 자연적으로 발생하는 TOP 유전자의 5'UTR을 나타낸다.
폴리(A) 서열
본 발명의 DdRp RNA 발현 카세트는 3' 폴리(A) 서열을 포함할 수 있다.
폴리(A) 서열은 본질적으로 적어도 20개, 적어도 26, 적어도 40개, 적어도 80개, 적어도 100개이고, 500개 이하, 400개 이하, 바람직하게는 300개 이하, 200개 이하, 특히 150개 이하의 A 뉴클레오타이드이고, 특히 약 120개의 A 뉴클레오타이드로 구성되거나 포함한다.
폴리(A) 서열에서 뉴클레오타이드 수에 따라 전형적으로 적어도 50%, 적어도 75%의 폴리(A) 서열에서의 대부분의 뉴클레오타이드가 A 뉴클레오타이드이지만, 나머지 뉴클레오타이드는 A 뉴클레오타이드 이외의 뉴클레오타이드, 예컨대 U 뉴클레오타이드 (유리딜레이트), G 뉴클레오타이드 (구아닐레이트), C 뉴클레오타이드 (시티딜레이트)인 것을 허용한다. 폴리(A) 서열에서의 모든 뉴클레오타이드, 즉 폴리(A) 서열에서의 뉴클레오타이드의 수에 따라 100%가 A 뉴클레오타이드인 것을 의미한다. 용어 "A 뉴클레오타이드" 또는 "A"는 아데닐레이트를 지칭한다.
본 발명의 유전체 편집 도구 DNA 발현 카세트, 및 auto_DdRp DNA 발현 카세트는 폴리(A) 서열을 코딩하는 DNA 서열(코딩 가닥)를 포함할 수 있다.
본 발명은 코딩 가닥에 상보적인 가닥에서 반복된 dT 뉴클레오타이드 (데옥시티미딜레이트)를 포함하는 DNA 주형에 기반하여, RNA 전사 동안, 즉 시험관내 전사된 RNA의 제조 중에 부착되는 3' 폴리(A) 서열을 제공한다. 폴리(A) 서열을 코딩하는 DNA 서열(코딩 가닥)은 폴리(A) 카세트로 지칭된다.
DNA의 코딩 가닥에 존재하는 3' 폴리(A) 카세트는 본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 내지 50개, 바람직하게는 10 내지 30개, 보다 바람직하게는 10 내지 20개일 수 있다.
본질적으로 dA 뉴클레오타이드로 이루어지지만, 4개의 뉴클레오타이드(dA, dC, dG, dT)의 균등한 분포를 갖고 길이가 예를 들어 예를 들어 5 내지 50개의 뉴클레오타이드인 무작위 서열에 의해 중단되는 폴리(A) 카세트는 DNA 수준에서 E.coli에서의 plasmid DNA의 일정한 증식을 나타내며, RNA 수준에서 RNA 안정성 및 번역 효율을 지지하는 것과 관련하여 유익한 특성과 여전히 연관되어 있다.
결과적으로, 본원에 기술된 RNA 분자에 함유된 3' 폴리(A) 서열은 본질적으로 A 뉴클레오타이드로 구성되지만, 4개의 뉴클레오타이드(A, C, G, U)가 균등한 분포를 갖는 무작위 서열에 의해 중단된다. 이러한 무작위 서열은 길이가 5 내지 50개, 바람직하게는 10 내지 30개, 보다 바람직하게는 10 내지 20개일 수 있다.
아데닐산중합반응(polyadenylation)은 일반적으로 RNA 분자, 예를 들어, 미성숙 mRNA와 같은 핵산 분자에 폴리(A) 서열이 첨가되는 것으로 이해된다. 아데닐산중합반응은 소위 아데닐산중합반응 신호에 의해 유도될 수 있다. 이 신호는 아데닐산중합반응될, RNA 분자와 같은 핵산 분자의 3'말단의 뉴클레오타이드의 스트레치(stretch) 내에 위치한다. 아데닐산중합반응 신호는 일반적으로 아데닌 및 우라실/티민 뉴클레오타이드로 이루어진 헥사머(hexamer), 바람직하게는 헥사머 서열 AAUAAA 를 포함한다. 다른 서열, 헥사머 서열도 가능하다. 아데닐산중합반응은 일반적으로 프리-mRNA(미성숙-mRNA로도 불리우는)의 가공 중에 발생한다. 일반적으로, RNA 성숙(프리-mRNA로부터 성숙 mRNA 까지)은 아데닐산중합반응의 단계를 포함한다.
코돈 사용법
일반적으로 유전 암호의 축퇴는 동일한 코딩 능력을 유지하면서 다른 코돈 (염기 삼중항)에 의해 RNA 서열에 존재하는 특정 코돈(아미노산을 코딩하는 염기 삼중항)을 대체할 수 있게 한다(코돈을 대체하는 것은 대체된 코돈과 동일한 아미노산을 코딩한다).
본 발명에서, RNA 분자에 포함된 오픈 리딩 프레임의 적어도 하나의 코돈은 오픈 리딩 프레임이 유래한 종에서 각각의 오픈 리딩 프레임의 각각의 코돈과 상이하다. 오픈 리딩 프레임의 코딩 서열은 "개조된" 것으로 언급된다.
예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, 빈번하게 사용되는 코돈이 선택될 수 있다. 더욱 빈번하게 사용되는 희귀 코돈의 치환을 포함하여, 핵산 분자의 코딩 서열의 변형을 한다.
코돈 사용의 빈도는 대상세포 또는 대상 유기체에 따라 다르기 때문에, 그러한 유형의 변형은 특정 대상세포 또는 대상 유기체에서의 발현에 핵산 서열을 맞추는 것이 적합하다. 일반적으로 말하면, 보다 빈번하게 사용되는 코돈은 전형적으로 대상세포 또는 대상 유기체에서 보다 효율적으로 번역되지만, 오픈 리딩 프레임의 모든 코돈의 변형이 항상 필요한 것은 아니다.
예를 들어, 오픈 리딩 프레임의 코딩 서열이 변형되는 경우, G (구아닐레이트) 잔기 및 C (시티딜레이트) 잔기의 함량은 각 아미노산에 대해 가장 풍부한 GC-함량을 갖는 코돈을 선택함으로써 변형될 수 있다. GC가 풍부한 오픈 리딩 프레임을 가진 RNA 분자는 면역 활성을 감소시키고 RNA의 번역 및 반감기를 향상시킬 가능성이 있다고 보고되어 있다.
본 발명에 따른 DdRp를 코딩하는 오픈 리딩 프레임은 각각 개조될 수 있다.
II. DNA 발현카세트
본 발명의 유전체 편집 RNA/DNA 시스템은 DdRp RNA 발현 카세트에 더하여, 각각 바람직하게는 적어도 하나의 유전체 편집 도구를 코딩하는 DNAge 발현 카세트를 포함한다.
본 발명의 유전체 편집 시스템은 폴리뉴클레오타이드의 단편, 플라스미드, 렌티 바이러스, 아데노 관련 바이러스 및 리보 핵 단백질 (RNP) 복합체를 포함한 다양한 형태 또는 이들의 조합으로 세포에 전달될 수 있다.
대표적인 유전체 편집 CRISPR/Cas9 시스템은CRISPR/Cas9 리보 핵 단백질 (RNP) 시스템으로 Cas9 단백질과 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex로 구성된다.
본 발명의 유전체 편집 RNA/DNA 시스템을 구성하는 상기 DdRp에 의해 전사될 수 있는 DNAge 발현 카세트는 표적화 엔도뉴클레아제(Cas9 단백질)를 코딩하는 DNAen 발현 카세트 및 선택된 유전체의 특정 표적화 염기서열에 관련된 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex를 코딩하는 DNAsg 발현 카세트를 포함할 수 있다.
상기 표적화 엔도뉴클레아제는 아연 핑거 뉴클레아제(ZFN), 전사 활성화제-유사 이펙터 뉴클레아제(TALEN), CRISPR-연합된 Cas 뉴클레아제, 알고너트 엔도뉴클레아제및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질을 포함하는 엔도뉴클레아제를 포함하는 군에서 선택되어지는 1종이다.
본 발명의 DNAen 발현 카세트는
(1) DdRp가 결합하는 프로모터;
(2) 5*?**?*UTR;
(3) DNAen를 코딩하는 DNA 절편; 및
(4) 3'UTR을 포함할 수 있다.
단일 가이드 RNA(sgRNA) 또는 CRISPR RNA(crRNA):trans-activating crRNA(tracrRNA) duplex의 구성은 다음과 같다.
crRNA는 유전체 표적에 대해 상보적으로 설계된 20개의 nt RNA 올리고 뉴클레오티드이다. crRNA 시퀀스 디자인은 표준 gRNA 디자인 원칙을 활용하며 gRNA 데이터베이스에서 쉽게 선택하거나 gRNA 디자인 도구를 사용하여 사용자 정의할 수 있다. tracrRNA는 crRNA 및 Cas9 뉴클레아제와 함께 활성화된 CRISPR/Cas9 RNP 복합체를 형성하는 67nt RNA 올리고뉴클레오타이드이다.
sgRNA는 표적 게놈 서열을 식별할 수 있는 crRNA 서열과 Cas9 단백질과 복합체를 형성할 수 있는 tracrRNA 서열을 모두 포함하는 단일 RNA 올리고이다. sgRNA 또는 crRNA:tracrRNA 듀플렉스가 Cas9 단백질과 복합체를 형성 할 때, 이들은 함께 프로토스페이서 인접 모티프 (protospacer adjacent motif, PAM) 서열(5'NGG-3')로부터 3-4 bp 업스트림, 20 nt 가이드 RNA 서열에 상보적인 유전자좌에서 이중 가닥 파손을 생성할 수 있다.
본 발명의 DNAsg 발현 카세트는
(1) DdRp가 결합하는 프로모터(또는 RNA 폴리머라제Ⅲ(Pol Ⅲ) 프로모터) ;
(2) DNAsg를 코딩하는 DNA 절편; 및
(3) 3'UTR을 포함할 수 있다.
본 발명에서 DdRp RNA 발현 카세트에서 합성되는 DdRp는 각각의 DNAge 발현 카세트에 작용하여 유전체 편집 도구의 전사 및 생산을 유도할 수 있다. 예를 들어, 각각의 DNAge 발현 카세트는 유전체 편집에 사용하는 표적화 엔도뉴클레아제또는 가이드 핵산을 코딩할 수 있다. 이는 대상체에 대해 여러 다른 유전자 좌의 유전체 편집이 필요한 경우에 유리하다.
본 발명의 DNAge 발현 카세트의 유전체 편집 도구는 유전체 편집을 수행하는 표적화 엔도뉴클레아제를 포함할 수 있다(도 5). 특히, DNAge 발현 카세트가 표적화 엔도뉴클레아제를 사용하는 경우를 포함하여 이런 경우에는 유전체 편집 도구의 일부인 가이드 핵산은 외부로부터 전달 시스템을 통해 도입될 수 있다. 예외적으로 가이드 핵산은 RNA 또는 DNA일 수도 있다.
바람직하게, 상기 DNAge 발현 카세트를 구성하고 DdRp에 의해 전사될 수 있는 유전체 편집 도구는 유전체 편집에 사용하는 가이드 핵산을 포함할 수 있다(도 6). 예외적으로 이런 경우에는 유전체 편집 도구의 일부인 표적화 엔도뉴클레아제는 외부로부터 전달 시스템을 통해 도입될 수도 있다.
바람직하게, 상기 DNAge 발현 카세트를 구성하고 DdRp에 의해 전사될 수 있는 유전체 편집 도구는 유전체 편집에 사용하는 표적화 엔도뉴클레아제및 2종류의 가이드 핵산을 포함할 수 있다(도 7). 프라임 에이팅(prime editing)을 포함한 이런 경우에는 2 종류의 가이드 핵산은 하나 또는 두 개의 DNA에 있을 수도 있다.
본 발명의 증폭 유전체 편집 시스템은 기능적 요소에만 제한하는 것이 아니며 비제한적이다.
유전체 편집 도구를 코딩하는 DNAge 발현 카세트가 발현 제어 서열과 함께 존재한다. 유전체 편집 도구를 코딩하는 DNAge는 DdRp가 결합하는 프로모터의 제어 하에 있다. 유전체 편집 도구를 코딩하는 DNAge는 DdRp가 결합하는 프로모터의 하류에 위치한다. 유전체 편집 도구는 이종 핵산에 의해 코딩된다. DdRp가 결합하는 프로모터의 하류 위치는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하도록 한다.
본 발명의 DNAge 발현 카세트를 구성하는 표적화 엔도뉴클레아제을 코딩하는 DNA(DNAen)는 표적화 엔도뉴클레아제를 전사하는 단위로, 시작코돈 (염기 삼중항)을 포함하고, 전형적으로는 AUG (RNA 분자에서) 또는 (각각의 DNA 분자에서) ATG를 포함하는 오픈 리딩 프레임을 포함한다.
바람직하게는, 본 발명에 따른 DNAen 발현 카세트가 적어도 하나의 오픈 리딩 프레임 (단백질 코딩영역)을 포함하는 경우, 발현 카세트는 유전체 편집 도구 분자의 전사 단위이다.
본 발명에 따른 DNAen 발현 카세트는 단일 표적화 엔도뉴클레아제또는 다중 표적화 엔도뉴클레아제를 코딩할 수 있다. 다중 표적화 엔도뉴클레아제는 단일 표적화 엔도뉴클레아제(융합 표적화 엔도뉴클레아제) 또는 별도의 표적화 엔도뉴클레아제로서 코딩될 수 있다.
표적화 엔도뉴클레아제가 별도의 표적화 엔도뉴클레아제로 코딩되는 DNAen 발현 카세트, 이들 중 하나 이상에 상류 IRES 또는 추가적인 바이러스 프로모터 요소가 제공될 수 있다. 바람직하게, 본 발명에 따른 DNAen 발현 카세트는 둘 이상의 오픈 리딩 프레임을 포함할 수 있으며, 이들 각각은 DdRp가 결합하는 프로모터의 제어 하에 있을 수 있다.
따라서, 목적하는 폴리펩티드를 발현하도록 구성되는 DNAen 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 코딩 영역, 코딩 영역에 작동 가능하게 연결된 하나 이상의 적합한 프로모터, 해독 개시 서열, 개시 코돈, 정지 코돈, 폴리A 신호 서열, 리더 서열, NLS 등 중 하나 이상을 포함할 수 있다.
DNAen 발현 카세트는 핵 위치화 서열(nuclear localization sequence, NLS)을 코딩하는 서열을 포함한다. 임의의 적합한 NLS 서열이 사용될 수 있다. DNAen 발현 카세트는 표적화 엔도뉴클레아제또는 이의 기능성 단편을 발현하도록 구성된다.
바람직하게는, 유전체 편집 도구를 코딩하는 오픈 리딩 프레임은 DdRp를 유도하는 바이러스에 고유한 것이 아니다. DdRp가 결합하는 프로모터의 제어하에 있는 오픈 리딩 프레임은 임의의 바이러스 단백질을 코딩하지 않는다. DdRp가 결합하는 프로모터의 제어 하에 있는 오픈 리딩 프레임은 임의의 전장 바이러스 비구조성 단백질 또는 이의 단편을 코딩하지 않으며 및/또는 임의의 전장 바이러스 구조 단백질 또는 이의 단편을 코딩하지 않는다.
DdRp가 결합하는 프로모터는 DdRp의 존재 하에서 유전체 편집 도구를 코팅하는 DNAge 발현 카세트의 전사를 지시할 수 있다. 따라서, 유전자 편집 도구가 발현하기 위해서, DdRp RNA 발현 카세트는 DNAge 발현 카세트와 함께 존재하는 경우에, 이들 프로모터는 유전체 편집 도구를 코팅하는 DNA 발현 카세트의 전사를 지시한다.
DdRp가 결합하는 프로모터는 DdRp를 유도하는 바이러스에 고유한 것이다.
DNAge 발현 카세트는 이종 핵산을 포함한다.
본 발명의 DNAge 발현 카세트를 구성하는 DNAen는 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임을 포함한다. 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임은 DdRp를 유도하는 바이러스에 고유한 것이 아니다. 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임은 바이러스 구조 단백질을 코딩하지 않는다. 상기 표적화 엔도뉴클레아제는 코딩하는 유전자는 DdRp가 결합하는 프로모터의 제어하에 있다. 이것은 표적화 엔도뉴클레아제를 코딩하는 오픈 리딩 프레임의 발현이 DdRp가 결합하는 프로모터의 제어하에 있게 한다.
DNAen 발현 카세트의 전사체는 5'캡을 포함한다.
본 발명의 DNAen 발현 카세트는 5'UTR 및/또는 3'UTR이 존재할 수 있다. DNAen 발현 카세트의 3'UTR는 3' 폴리(A) 서열을 포함한다.
본 발명의 DNAen 발현 카세트는 G/C 함량, 코돈 최적화(optimization), UTR 변형, 30개 초과의 아데노신 뉴클레오타이드를 갖는 폴리(A) 꼬리, 폴리(C) 서열, 및 히스톤-스템-루프 서열로 이루어진 염기서열 변형(SM)을 포함할 수 있다.
본 발명의 DNAsg 발현 카세트는 선택된 유전체의 특정 표적화 염기서열에 관련된 RNA, sgRNA를 포함할 수도 있다. 본 발명의 DNAsg 발현 카세트는 DdRp가 결합하는 프로모터를 포함하거나, DdRp가 결합하는 프로모터 대신에 RNA 폴리머라제Ⅲ(Pol Ⅲ) 프로모터를 사용할 수도 있다.
DdRp가 결합하는 프로모터는 DdRp를 유도하는 바이러스에 고유한 것이다. DdRp가 결합하는 프로모터는 바이러스의 구조 단백질에 대한 프로모터이다. 이것은 DdRp가 결합하는 프로모터가 바이러스에 고유한 것이고 상기 바이러스에서 하나 이상의 구조 단백질의 유전자 전사를 제어하는 것임을 의미한다.
본 발명의 유전체 편집 RNA/DNA 시스템은 DdRp RNA 발현 카세트, 유전체 편집 도구를 코딩하는 DNAge를 포함하는 DNAge 발현 카세트 및 DdRp를 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트를 포함할 수 있다.
상기 DdRp 또는 유전체 편집 도구를 코딩하는 DNA 절편을 포함하는 발현 카세트는 각각의 상류 방향에 DdRp가 결합하는 프로모터가 있거나 또는 상류 방향에 하나의 DdRp가 결합하는 프로모터가 있을 수 있다.
본 발명의 DdRp는 한 개의 서브유닛으로 구성된 DdRp를 선택하였다.
본 발명의 상기 DdRp RNA 발현 카세트는 핵-비의존적으로 세포질 내에서 전사를 시킬 수 있는 T7 RNA 폴리머라제, T3 RNA 폴리머라제및 SP6 RNA 폴리머라제를 포함하는 군에서 선택되어진 어느 하나의 발현을 증가시켜 표적 RNA를 장기간 지속적으로 발현시킬 수 있다.
본 발명에 있어서, T7 RNA 폴리머라제는 T7 프로모터에 대한 특이성이 매우 높으며, T7 프로모터 하류의 DNA만을 전사할 수 있다. 따라서, 본 발명에서 T7 RNA 폴리머라제를 사용함으로써 세포 내에 다른 프로모터와 반응하지 않고 오직 T7 프로모터를 갖는 RNA 발현 카세트 및 auto_DdRp 발현 카세트에 결합 및 전사를 수행하게 되고, 높은 효율로 T7 RNA 폴리머라제자신을 자가전사하고 RNA를 전사하여 증폭할 수 있다.
상기 auto_DdRp 발현 카세트는 T7 RNA 폴리머라제발현 루프(loop)의 반복에 의해 상기 T7 RNA 폴리머라제를 세포질 내에서 자가전사시키는 것을 특징으로 한다.
구체적으로, 상기 auto_DdRp 발현 카세트는 T7 프로모터, IRES(Internal ribosome entry site) 영역, T7 RNA 폴리머라제를 코딩하는 DNA 절편, 폴리 아데닌 꼬리(poly A tail) 및 T7 종결서열(termination)을 포함할 수 있으며, 이들이 작동 가능하게 연결되어 구성된 것일 수 있다. 상기 auto_DdRp 발현 카세트 내부에 포함된 IRES 영역은 viral IRES일 수 있으며, IRES-융합된 T7 폴리머라제 전사체를 생성함으로써 DdRp mRNA의 전사 안정성을 높일 뿐만 아니라, 세포질 내에서 T7 폴리머라제의 높은 발현효율을 유지할 수 있다.
상기 자가전사는 본 발명 조성물을 구성하는 DdRp RNA 발현 카세트에 의해 합성되는 DdRp의 자가전사를 위한 auto_DdRp 발현 카세트에 의한 DdRp 발현 루프에 의해 수행될 수 있다.
구체적으로, 상기 DdRp mRNA 또는 캡된 CM/SM DdRp mRNA가 세포질 내에서 리보솜에 의해 번역되어 DdRp를 생성하고, 생성된 DdRp는 상기 auto_DdRp 발현 카세트에 존재하는 프로모터를 인식하여 DdRp의 전사를 수행한다. 이후 생성된 DdRp mRNA는 세포질 내에서 다시 리보솜에 의해 번역되어 DdRp를 생성하는 것을 반복함으로써, DdRp의 자가전사가 이루어진다. 따라서, 본 발명의 조성물은 DdRp 발현 루프에 의해 자가전사된 DdRp를 세포질 내에서 장기간 고농도로 유지시킬 수 있음을 특징으로 한다.
이에, 본 발명은 DdRp RNA 발현 카세트; 및 DdRp 자가전사를 위한 DdRp 을 코딩하는 DNA를 포함하는 auto_DdRp 발현 카세트에 의해 수행되는 DdRp 발현 루프를 통해 핵-비의존적으로 세포질 내에서 DdRp mRNA를 장기간 고농도로 유지하고, 이에 따라 또한 DdRp 장기간 지속적으로 발현시키는 것을 특징으로 한다.
캡핑은 거의 모든 진핵세포 메신저 RNA의 5'말단에서 발견된 특수한 구조이다. 가장 단순한 캡 구조, cap0은 1차 RNA의 말단에 결합된 5'5' 트리포스페이트 말단의 감마 포스페이트에 의해 결합되는 N7에서 메틸화된 구아닌 뉴클레오사이드 부가의 결과이다(즉, m7GpppN, 여기서 N은 임의의 염기이고, p는 포스페이트를 나타내며, m은 메틸 그룹이다). cap0의 형성은 일련의 3가지 효소 반응을 수반한다: RNA 트리포스파타제(RTPase)는 디포스페이트에 대한 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하고, RNA 구아닐릴트랜스퍼라제(GTase)는 GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하며, RNA N7-구아닌 메틸트랜스퍼라제(N7-MTase)는 GpppN 캡에 구아닌의 질소 7상의 메틸 잔기를 부가한다.
보다 고급 진핵세포 및 일부 바이러스에서, 1차(즉, cap1 구조체; m7GpppNm2'-opN) 및 2차(즉, cap2 구제초; m7GpppNm2'-opNm2'-o) 전사된 뉴클레오티드의 리보스의 2'-하이드록실 그룹은 각각 cap1- 및 cap2-특이적 MTase로서 명명된 2개의 별개의 리보스-2'-O MTase에 의해 메틸화될 수 있다.
그러나, 오로지 핵에 존재하는 세포 N7-MTase 활성과 대조적으로, cap1 리보스-2'-O MTase 활성은 헬라 세포의 세포질 및 핵 둘 다에서 검출된 반면, cap2 MTase 활성은 이들의 세포질에서 유일하게 발견되었다.
5'말단 m7GpppN 캡의 형성은 프리-mRNA 프로세싱의 제1 단계이다. m7GpppN cap는 mRNA 안정성 및 핵으로부터 세포질로의 이의 수송에 중요한 역할을 담당한다.
또한, 5'말단 m7GpppN 캡은 진핵세포 번역 개시 인자 4F(eIF4F) 복합체를 고정함으로써 단백질로의 mRNA의 번역에 중요하며, 상기 복합체는 작은 리보솜 서브유닛의 16S 부분의 mRNA로의 보충을 매개한다. 따라서, 5'말단 m7GpppN 캡은 시험관내 및 생체내 둘 다에서 mRNA의 번역을 현저히 향상시킨다.
본 발명의 auto_DdRp 발현카세트의 DdRp는 DdRp 그 자가, 또는 RNA 트리포스파타제(RNA triphosphatase)의 촉매 도메인, 구아닐릴트랜스퍼라제(guanylyltransferase)의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제(N7-guanine methyltransferase) 및 DdRp(DNA-dependant RNA polymerase)의 촉매 도메인을 포함하는 키메라 효소가, 세포독성 및 아폽토시스의 유도 없이, 진핵세포 번역 장치에 의해 고도로 해독 가능한 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성한다는 보고(한국, 공개특허 10-2013-0069632)를 기반으로 하는 키메라 효소를 사용하여 제작하였다.
본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7-구아닌 메틸트랜스퍼라제의 촉매 도메인, 및 적어도 하나의, 특히 DdRp의 촉매 도메인을 포함하는 키메라 효소에 관한 것이다.
특히, 본 발명에 따르는 키메라 효소는 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.
키메라 효소는 자연에서 발견되는 천연 효소가 아닌 효소를 지칭한다. 따라서, 키메라 효소는, 자연에서 발견된 것과는 상이한 방식으로 배열된, 상이한 공급원(예: 상이한 효소)으로부터 유래된 촉매 도메인 또는 동일한 공급원(예: 동일한 효소)으로부터 유래된 촉매 도메인을 포함할 수 있다. 키메라 효소는 단량체성(즉, 단일 단위) 효소 뿐만 아니라 올리고머성(즉, 복수 단위) 효소, 특히 헤테로-올리고머성 효소를 포함한다. 단량체성 효소는 단지 하나의 폴리펩티드 쇄로 이루어진 단일-단위 효소와 관련된다.
특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인들은 함께 공유 및/또는 비공유적으로 연결되어 있다.
특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 함께 작동적으로 연결되어, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성한다.
특히, 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매 도메인(여기서, 상기 촉매 도메인 중의 적어도 2개는 바람직하게는 이들의 말단(N 또는 C 말단)에서 함께 공유 또는 비공유적으로 연결되고, 보다 특히는 상기 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 상기 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인으로 이루어진 그룹으로부터 선택된 적어도 하나의 촉매 도메인은 바람직하게는 이의 말단(N 또는 C 말단)에서 공유 또는 비공유적으로 연결된다)을 포함하는 본 발명의 키메라 효소는 상기 적어도 하나의, 특히 DdRp의 촉매 도메인과 바람직하게는 이의 말단(N 또는 C 말단)에서 연결된다.
특히, 본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매적 도메인을 포함하는 본 발명의 키메라 효소에 관한 것이며, 단 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 핵 진핵세포 DdRpI, II 및/또는 III의 유일한 촉매 도메인; 및 보다 특히는, DdRpII의 유일한 촉매 도메인(들)을 포함하는 키메라 효소는 제외된다.
특히, 본 발명은 적어도 하나의, 특히 RNA 트리포스파타제의 촉매 도메인, 적어도 하나의, 특히 구아닐릴트랜스퍼라제의 촉매 도메인, 적어도 하나의, 특히 N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 적어도 하나의, 특히 DdRp의 촉매적 도메인을 포함하는 본 발명의 키메라 효소에 관한 것이며, 단 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 핵 진핵세포 DdRpI, II 및/또는 III의 촉매 도메인; 및 보다 특히는, DdRpII의 적어도 하나의 촉매 도메인을 포함하는 키메라 효소는 제외된다.
특히, 진핵 숙주 세포에서 발현시키면, 본 발명에 따르는 상기 키메라 효소는, 바람직하게는 진핵세포 번역 장치에 의해 번역가능한, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.
특히, 진핵 숙주 세포에서 발현시키면, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 DdRp의 상기 촉매 도메인에 의해 합성된 RNA 분자의 5'말단에서 m7 GpppN 캡을 부가할 수 있고, 바람직하게는 5'말단 m7 GpppN 캡을 갖는 상기 RNA 분자는 진핵세포 번역 장치에 의해 번역할 수 있다.
특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 박테리오파지 DdRp의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5' 말단에서 구아노신 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에 m7GpppN 캡을 부가할 수 있다.
특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 박테리아 DNA-의존성RNA 폴리머라제의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5'말단에서 구아노신 또는 아데노신 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있다.
특히, 진핵 숙주 세포에서 발현시키면, DdRp의 상기 촉매 도메인이 사람 또는 마우스 미토콘드리아 DdRp의 촉매 도메인인 경우, RNA 트리포스파타제, 구아닐릴트랜스퍼라제및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 이들의 5' 말단에서 아데노신 또는 티미딘 리보뉴클레오티드를 갖는 RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있다.
효소의 촉매 도메인은, 특히 이의 3차원 구조에서, 효소 기능을 보장하기에 필요하고 충분한 도메인에 관한 것이다. 예를 들면, RNA 트리포스파타제의 촉매 도메인은 RNA 트리포스파타제기능을 보장하기에 필요하고 충분한 도메인이다. 용어 "촉매 도메인"은 야생형 또는 돌연변이체 효소의 촉매 도메인을 포함한다.
본 발명의 키메라 효소는 적어도 상기 촉매 도메인을 포함하지만, 상기 촉매 도메인을 함유하는 효소 전체 또는 일부분을 추가로 포함할 수 있다. 실제로, 본 발명에 따르는 키메라 효소의 한 가지 양태에 따라, DdRp의 상기 촉매 도메인은 DdRp, 바람직하게는 단량체성 DdRp의 전부 또는 일부에 포함될 수 있다. RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 또한 캡핑 효소, 바람직하게는 단량체성 캡핑 효소의 전부 또는 일부에 포함될 수 있다.
본 발명의 키메라 효소는 핵 효소, 아세포 구획 효소(subcellular compartment enzyme) 또는 세포질 효소일 수 있다. 따라서, 본 발명에 따르는 키메라 효소는, 세포에서 효소의 전달을 유도하는, 당해 기술분야의 통상의 지식을 가진 자에게 공지된 시그날 펩티드 또는 마커-시그날을 포함할 수 있다. 예를 들면, 본 발명에 따르는 키메라 효소는 당해 효소를 핵으로 유도하는 핵국지화신호(NLS)을 포함할 수 있다. 이러한 NLS는 종종 5개의 기본적 양전하 아미노산으로 이루어진 단위이다. NLS는 펩티드 쇄 상의 어느 곳에도 위치할 수 있다.
키메라 효소는 세포질 키메라 효소일 경우, 세포질을 제외하고는, 당해 효소의 전달을 유도하는 시그날 펩티드 또는 마커-시그날을 포함하지 않는다.
본 발명의 키메라 효소의 세포질 국지화는, 세포질로부터 진핵 세포의 핵으로의 거대 DNA 분자(즉, 도입유전자)의 활발한 이동 및 핵으로부터 세포질로의 RNA 분자의 이출을 피함으로써 도입유전자 발현 수준을 최적화시키는 잇점을 갖는다.
따라서, 본 발명의 이들 세포질 키메라 효소는, 현저히 높은 양의 형질감염된 DNA가 핵과 비교하여 통상 발견되는 세포질에서 작동할 수 있는, 숙주 독립적, 진핵세포 유전자 발현시스템을 생성하는데 유용할 수 있다.
본 발명의 이들 세포질 키메라 효소는, 세포독성 및 아폽토시스 유도 없이, 진핵세포 세포질 번역 장치에 의해 고도로 번역가능한, 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성할 수 있다.
내인성 유전자 전사가, 세포질에서 일어나는 도입유전자 전사와 대조적으로, 진핵 세포의 핵에서 일어나기 때문에, 내인성 유전자 잔사와 도입유전자 전사 사이에 경쟁이 없다.
따라서, 본 발명의 세포질 키메라 효소는 특히 대규모 분석 및 단백질 생산에 적절하다.
본 발명의 키메라 효소에서, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 단량체, 즉 하나의 폴리펩티드에 포함된다. 예를 들면, 상기 단량체는 본 발명에 따르는 단량체성 캡핑 효소 또는 단량체성 키메라 효소일 수 있다.
특히, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 단량체성 캡핑 효소에 포함된다. 이 경우, 본 발명의 키메라 효소는 단량체성 캡핑 효소를 포함하고, 이 효소는 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인을 포함한다. 상기 단량체성 캡핑 효소는, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 특히 야생형 청설병 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카 돼지열 바이러스 캡핑 효소, 야생형 아칸트아메바 폴리파가 미미바이러스(acanthamoeba polyphaga mimivirus) 캡핑 효소 및 이의 돌연변이체 및 유도체로 이루어진 그룹으로 부터 선택된 단량체성 바이러스 캡핑 효소 및 보다 특히는 야생형 아프리카 돼지열 바이러스 캡핑 효소일 수 있다.
특히, DdRp의 상기 촉매 도메인은 또한 단량체, 즉 하나의 폴리펩티드에 포함될 수 있다.
예를 들면, 상기 단량체는 본 발명에 따르는 단량체성 DdRp또는 단량체성 키메라 효소일 수 있다.
특히, DdRp의 상기 촉매 도메인은 단량체성 DdRp에 포함된다. 이 경우, 본 발명의 키메라 효소는, DdRp의 상기 촉매 도메인을 포함하는, 단량체성 DdRp를 포함한다. 상기 단량체성 DdRp는 단량체성 파지 DdRp일 수 있고, 특히 5' → 3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는, T7 RNA 폴리머라제, T3 RNA 폴리머라제및 SP6 RNA 폴리머라제및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택될 수 있고, 보다 특히, 5' → 3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 T7 RNA 폴리머라제및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택될 수 있다.
DdRp의 상기 촉매 도메인 및 RNA 트리포스파타제의 상기 촉매 도메인 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 2개 및 보다 바람직하게는 전체 촉매 도메인은 단량체에 포함될 수 있다.
본 발명의 키메라 효소는 단량체성 또는 올리고머성일 수 있다. 실제로, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 하나 또는 수개의 폴리펩티드에 포함될 수 있다.
바람직하게는, 본 발명의 키메라 효소는 단량체성일 수 있다.
실제로, 본 발명은 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp의 촉매 도메인을 포함하는 단량체성 키메라 효소가, 세포독성 및 아폽토시스 유도 없이, 진핵 번역 장치에 의해 고도로 번역가능한, 5'말단 m7GpppN 캡을 갖는 RNA 분자를 합성할 수 다는 보고를 확인하였다.
이들의 천연 구조로 유지되어야 하는, 입체 장애 및 성분 및 효소에 기인하여, 전사체의 캡핑이 단량체성 효소로 발생다는 것은 자명하지 않다. 실제로, T7 전사체의 캡핑은, 발생 RNA 분자의 5'말단에서 m7GpppN 캡을 유발하는 것으로 가정하더라도, 융합 효소 CTD-T7 RNA 폴리머라제에 의해 달성될 수 없다.
본 발명의 단량체성 키메라 효소는, 특히 저렴하고 신속하며 실시가 용이하여 대규모 분석 및 단백질 생산에 상당히 적절하다는 잇점을 갖는다. 실제로, 단량체성 효소의 생산은 올리고머성 효소보다 더욱 용이하다. 또한, 단일-단위만이 존재하기 때문에, 단위 조립 문제가 없다. 단량체성 효소는 또한 다량체성 효소보다 조작이 보다 용이하다.
DdRp(RNAP)는 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 RNA를 합성하는 뉴클레오티딜 트랜스퍼라제에 관한 것이다.
바람직하게는, DdRp의 상기 촉매 도메인은 효소의 촉매 도메인이고, 이는 비교적 단순한 구조이고 보다 바람직하게는 게놈 효소 조절 요소(즉, 프로모터, 전사 종결 시그날 및 연쇄 접합)를 특성화한다. 따라서, 특히, DdRp의 상기 촉매 도메인은 박테리오파지 DdRp, 박테리아 DdRp또는 각종 진핵세포 세포기관(예: 미토콘드리아, 엽록체 및 전색소체)의 DdRp의 촉매 도메인일 수 있다.
본 발명에서, DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 촉매 도메인이다. 박테리오파지 DdRp는 특히 진핵세포 RNA 폴리머라제보다 높은 처리능을 가짐으로써 도입 유전자 발현 수준을 최적화하는 잇점을 상당히 갖는다. 박테리오파지 DdRp는 또한, 다중 서브유닛(예: RNA 폴리머라제II)와 함께 복잡한 구조를 갖는 대부분 핵 진핵세포 폴리머라제보다 훨씬 단순한 구조를 갖는다. 지금까지 특성화된 대부분의 박테리오파지 DdRp는 단일-서브유닛 효소이고, 이는 전사의 개시, 신장 또는 종결을 위해 보조 단백질을 필요로 하지 않는다. 클로닝된 박테리오파지에 대해 명명화된 이들 효소 중의 몇가지는 또한 잘 특성화된 조절 게놈 요소(즉, 프로모터, 종결 시그날, 전사 정지 서열)을 갖고, 이들은 유전자도입에 중요하다.
또한, 내인성 유전자 전사와 도입유전자 전사 사이에 경쟁이 없다. 박테리오파지 DNA 의존성 RNA-폴리머라제잔기를 포함하는 본 발명에 따르는 키메라 효소는, 임의의 진핵세포 종(예: 효모, 설치류 및 사람)에서 RNA 전사체의 생산을 가능하게 한다. 이들은 저렴하고 신속하며 실시가 용이하여 대규모 분석 및 단백질 생산에 적절하고, RNA 폴리머라제II 등의 진핵세포 RNA 폴리머라제와 대조적으로, 대부분의 박테리오파지 DdRp가 전사의 개시, 신장 또는 종결을 위해 관련 인자를 필요로 하지 않기 때문에, 임의의 생물학적 시스템(예: 세포 반응 혼합물, 배양된 세포 및 살아있는 생물체)에서 RNA 전사체의 생산을 가능하게 한다.
박테리오파지 DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 촉매 도메인, 특히 T7 RNA 폴리머라제의 야생형, T3 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_003298; GeneID# 927437; UniProtKB/Swiss-Prot ID# Q778M8), K11 RNA 폴리머라제의 야생형(NCBI 게놈 K11 RNAP 서열ID# NC_004665; GeneID# 1258850; UniProtKB/Swiss-Prot ID# Q859H5), ψA1122 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_004777; GeneID# 1733944; UniProtKB/Swiss-Prot 단백질 ID# Q858N4), ψYeo3-12 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_001271; GeneID# 1262422; UniProtKB/Swiss-Prot ID# Q9T145) 및 gh-1 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC 004665; GeneID# 1258850; UniProtKB/Swiss-Prot 단백질 ID#Q859H5), K1-5 RNAP RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_008125; GeneID# 5075932 UniProtKB/Swiss-Prot 단백질 ID# Q8SCG8) 및 SP6 RNA 폴리머라제의 야생형(NCBI 게놈 서열 ID# NC_004831; GeneID# 1481778; UniProtKB/Swiss-Prot 단백질 ID# Q7Y5R1) 및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택된 촉매 도메인일 수 있고, 이들은 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있고, 보다 특히는 T7 RNA 폴리머라제의 촉매 도메인일 수 있다.
T7 RNA 폴리머라제는 박테리오파지 T7 DdRp에 관한 것이다. 바람직하게는, T7 RNA 폴리머라제는 서열번호 1의 아미노산 서열(NCBI 게놈 서열 ID# NC_001604; GeneID# 1261050; UniProtKB/Swiss-Prot ID# P00573)을 갖고, 98.8kDa의 분자량을 갖는 883개 아미노산 단백질이다.
T7 RNA 폴리머라제는 특히, 시험관내에서 당해 효소가 매우 처리능이 있고, 5'→3' 방향에서 37℃에서 240 내지 250 개 뉴클레오티드/s를 신장시킨다. 더욱이, 진핵 세포에서 발현되는 경우, T7 RNA 폴리머라제는 대부분 세포질에서 유지되며[참조: Elroy-Stein and Moss 1990; Gao and Huang 1993; Brisson, He et al. 1999], 따라서 세포질로부터 진핵 세포 핵으로 거대 DNA 분자(즉, 도입유전자)의 활발한 이동 및 핵으로부터 세포질로 RNA 분자의 이출을 피함으로써 도입유전자 발현 수준을 최적화한다.
DdRp의 촉매 도메인은 T7 RNA 폴리머라제의 야생형 뿐만 아니라 T7 RNA 폴리머라제의 돌연변이체 중의 하나일 수 있고, 이는 감소된 처리능에서도 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있다. 예를 들면, 상기 돌연변이체는 R551S, F644A, Q649S, G645A, R627S, I810S 및 D812E로 이루어진 그룹에서 선택될 수 있다.
본 발명의 키메라 효소에서, DdRp의 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대해 C-말단에 위치된다.
실제로, DdRp의 촉매 도메인이 박테리오파지 DdRp의 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 촉매 도메인인 경우, 상기 촉매 도메인은 바람직하게는 이의 천연 카복실 말단을 보존한다. 특히, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인의 C-말단은 상기 키메라 효소의 C-말단에 상응한다. 특히, 키메라 효소가 전체 박테리오파지 DdRp, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp인 경우, 상기 폴리머라제는 바람직하게는 이의 천연 카복실-말단을 보존한다. 특히, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인의 C-말단은 상기 키메라 효소의 C-말단에 상응한다. 특히, DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인은 박테리오파지 DdRp의 전체 또는 일부에 포함되고, 이때 상기 박테리오파지 DdRp의 C-말단은 상기 키메라 효소의 C-말단에 상응한다.
본 발명의 키메라 효소에서, DdRp의 상기 촉매 도메인, 특히 박테리오파지 DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대하여 C-말단에 위치된다.
DdRp의 상기 촉매 도메인은 박테리아 DdRp의 촉매 도메인이다.
바람직하게는, 상기 박테리아 DdRp는 적당한 구조 복잡성을 갖는다.
예를 들면, 상기 박테리아 DdRp는 대장균(E. coli) DdRp(K-12 기질 DH10B ID# NC_010473의 NCBI 게놈 서열)일 수 있고, 이는 4개의 상이한 서브유닛(α 서브유닛: rpoA GeneID# 6060938, UniProtKB/Swiss-Prot ID# B1X6E7; β 서브유닛: rpoB GeneID# 6058462, UniProtKB/Swiss-Prot ID# B1XBY9; β' 서브유닛: rpoC GeneID# 6058956, UniProtKB/Swiss-Prot ID# B1XBZ0; σ 서브유닛: rpoE GeneID# 6060683, UniProtKB/Swiss-Prot ID# B1XBQ0)으로 이루어져 있고, 5개의 ααββ'σ 서브유닛 복합체에서 조립된다. 이. 콜라이 RNA 폴리머라제프로모터, rho-의존성 및 -독립성 터미네이터 및 전사 중지 서열을 포함하는, 효소 활성의 조절에 수반된 게놈 요소는 잘 특성화되어 있다.
DdRp의 상기 촉매 도메인은 미토콘드리아, 엽록체 및 전색소체와 같이 진핵세포 세포기의 DdRp의 촉매 도메인이다. 실제로, 이들 폴리머라제는 또한 비교적 단순한 구조를 가질 수 있다.
DdRp의 상기 촉매 도메인은 포유동물 마우스 미토콘드리아 RNA 폴리머라제의 촉매 도메인일 수 있고, 이는 단일 단위 120 kDa 단백질(GeneID# 216151, UniProtKB/Swiss-Prot ID# Q8BKF1)이고 박테리오파지 RNA 폴리머라제와 상동성을 공유한다. 몇몇 전사 인자는 전사개시, 신장 또는 종결에 요구된다: 전사 종결을 위한 TFB1M (미토콘드리아 전사 인자 Bl; 마우스 GeneID#224481, UniProtKB/Swiss-Prot ID# Q8JZM0) 또는 TFB2M (미토콘드리아 전사 인자 B2; 마우스 GeneID# 15278, UniProtKB/Swiss-Prot ID# Q3TL26), TFAM (미토콘드리아 전사 인자 A; 마우스 GeneID# 21780, UniProtKB/Swiss-Prot ID# P40630), 및 mTERF (미토콘드리아 전사 종결 인자; 마우스 GeneID# 545725, UniProtKB/Swiss-Prot ID# Q8CHZ9). 전사 종결 시그날 뿐만 아니라 미토콘드리아 게놈의 경쇄 및 중쇄에서 2개의 프로모터를 포함하는, 미토콘드리아 RNA 폴리머라제의 효소 활성의 조절에 수반된 게놈 요소는 잘 특성화되어 있다.
RNA 트리포스파타제(RTPase)는, 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하여 디포스페이트로 되게 하는 효소이다. RNA 구아닐릴트랜스퍼라제(GTase)는, GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하는 효소를 지칭한다. N7-구아닌 메틸트랜스퍼라제(N7-MTase)는, 구아닌의 질소 7상의 메틸 잔기를 GpppN 캡에 부가하는 효소에 관한 것이다.
RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 동일하거나 상이한 캡핑 효소의 것일 수 있다. 상기 촉매 도메인이 동일한 효소의 것이면, DdRp의 상기 촉매 도메인은 상이한 효소의 것이다.
바람직하게는, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은, 유리하게는 비교적 단순한 구조 및 잘 특성화된 효소 활성을 갖는 하나 또는 수개의 세포질 효소로부터 기원한다. 따라서, 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 하나 또는 수개의 바이러스 캡핑 효소, 또는 세포질 에피좀의 캡핑 효소의 촉매 도메인일 수 있다.
RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 하나 또는 수개의 바이러스 캡핑 효소, 특히 야생형 청설병 바이러스 캡핑 효소, 야생형 대나무 모자이크 바이러스 캡핑 효소, 야생형 아프리카 돼지열 바이러스 캡핑 효소, 야생형 아칸트아메바 폴리파가 미미바이러스캡핑 효소 및 이의 돌연변이체 또는 유도체로 이루어진 그룹에서 선택된 효소의 것이고, 이들은 각각 발생 프리-mRNA의 5' 트리포스페이트 말단의 감마 포스페이트 잔기를 제거하여 디포스페이트로 되게 하거나, GMP를 GTP로부터 디포스페이트 발생 RNA 말단으로 전달하거나, 구아닌의 질소 7 상의 메틸 잔기를 GpppN 캡에 부가할 수 있고, 보다 특히는 야생형 아프리카 돼지열 바이러스 캡핑 효소의 것일 수 있다.
청설병 바이러스 캡핑 효소는 청설병 바이러스(BTV)의 단일-단위 VP4 캡핑 효소에 관한 것이고, 이는 74 kDa 단백질이다(644개 아미노산; 서열의 경우, 예를 들면, NCBI BTV 혈청형 10 게놈 서열 ID# Y00421; GeneID# 2943157; UniProtKB/Swiss-Prot ID# P07132, D0UZ45, Q5J7C0, Q65751, Q8BA65, P33428, P33429, P33427, C3TUP7, Q8BAD5, C5IWW0, B4E551, Q3KVQ2, Q3KVQ1, Q65732, Q3 VP8, Q3KVP9, Q3KVQ0). 이러한 캡핑 효소는 이의 카복실 말단에 인접하여 위치된 류신 지퍼를 통해 호모이량체화할 수 있다. VP4는 mRNA m7GpppN 캡핑 합성에 요구된 모두 3개의 효소 단계를 촉매한다: RTPase, GTase 및 N7-MTase.
대나무 모자이크 바이러스 효소는 ORF1, 대나무 모자이크 바이러스(BMV) mRNA 캡핑 효소에 관한 것이고, 이는 단일-단위 155-kDa 단백질이다(1365-아미노산; NCBI BMV 분리물 BaMV-0 게놈 서열 ID# NC 001642; GeneID# 1497253; UniProtKB/Swiss-Prot ID# Q65005). ORF1 단백질은 m7GpppN mRNA 캡핑, 즉 RTPase , GTase 및 N7-MTase 을 생성하는데 필요한 모든 효소 활성을 갖는다. 또한, ORF1은 RNA-의존성 RNA-폴리머라제활성을 갖고, 이는 본 발명의 키메라 효소 활성에 지배되지 않으며, mRNA 캡핑 효소의 Asp1229 Asp1230 잔사의 결실에 의해 파괴될 수 있다. 본원에 사용된 바와 같이, 용어 "아프리카 돼지열 바이러스 캡핑 효소"는 NP868R 캡핑 효소(G4R), (ASFV)에 관한 것이며, 이는 단일-단위 100 kDa 단백질이다(868 아미노산; NCBI ASFV 게놈 서열 균주 BA71V ID# NC_001659; GeneID# 1488865; UniProtKB/Swiss-Prot ID# P32094).
아칸트아메바 폴리파가 미미바이러스 캡핑 효소는 또다른 단일 단위 136.5 kDa 단백질인 R382(APMV)에 관한 것이다(1170 아미노산; NCBI APMV 게놈 서열 ID# NC_006450; GeneID#3162607; UniProtKB/Swiss-Prot ID# Q5UQX1).
RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 pGKL2와 같이 세포질 에피좀의 하나 또는 수개의 캡핑 효소의 것이다. 특히, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인은 효모 선형 염색체외 에피좀 pGKL2의 캡핑 효소의 전부 또는 일부에 포함된다.
세포질 선형 에피좀은 이중가닥 DNA 구조이고, 이는 다양한 효모 균주의 세포질에서 안정하게 복제한다[참조: Cong, Yarrow et al. 1994]. 효모 선형 염색체외 에피좀의 한 가지 프로토타입, pgKL2(13,457 bp; 또한 pGK12로 명명됨)은 클루이베로마이세스 락티스(Kluyveromyces lactis) CB 2359 및 사카로마이세스 세레비지애(Saccharomyces cerevisiae) F102-2를 포함하는 다양한 효모 균주로부터 완전히 서열분석되었다[참조:Tommasino, Ricci et al. 1988]. 클루이베로마이세스 락티스 pGKL2의 ORF3 유전자에 의해 코딩된 캡핑 효소(NCBI 클루이베로마이세스 락티스 CB 2359 pGKL2 게놈 서열 ID# NC_010187; UniProtKB/Swiss-Prot ID# P05469)은 594 아미노산 단백질(70.6 kDa 단백질)이다.
본 발명의 키메라 효소의 한 가지 양태에서, 적어도 2개, 특히 적어도 3개 및 보다 특히는 전체 촉매 도메인은 연결 펩티드에 의해 조립, 융합 또는 직접 또는 간접적으로 결합될 수 있다.
특히, RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7 -구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp로 이루어진 그룹에서 선택된 적어도 2개, 특히 적어도 3개 및 보다 특히는 전체 촉매 도메인은 직접 또는 연결 펩티드에 의해 결합된다.
연결 펩티드는, 입체 장애를 최소화하고 충분한 공간이 융합 단백질의 성분에 제공되어 이들의 천연 배좌를 유지하는 융합 단백질을 생성하는 잇점을 갖는다.
바람직하게는, DdRp의 적어도 상기 촉매 도메인은 RNA 트리포스파타제의 상기 촉매 도메인; 구아닐릴트랜스퍼라제의 상기 촉매 도메인; 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 하나의 촉매 도메인에 연결 펩티드에 의해 결합된다.
특히, 연결 펩티드는 DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인에 대해 N-말단에 위치할 수 있고, RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7-구아닌 메틸트랜스퍼라제의 상기 촉매 도메인에 대해 C-말단에 위치할 수 있다.
특히, DdRp의 상기 촉매 도메인, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 박테리오파지 DdRp의 상기 촉매 도메인의 N-말단은, RNA 트리포스파타제의 상기 촉매 도메인,구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 하나의 촉매 도메인의 C-말단에 공유 결합, 특히 연결 펩티드에 의해 연결된다.
상기 연결 펩티드는 화학식 (GlymSerp)n의 펩티드(여기서, m은 0~12의 정수, 특히 1~8의 정수 및 보다 특히는 3~6 및 보다 특히 4의 정수이고, p는 0~6의 정수, 특히 0~5의 정수, 보다 특히 0~3 및 특히 1의 정수이고, n은 0~30의 정수, 특히 0~12, 보다 특히 0~8 및 더욱 특히 1~6의 정수이다),
서열번호 6, 서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10, 서열번호 11, 서열번호 12, 서열번호 13, 서열번호 14, 서열번호 15, 서열번호 16, 서열번호 17, 서열번호 18, 서열번호 19, 서열번호 20, 서열번호 21 및 서열번호 22로 이루어진 그룹으로부터 선택된 아미노산 서열로 이루어진 펩티드로 이루어진 그룹으로부터 선택될 수 있다.
화학식(GlymSerp)n의 가요성 링커 펩티드는, 글리신 잔기가 펩티드 가요성을 제공하고 세린이 일부 가용성을 제공하는 잇점을 갖는다. 추가로, 화학식 (GlymSerp)n 링커 서열 중의 키로트립신 I, 인자 Xa, 파파인, 플라스민, 트롬빈 및 트립신에 대한 감수성 부위의 부재는 생성 융합 단백질의 전체 안정성을 증가시키는 것으로 생각된다.
가변 길이의 화학식 (GlymSerp)n 링커는 단일가닥 Fv 단편(sFv) 항체를 작제하기 위해 통상 사용된다. 또한, 화학식 (GlymSerp)n 링커는 각종 융합 단백질을 생성하기 위해 사용되었고, 이는 종종 이들의 성분 각각의 생물학적 활성을 보유한다.
다른 형태의 펩티드 링커는 또한 본 발명에 따르는 키메라 효소, 예를 들면, GGGGIAPSMVGGGGS(서열번호 6), SPNGASNSGSAPDTSSAPGSQ(서열번호 7), EGKSSGSGSESKSTE(서열번호 8), EGKSSGSGSESKEF(서열번호 9), GGGSGGGSGGGTGGGSGGG(서열번호 10)], GSTSGSGKSSEGKG(서열번호 11), YPRSIYIRRRHPSPSLTT(서열번호 12), GSTSGSGKPGSGEGSTKG(서열번호 13), GSTSGSGKPGSGEGS(서열번호 14), SSADDAKKDAAKKDDAKKDDAKKDA(서열번호 l5), GSADDAXXDAAXKDDAKKDDAKKDGS(서열번호 16), LSADDAKKDAAKKDDAKKDDAKKDL(서열번호 17), AEAAAKEAAAKEAAAKA(서열번호 18), GSHSGSGKP(서열번호 19), GSTSGSGKPGSGEGSTGAGGAGSTSGSGKPSGEG(서열번호 20), LSLEVAEEIARLEAEV (서열번호 21), 및 GTPTPTPTPTGEF(서열번호 22)을 생성하는 것으로 고려될 수 있다.
다른 종류의 공유 결합은, 이로써 한정되는 것은 아니지만, 디설파이드 결합, 트랜스글루타민화 및 화학적 및/또는 물리적 제제에 의한 단백질 트랜스-결합, 예를 들면, 트리스(비피리딘)루테늄(II)-디클로라이드 및 자외선광 조사를 포함한다.
RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7 -구아닌 메틸트랜스퍼라제및 DdRp의 상기 촉매 도메인은 또한 특정한 단백질 요소, 예를 들면, 류신 지퍼에 의해 조립될 수 있고, 예를 들면, 본 발명에 따르는 키메라 효소에서 비오티닐화 도메인을 촉매 도메인의 하나(예: Avi-tag II 또는 PFBtag) 및 비오틴 결합 도메인을 다른 촉매 도메인의 하나(예를 들면, 스트렙-tagII 또는 nono-tag)로 조립될 수 있다.
본 발명에 따르는 키메라 효소의 한 가지 양태에서, 적어도 2개의 상기 촉매 도메인은 비공유 결합, 특히 류신 지퍼에 의해 조립될 수 있다.
바람직하게는, DdRp의 적어도 상기 촉매 도메인은 비공유 결합, 특히 류신 지퍼에 의해 RNA 트리포스파타제의 상기 촉매 도메인, 구아닐릴트랜스퍼라제의 상기 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 상기 촉매 도메인으로 이루어진 그룹에서 선택된 촉매 도메인의 적어도 하나로 조립될 수 있다.
서로 상호작용하는 2개의 양쪽성 α-헬릭스로 이루어진 이량체성 나선형-코일 단백질 구조인 류신 지퍼는 통상 단백질을 호모- 또는 헤테로-이량체화하는데 사용된다. 각각의 헬릭스는 7개의 아미노산의 반복체로 이루어져 있고, 여기서 제1 아미노산(잔기 a)는 소수성이며, 제4 아미노산(잔기 d)는 통상 류신이며, 다른 잔기는 극성이다. 평행한 헤테로 이량체성 2본쇄 나선형 코일 구조를 형성하는 류신 지퍼 VELCRO ACID-p1 및 BASE-p1은 평행 단백질 헤테로-이량체를 형성하는 높은 경향을 갖는다. 이들은 몇몇 가용성 단백질] 뿐만 아니라 구성원 단백질을 헤테로 이량체화하는데 사용되었다.
다른 종류의 올리고머화 펩티드 도메인은 또한 본 발명에 따르는 키메라 효소를 생성하고 본 발명에 따르는 키메라 효소의 적어도 2개의 상기 도메인, 특히 항평행 헤테로 이량체성 구조를 형성하는 류신 지퍼, 예를 들면, ACID-al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ, ACID-pLL/ BASE-pLL 및 EE1234L 및 RR1234L 류신 지퍼를 조립하는 것으로 생각된다. 류신 지퍼의 디설파이드-연결된 버젼은 또한 본 발명에 따르는 디설파이드 나선형 코일-결합된 헤테로 이량체성 키메라 효소 뿐만 아니라 환원 조건하에 시스테인 잔기 사이의 쇄간 디설파이드 브릿지를 생성하기 위해 사용될 수 있다.
따라서, RNA 트리포스파타제, 구아닐릴트랜스퍼라제, N7-구아닌 메틸트랜스퍼라제및 DdRp의 적어도 2개의 상기 촉매 도메인은 류신지퍼, 특히 항평행 헤테로이량체성 구조를 형성하는 류신지퍼, 예를 들면, ACID-al/BASE-al, ACID-Kg/BASE-Eg, NZ/CZ 및 ACID-pLL/ BASE-pLL 류신지퍼, 디설파이드 나선형 코일-결합된 지퍼, 및 시스테인 잔기 사이의 디설파이드 브릿지에 의해 조립될 수 있다.
본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 T7 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T7 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.
본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 T3 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T3 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.
본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커를 통해 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는 야생형 SP6 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 SP6 RNA 폴리머라제의 야생형에 융합된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소를 포함한다.
본 발명의 키메라 효소는, 류신 지퍼에 의해 조립된, RNA 분자의 5'말단에서 m7GpppN 캡을 부가할 수 있는, 아프리카 돼지열 바이러스의 야생형 mRNA 캡핑 효소 또는 이의 돌연변이체 또는 유도체, 특히 야생형 아프리카 돼지열 바이러스 캡핑 효소 및 5'→3' 방향에서 이중가닥 주형 DNA에 서열 상보성이 있는 단일가닥 RNA를 합성할 수 있는, 야생형 T7 RNA 폴리머라제또는 이의 돌연변이체 또는 유도체의 아미노 말단, 특히 T7 RNA 폴리머라제의 야생형을 포함한다.
본 발명에 키메라 효소는, 본 발명의 키메라 효소의 적어도 하나의 촉매 도메인, 특히 RNA 트리포스파타제의 촉매 도메인, 구아닐릴트랜스퍼라제의 촉매 도메인, N7-구아닌 메틸트랜스퍼라제의 촉매 도메인 및 DdRp의 촉매 도메인으로 이루어진 그룹에서 선택된 적어도 하나의 촉매 도메인의 활성을 증강시키는 도메인을 추가로 포함한다.
예를 들면, 본 발명의 키메라 효소의 적어도 하나의 촉매 도메인의 활성을 증강시키는 상기 도메인은, 고유한 효소 활성은 없지만 백시니아 mRNA 캡핑 효소의 D1R 서브유닛의 RNA N7-구아닌 메틸트랜스퍼라제활성을 현저히 증강시키는, 백시니아 바이러스 D12L 유전자에 의해 코딩된 31-kDa 서브유닛일 수 있다(게놈 서열 ID#NC_006998.1; GeneID#3707515; UniProtKB/Swiss-Prot ID#YP_232999.1).
본 발명의 키메라 효소는, 특히 링커 및 보다 특히는 화학식 (Gly3Ser)4 링커 및/또는 류신 지퍼에 의해 전체 또는 부분으로 조립된, RNA-트리포스파타제, RNA 구아닐릴트랜스퍼라제및 RNA-구아닌 메틸트랜스퍼라제효소 활성을 갖는, 백시니아 mRNA 캡핑 효소의 적어도 하나의 촉매 도메인, 특히 백시니아 바이러스 D1R 유전자에 의해 코딩된 95 kDa 서브유닛(genomic sequence ID# NC 006998.1; GeneID# 3707562; UniProtKB/Swiss-Prot ID# YP 232988.1); - DdRp, 특히 T7, T3 및 SP6-RNA 폴리머라제로 이루어진 그룹에서 선택된 폴리머라제및 보다 특히는 T7 RNA 폴리머라제의 적어도 하나의 촉매 도메인 및 백시니아 바이러스 D12L 유전자에 의해 코딩된 31-kDa를 포함한다.
본 발명은 또한 분리된 핵산 분자 또는 분리된 핵산 분자의 그룹에 관한 것이며, 상기 핵산 분자(들)는 본 발명에 따르는 키메라 효소를 코딩한다.
본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은, 이들의 발현에 의해 본 발명에 따르는 키메라 효소를 수득하는데 필요하고 충분한 모든 핵산 분자를 포함하거나 이들로 이루어진다.
본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은 RNA 트리포스파타제의 적어도 하나의 촉매 도메인, 구아닐릴트랜스퍼라제의 적어도 하나의 촉매 도메인 및 N7 -구아닌 메틸트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자 및 DdRp의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함하거나 이들로 이루어진다.
본 발명의 키메라 효소를 코딩하는 분리된 핵산 분자의 상기 그룹은 RNA 트리포스파타제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자, 구아닐릴트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자, N7 -구아닌 메틸트랜스퍼라제의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자 및 DdRp의 적어도 하나의 촉매 도메인을 코딩하는 핵산 분자를 포함하거나 이들로 이루어진다.
본 발명의 핵산 분자는, 진핵세포 DdRp, 바람직하게는 RNA 폴리머라제II를 위한 프로모터 및 DdRp의 상기 촉매 도메인을 위한 프로모터로 이루어진 그룹으로부터 선택된 적어도 하나, 바람직하게는 전체 프로모터(들)에 기능적으로 연결될 수 있다.
진핵세포 DdRp, 바람직하게는 RNA 폴리머라제II를 위한 프로모터에 대한 핵산의 연결은 현저하게는, 본 발명의 키메라 효소가 진핵 숙주 세포에서 발현되는 경우, 당해 키메라 효소의 발현은 진핵 RNA 폴리머라제, 바람직하게는 RNA 폴리머라제II에 의해 유도된다는 잇점을 갖는다. 이들 키메라 효소는 또한 도입유전자의 전사를 개시할 수 있다. 조직 특이적 RNA 폴리머라제II 프로모터가 사용되는 경우, 본 발명의 키메라 효소는 표적 조직/세포에서 선택적으로 발현될 수 있다.
상기 프로모터는 당해 기술분야의 통상의 지식을 가진 자에게 공지된 구조 프로모터 또는 유도 프로모터일 수 있다. 당해 프로모터는 발달상 조절될 수 있고, 유도성 또는 조직 특이성일 수 있다.
본 발명은 또한 본 발명의 핵산 분자를 포함하는 벡터에 관한 것이다. 상기 벡터는 반-안정한 또는 안정한 발현에 적절할 수 있다.
본 발명은 또한 본 발명의 분리된 핵산 분자의 상기 그룹을 포함하는 벡터 그룹에 관한 것이다.
특히, 본 발명의 상기 벡터는 클로닝 또는 발현 벡터이다.
당해 벡터는 박테리오파지 등의 바이러스 벡터 또는 플라스미드 벡터 등의 비바이러스성 벡터일 수 있다.
본 발명의 상기 벡터는, 특히 본 본 발명의 핵산 분자, 및 DdRp의 상기 촉매 도메인 및/또는 목적하는 적어도 하나의 DNA 서열을 위한 프로모터를 포함하는 비시스트로닉 벡터(bicistronic vector)이고, 상기 DNA 서열은 DdRp의 상기 촉매 도메인을 위한 프로모터에 작동적으로 연결된다.
본 발명의 상기 벡터는 또한 DdRp의 상기 촉매 도메인을 위한 프로모터를 포함할 수 있다.
본 발명은 또한 본 발명의 분리된 핵산 분자 또는 본 발명의 분리된 핵산 분자 그룹 또는 본 발명의 벡터 또는 본 발명의 벡터 그룹을 포함하는 숙주 세포에 관한 것이다.
본 발명의 숙주 세포는 대규모 단백질 생산에 유용할 수 있다.
바람직하게는, 본 발명의 DdRp 키메라 효소의 상기 촉매 도메인은 내인성 유전자 전사와 도입유전자 전사 사이의 경쟁을 방지하기 위해 숙주 세포의 것과는 상이한 효소의 것이다.
본 발명은 또한, 본 발명의 키메라 효소를 발현하는 유전자 조작된 비사람 진핵 생물에 관한 것이다.
상기 비사람 진핵 생물은 임의의 비사람 동물 및 식물일 수 있다.
본 발명은 또한, 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 생산하기 위한, 본 발명에 따르는 키메라 효소 또는 본 발명에 따르는 분리된 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자 그룹의 특히 시험관내 또는 생체외에서의 용도에 관한 것이다.
본 발명은 또한, 특히 진핵세포 시스템, 예를 들면, 시험관내 합성된 단백질 분석 또는 배양된 세포에서단백질, 특히 항체와 같은 치료학적 목적의 단백질을 생산하기 위한, 본 발명에 따르는 키메라 효소, 본 발명에 따르는 분리된 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자 그룹의 시험관내 또는 생체외 용도에 관한 것이다.
본 발명은 또한, DNA 서열에 의해 코딩된 5'말단 m7 GpppN 캡을 갖는 RNA 분자를 숙주 세포에서 생산하는 특히 시험관내 또는 생체외 방법으로서, 상기 방법은 숙주 세포에서 본 발명에 따르는 핵산 분자 또는 본 발명에 따르는 분리된 핵산 분자의 그룹을 발현시키는 단계를 포함하고, 상기 DNA 서열은 DdRp의 상기 촉매 도메인에 대한 프로모터에 작동적으로 연결되어 있고, 특히 상기 프로모터는 상기 숙주 세포에서 효과적인, 시험관내 또는 생체외 방법에 관한 것이다.
바람직하게는, 본 발명의 키메라 효소의 DNA-의존성 RNA-폴리머라제의 상기 촉매 도메인은 내인성 유전자 전사와 상기 DNA 서열 전사 사이의 경쟁을 방지하기 위해 숙주 세포의 것과는 상이한 효소의 것이다.
Ⅲ. RNA/DNA 시스템의 변형
본 발명의 RNA/DNA 시스템을 구성하는 상기 DdRp RNA 발현 카세트는 화학적 변형(CM)을 적어도 하나를 포함할 수 있다. 또한, 본 발명의 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트 또는 DNAge 발현 카세트는 염기서열 변형(SM)을 적어도 하나를 포함할 수 있다.
본 발명의 RNA/DNA 시스템은 RNA 및 DNA로 구성된다. 상기 DdRp RNA 발현 카세트는 DdRp 오픈 리딩 프레임(ORF), 5‘UTR 및 3'UTR를 포함하는 DdRp mRNA이고 5'cap 구조, 화학적 변형(CM) 및 염기서열 변형(SM)을 포함할 수 있으며, 이들 증 SM이 결여하면 캡된 CM_DdRp mRNA이라고 하고, 이들을 모두 포함하면 캡된 CM/SM_DdRp mRNA이라고 하였다.
본 발명의 "캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트"는 SM_DdRp mRNA에 화학적 변형된 뉴클레오타이드를 포함하여 CM/SM_DdRp mRNA를 제조하고 5'cap 구조를 추가한 발현 카세트로, 특정 시점에 측정된 상기 캡된 CM/SM_mRNA로부터 생산된 단백질 또는 펩타이드의 양은 캡된 CM/SM_mRNA이 CM이 결여된 SM_DdRp mRNA("캡된 SM_DdRp mRNA") 보다 안정성이 높아, 상대적으로 증가한다.
본 발명에서 DdRp mRNA는 DdRp 발현을 증가시키는 CM 및 SM으로 이루어진 변형에서 적어도 하나의 변형을 포함한다. 상기 DdRp 발현은 CM와 SM이 포함된 CM/SM_DdRp mRNA의 투여에 의해 추가로 증가한다. 캡된 CM/SM_DdRp mRNA에서 CM/SM의 적어도 하나에 따른 단백질 생산의 증가는 본원에서 "캡된 CM/SM_DdRp mRNA-연관 단백질 발현"로서 언급된다.
본 발명은 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트는 상기 DdRp mRNA의 안정성, 복제, 전사 및 번역을 관리하는 요소들을 포함하는 을 제공한다. 만약 본 발명의 캡된 CM/SM_DdRp mRNA 방법과 기존의 핵-의존적 프로모터를 갖는 발현 카세트를 비교하면, 캡된 CM/SM_DdRp mRNA 방법의 단백질 생산의 증가는 본원에서 "캡된 CM/SM_DdRp mRNA-연관 증가"로서 언급할 수 있다.
본 발명의 "캡된 CM/SM_DdRp mRNA-연관 단백질 발현"는 특정 기간 동안 측정된 캡된 CM/SM_DdRp mRNA로부터 생산된 단백질이 CM/SM이 결여된 참조 DdRp mRNA로부터 생산된 단백질의 총량과 비교하여 증가되는 상황, 또는 특정 시점에 측정된 캡된 CM/SM_DdRp mRNA로부터 생산된 단백질 수준이 CM/SM이 결여된 참조 DdRp mRNA로부터 생산된 단백질 수준과 비교하여 증가되는 상황을 나타낸다.
본 발명에서 DNAge 발현 카세트는 적어도 하나의 표적화 엔도뉴클레아제코딩하는 DNA 절편, sgRNA를 코딩하는 DNA 절편, 5‘UTR 및 3'UTR를 포함할 수 있다. 상기 DNAge 발현 카세트는 염기서열 변형(SM)을 포함할 수 있으며, 이를 SM_DNAge이라고 하였다. 상기 DNAge 발현 카세트는 SM_DNAge를 포함할 수 있다.
여기에 추가적으로 auto_DdRp DNA 발현 카세트의 DdRp DNA를 포함할 수 있으며, 또한 염기서열 변형(SM)을 포함할 수 있고 auto_SM DdRp DNA라고 하였다.
본 발명에서는 염기서열 변형(SM)이 있는 SM_DNAge 발현 카세트도 특정 시점에 측정된 상기 SM_DNAge 발현 카세트로부터 생산된 단백질 또는 RNA의 양이 SM이 결여된 DNAge 발현 카세트의 경우와 비교하여 증가한다.
본 발명의 유전체 편집 RNA/DNA 시스템의 개념에서, 본 발명의 캡된 CM/SM_DdRp mRNA를 포함하는 DdRp RNA 발현 카세트와 더불어 SM_DNAge를 포함하는 DNAge 발현 카세트를 세포/조직에 주입한 경우, 상기 SM_DNAge 발현 카세트가 코딩하는 표적화 엔도뉴클레아제또는 sgRNA의 발현을 증가된다. 상기 SM_DNAge 발현 카세트는 적어도 하나의 SM을 포함한다. 상기 코딩된 표적화 엔도뉴클레아제또는 sgRNA의 발현은 SM_DNAge 발현 카세트의 투여에 의해 증가된다. DNA 발현 카세트의 SM에 따른 표적화 엔도뉴클레아제생산의 증가는 본원에서 "SM_DNA-연관 단백질 발현"로서 언급된다.
따라서, 본 발명의 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트와 더불어 SM_DNAge 또는 참조 DNAge를 포함하는 DNAge 발현 카세트를 표적 조직내로 주입되며, 예를 들어, 바람직하게는 피부 내로, 근육 내로 또는 피하로 주사된다.
본 발명에 따르면, DNAge 발현 카세트는 코딩된 단백질의 발현을 향상하기 위해서 SM이 될 수 있다("SM_DNAge-연관 증가"). 거기서, SM은 코딩된 단백질의 발현만큼 임의의 특정 구조에 한정되지 않고 본원에 정의된 바와 같은 참조 DNAge 발현 카세트와 비교하여 증가된다. 여러 DNA 변형체는 당 업계에 알려져 있으며, 본 발명에서 주어진 DNAge로 적용할 수 있다.
기존의 핵-의존적 프로모터를 갖는 DNA plasmid를 이용한 핵에서의 mRNA 발현방법은 세포막 투과에 비해 그 효율이 1%에 불과한 핵막 투과에 의존하여 세포 내로 형질 도입된 DNA plasmid에서 전사되는 RNA의 발현효율이 매우 낮다. 또한, 핵에서 발현된 mRNA는 세포질로 배출되어야만 단백질의 합성이 가능하나, 이러한 세포질로의 분출에 관여하는 엑스포틴(exportin)-5 운반체가 고농도의 다른 RNA에 의하여 포화되는 문제로 인해 세포 내로 형질 도입된 RNA의 세포질 분출을 방해하는 문제가 발생하여 세포질로 이동되는 RNA는 극소량에 불과하다.
본 발명의 지속적인 유전체 편집 도구 발현용 조성물인 RNA/DNA 시스템은 핵-비의존적으로 상기 캡된 CM/SM_DdRp mRNA를 포함하는 RNA 발현 카세트에서 세포질 내에서 합성된 선택된 DdRp, 예를 들어 T7 RNA 폴리머라제의 발현을 증가시켜 상기 DNAge 발현 카세트에 있는 DdRp 프로모터(T7 프로모터) 하류에 위치한 DNAge 발현을 장기간 지속적으로 발현시키는 것일 수 있다. 구체적으로, 상기 DNAge가 코딩하는 전사체의 지속적 발현은 상기 조성물로부터 세포질 내 장기간 지속적으로 DNAge를 생성할 수 있어, 기존의 핵-의존적 프로모터를 갖는 DNA plasmid를 이용한 핵에서의 mRNA 발현방법의 문제점을 극복할 수 있다.
1. 변형 RNA의 5'말단(5' 캡)의 변형
본 발명의 DdRp RNA 발현 카세트, CM_DdRp mRNA, SM_DdRp mRNA 및 CM/SM_DdRp mRNA 발현 카세트는 소위 "5' 캡(CAP)" 구조의 첨가에 의해 변형될 수 있다.
5'캡(cap)은 독립체, 일반적으로 성숙한 mRNA의 5'말단을 "덮는(caps)" 일반적으로 변형 독립체이다. 5'캡(cap)은 일반적으로 변형, 특히 구아닌 뉴클레오타이드의 유도체에 의해 형성될 수 있다. 바람직하게, 5'캡(cap)은 5'5'트리포스페이트 결합을 통해 5'말단에 연결된다. 5'캡(cap)은 메틸화될 수 있으며, 예를 들어, m7GpppN, 여기서 N은 5'캡(cap), 일반적으로 RNA의 5'말단을 운반하는 핵산의 말단 5' 뉴클레오타이드이다. m7GpppN은 폴리머라아제II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'캡(CAP) 구조이고, 따라서, 본 발명에 따른 CM/SM_mRNA에 포함된 SM으로서 간주되지 않는다. 이는 본 발명에 따른 CM/SM_mRNA는 5'캡(CAP)으로서 m7GpppN을 포함할 수 있는 것을 의미하지만, 추가적으로 SM_mRNAi는 본 원에 정의된 바와 같은 적어도 하나의 추가의 SM을 포함한다.
추가적인 5'캡(cap) 구조의 예로는 글리세릴, 역(inverted) 데옥시 무염기 잔기(성분), 4',5' 메틸렌 뉴클레오타이드, 1-(베타-D-에리스로퓨라노실)뉴클레오타이드, 4'-티오 뉴클레오타이드, 카보사이클릭 뉴클레오타이드, 1,5-안하이드로헥시톨 뉴클레오타이드, L-뉴클레오타이드, 알파-뉴클레오타이드, 화학적 변형된 염기 뉴클레오타이드, 트레오-펜토퓨라노실 뉴클레오타이드, 아사이클릭(acyclic) 3',4'-세코(seco) 뉴클레오타이드, 아사이클릭 3,4-디하이드록시부틸 뉴클레오타이드, 아사이클릭 3,5 디하이드록시펜틸 뉴클레오타이드, 3'3'역 뉴클레오타이드 성분, 3'3'역 무염기 성분, 3'2'-역 뉴클레오타이드 성분, 3'2'-역 무염기 성분, 1,4-부탄디올 포스페이트, 3'포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'포스페이트, 3'포스포로티오에이트, 포스포로디티오에이트, 또는 가교(bridging) 또는 비-가교(non-bridging) 메틸포스포네이트 성분을 포함한다. 이들 화학적 변형된 5'캡(CAP) 구조는 본 발명에 따른 SM_mRNAi에 포함된 적어도 하나의 SM으로 여겨진다.
특히 바람직한 화학적 변형된 5'캡(CAP) 구조는 CAP1(m7G 인접 뉴클레오타이드의 리보오스의 메틸화), CAP2(m7G의 제2 뉴클레오타이드 다운스트림의 리보오스의 메틸화), CAP3(m7G의 제3 뉴클레오타이드 다운스트림의 리보오스의 메틸화), CAP4(m7G의 제4 뉴클레오타이드 다운스트림의 리보오스의 메틸화), ARCA(항-역 캡(CAP) 유사체, 화학적 변형된 ARCA (e.g. phosphothioate modified ARCA), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-데아자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.
2. 화학적 변형(CM): 화학적 변형체(Chemical modifications)
용어 "RNA 화학적 변형"은 당 변형 또는 염기 변형뿐만 아니라 백본 변형을 포함하는 화학적 변형을 나타낼 수 있다.
본 발명의 화학적 변형 RNA 발현 카세트는 뉴클레오타이드 유사체/변형체, 예를 들어, 백본 변형체, 당 변형체 또는 염기 변형체를 함유할 수 있다. 본 발명과 관련된 백본 변형은 본원에 정의된 바와 같은 핵산 분자에 함유된 뉴클레오타이드의 백본의 포스페이트가 화학적으로 변형된 변형이다. 본 발명과 관련된 당 변형은 본원에 정의된 바와 같은 핵산 분자의 뉴클레오타이드의 당의 변형이다. 더욱이, 본 발명과 관련된 염기 변형은 핵산 분자의 핵산 분자의 뉴클레오타이드 염기 성분의 변형이다. 뉴클레오타이드 유사체 또는 변형체는 바람직하게 전사 및/또는 번역에 적용할 수 있는 뉴클레오타이드 유사체로부터 선택된다.
당 변형체(Sugar Modifications):
본 발명의 변형 RNA 내로 포함될 수 있는 화학적 변형된 뉴클레오사이드 및 뉴클레오타이드는 당 성분에서 화학적 변형될 수 있다. 예를 들어, 2' 하이드록실기(OH)는 상이한 수의 "옥시" 또는 "데옥시" 치환체와 함께 SM되거나 치환될 수 있다. "옥시" -2'하이드록실기 화학적 변형체의 예로는, 이에 한정되는 것은 아니지만, 알콕시 또는 아릴옥시(-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아르알킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -0(CH2CH2o)nCH2CH2OR; 2' 하이드록실이 예를 들어, 메틸렌 다리(methylene bridge)에 의해 동일한 리보오스 당의 4' 탄소에 연결된 "잠금(locked)" 핵산(LNA); 아미노기(-O-아미노, 여기서 아미노기 예를 들어, NRR은 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴 아미노, 헤테로아릴 아미노, 또는 디헤테로아릴 아미노, 에틸렌 디아민, 폴리아미노일 수 있다) 또는 아미노알콕시를 포함한다.
"데옥시" 변형체는 하이드로겐, 아미노(예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로사이클릴, 아릴아미노, 디아릴 아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노, 또는 아미노산); 또는 연결자(linker)를 통해 당에 부착될 수 있는, 여기서 상기 연결자는 원자, C, N 및 O 중 하나 이상의 원자를 포함하는 아미노기를 포함한다.
당기(sugar group)는 또한 리보오스 내 상응하는 탄소와 반대의 입체화학적 배열을 가지는 하나 이상의 탄소를 함유할 수 있다. 따라서, SM_mRNA는 예를 들어, 당으로서 아라비노스를 함유하는 뉴클레오타이드를 포함할 수 있다.
백본 변형체(Backbone Modifications):
포스페이트 백본은 또한, 본원에 설명된 바와 같이, 변형 RNA 내로 포함될 수 있는 변형된 뉴클레오사이드 및 뉴클레오타이드로 변형될 수 있다. 백본의 포스페이트기는 상이한 치환체를 갖는 하나 이상의 산소 원자를 치환함으로써 변형될 수 있다. 또한, 변형된 뉴클레오사이드 및 뉴클레오타이드는 본원에 설명된 바와 같은 변형된 포스페이트를 갖는 비화학적 변형된 포스페이트 성분의 총 치환을 포함할 수 있다. 변형된 포스페이트기의 예로는, 이에 한정되는 것은 아니지만, 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로겐 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 포스포로티오에이트는 황(sulfur)으로 치환된 모두 비-연결된 산소를 갖는다. 포스페이트 연결자는 또한 연결된 산소가 질소(가교 포스포로아미데이트), 황(가교 포스포로티오에이트) 및 탄소(가교 메틸렌-포스포네이트)의 치환에 의해 SM될 수 있다.
염기 변형체(base modifications):
본원에 설명된 바와 같이, 변형 RNA 내로 포함될 수 있는 화학적 변형된 뉴클레오사이드 및 뉴클레오타이드는 핵염기 성분(moiety)에서 추가로 SM될 수 있다. RNA에서 발견되는 핵염기의 예로는, 이에 한정되는 것은 아니지만, 아데닌, 구아닌, 사이토신 및 우라실이 포함된다. 예를 들어, 본원에 설명된 바와 같은 뉴클레오사이드 및 뉴클레오타이드는 주홈면(major groove face)에서 화학적으로 SM될 수 있다. 화학적 변형체는 아미노기, 티올기, 알킬기, 또는 할로기를 포함할 수 있다.
본 발명에서, 뉴클레오타이드 유사체/변형체는 염기 변형체로부터 선택되며, 이는 바람직하게 2-아미노-6-클로로퓨린리보사이드-5'트리포스페이트, 2-아미노퓨린-리보사이드-5'트리포스페이트; 2-아미노아데노신-5'트리포스페이트, 2'-아미노-2'-데옥시사이티딘-트리포스페이트, 2-티오사이티딘-5'트리포스페이트, 2-티오우리딘-5'트리포스페이트, 2'-플루오로티미딘-5'트리포스페이트, 2'-O-메틸 이노신-5'트리포스페이트 4-티오우리딘-5'트리포스페이트, 5-아미노알릴사이티딘-5'트리포스페이트, 5-아미노알릴우리딘-5'트리포스페이트, 5-브로모사이티딘-5'트리포스페이트, 5-브로모우리딘-5'트리포스페이트, 5-브로모-2'-데옥시사이티딘-5'트리포스페이트, 5-브로모-2'-데옥시우리딘-5'트리포스페이트, 5-요오도사이티딘-5'트리포스페이트, 5-요오도-2'-데옥시사이티딘-5'트리포스페이트, 5-요오도우리딘-5'트리포스페이트, 5-요오도-2'-데옥시우리딘-5'트리포스페이트, 5-메틸사이티딘-5'트리포스페이트, 5-메틸우리딘-5'트리포스페이트, 5-프로피닐-2'-데옥시사이티딘-5'트리포스페이트, 5-프로피닐-2'-데옥시우리딘-5'트리포스페이트, 6-아자사이티딘-5'트리포스페이트, 6-아자우리딘-5'트리포스페이트, 6-클로로퓨린리보사이드-5'트리포스페이트, 7-데아자아데노신-5'트리포스페이트, 7-데아자구아노신-5'트리포스페이트, 8-아자아데노신-5'트리포스페이트, 8-아지도아데노신-5'트리포스페이트, 벤지미다졸-리보사이드-5'트리포스페이트, N1-메틸아데노신-5'트리포스페이트, N1-메틸구아노신-5'트리포스페이트, N6-메틸아데노신-5'트리포스페이트, O6-메틸구아노신-5'트리포스페이트, 슈도우리딘-5'트리포스페이트, 또는 퓨로마이신-5'트리포스페이트, 잔토신-5'트리포스페이트로부터 선택된다. 5-메틸사이티딘-5'트리포스페이트, 7-데아자구아노신-5'트리포스페이트, 5-브로모사이티딘-5'트리포스페이트, 및 슈도우리딘-5'트리포스페이트로 이루어진 염기-CM의 군으로부터 선택된 염기 SM을 위한 뉴클레오타이드가 특히 바람직하다.
변형된 뉴클레오사이드는 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로피닐-우리딘, 1-프로피닐-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, l-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-l-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 디하이드로우리딘, 디하이드로슈도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘, 및 4-메톡시-2-티오-슈도우리딘을 포함한다.
변형된 뉴클레오사이드는 5-아자-사이티딘, 슈도이소사이티딘, 3-메틸-사이티딘, N4-아세틸사이티딘, 5-포밀사이티딘, N4-메틸사이티딘, 5-하이드록시메틸사이티딘, 1-메틸-슈도이소사이티딘, 피롤로-사이티딘, 피롤로-슈도이소사이티딘, 2-티오-사이티딘, 2-티오-5-메틸-사이티딘, 4-티오-슈도이소사이티딘, 4-티오-1-메틸-슈도이소사이티딘, 4-티오-1-메틸-1-데아자-슈도이소사이티딘, 1-메틸-1-데아자-슈도이소사이티딘, 제부라린, 5-아자-제부라린, 5-메틸-제부라린, 5-아자-2-티오-제부라린, 2-티오-제부라린, 2-메톡시-사이티딘, 2-메톡시-5-메틸-사이티딘, 4-메톡시-슈도이소사이티딘, 및 4-메톡시-l-메틸-슈도이소사이티딘을 포함한다.
변형된 뉴클레오사이드는 2-아미노퓨린, 2, 6-디아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노퓨린, 7-데아자-8-아자-2-아미노퓨린, 7-데아자-2,6-디아미노퓨린, 7-데아자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜테닐아데노신, N6-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐)아데노신, N6-글리시닐카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐카바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.
변형된 뉴클레오사이드는 이노신, 1-메틸-이노신, 와이오신(wyosine), 와이부토신(wybutosine), 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, l-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.
뉴클레오타이드는 SM될 수 있고 우라실의 C-5의 하이드로겐을 메틸기 또는 할로기로 교체하는 것을 포함할 수 있다.
변형된 뉴클레오사이드는 5'0-(l-티오포스페이트)-아데노신, 5'0-(1-티오포스페이트)-사이티딘, 5'0-(1-티오포스페이트)-구아노신, 5'0-(1-티오포스페이트)-우리딘 또는 5'0-(l-티오포스페이트)-슈도우리딘이다.
SM_mRNAi는 6-아자-사이티딘, 2-티오-사이티딘, α-티오-사이티딘, 슈도-이소-사이티딘, 5-아미노알릴-우리딘, 5-요오도-우리딘, N1-메틸-슈도우리딘, 5,6-디하이드로우리딘, α-티오-우리딘, 4-티오-우리딘, 6-아자-우리딘, 5-하이드록시-우리딘, 데옥시-티미딘, 5-메틸-우리딘, 피롤로-사이티딘, 이노신, α-티오-구아노신, 6-메틸-구아노신, 5-메틸-사이티딘, 8-옥소-구아노신, 7-데아자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 슈도-이소-사이티딘, 6-클로로-퓨린, N6-메틸-아데노신, α-티오-아데노신, 8-아지도-아데노신, 7-데아자-아데노신으로부터 선택된 뉴클레오사이드 화학적 변형체를 포함할 수 있다.
지질 변형체(Lipid modification):
본 발명의 변형 RNA는 지질 변형을 함유할 수 있다. 이와 같은 지질-변형 RNA는 일반적으로 본원에 정의된 바와 같은 RNA를 포함한다. 본 발명의 지질-변형 RNA 분자는 일반적으로 RNA 분자와 공유결합된 적어도 하나의 연결자, 및 각각의 연결자와 공유결합된 적어도 하나의 지질을 추가적으로 포함한다. 대신에, 지질-변형 RNA 분자는 본원에 정의된 바와 같은 적어도 하나의 RNA 분자 및 RNA 분자와 (연결자 없이) 공유결합된 적어도 하나의 (2 기능성) 지질을 포함한다. 세 번째 대안에 따라서, 지질-화학적 변형 RNA 분자는 본원에 정의된 바와 같은 RNA 분자, RNA 분자와 공유결합된 적어도 하나의 연결자, 및 각각의 연결자와 공유결합된 적어도 하나의 지질, 및 또한 RNA 분자와 (연결자 없이) 공유결합된 적어도 하나의 (2 기능성) 지질을 포함한다. 지질 변형은 선형 RNA 서열의 말단 끝에 존재하는 것이 특히 바람직하다.
3. 염기서열의 변형(SM)
오픈 리딩 프레임의 변형: G/C 함량의 변형:
본 발명의 SM_mRNAi는 적어도 하나의 펩타이드 또는 단백질을 코딩하는, 코딩 영역의 G/C 함량은 변형되고, 이의 특정 야생형 코딩 영역, 즉, 비변형 코딩 영역의 G/C 함량과 비교하였을 때 특히 증가된다. 코딩 역역의 아미노산 서열은 특정 야생형 코딩 영역의 코딩된 아미노산 서열과 비교하였을 때 변형되지 않는 것이 바람직하다.
본 발명에서 SM_mRNAi 코딩 영역의 G/C-함량의 변형은, 번역될 임의의 mRNA 영역의 서열이 mRNA의 효율적인 번역에 중요하다는 사실을 기초로 한다. 따라서, 다양한 뉴클레오타이드의 조성 및 서열은 중요하다. 특히 G(구아노신)/C(사이토신) 함량이 증가된 mRNA 서열은, A(아데노신)/U(우라실) 함량이 증가된 mRNA 서열보다 더욱 안정하다. 본 발명에 따르면, 지속적으로 아미노산 서열로 번역되고 있는 코딩 영역의 코돈은, 이 코돈 중 G/C 뉴클레오타이드의 양이 증가되었다는 점에서 이의 야생형 코딩 영역의 코돈과는 상이하다. 몇몇 코돈은 하나의 동일한 아미노산을 코딩한다는 사실(소위 유전적 암호의 축퇴성(degeneration))에 비추어, 안정성에 가장 유리한 코돈이 결정될 수 있다(소위 대안적 코돈 선호도(alternative codon usage)).
본 발명에서 SM_mRNAi의 코딩 영역에 의해 코딩될 아미노산에 따라서, 이의 야생형 코딩 영역과 비교할 때 RNA 서열, 예를 들어, 코딩 영역의 변형에 대한 다양한 가능성이 존재한다. 오직 G 또는 C 뉴클레오타이드만을 함유하는 코돈에 의해 코딩된 아미노산의 경우, 코돈의 변형은 필요하지 않다. 따라서, A 또는 U가 존재하지 않기 때문에, Pro(CCC 또는 CCG), Arg(CGC 또는 CGG), Ala(GCC 또는 GCG) 그리고 Gly (GGC 또는 GGG)에 대한 코돈은 변형이 필요하지 않다.
대조적으로, A 및/또는 U 뉴클레오타이드를 함유하는 코돈은, 동일한 아미노산을 코딩하지만 A 및/또는 U를 함유하지 않는 다른 코돈의 치환에 의해 변형될 수 있으며, 이들의 예로는 다음과 같다:
Pro에 대한 코돈은 CCU 또는 CCA에서 CCC 또는 CCG로 변형될 수 있고;
Arg에 대한 코돈은 CGU 또는 CGA 또는 AGA 또는 AGG에서 CGC 또는 CGG로 변형될 수 있으며;
Ala에 대한 코돈은 GCU 또는 GCA에서 GCC 또는 GCG로 변형될 수 있고;
Gly에 대한 코돈은 GGU 또는 GGA에서 GGC 또는 GGG로 변형될 수 있다.
다른 경우에서, 비록 A 또는 U 뉴클레오타이드가 코돈으로부터 제거될 수 없다고 하더라도, 더욱 적은 함량의 A 및/또는 U 뉴클레오타이드를 함유하는 코돈을 사용함으로써 A 및 U 함량이 감소할 수 있다. 이들의 예로는 다음과 같은 경우가 있다:
Phe에 대한 코돈은 UUU에서 UUC로 변형될 수 있고;
Leu에 대한 코돈은 UUA, UUG, CUU 또는 CUA에서 CUC 또는 CUG로 변형될 수 있으며;
Ser에 대한 코돈은 UCU 또는 UCA 또는 AGU에서 UCC, UCG 또는 AGC로 변형될 수 있고;
Tyr에 대한 코돈은 UAU에서 UAC로 변형될 수 있으며;
Cys에 대한 코돈은 UGU에서 UGC로 변형될 수 있고;
His에 대한 코돈은 CAU에서 CAC로 변형될 수 있으며;
Gln에 대한 코돈은 CAA에서 CAG로 변형될 수 있고;
Ile에 대한 코돈은 AUU 또는 AUA에서 AUC로 변형될 수 있으며;
Thr에 대한 코돈은 ACU 또는 ACA에서 ACC 또는 ACG로 변형될 수 있고;
Asn에 대한 코돈은 AAU에서 AAC로 변형될 수 있으며;
Lys에 대한 코돈은 AAA에서 AAG로 변형될 수 있고;
Val에 대한 코돈은 GUU 또는 GUA에서 GUC 또는 GUG로 변형될 수 있으며;
Asp에 대한 코돈은 GAU에서 GAC로 변형될 수 있고;
Glu에 대한 코돈은 GAA에서 GAG로 변형될 수 있으며;
종결 코돈 UAA는 UAG 또는 UGA로 변형될 수 있다.
한편, Met(AUG) 및 Trp(UGG)에 대한 코돈의 경우, 서열 변형 가능성은 없다.
본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량을, 특정 야생형 코딩 영역(즉 원래의 서열)의 G/C 함량에 비해 증가시키기 위해서는, 상기 나열된 치환들은 개별적으로 적용될 수 있거나, 가능한 임의의 조합으로 적용될 수 있다. 따라서, 예를 들어 야생형 서열에서 발생하는 Thr에 대한 모든 코돈은 ACC(또는 ACG)로 변형될 수 있다.
바람직하게 본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량은, 야생형 코딩 영역의 G/C 함량에 비하여 7% 이상, 더욱 바람직하게 15% 이상, 특히 바람직하게 20% 이상 증가된다. 병원성 항체 또는 절편, 이의 변이체 또는 유도체를 포함하는 적어도 하나의 펩타이드 또는 단백질을 하나 이상을 코딩하는 코딩 영역에서 치환 가능한 코돈들 중 5%, 10%, 20%, 30%, 40%, 50%, 60% 이상, 더욱 바람직하게는 70% 이상, 더욱 더 바람직하게는 80% 이상, 그리고 가장 바람직하게는 90% 이상, 95% 이상 또는 심지어 100%가 치환되며, 이로써 상기 코딩 영역의 G/C 함량이 증가하게 된다.
특히 바람직하게, 본 발명에서 SM_mRNAi의 코딩 영역의 G/C 함량은, 야생형 코딩 영역의 G/C 함량에 비하여 최대값(즉, 치환 가능한 코돈의 100%)만큼 증가할 수 있다.
코돈 최적화(Codon optimization):
본 발명에서 SM_mRNAi의 적어도 하나의 펩타이드 또는 단백질을 코딩하는 코딩 영역의 추가적인 바람직한 변형은 번역 효율이 세포 내 tRNA의 출현의 상이한 빈도에 의해 또한 결정된다는 발견에 기초한다. 따라서, 만약, 소위 "희귀(rare) 코돈"이 야생형 RNA 서열의 코딩 영역에 증가된 정도로 존재하면, 상대적으로 "빈번한(frequent)" tRNA를 코딩하는 코돈이 존재하는 경우보다 현저히 낮은 정도로 번역된다.
SM_mRNAi의 코딩 영역은 바람직하게 상응하는 야생형 코딩 영역과 비교하여 변형되는 결과, 적어도 하나의 세포 내에서 상대적으로 희귀한 tRNA를 코딩하는 야생형 서열의 코돈은, 세포 내에서 상대적으로 빈번한 tRNA를 코딩하고 상대적으로 희귀한 tRNA로서 동일한 아미노산을 운반하는 코돈으로 치환된다. 이러한 변형에 의해, 본 발명의 SM_mRNAi의 코딩 영역은 변형되는 결과, 빈번하게 발생하는 tRNA를 이용하기 위한 코돈이 삽입된다. 다시 말해서, 본 발명에 따르면, 이러한 변형에 의해 세포 내에서 상대적으로 희귀한 tRNA를 코딩하는 야생형 코딩 영역의 모든 코돈은 각각의 경우에서 세포 내에서 상대적으로 빈번한 tRNA를 코딩하는 코돈으로 치환될 수 있고, 각각의 경우에서 상대적으로 희귀한 tRNA로서 아미노산을 운반할 수 있다.
어떤 tRNA가 세포 내에서 상대적으로 빈번하게 발생하는지, 그리고 이와는 대조적으로 어떤 tRNA가 상대적으로 희귀하게 발생하는지는 통상의 기술자에게 알려져있다. 특정 아미노산을 위해 사용하는 가장 빈번하게 발생하는 tRNA, 예를 들어, (인간) 세포내에서 가장 빈번하게 발생하는 tRNA를 사용하는 Gly 코돈이 특히 바람직하다.
본 발명의 SM_mRNAi의 코딩 영역 내에 특히 최대로 증가된 서열 G/C 함량을, RNA 서열의 코딩 영역에 의해 코딩된 펩타이드 또는 단백질의 아미노산 서열이 변형되지 않은 "빈번한" 코돈과 연관짓는 것이 특히 바람직하다. 특히 효율적으로 번역 및 안정화된(화학적 변형된) RNA 서열을 제공한다.
UTR의 변형:
바람직하게, 본 발명의 SM_mRNAi는 적어도 하나의 화학적 변형된 5' 및/또는 3' UTR 서열을 갖는다. 이들 5' 및/또는 3' UTR 내 변형은 세포 기질 내 RNA의 반감기를 증가시키는 효과를 가질 수 있거나 번역 효율을 증가시킬 수 있고 따라서 코딩된 단백질 또는 펩타이드의 발현을 향상시킬 수 있다. 이들 UTR 서열은 바이러스, 박테리아 및 진핵생물에서 발생한 자연적으로 발생하는 서열과 100% 서열 상동성을 가질 수 있으나, 부분적이거나 전체적으로도 합성될 수 있다.
본 발명에 따른 SM_mRNAi는 바람직하게 5' 및/또는 3' UTR 요소, 특히 TOP 유전자의 5'UTR로부터 또는 이의 절편, 동족체 또는 변이체로부터 유래된 핵산을 포함하거나 이로 이루어진 5'UTR 요소, 또는 안정한 mRNA를 제공하는 유전자로부터, 또는 이의 동족체, 절편 또는 변이체로부터 유래할 수 있는 5' 및/또는 3'UTR 요소; 히스톤-스템-루프 구조, 바람직하게는 이의 3' 비번역 영역 내 히스톤-스템-루프; 5'캡(CAP) 구조; 폴리-A 꼬리; 또는 폴리(C) 서열을 포함하는 군에서 적어도 하나의 구조적 요소를 포함한다.
본 발명에 따른 SM_mRNAi는 적어도 하나의 5' 또는 3'UTR 요소를 포함한다. UTR 요소는 임의의 자연적으로 발생하는 5' 또는 3'UTR로부터 유래되거나, 유전자의 5' 또는 3'UTR의 절편, 동족체 또는 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다. 바람직하게, 본 발명에 따라 사용된 5' 또는 3'UTR 요소는 본 발명에 따른 SM_mRNAi의 코딩 영역에 이종(heterologous)이다. 자연적으로 발생하는 유전자로부터 유래된 5' 또는 3'UTR 요소가 바람직하다 하더라도, 본 발명에서 합성적으로 조작된(engineered) UTR 요소도 사용될 수 있다.
본 발명에 따른 SM_mRNAi의 서열은 TOP 유전자의 5'UTR로부터 유래되거나 TOP 유전자의 5'UTR의 절편, 동족체 또는 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어지는 적어도 하나의 5'비번역 영역 요소(5'UTR 요소)를 포함할 수 있다.
TOP 유전자의 5'UTR로부터 유래된 5'UTR 요소의 핵산 서열은 유전자 또는 mRNA의 시작 코돈(예를 들어, A(U/T)G)의 업스트림 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 자리에 위치한 뉴클레오타이드와 함께 이의 3'말단에서 종결된다. 따라서, 5'UTR 요소는 단백질 코딩 영역의 임의의 부분을 포함하지 않는다. 따라서, 바람직하게, 오직 본 발명에 따른 SM_mRNAi의 단백질 코딩 부분은 코딩 영역에 의해 제공된다.
TOP 유전자의 5'UTR로부터 유래된 핵산 서열은 진핵생물 TOP 유전자로부터 유래되고, 바람직하게는 식물 또는 동물 TOP 유전자, 더욱 바람직하게는 척색동물 TOP 유전자, 더욱 더 바람직하게는 척추동물 TOP 유전자, 가장 바람직하게는 인간 TOP 유전자와 같은 포유동물 TOP 유전자로부터 유래된다.
본 발명에 따른 SM_mRNAi는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더욱 바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR로부터 유래되거나, 척색동물 유전자, 바람직하게는 척추동물 유전자, 더욱 바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진 적어도 하나의 3'UTR 요소를 추가로 포함한다.
용어 '3'UTR 요소'는 3'UTR로부터 유래되거나 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진 핵산 서열을 나타낸다. 본 발명의 의미에서, 3'UTR 요소는 mRNA의 3'UTR을 대표할 수 있다. 따라서, 본 발명의 의미에서, 바람직하게, 3'UTR 요소는 mRNA, 바람직하게는 인공 mRNA의 3'UTR 일 수 있고, 또한 이는 mRNA의 3'UTR을 위한 전자 주형일 수 있다. 따라서, 3'UTR 요소는 바람직하게 mRNA의 3'UTR, 바람직하게는 인공 mRNA, 예컨대 유전적으로 조작된 벡터 plasmid의 전사에 의해 수득된 mRNA의 3'UTR에 상응하는 핵산 서열이다. 바람직하게, 3'UTR 요소는 3'UTR의 기능을 실현하거나 3'UTR의 기능을 실현하는 서열을 코딩한다.
독창적인 mRNA는 (안정한 mRNA를 제공하는) 반감기가 향상된 mRNA와 관련된 유전자로부터 유래될 수 있는 3'UTR 요소를 포함하며, 예를 들어, 하기 정의 및 설명된 바와 같은 3'UTR 요소이다.
3'UTR 요소는 알부민 유전자, α-글로빈 유전자, β-글로빈 유전자, 타이로신 하이드록실라아제유전자, 리폭시게나아제유전자, 및 콜라겐 알파 유전자, 예컨대 콜라겐 알파 1(I) 유전자로 이루어진 군으로부터 선택되는 유전자의 3'UTR로부터 유래되거나, 알부민 유전자, α-글로빈 유전자, β-글로빈 유전자, 타이로신 하이드록실라아제유전자, 리폭시게나아제유전자, 및 콜라겐 알파 유전자, 예컨대 콜라겐 알파 1(I) 유전자로 이루어진 군으로부터 선택되는 유전자의 3'UTR의 변이체로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다. 3'UTR 요소는 알부민 유전자, 바람직하게는 척추동물 알부민 유전자, 더욱 바람직하게는 포유동물 알부민 유전자일 수 있다,
가장 바람직하게는 인간 알부민 유전자의 3'UTR로부터 유래된 핵산 서열, 서열번호 6을 포함하거나 이로 이루어진다.
인간 알부민 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACCA TGAGAATAAG AGAAAGAAAA TGAAGATCAA AAGCTTATTC ATCTGTTTTT CTTTTTCGTT GGTGTAAAGC CAACACCCTG TCTAAAAAAC ATAAATTTCT TTAATCATTT TGCCTCTTTT CTCTGTGCTT CAATTAATAA AAAATGGAAA GAATCT (서열번호 6)
본 발명에 따른 SM_mRNAi는 다른 핵산으로부터 유래된 상응하는 RNA 또는 이의 절편, 동족체 또는 변이체를 포함하는 3'UTR 요소를 포함하는 것이 특히 바람직하다.
가장 바람직하게, 3'UTR 요소는 서열번호 6에 따른 인간 알부민 유전자의 절편으로부터 유래된 핵산 서열, 서열번호 7을 포함한다.
알부민 3'UTR: CATCACATTT AAAAGCATCT CAGCCTACC ATGAGAATAA GAGAAAGAAA ATGAAGATCA ATAGCTTATT CATCTCTTTT TCTTTTTCGT TGGTGTAAAG CCAACACCCT GTCTAAAAAA CATAAATTTC TTTAATCATT TTGCCTCTTT TCTCTGTGCT TCAATTAATA AAAAATGGAA AGAACCT (서열번호 7).
본 발명의 독창적인 mRNA의 3'UTR 요소는 서열번호 6에 따른 핵산 서열의 상응하는 RNA 서열을 포함하거나 이로 이루어지는 것이 XRMGL 바람직하다.
3'UTR 요소는 α-글로빈 유전자, 바람직하게는 척추동물 α- 또는 β-글로빈 유전자, 더욱 바람직하게는 포유동물 α- 또는 β-글로빈 유전자, 가장 바람직하게는 서열번호 6 내지 7에 따른 인간 α- 또는 β-글로빈 유전자의 3'UTR로부터 유래된 핵산 서열을 포함하거나 이로 이루어진다.
3'UTR 요소는 호모 사피엔스 헤모글로빈, 알파 1(HBA1), 알파 2(HBA2) 및 베타(HBB) 유전자의 3'UTR로부터 유래된 핵산 서열 서열번호 8 내지 10을 포함하거나 이로 이루어진다.
호모 사피엔스 헤모글로빈, 알파 1(HBA1)의 3'UTR: GCTGGAGCCT CGGTGGCCAT GCTTCTTGCC CCTTGGGCCT CCCCCCAGCC CCTCCTCCCC TTCCTGCACC CGTACCCCCG TGGTCTTTGA ATAAAGTCTG AGTGGGCGGC (서열번호 8)
호모 사피엔스 헤모글로빈, 알파 2(HBA2)의 3'UTR: GCTGGAGCCT CGGTAGCCGT TCCTCCTGCC CGCTGGGCCT CCCAACGGGC CCTCCTCCCC TCCTTGCACC GGCCCTTCCT GGTCTTTGAA TAAAGTCTGA GTGGGCAG (서열번호 9)
호모 사피엔스 헤모글로빈, 베타(HBB)의 3'UTR: GCTCGCTTTC TTGCTGTCCA ATTTCTATTA AAGGTTCCTT TGTTCCCTAA GTCCAACTAC TAAACTGGGG GATATTATGA AGGGCCTTGA GCATCTGGAT TCTGCCTAAT AAAAAACATT TATTTTCATT GC (서열번호 10)
예를 들어, 3'UTR 요소는 바람직하게는 서열번호 7에 따른 인간 α-글로빈 유전자와 같은 α-글로빈 유전자의 3'UTR의 중심, α-복합-결합 부분을 포함하거나 이로 이루어질 수 있다:
중심, α-글로빈 유전자의 3'UTR의 α-복합-결합 부분(또한 "muag"로서 본원에 명명됨); GCCCGATGGG CCTCCCAACG GGCCCTCCTC CCCTCCTTGC ACCG (서열번호 11).
본 발명에 따른 SM_mRNAi의 3'UTR 요소는 서열번호 7에 따른 핵산 서열의 상응하는 RNA 서열 또는 이의 동족체, 절편 또는 변이체를 포함하거나 이로 이루어지는 것이 특히 바람직하다.
바람직하게, 적어도 하나의 5'UTR 요소 및 적어도 하나의 3'UTR 요소는 상기 설명된 바와 같은 본 발명에 따른 SM_mRNAi 유래 단백질 생산을 증가시키는데 상승적인 역할을 한다. 더욱 바람직하게, 적어도 하나의 5'UTR 요소 및/또는 적어도 하나의 3'UTR 요소는 단백질 생산을 증가시키기 위해서 SM_mRNAi의 주입과 함께 상승적인 역할을 한다.
본 발명에 따른 SM_mRNAi는 - 적어도 하나의 변형을 첨가하여 - 내부 리보솜 유입점(internal ribosome entry site)(IRES) 서열 또는 IRES-모티프를 추가로 포함할 수 있고, 예를 들어, 만약 SM_mRNAi가 2 이상의 펩타이드 또는 단백질을 코딩하면 여러 오픈 리딩 프레임으로 분리될 수 있다. IRES-서열은 만약 mRNA가 바이- 또는 멀티시스트론 RNA라면 특히 도움이 될 수 있다.
본 발명에서 사용된 바와 같이, 용어 "RNA"는 한정되지 않고 임의의 리보 핵산을 나타낸다. 따라서, 용어 RNA는 예를 들어, 바이러스 RNA, (replicon) 또는 mRNA로서 코딩 RNA로서 기능하는 리보 핵산에, 또는 임의의 유형의 인공 RNA 발현 카세트에 동등하게 적용한다.
본 발명에 따르면, mRNAi는 RNA의 코딩 영역에 의해 코딩된 펩타이드 또는 단백질의 발현을 증가시키는 적어도 하나의 변형을 포함한다. 본 발명에 따른 mRNAi는 본원에 정의된 바와 같은 변형 중 적어도 하나의 유형을 포함한다. 대신에, 또는 다른 유형의 변형과 조합하여, 본원에 정의된 바와 같은 특정 변형, 예컨대 3'UTR, 히스톤 스템-루프 또는 폴리 C 서열은 또한 본 발명에 따른 SM_mRNAi에 하나 이상의 복제물(copy)로 존재할 수 있다. 이는 바이- 또는 멀티시스트론 RNA에 대해 특히 마찬가지이다. 본 발명에 따른 SM_mRNAi는 여러 별개의 변형의 조합을 포함할 수 있으며, 예컨대, 임의의, 예를 들어, 5'UTR, 폴리 C 서열, 폴리 A 서열, 3'UTR 또는 히스톤 스템-루프와 GC-풍부(GC-enrichment)를 조합한 변형, 여기서 각각 별개의 변형은 RNA 당 단일 복제물의 형태 또는 RNA 당 다수의 복제물 형태로 존재할 수 있다.
RNA의 3'말단의 변형:
더욱이, 투여될 적어도 하나의 오픈 리딩 프레임을 포함하는 SM_mRNAi에 있어서, 코딩 영역의 3' 영역은 예를 들어, 아데닌 또는 사이토신 잔기의 다중 반복 스트레치의 삽입 또는 첨가에 의해 변형될 수 있다. RNA 분자의 3' 말단은 아데닌 뉴클레오타이드의 시리즈(series)("폴리(A) 꼬리")의 첨가에 의해 화학적 변형된다.
폴리(A) 꼬리의 길이는 plasmid를 구성하는 각각의 번역 효율에 주요한 영향을 갖는다. 효율적으로 번역되기 위해, 외생적으로(exogenously) 전달되는 mRNA의 폴리(A) 꼬리는 적어도 20개 A 잔기로 이루어져야 한다. 게다가, mRNA 발현은 폴리(A) 꼬리의 길이와 긍정적 상관관계가 있다고 설명되어 있다. 120개 뉴클레오타이들로 측정된 폴리(A) 꼬리가 더 짧은 것에 비해 mRNA 안정성 및 번역 효율이 향상되는 것을 보여준다. 본 발명의 SM_mRNAi는 폴리(A) 꼬리를 (선택적으로 다른 변형과 조합하여) 포함하고, 여기서 폴리(A) 꼬리는 적어도 30개, 바람직하게는 50개를 초과하는, 더욱 바람직하게는 100개를 초과하는, 더욱 더 바람직하게는 200개를 초과하는 아데노신 뉴클레오타이드를 포함한다. 가장 바람직하게는, RNA는 64개 아데노신 뉴클레오타이드로 이루어진 폴리(A) 꼬리를 포함한다.
폴리(A) 꼬리가 30개 아데노신보다 길다면, 바람직하게는 50개 아데노신보다 길다면, 더욱 바람직하게는 100개 아데노신보다 길다면, 그리고 더욱 더 바람직하게는 200개 아데노신보다 길다면, 폴리(A) 꼬리는 단지 본 발명에 따른 SM_mRNAi에 포함된 적어도 하나의 변형으로서 고려된다.
폴리(A) 꼬리의 변형은 본 발명에 따른 SM_mRNAi의 적어도 하나의 변형으로 간주되지 않는다. 이는 본 발명에 따른 SM_mRNAi는 상기 정의된 바와 같은 폴리(A) 꼬리를 포함할 수 있지만, 본 발명의 적어도 하나의 추가적인 변형을 포함할 수 있는 것을 의미한다.
적어도 하나의 오픈 리딩 프레임을 포함하는 SM_mRNAi는 RNA의 코딩 영역의 영역 3'에 폴리(C) 서열을 (선택적으로 다른 변형과 조합하여) 포함한다. 폴리(C) 서열은 일반적으로 다수의 사이토신 뉴클레오타이드, 일반적으로 약 10 내지 약 200개 사이티딘 뉴클레오타이드, 바람직하게는 약 10 내지 약 100개 사이티딘 뉴클레오타이드, 더욱 바람직하게는 약 10 내지 약 70개 사이티딘 뉴클레오타이드 또는 더욱 더 바람직하게는 약 20 내지 약 50개 또는 심지어 약 20 내지 약 30개 사이티딘 뉴클레오타이드의 스트레치(stretch)이다. 폴리(C) 서열은 바람직하게는 핵산에 의해 코딩 영역의 3'에 위치할 수 있다. 본 발명의 폴리(C) 서열은 폴리(A) 서열의 3'에 위치한다.
본 발명에 따른 SM_mRNAi는 적어도 하나의 변형으로서 이의 3' 말단에 히스톤 스템-루프를 포함하거나 코딩한다.
히스톤 스템-루프 서열을 위한 특히 바람직한 실시예는 서열번호 12 (CAAAGGCTCTTTTCAGAGCCACCA)에 따른 서열 또는 서열번호 13 (CAAAGGCUCUUUUCAGAGCCACCA)에 따른 상응하는 RNA 서열이다.
이종 핵산 서열
본 발명의 유전체 편집 RNA/DNA 시스템에 포함되는 발현 카세트는 추가로 바이러스 유래가 아닌 적어도 하나의 핵산 서열, 특히 바이러스가 아닌 핵산 서열을 포함한다. 바람직한 실시형태에서, 본 발명에 따른 발현 카세트는 이종 핵산 서열을 포함한다.
용어 "이종"은 핵산 서열이 바이러스 발현 제어 서열, 특히 바이러스 DdRp가 결합하는 프로모터와 같은 바이러스 핵산 서열에 천연 기능적으로 결합되지 않는 상황을 의미한다. 이종 핵산 서열은 레플리콘의 핵산 서열에 포함된다.
바람직하게는, 이종 핵산 서열은 DdRp가 결합하는 프로모터, 바람직하게는 바이러스 DdRp가 결합하는 프로모터의 제어 하에 있고, 보다 바람직하게는, 이종 핵산 서열은 DdRp가 결합하는 프로모터의 하류에 위치한다. 바이러스 DdRp가 결합하는 프로모터는 매우 효율적이어서 높은 수준의 이종 유전자 발현에 적합하다. 바람직하게는, DdRp가 결합하는 프로모터는 이종 핵산 서열 또는 그의 일부의 전사체를 포함하는 전사체의 생산을 제어한다.
바람직하게는, DdRp가 결합하는 프로모터는 바이러스의 구조 단백질에 대한 프로모터이다. 이것은 DdRp가 결합하는 프로모터가 바이러스에 고유하고 상기 바이러스에서 하나 이상의 구조 단백질의 코딩 서열의 전사를 제어하는 프로모터라는 것을 의미한다. 본 발명에 따르면, 이종 핵산 서열은 바이러스 구조 단백질을 코딩하는 핵산 서열과 같은 바이러스 핵산 서열을 부분적으로 또는 완전히 대체할 수 있다. 바람직하게는, 이종 핵산 서열은 바이러스로부터 유래되지 않으며; 특히, 이종 핵산 서열은 DdRp가 결합하는 프로모터가 유래된 바이러스와 동일한 바이러스로부터 유래되지 않는 것이 바람직하다.
Ⅳ. 유전체 편집 도구
본 발명에서 DNAge 발현 카세트는 유전체 편집 도구를 코딩하는 DNA 절편을 포함한다. 상기 유전체 편집 도구는 표적화 엔도뉴클레아제및 가이드 핵산이다. 본 발명의 DNAge 발현 카세트는 표적화 엔도뉴클레아제을 코딩하는 DNAen 발현 카세트 및 가이드 핵산을 코딩하는 DNAsg 발현 카세트를 적어도 하나 이상을 포함할 수 있다.
본 발명에서 유전체 편집 도구를 코딩하는 DNA는 동의어로 "DNAge"라고 한다. DNA는 바람직하게는 DdRp가 결합하는 프로모터의 제어 하에 본 발명에 따른 발현 카세트 상에 존재한다.
기존 유전체 편집 CRISPR/Cas9 시스템은 플라스미드, 렌티 바이러스, 아데노 관련 바이러스 및 리보 핵 단백질(RNP) 복합체를 포함한 다양한 형태로 세포에 전달될 수 있다. CRISPR/Cas9 리보 핵 단백질 (RNP) 시스템은 Cas9 단백질과 단일 가이드 RNA (sgRNA) 또는 CRISPR RNA (crRNA) : trans-activating crRNA (tracrRNA) duplex로 구성된다.
crRNA는 게놈 표적에 대해 상보적으로 설계된 20개의 nt RNA 올리고 뉴클레오티드이다. crRNA 시퀀스 디자인은 표준 gRNA 디자인 원칙을 활용하며 gRNA 데이터베이스에서 쉽게 선택하거나 gRNA 디자인 도구를 사용하여 사용자 정의할 수 있다.
tracrRNA는 crRNA 및 Cas9 뉴클레아제와 함께 활성화된 CRISPR/Cas9 RNP 복합체를 형성하는 67nt RNA 올리고뉴클레오타이드이다. sgRNA는 표적 게놈 서열을 식별할 수 있는 crRNA 서열과 Cas9 단백질과 복합체를 형성할 수 있는 tracrRNA 서열을 모두 포함하는 단일 RNA 올리고이다.
sgRNA 또는 crRNA:tracrRNA 듀플렉스가 Cas9 단백질과 복합체를 형성 할 때, 이들은 함께 프로토스페이서 인접 모티프 (protospacer adjacent motif, PAM) 서열(5'NGG-3')로부터 3-4 bp 업스트림, 20 nt 가이드 RNA 서열에 상보적인 유전자좌에서 이중 가닥 파손을 생성할 수 있다.
본 발명의 DNAge 발현 카세트를 구성하는 가이드 핵산을 코딩하는 DNA(DNAgn)는 가이드 핵산 분자를 전사하는 단위이다. 가이드 핵산, 에를 들면 gRNA를 포함한다. "가이드 RNA" 및 "gRNA"는 본 발명에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 CRISPR RNA (crRNA)와 트랜스-코딩된 CRISPR RNA (tracrRNA, scaffold RNA)로 구성된 RNA 키메라 분자이며, crRNA는 혼성화하기 위한 타겟 서열에 충분히 상보적이며; CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 이 서열은 19-22개의 뉴클레오티드 길이이며, 예를 들어 타겟에 상보적인 20개의 연속 뉴클레오티드이며, 전형적으로 sgRNA 분자의 5' 말단에 위치한다. crRNA는 타겟 서열과 100% 상보적일 수 있지만, 본 발명에서는 타겟 서열과의 전체 상보성 적어도 80%, 85%, 90% 및 95%도 고려한다. tracrRNA는 100-300개의 뉴클레오티드 길이이며, 뉴클레아제에 대한 결합 부위로서, 예를 들어, Cas9 단백질은 CRISPR/Cas9 복합체를 형성하도록 한다. 바람직하게, tracrRNA는 Scaffold Template-specific sequence로 21개의 뉴클레오타이드 길이이며 Cas9과 복합체를 이루는 서열이다.
그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘 다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.
본 발명에 따른 DNAsg 발현 카세트는 단일 가이드 핵산 또는 다중 가이드 핵산를 코딩할 수 있다. 다중 가이드 핵산은 단일 가이드 핵산(융합 표가이드 핵산) 또는 별도의 가이드 핵산로서 코딩될 수 있다. DNAge 발현 카세트가 별도의 다중 가이드 핵산으로 코딩되는 경우, 이들 중 하나 이상에 Csy4 ribonuclease sequences 및 Cys4 ribonucleae 시스템 또는 추가적인 바이러스 프로모터 요소가 제공될 수 있다.
본 발명에서 DNAsg 발현 카세트는 둘 이상의 가이드 핵산을 포함할 수 있으며, 이들 각각은 DdRp가 결합하는 프로모터의 제어 하에 있다. 이러한 다중 가이드 핵산 DNAsg 발현 카세트에서 다중 가이드 핵산 sgRNA가 제조될 것이고, 각각의 자가 DdRp가 결합하는 프로모터에 의해 개시되는 multiple gRNA 발현 카세트이 있다.. 또한, 하나의 자가 DdRp가 결합하는 프로모터에 의해 합성된 polycistronic tRNA-gRNA 발현 카세트가 있다.
본 발명의 시스템의 이점은 바이러스 구조 단백질을 코딩하는 헬퍼 바이러스의 존재 또는 투여를 필요로 하지 않는다는 것이다.
상기 유전체 편집 도구는 메가뉴클레아제(meganuclease); 징크-핑거 뉴클레아제(zinc-finger nucleases, ZFNs) ; TAL-이펙터 뉴클레아제(TAL-effector nucleases, TALENs); RNA-guided 엔도뉴클레아제; DNA-guided 엔도뉴클레아제; 및 M-MLV 역전사 효소와 Cas9 H840A nickase의 융합 단백질;를 포함하며 이들 대한 구체적인 내용은 다음과 같다.
1. RNA-가이드된 엔도뉴클레아제
본 발명에서 유전체 편집 도구가 RNA-guided 엔도뉴클레아제인 경우, 표적화 엔도뉴클레아제는 "Cas9 뉴클레아제" 및 "Cas9"이며, 본 발명에서 상호 호환적으로 사용되며, Cas 단백질 또는 이의 단편 (예, Cas9의 활성형의 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질) 등의, RNA-가이드된 엔도뉴클레아제(RNA guided endonuclease)를 지칭한다. Cas9은 가이드 RNA의 안내 하에 DNA 타겟 서열을 타겟팅 및 절단하여 DNA 이중 가닥 절단 (DSB)을 형성하는, CRISPR/Cas (규칙적으로 반복되는 짧은 회문구조 반복체 클러스터 및 이의 부속 시스템) 유전체 편집 시스템의 구성 성분이다.
"가이드 RNA" 및 "gRNA"는 본 발명에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 CRISPR RNA (crRNA)와 트랜스-코딩된 CRISPR RNA (tracrRNA)로 구성된 RNA 키메라 분자이며, crRNA는 혼성화하기 위한 타겟 서열에 충분히 상보적이며; CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 이 서열은 19-22개의 뉴클레오티드 길이이며, 예를 들어 타겟에 상보적인 20개의 연속 뉴클레오티드이며, 전형적으로 sgRNA 분자의 5' 말단에 위치한다. crRNA는 타겟 서열과 100% 상보적일 수 있지만, 본 발명에서는 타겟 서열과의 전체 상보성 적어도 80%, 85%, 90% 및 95%도 고려한다. tracrRNA는 100-300개의 뉴클레오티드 길이이며, 뉴클레아제에 대한 결합 부위로서, 예를 들어, Cas9 단백질은 CRISPR/Cas9 복합체를 형성한다.
그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘 다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.
sgRNA를 암호화하는 DNA 서열은 다음과 같이 설계 될 수 있다(센스 가닥 표시) :
5'GAAATTAATACGACTCACTATA GGN 18 GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT 3' (서열번호 14).
초기 22 bp (이탤릭체로 표시됨)는 시험관내 전사에 사용된 T7 RNA 폴리머라제의 프로모터이다. 그 뒤에 GGN18 시퀀스 (밑줄이 쳐짐)가 나타나며, 대상 (스페이서) 시퀀스와 일치하는 20 bp를 나타낸다. 절단은 표적 DNA의 두 가닥 모두에서 이 서열의 3' 말단 내에서 3 개의 염기를 발생시킨다. 초기 GG 디뉴클레오티드는 절단을 달성하는 데 필요하지 않지만, T7 RNA 폴리머라제에 의한 시험관내 전사를 최적화하기 위해 포함된 것이다. 이들 처음 두 뉴클레오티드에서는 약간의 변이가 허용할 수 있어 전사 효율은 감소된다.
sgRNA와 동일한 의미를 갖는 표적 DNA 가닥은 스페이서와 일치하는 20 bp의 3' 말단을 즉시 삼중 항 NGG로 운반해야 한다. NAG는 또한 S. 파이오게네스 Cas9에 의해 견딜 수 있지만 효율이 떨어진다. 따라서, 표적은 서열 GGN18NGG를 갖는다. 나머지 80 bp (굵은 체 유형)는 crRNA 및 tracrRNA의 키메라 융합을 코딩한다. 더 짧은 sgRNA 세그먼트는 시험관내 및 생체 내에서 효과가 있었지만, 덜 효율적인 것으로 보인다. 추가 테스트를 통해 효율성이 향상된 변형 버전을 확인할 수 있지만 이 세그먼트는 이미 잘 작동한다.
타겟 서열은 대상 유전체에 내인성이다. 즉, 타겟 서열은 야생형 유전체과 동일한 카피 수 및 유전체 위치로 존재한다. 또는 타겟 서열은 대상 유전체에 외인성이다. 또한, 본 발명에서는 이종으로도 언급된다. 이 경우, 이는 유전체에 존재하지만 다른 위치에 있는 유전자이거나 또는 완전히 외래의 유전자, 즉 타겟 서열을 포함하는 유전체에 존재하지 않는 유전자일 수 있다.
여러 가지 타겟 핵산 서열에 상보적인 복수의 gRNA가 식물 세포로 제공되며, 뉴클레아제, 예를 들어 Cas9 효소가 부위 특이적인 방식으로 여러 타겟 핵산 서열들을 절단한다. 복수의 gRNA들은 본 발명에 기술된 TRV 벡터 한종 또는 여러 종으로부터 코딩될 수 있다. 복수의 sgRNA의 사용은 멀티플렉싱 (multiplexing)을 가능하게 한다.
하나의 타겟 유전자 (예, 벡터 B2) 또는 복수의 타겟 유전자에 대한 복수의 sgRNA들이 발현 카세트에 존재한다. 이들 복수 (예, 2 이상, 3 이상, 4 이상, 5 이상, 6 이상, 예를 들어 2-5, 2-4, 2-3)의 sgRNA들은 하나의 프로모터 하에 위치된다. sgRNA들은 서로 스페이서에 의해 이격되거나 또는 이격되지 않을 수도 있다.
이러한 멀티플렉스 배치 (multiplex configuration), 즉 하나의 DdRp가 결합하는 프로모터 하의 멀티플렉스 배치는 CRISPR/Cas9 시스템을 이용하는 임의의 유전체 편집 방법에 적용될 수 있다. 이에, 하나의 프로모터 하에 2 이상의 sgRNA를 포함하는 핵산 발현 카세트를 제공한다.
이러한 핵산 발현 카세트는 원핵 또는 진핵 생물, 예컨대 포유류 (예, 사람), 식물, 곤충 및 효모에서의 임의 세포에 대한 것일 수 있다.
sgRNA를 코딩하는 핵산 서열은 양 쪽에 리보자임 서열들이 위치하여, 리보자임-sgRNA-리보자임 (RGR) 서열을 형성한다. RGR의 1차 전사체가 기가-촉매적으로 절단되고, sgRNA가 해리되는 것으로 제시된다. 또한, TRV DdRp가 결합하는 프로모터의 사용은, 심지어 측면에 리보자임 없이도 sgRNA의 전사를 효율적으로 수행하는 것으로 확인되었음에도 불구하고, RGR 배열이 sgRNA 전사에 사용될 수 있는 프로모터의 범위를 확장시키는 것으로 생각된다. RGR 전략은, 전체 바이러스 리플리콘이 완전히 전사된다면, 임의의 대상 발현 산물 (예, 리포터, 농업적으로 유용한 형질, 예를 들어, 스트레스 내성 등)이 접종된 조직에서 발현되고, 가이드 RNA 또한 동일 조직에서 형성됨을, 보장한다.
가이드 RNA는 싱글 가이드 RNA (sgRNA)이다. 소정의 타겟 서열에 따라 적합한 sgRNA를 구축하는 방법들이 당해 기술 분야에 공지되어 있다.
본 발명에서, 용어 "tRNA" 및 "transfer RNA"는 본 발명에서 상호 호환적으로 아미노산을 운반 및 수송하는 기능을 가진 소분자 RNA를 지칭하기 위해 사용된다. tRNA 분자는 일반적으로 클로버 형태로 접히는 뉴클레오티드 약 70-90개로 된 단쇄로 이루어져 있다. 진핵생물의 경우, 유전체의 tRNA 유전자는 tRNA 전구체로 전사된 다음 RNase P 및 RNase Z에 의해 5' 및 3'의 부가적인 서열이 절단되어 성숙한 tRNA로 가공된다.
본 발명에서, 용어 "리보자임"은 트랜스포스페이트 및 포스포다이에스테르 결합의 가수분해 반응을 촉매함으로써, RNA의 절단 및 가공에 관여하는 촉매 기능을 가진 RNA 분자를 지칭한다.
한국 공개특허 10-2019-0120287에서, Cas9 뉴클레아제변이체 eSpCas9 (1.0) (K810A/K1003A/R1060A), eSpCas9(1.1) (K848A/K1003A/R1060A), 및 Cas9 뉴클레아제변이체 SpCas9-HF1(N497A/R661A/Q695A/Q926A)은 유전체 편집시 오프-타겟 비율을 현저하게 낮출 수 있으며, 즉 특이성이 높은 것으로, 보고된 바 있다.
그러나, 이들 3종의 Cas9 뉴클레아제변이체가, 높은 특이성을 가지면서도, 야생형 Cas9와 비교해 유전자 편집 효율이 훨씬 낮다. 가이드 RNA의 5' 말단에 tRNA를 융합함으로써, 높은 특이성을 유지하면서, 고-특이성 Cas9 뉴클레아제변이체의 편집 효율을 심지어 야생형 수준까지 높일 수 있다.
고 특이성 Cas9 뉴클레아제변이체의 낮은 편집 효율은 가이드 RNA의 전사가 정확하게 개시될 수 있는지의 여부와 관련이 있다.
당해 기술 분야에서, 가이드 RNA를 생체내에서 생산하기 위해 통상적으로 사용되는 프로모터로는, 예를 들어, RNA 중합효소 III에 의해 전사가 구동되는 U6 또는 U3 snRNA 프로모터들이 있다. U6 프로모터는 G에서 전사를 개시하여야 하므로, 첫번째 뉴클레오티드가 A, C 또는 T인 타겟 서열의 경우, 전사되는 sgRNA의 5' 말단에 부가적인 G가 제공될 것이다. U3 프로모터는 A에서 전사를 개시하므로, 첫번째 뉴클레오티드가 G, C 또는 T인 타겟 서열의 경우, 부가적인 A가 전사되는 sgRNA의 5' 말단에 제공될 것이다. 고-특이성 Cas9 뉴클레아제변이체의 편집 효율이 sgRNA의 5' 말단에 부가적인 뉴클레오티드가 존재하는 경우에 감소된다.
본 발명에서 gRNA와 tRNA의 융합 전사함으로써, tRNA의 정확한 프로세싱 기전으로 인해 (tRNA 전구체의 5' 및 3'의 부가적인 서열을 정확하게 제거하여 성숙한 tRNA를 형성함), 5' 말단에 부가적인 뉴클레오티드가 없는 sgRNA를 심지어 SGP, U6 또는 U3 프로모터를 사용하여 쉽게 수득할 수 있으며, 타겟 서열의 첫번째 뉴클레오티드의 타입을 고려하지 않아도 된다.
이로써, 고 특이성 Cas9 뉴클레아제변이체의 편집 효율을 개선할 수 있으며, 타겟 서열의 선택가능한 범위는 넓어질 수 있다. 또한, tRNA와 융합하여 sgRNA의 발현 수준을 높일 수 있으며, 이는 고-특이성 Cas9 뉴클레아제변이체의 편집 효율을 개선하는 데에도 기여할 수 있다.
tRNA와 변형시킬 세포는 동일 종으로부터 유래된다. tRNA는 다음과 같은 서열에 의해 코딩된다. 5'aacaaagcaccagtggtctagtggtagaatagtaccctgccacggtacagacccgggttcgattcccggctggtgca-3' (서열번호 15).
tRNA-가이드 RNA 융합체의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다.
또한, 본 발명은 가이드 RNA 및 리보자임의 융합체를 고려한다. 본 발명에서 고-특이성 Cas9 뉴클레아제변이체의 편집 효율이 sgRNA의 정확한 전사 개시와 관련있다는 사실을 토대로, 특정 부위에서 RNA를 절단하는 리보자임의 능력을 이용함으로써, RNA와 리보자임의 융합체를 합리적으로 설계하여 5' 말단에 부가적인 뉴클레오티드 없이 sgRNA를 생산할 수 있으며, 그래서 고 특이성을 유지하면서도 편집 효율을 개선시킬 수 있다.
가이드 RNA의 3' 말단이 제2 리보자임의 5' 말단과 연결되고, 제2 리보자임이 융합체를 가이드 RNA의 3' 말단에서 절단하여, 3' 말단에 추가의 뉴클레오티드를 운반하지 않는 가이드 RNA가 형성된다.
제1 리보자임 또는 제2 리보자임의 설계는 당해 기술 분야의 당업자의 능력 내에서 이루어진다.
제1 리보자임은 서열: 5'(N)6CTGATGAGTCCGTGAGGACGAAACGAGTAAGCTCGTC-3' (서열번호 16)에 의해 코딩되며, 여기서 N은 독립적으로 A, G, C 및 T로부터 선택되고, (N)6는 가이드 RNA의 5' 말단 위치에서 처음 뉴클레오티드 6개에 역순으로 상보적인 서열이다.
제2 리보자임은 서열: 5'GGCCGGCATGGTCCCAGCCTCCTCGCTGGCGCCGGCTGGGCAACATGCTTCGGCATGGCGAATGGGAC-3' (서열번호 17)에 의해 코딩된다.
본 발명에서 야생형 Cas9 뉴클레아제와 비교해 특이성이 더 높은 Cas9 뉴클레아제변이체는 다양한 종들의 Cas9으로부터, 예를 들어, 스트렙토코커스 피오게네스의 Cas9 (SpCas9, 서열번호 2의 뉴클레오티드 서열, 서열번호 으로 표시되는 아미노산 서열)로부터 유래될 수 있다.
본 발명의 Cas9 뉴클레아제변이체는 핵 위치화 서열 (nuclear localization sequence, NLS)을 더 포함한다. 일반적으로, Cas9 뉴클레아제변이체의 경우, 하나 이승의 NLS는, Cas9 뉴클레아제변이체를 유전체 편집 기능을 위한 충분한 양으로 세포의 핵 내에 축적시킬 수 있을 만큼, 충분한 강도를 가져야 한다. 일반적으로, 핵 위치화 활성 강도는 NLS의 갯수 및 위치, Cas9 뉴클레아제변이체에 사용된 하나 이상의 구체적인 NLS 또는 이들의 조합에 의해 결정된다.
본 발명의 Cas9 뉴클레아제변이체에서 NLS는 N-말단 및/또는 C-말단에 위치할 수 있다. Cas9 뉴클레아제변이체는 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. Cas9 뉴클레아제변이체는 N-말단에 또는 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다. Cas9 뉴클레아제변이체는 C-말단에 또는 그 근처에서 NLS를 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상으로 포함한다.
Cas9 뉴클레아제변이체는, N-말단에 하나 이상의 NLS 및 C-말단에 하나 이상의 NLS와 같이, 이들의 조합을 포함한다. NLS가 하나 보다 많이 존재하는 경우, 각각의 NLS는 다른 NLS와 독립적으로 선택될 수 있다. 바람직하게, Cas9 뉴클레아제변이체는 NLS를 2개 포함하며, 예를 들어, 2개의 NLS는 각각 N-말단과 C-말단에 위치한다.
일반적으로, NLS는 단백질의 표면에 노출되는 양으로 하전된 라이신 또는 아르기닌으로 된 짧은 서열 하나 이상으로 구성되지만, 다른 타입의 NLS도 당해 기술 분야에 공지되어 있다. NLS에 대한 비-제한적인 예로는 KKRKV (서열번호 18), 5'AAGAAGAGAAAGGTC-3' (서열번호 19), PKKKRKV (서열번호 20), 5'CCCAAGAAGAAGAGGAAGGTG-3' (서열번호 21) 또는 CCAAAGAAGAAGAGGAAGGTT(서열번호 22),또는 SGGSPKKKRKV (서열번호 22), 5' TCGGGGGGGAGCCCAAAGAAGAAGCGGAAGGTG -3'(서열번호 23) 등이 있다.
Cas9 뉴클레아제변이체의 N-말단은 PKKKRKV (서열번호 24)로 표시되는 아미노산 서열을 가진 NLS를 포함한다. Cas9 뉴클레아제변이체의 C-말단은 SGGSPKKKRKV (서열번호 25)로 표시되는 아미노산 서열을 가진 NLS를 포함한다.
아울러, 본 발명의 Cas9 뉴클레아제변이체는 또한 편집할 DNA의 위치에 따라 세포질 위치화 서열, 엽록체 위치화 서열, 미토콘드리아 위치화 서열 등과 같은 다른 위치화 서열을 포함할 수 있다.
타겟 서열에서 효과적인 발현을 달성하기 위해, Cas9 뉴클레아제변이체를 코딩하는 뉴클레오티드 서열은 유전체-편집할 세포가 유래된 유기체에 대해 코돈-최적화된다.
코돈-최적화는 천연 서열의 코돈 하나 이상 (예, 코돈 약 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 50개 이상)을, 대상 세포의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 치환함으로써, 천연 아미노산 서열을 유지하면서도, 대상 대상 세포에서 발현을 강화하기 위해 핵산 서열을 변형하는 과정을 의미한다. 다양한 종들은 특정 아미노산의 일부 코돈들에 대해 특별한 편향성을 나타낸다. 코돈 편향성 (유기체들 간의 코돈 용법 차이)은 대개 메신저 RNA (mRNA)의 번역 효율과 관성이 있으며, 이는 특히 번역되는 코돈의 특성 및 특정 트랜스퍼 RNA (tRNA) 분자의 이용가능성에 의존하는 것으로 보인다.
세포에서 선택된 tRNA의 선호성은 일반적으로 펩타이드 합성에서 가장 빈번하게 사용되는 코돈을 반영한다. 즉, 유전자는 코돈 최적화에 토대가 되는 소정의 유기체에서 유전자 발현을 최적화하기 위해 맞춤 정될 수 있다. 코돈 용법 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용가능한 "코돈 용법 데이타베이스"에서 쉽게 이용가능하며, 이러한 표는 여러가지 방식으로 수정될 수 있다.
Cas9 뉴클레아제변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 서열번호 7 (eSpCas9(1.0)), 서열번호 8 (eSpCas9(1.1)) 또는 서열번호 9 (SpCas9-HF1)로 표시된다.
Cas9 뉴클레아제변이체를 코딩하는 뉴클레오티드 서열 및/또는 가이드 RNA 융합체를 코딩하는 뉴클레오티드 서열은 프로모터와 같은 발현 조절 인자에 작동가능하게 연결된다.
Cas9 뉴클레아제은 기본적으로 가이드 RNA와 상보적인 표적 DNA를 찾아 인식하고, 결합하는 능력이 아주 우수하다. Cas9가 표적 DNA와 결합하게 되면, R-loop 형태를 만들어 지는데, 이 과정에서 DNA는 일시적으로 단일 가닥 상태로 머무르게 된다. 이에 착안하여, 각각 독립적으로 시토신 염기교정 유전자가위를 개발하였다. 염기교정 유전자 가위에는 DNA 이중나선절단이 일어나지 않도록 Cas9 단백질의 절단능력을 아예 없애거나(dCas9), 단일가닥만 절단할 수 있는 돌연변이(Cas9 nickase; nCas9)를 사용하였다. 그리고 여기에 단일가닥에 작동할 수 있는 사이티딘 탈아미노화 효소를 연결하여 타겟 염기인 시토신에 바로 탈아미노화를 유도할 수 있도록 하였다.
시토신은 탈아미노화되면 유라실로 바뀌게 되는데, 유라실은 나중에 DNA 전사과정 등에서 티민으로 인식되어 전사가 된다. 결과적으로 시토신 염기교정 유전자 가위는 단일 염기인 시토신을 티민으로 치환할 수 있게 된다. 연구진들은 시토신 염기교정 효율을 극대화하기 위해서 2가지의 추가적인 작업을 진행하였다.
중간에 생성된 유라실은 맞은편 DNA 염기와 일시적으로 미스매치를 형성하기 때문에 세포 내 염기절제수선(Base excision repair; BER) 기작이 작동하게 된다.
이때 돌연변이 복구효소(uracil-DNA glycosylase; UNG)가 DNA 상에 있는 유라실을 제거하게 되는데, 이를 억제할 수 있도록 억제제인 UGI(uracil-DNA glycosylase inhibitor)를 추가로 연결하여 유라실 제거를 막아 티민으로의 치환을 극대화했다.
또한, 시토신 탈아미노화가 발생한 단일가닥의 맞은편 DNA 가닥에 틈(nick)을 유도해, 유라실이 제거되는 것을 최소화하도록 시토신 염기교정 유전자가위를 제작하였다.
한편, 아데닌 염기교정 유전자가위는 리우 그룹에 의해 시토신 염기교정 유전자 가위와 비슷한 형태로 개발되었다. 즉, 이중나선절단능력을 잃은 카스9에 사이 티딘 탈아미노화 효소를 연결하는 대신, 아데노신 탈아미노화 효소를 부착하여 아데닌을 구아닌으로 치환할 수 있도록 구성하였다.
당시, DNA에 작용하는 아데노신 탈아미노화 효소는 자연계에서 발견되지 않았기 때문에, 연구진들은 RNA에 작용하는 아데노신 탈아미노화 효소를 박테리아를 이용한 선택진화 방법으로 변형시켜 단일가닥 DNA에 작동하도록 구현하였다. 결과적으로, 아데노신의 경우 탈아미노화되면 이노신이 되는데, 이는 나중에 DNA 전사 과정 등을 통해 구아노신으로 치환된다.
염기교정 유전자가위는 DNA 이중나선절단을 일으키지 않기 때문에 그로 인해 발생하는 문제들(유전체 구조 변이나 대량결실, p53으로 인한 DNA 손상 반응 등)을 기본적으로 피해갈 수 있다. 그러면서 동형방식수선 기작을 통한 유전자교정 방법과 달리, 동형유전자가 주형으로 필요하지도 않고, 효율도 보통 30~50% 정도로 높다고 보고되고 있다. 또한 거의 분열되지 않는 세포에도 적용 가능하다는 장점이 있어, 현재까지 인간 질병치료 뿐 아니라, 동물, 식물 등 많은 연구 분야와 다양한 생물 종에 사용되고 있다.
그러나 염기교정 유전자가위 또한 분명한 한계점들을 가지고 있다. 기본적으로 탈아미노화 효소를 기반으로 작동하기 때문에, 염기를 추가하거나 제거하는 기능이 없고 치환만 가능하다. 또한 염기치환 중에서도 시토신을 아데닌으로 바꾸는 전좌(transversion, 고리 개수가 다른 염기로 치환되는 것)는 불가능하다. 그리고, 표적염기 외에 타겟 범위 안에 존재하는 주변의 사이토신이나 아데닌을 구분 없이 치환하는 문제(bystander mutation)도 잘 알려져 있다. 또한, 아데닌 염기교정 유전자가위의 경우, 타겟 목적으로 하는 아데닌 외에 TC모티프에 한해서 시토신도 치환시키는 문제가 있다. 이는 아데노신 탈아미노화 효소를 인공적으로 개량시키는 과정에서 습득된 문제로 추정된다.
또한, 탈아미노화 효소는 본래 세포 내의 DNA, RNA에서 작동하기 때문에, 염기 교정 유전자가위와 무관하게, 즉 가이드 RNA가 없는 경우에도, 무작위적인 변이를 유도할 가능성이 있다. 실제시토신 염기교정 유전자가위에 의해 유전체 전체에서 무작위적인 시토신 치환이 발생한다는 사실이 밝혀졌다. 또한 RNA 전사체에 대해서는 시토신 염기교정 유전자가위와 아데닌 염기교정 유전자가위가 각각 무작위적으로 시토신 또는 아데닌 염기를 치환시킨다는 것이 보고되었다.
본 발명의 시스템에 의해 유전체 편집될 수 있는 세포가 유래되는 유기체로는, 인간, 마우스, 랫, 원숭이, 개, 돼지, 양, 소 및 고양이와 같은 포유류; 닭, 오리 및 거위와 같은 가금류; 외떡잎 식물 및 쌍떡잎 식물과 같은 식물, 예를 들어, 벼, 옥수수, 밀, 수수, 보리, 대두, 땅콩 및 아라비돕시스 탈리아나 등이 있으나, 이들로 제한되는 것은 아니다.
2. DNA-가이드된 엔도뉴클레아제
본 발명에서 유전체 편집 도구가 DNA-guided 엔도뉴클레아제인 경우, 표적화 엔도뉴클레아제는 알고너트(Argonaute)이다. 알고너트(Argonaute) 폴리펩티드 패밀리는 RNA-유도 침묵 복합체 (RNA-induced silencing complex; RISC)의 필수 성분으로서, RNA 침묵 과정에서 중심적인 역할을 한다. RISC는 RNAi (RNA 간섭)로 알려진 유전자 침묵 현상을 담당한다. 알고너트 폴리펩티드는 마이크로 RNA (miRNA), 작은 간섭 RNA (siRNA) 및 피위-상호 작용 RNA (piRNA)를 포함하여 상이한 부류의 작은 비코딩 RNA에 결합한다. 작은 RNA는 서열 상보성 (염기 쌍 형성)을 통해 알고너트 폴리펩티드를 그들의 특정 표적으로 안내하여 mRNA 절단 또는 번역 억제를 초래한다.
Argonaute 폴리펩티드는 모든 생명체에 잘 보존되어 있다. Natronobacterium gregoryi Argonaute (NgAgo)는 Pasteurella multocida 및 대장균에서 유전자 삽입 또는 삭제를 80-100 %의 효율로 향상시킨다. 또한, 효과는 상동성 암(homologous arms) 의존적이지만 DNA-및 잠재적 효소 활성(guide DNA- and potential enzyme activity)-비 의존적 방식이다. 이러한 효과는 Thermus thermophilus Argonaute (TtAgo), Aquifex aeolicus Argonaute (AaAgo) 및 Pyrococcus furiosus Argonaute (PfAgo)를 포함하는 다른 pAgos 단편에서도 관찰되었다.
NgAgo 시스템의 기본 메커니즘은 recA-매개 DNA 가닥 교환(recA-mediated DNA strand exchange) 을 향상시키기 위해 재조합 효소 A (recA)와 상호 작용하는 PIWI- 유사 도메인을 통한 양성 선택 과정이다.
NgAgo는 단일 가닥 DNA (ssDNA)-guided Argonaute endonuclease로 Natronobacterium gregoryi Argonaute의 약자이다. NgAgo는 ~ 24 개의 뉴클레오티드 (gDNA)의 5 '인산화 ssDNA에 결합하여 표적 부위로 안내하고 gDNA 부위에서 DNA 이중 가닥 수선을 한다. CRISPR / Cas 시스템과 마찬가지로 NgAgo는 유전체 편집에 적합한 것으로 보고되었지만, 이는 전사되지 않았다. Cas9와 달리, NgAgo-gDNA 시스템은 protospacer adjacent motif(PAM)를 필요로 하지 않다.
NgAgo는 시스템의 정확도와 효율성으로 인해 off-target 효과를 최소화하여 유전체 편집에 유용한 것으로 제안되었다. 절단 효율이 가이드와 표적 분자 사이의 단일 뉴클레오티드 불일치에 의해 손상되기 때문에 gDNA의 특이성은 매우 높다. 가이드 분자로 5' 인산화 ssDNA를 사용하면 NgAgo를 오도하는 세포 올리고 뉴클레오티드의 가능성이 감소한다. 가이드 분자는 단백질 발현 동안 NgAgo에만 부착될 수 있다. 일단 가이드가 로드되면 NgAgo는 gDNA를 위해 자유 부동 ssDNA를 교체할 수 없다. sgRNA를 사용하는 시스템에 비해 ssDNA의 농도를 설계, 합성 및 조정하는 것이 더 쉽다. ssDNA의 요구량은 sgRNA 발현 플라스미드의 것보다 적다.
알고너트(Argonaute) 폴리펩티드는 표적물 특이적 방식으로 세포 또는 대상체 내에서(예컨대, 대상체의 유전체 내에서) 핵산을 편집할 수 있는 DNA-가이드된 엔도뉴클레아제이다. 알고너트 폴리펩티드 또는 이의 기능성 단편은 표적물 특이적 방식으로 세포(예: 대상체의 세포) 내에서 표적 핵산 서열(예: RNA, DNA, 유전자, 프로모터 등)을 편집하는 능력을 보유한다. 대상체의 유전체 내의 표적 서열을 편집하는 능력은 세포(예: 인간 세포)의 표적 서열 내의 하나 이상의 특정 뉴클레오티드를 삽입, 제거 및/또는 치환하는 능력을 지칭한다.
알고너트 폴리펩티드 또는 이의 기능성 단편은 뉴클레오티드 서열의 일부에 의해 코딩되는 폴리펩티드를 포함하며, 여기서 코딩되는 폴리펩티드는 세포에서 발현되는 경우 세포 내에서 표적 핵산 서열을 편집하는 능력을 보유한다.
본 발명에서 기술되는 알고너트 핵산 또는 합성 핵산은 알고너트의 핵산 서열에 대해 80% 내지 100% 동일성을 갖는 100 내지 3000개 뉴클레오티드 길이의 핵산 서열을 포함한다. 본 발명에서 기술되는 핵산 또는 합성 핵산은 적어도 100, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 적어도 1750 또는 적어도 2000개 뉴클레오티드 길이의 제1 핵산 서열을 포함하며, 여기서 제1 핵산은 서열번호 1의 핵산 서열에 대해 적어도 80%, 적어도 81%, 적어도 82%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖는다.
알고너트 핵산은 포유동물 세포에서 폴리펩티드를 발현하도록 구성된다. 폴리펩티드(예: 알고너트 폴리펩티드)을 발현하도록 구성되는 핵산은 세포에서 폴리펩티드의 발현을 지시하는 하나 이상의 핵산 조절 서열을 포함한다.
따라서, 목적하는 폴리펩티드를 발현하도록 구성되는 핵산은 목적하는 단백질을 코딩하는 코딩 영역, 코딩 영역에 작동 가능하게 연결된 하나 이상의 적합한 프로모터, 해독 개시 서열, 개시 코돈, 정지 코돈, 폴리A 신호 서열, 리더 서열, NLS 등 중 하나 이상을 포함할 수 있다. 핵산은 핵 위치화 서열 (nuclear localization sequence, NLS)을 코딩하는 서열을 포함한다. 임의의 적합한 NLS 서열이 사용될 수 있다. 핵산은 알고너트 폴리펩티드 또는 이의 기능성 단편을 발현하도록 구성된다.
또한, 핵산은 가이드 올리고뉴클레오티드(올리고뉴클레오티드 가이드)이다. 가이드 올리고뉴클레오티드는 RNA를 포함하거나 DNA를 포함한다. 가이드 올리고뉴클레오티드는 때때로 18개 내지 30개 nt 길이인 핵산이다. 가이드 올리고뉴클레오티드는 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 뉴클레오티드 길이이다.
가이드 올리고뉴클레오티드는 종종 유기체 또는 세포의 유전체 내의 특정 위치에 위치한 표적 핵산 서열(표적 부위) 또는 이의 일부에 대해 80% 내지 100%. 85% 내지 100%, 90% 내지 100%, 95% 내지 100% 또는 100% 동일한 핵산 서열을 포함한다.
가이드 올리고뉴클레오티드는 18 내지 30, 18 내지 28, 18 내지 25, 18 내지 26, 19 내지 26, 19 내지 25, 20 내지 30, 20 내지 25, 20 내지 24 또는 21 내지 24개 뉴클레오티드 길이인 표적 서열, 즉 유전자, 인트론 또는 엑손의 일부에 대해 100% 동일하다.
표적 서열은 본 발명에서 기술되는 조성물 또는 방법을 이용하여 변형시키고자 하는 유기체 또는 세포의 유전체 내의 특정 위치(특정 핵산 서열)을 지칭한다. 표적 서열은 세포 또는 유기체의 유전체 내에 위치한 핵산이다. 표적 서열은 RNA를 포함한다. 표적 서열은 DNA를 포함한다.
표적 서열은 10 내지 100, 18 내지 50, 18 내지 30, 18 내지 28, 18 내지 25, 18 내지 26, 19 내지 26, 19 내지 25, 20 내지 30, 20 내지 25, 20 내지 24 또는 21 내지 24개 뉴클레오티드 길이이고, 유전자, 엑손, 인트론 또는 유전체의 임의의 적합한 부분 내에 위치할 수 있다.
표적 서열 또는 표적 서열의 임의의 부분 내의 임의의 뉴클레오티드는 본 발명에서 기술되는 방법에 의해 변형될 수 있다. 표적 서열 내의 임의의 수의 뉴클레오티드가 결실되거나, 돌연변이되거나, 예컨대 목적하는 서열(예: 공여 서열의 삽입 서열)에 의해 치환될 수 있다. 하나 이상의 뉴클레오티드 또는 목적하는 서열은 본 발명에서 기술되는 방법에 의해 표적 서열로 삽입된다.
표적 서열은 가이드 올리고뉴클레오티드에 대해 상보적이거나 동일한 핵산 서열 또는 이의 일부를 제공한다.
표적 서열은 공여 서열의 5' 및/또는 3' 플랭킹 영역에 대해 상보적이거나 동일한 핵산 서열을 제공한다. 예컨대, 18 내지 28개 뉴클레오티드 길이의 가이드 올리고뉴클레오티드가 표적 서열에 대해 85% 내지 100%, 90% 내지 100% 또는 95% 내지 100% 동일할 수 있다. 또는, 가이드 올리고뉴클레오티드는 유전체 내의 표적 서열에 대비하여 1 내지 2, 1 내지 3, 또는 1, 2, 3 또는 4개의 미스매치를 포함한다. 또는 가이드 올리고뉴클레오티드는 표적 서열에 대해 100% 동일하다.
가이드 올리고뉴클레오티드는 유전체 내의 표적 부위(즉 표적 서열)에 대해 정확히 매치되는 서열을 포함하거나 이로 이루어진다. 가이드 올리고뉴클레오티드는 인산화된다. 가이드 올리고뉴클레오티드는 5' 인산화된다(즉, 5'히드록실 말단 상에서 인산화된다).
기능성 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드의 서열에 의해 규정되는 특정 표적 서열에서 유기체 또는 세포의 유전체 DNA를 절단하기 위해 가이드 올리고뉴클레오티드를 사용한다. 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드에 의해 규정되는 서열 내의 어느 곳에서나 표적 핵산 서열을 절단한다.
알고너트 폴리펩티드는 가이드 올리고뉴클레오티드의 초기 10개 뉴클레오티드(5'뉴클레오티드)의 임의의 것에 의해 규정되는 위치에서 표적 부위를 절단한다.
가이드 올리고뉴클레오티드 및 공여 핵산이 둘 다 존재하는 경우, 알고너트 폴리펩티드는 가이드 올리고뉴클레오티드에 의해 규정되는 표적 서열 부위에서 세포의 유전체으로 공여 핵산을 삽입 및 슬라이싱 하도록 진행될 것이다.
공여 서열이 존재하지 않는 경우, 가이드 올리고뉴클레오티드와 함께 로딩된 알고너트 폴리펩티드는 종종 가이드 올리고뉴클레오티드 서열에 의해 규정되는 표적 부위를 절단할 것이다. 이러한 공정은 종종 표적 부위에 도입된 하나 이상의 단일 뉴클레오티드 돌연변이 도입을 야기한다.
공여 서열(공여 단편)은 5' 플랭킹 서열, 목적하는 서열 및 3' 플랭킹 서열의 3개의 부분을 포함하는 핵산이다. 공여 서열은 RNA를 포함한다. 공여 서열은 DNA를 포함한다. 공여 서열은 단일 가닥이다. 일부 실시양태에서, 공여 서열은 이중 가닥이다.
5'플랭킹 서열 및 3'플랭킹 서열은 동일한 서열이거나 상이한 서열일 수 있다. 5'플랭킹 서열 및 3'플랭킹 서열은 10% 초과의 동일성을 공유하지 않는 상이한 서열이다. 5'플랭킹 서열 및 3'플랭킹 서열은 목적하는 서열의 반대측에 위치한다. 공여 서열의 5'플랭킹 서열 및/또는 3'플랭킹 서열은 약 10 내지 100, 10 내지 50, 10 내지 75, 10 내지 25 또는 20 내지 25개 뉴클레오티드(nt) 또는 염기 쌍(bp) 길이이다.
목적하는 서열은 본 발명에서 기술되는 알고너트 폴리펩티드 및/또는 방법에 의해 표적 서열로 삽입시키고자 하는 핵산을 지칭한다. 용어 "목적하는 서열"은 용어 "목적하는 핵산" 및 "목적하는 핵산 서열"과 동의어로 사용된다. 명확성을 위해, "목적하는 서열"은 때때로 "삽입 서열"로 지칭될 수 있다. 목적하는 서열은 RNA를 포함한다. 목적하는 서열은 DNA를 포함한다.
목적하는 서열은 임의의 적합한 길이의 임의의 적합한 서열일 수 있다. 목적하는 서열은 1 내지 20,000, 1 내지 5,000, 1 내지 1000, 1 내지 500, 10 내지 5,000, 10 내지 1000 또는 10 내지 500개 뉴클레오티드 길이이다.
공여 서열은 각각 독립적으로 표적 부위에 80% 내지 100% 동일한 5' 플랭킹 서열 및 3' 플랭킹 서열을 포함하며, 플랭킹 서열은 또한 가이드 올리고뉴클레오티드의 일부와 동일하거나 이에 상보적인 서열 영역을 포함한다. 공여 서열은 가이드 올리고뉴클레오티드에 대해 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 서열을 포함한다.
공여 서열은 가이드 올리고뉴클레오티드에 대해 동일하거나 가이드 올리고뉴클레오티드의 일부와 겹치는 플랭킹 서열을 포함할 수 있다. 공여 서열은 (i) 목적하는 서열, (ii) 가이드 올리고뉴클레오티드 또는 이의 일부에 대해 적어도 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 5' 플랭킹 서열, 및 가이드 올리고뉴클레오티드 또는 이의 일부에 대해 적어도 80% 내지 100% 동일하고/하거나 표적 부위에 대해 80% 내지 100% 동일한 3' 플랭킹 서열을 포함한다.
가이드 올리고뉴클레오티드 및 기능성 알고너트 폴리펩티드는 유전체의 표적 부위로 목적하는 서열을 삽입하기에 충분하며, 여기서 공여 핵산(즉, 공여 서열, 공여 핵산 서열)은 가이드 올리고뉴클레오티드의 일부(예: 적어도 5 내지 10개 뉴클레오티드)와 동일한 서열에 의해 양측(5'측 및 3'측)에서 플랭킹된 목적하는 서열을 포함한다.
2개의 가이드 올리고뉴클레오티드가 유전체의 표적 부위로 목적하는 서열을 삽입하는 데 사용되며, 여기서 공여 핵산(공여 서열)은 일측에서는 제1 가이드 올리고뉴클레오티드의 서열 및 다른 측에서는 제2 가이드 올리고뉴클레오티드의 서열에 의해 플랭킹된 목적하는 서열을 포함한다.
따라서, 유기체 또는 세포의 유전체을 편집하는 방법이 본 발명에 제시된다. 유기체는 대상체이다. 대상체는 인간이다. 세포는 임의의 적합한 세포일 수 있으며, 이의 비-제한적 예는 원핵생물 세포, 식물 세포, 진핵생물 세포, 포유동물 세포 또는 인간 세포를 포함한다. 유전체을 편집하는 방법은 유전체으로부터 표적 서열의 제거, 유전체 내 표적 서열의 파괴 및/또는 유전체으로 목적하는 서열의 삽입을 포함한다. 목적하는 서열은 임의의 적합한 핵산 서열일 수 있으며, 이의 비-제한적 예는 이종 핵산(예컨대, 상이한 종으로부터의 것), 변형된 이종 핵산, 상동성 핵산(예컨대, 동일한 종으로부터의 것), 합성 핵산, 유전자 또는 이의 일부(예컨대, 인트론, 엑손, 조절 서열 등), 변형된 유전자, 마커, 독소, 단일 핵산, 2개 이상의 핵산 등 또는 이의 조합을 포함한다. 목적하는 핵산은 키메라 항원 수용체(CAR)을 코딩한다.
목적하는 핵산(목적하는 서열) 또는 유전자는 임의의 적합한 포유동물 유전자, 이의 일부 또는 이의 변형된 형태일 수 있다.
유기체 또는 세포의 유전체의 편집 방법은 하나 이상의 세포를 본 발명에서 기술되는 하나 이상의 핵산 또는 조성물과 접촉시키는 단계를 포함한다. 유기체 또는 세포의 유전체의 편집 방법은 세포, 유기체 또는 대상체의 유전체 내의 표적 서열을 변형시키는 방법이다. 유기체 또는 세포의 유전체의 편집 방법은 본 발명에서 기술되는 하나 이상의 핵산을 하나 이상의 세포 내로 도입하는 단계를 포함한다. 하나 이상의 핵산은 임의의 적합한 방법에 의해 하나 이상의 세포 내로 도입될 수 있다.
3. Prime editing
본 발명에서 유전체 편집 도구가 Prime editing(프라임 편집)인 경우, Cas9 뉴클레아제는 표적 DNA에 결합하게 되면, 가이드 RNA와 표적 DNA 간에 DNA-RNA 혼성화(hybridization)되는 메카니즘을 가지고 있다. 이 부분에 착안하여 역전사 효소(reverse transcriptase)를 이용해 가이드 RNA를 주형으로 해서 새로운 단일가닥 DNA를 제작할 수 있다.
표적 DNA는 이중나선 형태이기 때문에 한 가닥이 가이드 RNA와 결합하면, 다른 쪽 단일 가닥은 결합하지 않은 채 홀로 있게 된다. 만약, 어떤 주형 RNA가 추가로 홀로 남은 단일 가닥과 DNA-RNA 혼성화를 이루게 되면, 역전사 효소가 그 RNA를 주형으로 원하는 DNA 서열을 즉석에서 합성할 수 있다. 주형 RNA를 기존의 가이드 RNA의 3*?**?* 말단에 연결해서 프라임 에디팅 가이드 RNA (prime editing guide RNA; pegRNA)를 제조할 수 있다.
역전사효소를 단일 가닥만 절단할 수 있는 카스9 단백질(Cas9 nickase)에 연결하여 프라임 에디팅 유전자 교정기술을 완성했다.
Prime editing(프라임 편집)에는 세 가지 주요 구성 요소가 포함된다.
(a) 편집될 표적 뉴클레오티드 서열을 식별하고, 표적화된 서열을 대체하는 새로운 유전자 정보를 암호화할 수 있는 프라임 편집 가이드 RNA (pegRNA) : pegRNA는 프라이머 결합 부위 (PBS) 및 역전사 효소 (RT) 주형 서열을 함유하는 연장된 단일 가이드 RNA (sgRNA)로 구성된다. 유전체 편집 동안, 프라이머 결합 부위는 닉 DNA 가닥의 3 '말단이 pegRNA에 혼성화될 수 있게 하는 반면, RT 주형은 편집 된 유전자 정보의 합성을 위한 주형으로서 기능한다.
(b) Moloney Murine Leukemia Virus (M-MLV) 역전사 효소에 융합된 Cas9 H840A nickase로 구성된 융합 단백질 : Cas9 H840A 닉카아제(nickase)는 Cas9 효소는 DNA 서열을 절단할 수 있는 2 개의 뉴클레아제도메인, 비-표적 가닥을 절단하는 RuvC 도메인 및 표적 가닥을 절단하는 HNH 도메인을 함유한다. 840번째 아미노산 히스티딘이 알라닌으로 대체되는 Cas9에서 H840A 치환의 도입은 HNH 도메인을 불활성화시킨다. RuvC 기능 도메인만으로, 촉매적으로 손상된 Cas9는 단일가닥 닉 (single strand nick)을 도입할 수 있다. M-MLV 역전사 효소는 단일 가닥 RNA 주형으로부터 DNA를 합성하는 효소이다.
(c) 융합 단백질의 Cas9 H840A 닉카아제부분을 비 편집된 DNA 가닥에 닉킹하도록 지시하는 단일 가이드 RNA (sgRNA).
프라임 에디팅 단백질과 pegRNA 복합체가 표적 DNA에 결합하고 나면, Cas9 nickase에 의해 맞은 편 단일 가닥을 먼저 절단한다. 절단된 DNA 가닥은 pegRNA 3*?**?*말단의 상보적인 부분과 결합할 수 있는데, 이 부분이 결합되면, 역전사 효소가 pegRNA를 주형(RT template 부분)으로 새로운 DNA 가닥을 만들어 낸다. 이후에 타겟 DNA는 다시 세포의 수선 기작에 의해 이중가닥 형태로 복구되는데, 이 과정에서 역전사된 염기서열을 기반으로 이중가닥이 만들어지면, 의도한 유전자 교정이 완성된다.
처음 개발된 프라임 에디팅(PE1 버전)은 작동 여부는 확인이 되었지만, 효율이 매우 낮았다. 이를 극복하기 위해 열역학적 안정성, DNA-RNA 구조와의 결합성, RNA 분해 효소의 억제성 등을 고려해서 역전사 효소 부분을 인공적으로 개량하여 개선된 버전을 만들게 되었다 (PE2 버전). 하지만 이렇게 프라임 에디팅 자가를 개선하는 것만으로는 효율을 높이는데 한계가 있었다.
왜냐하면, 프라임 에디팅 작동 후, DNA 수선 과정에서 pegRNA와 직접 붙는 DNA 가닥이 멀쩡하기 때문에, 이를 기반으로 복구될 가능성이 훨씬 높기 때문이다. 즉, 역전사 효소에 의해 새롭게 만들어진 DNA 가닥보다는 원래 있었던 DNA 가닥을 기반으로 복구될 가능성이 높아 결과적으로 원래 서열로 원상복구하게 된다. 만약 pegRNA가 직접 붙는 가닥에도 추가적으로 틈(nick)을 만들어 낸다면, 프라임 에디팅 작동 효율을 극대화시킬 수 있을 것이다. 에디팅 부위에서 조금 떨어진 위치에 또 다른 DNA 틈을 만들어 낼 수 있도록 sgRNA를 추가로 도입한 프라임 에디팅 버전 (PE3 버전)을 제작하였다. 그 결과, 예상한 바와 같이, 반대쪽 가닥을 추가로 자름으로써, 프라임 에디팅 교정 효율이 더욱 상승하게 되었다.
유전체 편집은 pegRNA 및 융합 단백질을 세포로 도입함으로써 수행된다. 형질 도입은 종종 세포에 벡터를 도입하여 수행될 수 있다. 일단 내재화되면, 융합 단백질은 표적 DNA 서열을 절단하고, pegRNA의 RT 주형 부분의 역전사 (프라임)를 개시하는데 사용될 수 있는 3' 하이드록실기를 노출시킨다. 결과적으로 2 개의 DNA 플랩, 즉 새로 합성된 (편집된) 서열을 포함하는 3' 플랩과, 디스펜서 블, 편집되지 않은 DNA 서열을 포함하는 5' 플랩이 포함된 분지형 중간체가 생성된다. 그런 다음 5' 플랩은 구조별 엔도뉴클레아제또는 5' 엑소뉴클레아제로 절단된다. 이 과정은 3' 플랩 결찰을 허용하고 하나의 편집된 가닥과 하나의 편집되지 않은 가닥으로 구성된 DNA를 생성한다. 재어닐링된 이중 가닥 DNA는 편집이 일어난 위치에서 뉴클레오티드 불일치를 포함한다. 불일치를 정정하기 위해, 세포는 두 가지 가능한 결과로 본질적인 불일치 복구 메커니즘을 이용한다. (i) 편집된 가닥의 정보가 상보적 가닥으로 복사되어, 편집을 영구적으로 할 수 있으며; (ii) 원래의 뉴클레오티드는 편집을 제외하고 편집된 가닥으로 다시 통합된다.
프라임 에디팅 유전자 교정기술은 염기교정 유전자가위와 마찬가지로 이중나선절단을 일으키지 않는다는 큰 장점을 가지고 있다. 그리고 모든 종류의 염기 치환 뿐 아니라, 삽입이나 결실을 유도할 수 있다는 점에서 기존의 염기교정 유전자가위 보다 더욱 확장성이 크다고 할 수 있다.
하지만, 아직까지는 프라임 에디팅 가이드 RNA를 디자인 하는 과정이 최적화되지 않아, 최적의 RNA를 제작하기 위해서는 RNA가 절단된 가닥과 결합할 수 있는 PBS(primer binding site) 길이와 교정될 부분을 포함하고 있는 RT template 역전사 효소의 주형) 길이를 다양하게 시도해 보아야 한다. 그리고 염기 치환의 경우 기존의 염기교정 유전자가위에 비해 효율이 다소 떨어지고, 최종 버전(PE3)을 사용할 경우, 원치 않는 DNA 결실이나 삽입이 약간 발생한다는 점 등은 향후 추가로 개선되어야 할 것이다.
이 기술을 개발하는 동안 구성 요소의 효과를 높이기 위해 구성 요소를 몇 가지 수정했다.
(a) 프라임 에디터 1(PE1) ; 첫 번째 시스템에서, 야생형 몰로니 백혈병 바이러스 (M-MLV) 역전사 효소는 Cas9 H840A 닉카아제C- 말단에 융합되었다. 검출 가능한 편집 효율이 관찰되었다.
(b) 프라임 에디터 2(PE2) ; DNA-RNA 친화성, 효소 가공성 및 열 안정성을 향상시키기 위해, 5 개의 아미노산 치환을 M-MLV 역전사 효소에 포함시켰다. 이어서 돌연변이체 M-MLV RT를 PE1에 혼입하여 (Cas9 (H840A) -M-MLV RT (D200N / L603W / T330P / T306K / W313F))를 일으켰다. PE1에 비해 효율 개선이 관찰되었다.
(c) 프라임 에디터 3(PE3) : 증가된 효능에도 불구하고, PE2에 의해 삽입된 편집은 편집된 가닥의 DNA 불일치 복구로 인해 여전히 제거될 수 있다. DNA 이종 이중체 분해 동안이 문제를 피하기 위해, 추가적인 단일 가이드 RNA (sgRNA)가 도입할 수 있다. 이 sgRNA는 원래 대립 유전자가 아닌 pegRNA에 의해 도입된 편집된 서열과 일치하도록 설계되었다. 그것은 융합 단백질의 Cas9 닉카아제부분이 원래 닉과 반대되는 근처 위치에서 편집되지 않은 가닥을 닉킹하도록 지시한다. 편집되지 않은 가닥을 선택하면 셀의 자연 수리 시스템이 편집된 가닥의 정보를 보완 가닥에 복사하여 편집을 영구적으로 고정할 수 있다.
프라임 편집 도구는 전통적인 유전자 편집 기술보다 더 많은 장점을 제공한다. CRISPR/Cas9 편집본은 NHEJ (Non-homoousous End Joining) 또는 HDR (homology-directed repair)을 사용하여 DNA 단절을 수정하는 반면 프라임 편집 시스템은 DNA 불일치 복구를 사용한다.
NHEJ 및 HDR과 같은 DNA 복구 메커니즘은 올바른 편집을 수행하는 세포에서 원치 않는 랜덤 삽입 또는 결실(INDEL)부산물을 생성한다.
프라임 시스템은 염기 편집기 base editors와 같은 다른 편집 도구에서 관찰되는 이중 가닥 DNA 절단 대신 단일 가닥 DNA 절단을 도입한다. 염기 편집 및 프라임 편집 base editing 및 prime editing은 종합적으로 목표 전이 돌연변이 targeted transition mutations를 만들기 위한 보완적인 강점과 약점을 제공한다. 원하는 편집이 전이점 돌연변이 targeted transition mutations이고 PAM 서열이 표적 부위로부터 대략 15 개의 염기가 존재하는 경우, 염기 편집기는 보다 높은 편집 효율 및 더 적은 INDEL 부산물을 제공한다. 그러나, 프라임 편집 기술은 뉴클레오타이드 서열을 표적화하기 위해 정확하게 위치된 PAM 서열을 필요로 하기 때문에, 더 많은 유연성 및 편집 정밀도를 제공한다. 놀랍게도 프라임 편집기를 사용하면 모든 유형의 대체, 전환 및 변환을 대상 시퀀스에 삽입할 수 있다.
프라임 시스템은 (i) 가이드 서열과 표적 DNA 사이, (ii) 프라이머 결합 부위와 표적 DNA, (iii) 닉킹된 DNA 가닥의 3 '말단 및 pegRNA 등 총 3번의 독립적인 DNA 결합이 있어 CRISPR / Cas9보다 바람직하지 않은 오프-타겟 효과가 적은 것으로 제안되었다.
유전자 성분을 이용한 질병의 치료에 유전자 편집 방법을 적용하는 데 상당한 관심이 있다. 그러나 이 방법에는 여러 가지 문제가 있습니다. 효과적인 치료를 위해서는 많은 수의 표적 세포를 편집해야하는데 효과적인 전달 방법과 조직 특이성이 필요하다.
현재, 소수의 유전자 변형에 대해서는 프라임 편집이 유망해 보이지만, 표적 삽입 및 결실과 같은 더 큰 변화를 만드는 기술이 효율적인지 평가하기 위해 더 많은 연구가 필요하다. 더 큰 유전자 변경은 더 긴 RT 주형을 필요로 하며, 이는 pegRNA의 표적 세포로의 효율적인 전달을 방해할 수 있다. 또한, 긴 RT 주형을 함유하는 pegRNA는 세포 효소에 의해 야기되는 손상에 취약할 수 있다.
프라임 편집의 효율성을 개선하기 위해 추가 연구가 필요하지만 이 기술은 다른 유전자 편집 도구보다 유망한 과학적 개선을 제공한다. 프라임 편집 기술은 삽입, 결실 및 뉴클레오티드 치환을 복구할 수 있기때문에 유전병을 유발하는 대다수의 병원성 대립 유전자를 교정할 수 있는 잠재력을 가지고 있다.
인간 질병에서 병원성 대립 유전자를 교정하기 위해 프라임 편집을 사용하기 위해서는 많은 연구가 필요하다.
프라임 편집에 사용되는 염기 편집기는 단백질과 RNA 분자를 살아있는 세포로 전달해야 한다. 외인성 유전자 편집 기술을 살아있는 유기체에 도입하는 것은 중요한 과제이다. 동물과 식물에 염기 편집기를 도입할 수 있는 한 가지 방법은 염기 편집기를 바이러스성 캡시드에 포장하는 것이다.
그 후 표적 유기체는 바이러스에 의해 형질 도입되어 생체 내에서 염기 편집기를 합성할 수 있다. 렌티 바이러스와 같은 형질 도입의 일반적인 실험실 벡터는 인간에서 면역 반응을 유발하므로, 제안된 인간 요법은 종종 AAV 감염이 무증상이기 때문에 아데노 관련 바이러스 (AAV)를 중심으로 한다. 불행히도, AAV 벡터의 유효 패키징 용량은 작으며, 역 터미널 반복을 포함하지 않는 약 4.4kb입니다. SpCas9- 역전사 효소 융합 단백질은 6.3kb이며, 관심 부위를 표적화하고 프라이밍하는데 필요한 길어진 가이드 RNA를 설명하지도 않는다.
Ⅴ. 본 발명의 시스템의 다능성
본 발명의 시스템의 또 다른 이점은 핵 전사로부터의 독립성 및 전례없는 자유로운 설계를 제공하는 DdRp RNA 발현 카세트, auto-DdRp 발현 카세트 및 유전체 편집 도구를 코딩하는 DNA 발현 카세트의 존재를 포함한다. 서로 조합할 수 있는 다목적 요소를 고려하여, 본 발명은 DdRp RNA 발현 카세트 및 auto-DdRp 발현 카세트에서 원하는 수준의 DdRp 합성, 원하는 표적 유기체, 원하는 수준의 유전체 편집 도구 생산 등에 대한 DdRp 발현을 최적화할 수 있게 한다. DdRp에 의해 트랜스로 전사될 수 있는 발현 카세트는 독립적으로 설계될 수 있다.
본 발명은 최초 DdRp를 제공하는 DdRp RNA 발현 카세트를 포함하는 RNA 발현 카세트 및 발현 카세트가 DdRp에 대한 프로모터를 포함하는 한 auto-DdRp 발현 카세트 및 유전체 편집 도구를 코딩하는 DNA 발현 카세트를 포함하는 DNA 발현 카세트로 이루어진 유전체 편집 RNA/DNA 시스템으로 유전체 편집 도구중 가이드 RNA의 종류에 따라 다양한 기능이 있다.
예를 들어, 하기 요소는 본 발명에 기초하여 개별적으로 선택, 설계 및/또는 개조될 수 있다. RNA 발현 카세트의 캡핑 (특히 특정 캡의 선택); RNA 발현 카세트에 화학적 변형 뉴클레오타이드; RNA 발현 카세트의 5'UTR; DdRp를 코딩하는 ORF의 코딩 서열(코돈-최적화); RNA 발현 카세트의 3'UTR; RNA 발현 카세트의 폴리(A) 꼬리; DNA 발현 카세트의 5'UTR; DNA 발현 카세트의 프로모터 서열; DNA 발현 카세트로부터 생성된 전사체의 5'UTR; DdRp 및 유전체 편집 도구를 코딩하는 ORF의 코딩 서열 (코돈-최적화); DNA 발현 카세트로부터 생성된 전사체의 3'UTR; DNA 발현 카세트의 폴리(A) 꼬리 및/또는 발현 카세트으로부터 생성된 전사체를 포함한다.
또한, 본 발명은 시험관내 또는 생체내에서 휴지기 또는 세포주기인 임의의 주어진 세포 유형에 대해 유전체 편집 도구 DNA 발현 카세트, auto-DdRp 발현 카세트 및 DdRp RNA 발현 카세트의 최적량을 공동-형질주입시킬 수 있다.
DdRp를 발현시키기 위한 DdRp RNA 발현 카세트
본 발명은 DdRp의 번역을 유도하기 위한 5'캡을 포함하는 DdRp를 발현시키기 위한 RNA 발현 카세트 (DdRp RNA 발현 카세트)를 제공한다. 본 발명에 있어서, 본 발명의 DdRp RNA 발현 카세트는 본원에 기재된 바와 같이 본 발명의 DNA 발현 카세트와는 독립적으로 제공될 수 있다. DdRp RNA 발현 카세트는 본 발명의 DdRp RNA 발현 카세트의 임의의 하나 이상의 특성에 의해 독립적으로 특징화될 수 있다. DdRp를 발현시키기 위한 RNA 발현 카세트는 분리된 핵산 분자이다. 이는 다른 핵산 분자로부터 분리된, 즉 본질적으로 없는 실시형태를 포함한다.
본 발명에 따른 RNA 발현 카세트는 예를 들어 시스템 또는 키트의 형태로 적합한 DNA 발현 카세트와 조합하기에 적합하다.
본 발명의 시스템의 부분일 수 있거나 또는 아닌, 본 발명에 따른 임의의 DdRp RNA 발현 카세트는 시험관내 전사에 의해 수득될 수 있다. 시험관내 전사된 DdRp RNA 발현 카세트(IVT-RNA)는 본 발명에서 특히 중요하다. IVT-RNA는 핵산 분자 (특히 DNA 분자)로부터의 전사에 의해 수득될 수 있다. 본 발명의 auto_DdRp 발현 카세트(들)는 이러한 목적에 적합한데, 특히 DdRp에 의해 인식될 수 있는 프로모터를 포함하는 경우에 적합하다.
본 발명에 따른 RNA는 시험관내에서 합성될 수 있다. 이것은 시험관내 전사 반응에 캡-유사체를 추가하도록 할 수 있다. 전형적으로, 폴리(A) 꼬리는 auto_DdRp 발현 카세트 주형상의 폴리-(dT) 서열에 의해 코딩된다. 대안적으로, 캡핑 및 폴리(A) 꼬리 첨가는 전사 후에 효소로 달성될 수 있다.
시험관내 전사 방법론은 당업자에게 공지되어 있는 것이다. 다양한 시험관내 전사 키트가 상업적으로 이용 가능하다.
DNA 발현 카세트
본 발명은 본 발명에 따른 DdRp를 발현시키기 위한 RNA 발현 카세트(DdRp RNA 발현 카세트), 본 발명에 따른 RNA 발현 카세트, 또는 둘 모두를 코딩하는 핵산 서열을 포함하는 DNA 발현 카세트를 제공한다.
본 발명에 따른 DNA 발현 카세트는 본 발명에 따른 시스템의 유전체 편집 도구를 코딩한다. 상기 유전체 편집 도구 DNA(DNAge 발현 카세트는 표적화 엔도뉴클레아제를 코딩하는 DNAen 발현 카세트와 가이드 핵산, sgRNA를 코딩하는 DNAsg 발현 카세트로 구성되며 이들은 하나의 발현 카세트 또는 독립된 발현 카세트에 있을 수 있으며 본 발명은 이런 DNA 발현 카세트를 제공한다.
본 발명에 따른 DNA 발현 카세트는 본 발명에 따른 시스템의 DdRp RNA 발현 카세트를 코딩한다. auto_DdRp 발현 카세트는 본 발명에 따른 시스템의 하나의 RNA 요소(DdRp RNA 발현 카세트)를 코딩한다.
바람직하게, 본 발명에 따른 DNA 발현 카세트는 플라스미드이다. 본원에 사용된 용어 "플라스미드"는 일반적으로 염색체 DNA와 독립적으로 전사할 수 있는 염색체외 유전 물질, 대체로 원형 DNA 듀플렉스의 발현 카세트에 관한 것이다.
본 발명의 auto_DdRp 발현 카세트는 DdRp에 의해 인식될 수 있는 프로모터를 포함할 수 있다. 이것은 생체내 또는 시험관내에서 코딩된 RNA, 예를 들어 본 발명의 RNA의 전사를 허용한다. IVT 벡터는 시험관내 전사를 위한 주형으로 표준화된 방식을 사용할 수 있다. 본 발명에 따라 바람직한 프로모터의 예로서는 SP6, T3 또는 T7 중합효소에 대한 프로모터이다.
본 발명의 auto_DdRp 발현 카세트는 분리된 핵산 분자이다.
본 발명은 또한 본 발명에 따른 유전체 편집 RNA/DNA 시스템 또는 본 발명에 따른 DdRp를 발현시키기 위한 RNA 발현 카세트를 포함하는 키트를 제공한다.
키트의 구성은 별개의 실체로 존재한다. 예를 들어, 키트의 하나의 핵산 분자는 하나의 실체에 존재할 수 있고, 키트의 다른 핵산은 별도의 실체에 존재할 수 있다. 예를 들어, 개방형 용기 또는 밀폐형 용기가 적합한 실체이다. 밀폐된 용기가 바람직하다. 사용된 용기는 바람직하게는 RNase가 없거나 본질적으로 RNase가 없어야 한다.
본 발명의 키트는 세포 접종용 및/또는 인간이나 동물 대상체에 투여용 유전체 편집 RNA/DNA 시스템을 포함한다.
본 발명에 따른 키트는 임의로 라벨 또는 다른 형태의 정보 요소, 예를 들면, 전자 데이터 이동 매체를 포함한다. 라벨 또는 정보 요소는 바람직하게는 취급설명서, 예를 들어, 인쇄된 서면 취급설명서 또는 임의로 인쇄 가능한 전자 양식으로 된 취급설명서를 포함한다. 취급설명서는 적합하고 가능한 적어도 하나의 키트 사용법을 지칭할 수 있다.
Ⅵ. 발현카세트 및 전달체
본 발명의 자가전사 RNA/DNA 시스템은 DdRp에 의해 발현하는 신규 발현카세트에 관한 내용을 포함함으로, 보다 상세하게는 개발된 선형 DdRp RNA 발현 카세트, auto_DdRp 발현 카세트, auto-loop로 발현되는 DdRp 발현 시스템, DdRp에 의해 전사되는 유전체편집 도구를 코딩하는 DNAge 발현 카세트, auto_(DdRp+DNAge) 발현 카세트,항생제 저항성 유전자, 복제원점(origin of replication) 및 상기 클로닝 부위 서열을 포함하는 재조합 발현카세트 및 상기 발현카세트로 형질전환된 세포 등에 관한 것이다.
제한효소(Restriction endonuclease)는 거의 모든 세균에 존재하며 이는 DNA에 존재하는 특정한 염기서열을 인식하여 인식한 서열부위 또는 그 근처의 특정부위를 절단하는 효소이다. 이러한 제한효소는 원래 세균이 자신의 세포 내로 침입해 들어오는 바이러스와 같은 외부 DNA를 제거하기 위하여 방어기전으로 가지고 있는 것이며 자신의 DNA는 절단부위의 염기(아데닌 또는 사이토신)를 메틸화시켜서 제한효소로부터 보호하고 있다. 이런 제한효소의 성질을 이용하여, 벡터 내에 원하는 유전자를 삽입할 수 있다.
특히 발현카세트에는 다중클로닝부위(multicloning site, MCS)가 있는데, 이 부위는 인위적으로 여러 가지 제한효소의 인식부위를 모아놓은 것으로 cloning을 위한 insert DNA의 제한효소를 결정해 준다. 플라스미드 벡터는 제한효소 중에서 많이 쓰이는 것을 위주로 MCS를 구성해서 상용화되어 있다. 이러한 범용 제한효소를 활용한 MCS는 높은 빈도수로 인해서 전체 유전자의 클로닝이 어렵거나 불가능한 유전자들이 존재한다.
본 발명의 재조합 발현카세트는 숙주세포에서 목적 단백질 또는 목적 RNA를 발현할 수 있는 카세트로서, 유전자 삽입물이 발현되도록 작동 가능하게 연결된 필수적인 조절요소를 포함하는 유전자 제작물을 말한다. 발현카세트는 발현조절 서열 및 필요에 따라 막표적화 또는 분비를 위한 시그널 서열 또는 리더 서열을 포함하며 목적에 따라 다양하게 제조될 수 있다. 발현 조절 서열(expression control sequence)이란 특정한 숙주 세포에서 작동 가능하게 연결된 폴리뉴클레오티드 서열의 발현을 조절하는 DNA 서열을 의미한다. 그러한 조절 서열은 전사를 실시하기 위한 프로모터, 전사를 조절하기 위한 임의의 오퍼레이터 서열, 5′Cap 구조, 적합한 mRNA 리보좀 결합 부위를 코딩하는 서열 및 전사 및 해독의 종결을 조절하는 서열을 포함한다. 또한 발현카세트는 카세트를 포함하는 숙주 세포를 선택하기 위한 선택 마커를 포함할 수 있으며, 복제가능한 발현카세트인 경우 복제기원을 포함할 수 있다.
본 발명의 재조합 발현카세트에는 알려진 다양한 단백질을 암호화하는 염기서열을 포함할 수 있으며, 이 목적 단백질을 암호화하는 염기서열은 프로모터와 작동 가능하게 연결된다. 작동 가능하게 연결(operably linked) 된다는 것은 하나의 핵산 단편이 다른 핵산 단편과 결합되어 그의 기능 또는 발현이 다른 핵산 단편에 의해 영향을 받는 것을 말한다.
본 발명에 따른 발현카세트는 단백질 발현에 사용되는 기존의 카세트를 기본 골격으로 하여 본 발명의 MCS 폴리뉴클레오타이드를 각각 구조유전자가 선정된 DdRp가 결합하는 프로모터에 의해 작동가능하게 연결되도록 삽입됨으로써 제조할 수 있다. 바람직하게는 본 발명의 발현카세트는 복제원점, 프로모터, 형광 단백질 유전자, MCS 및 선별 마커를 포함할 수 있으며, 추가로 단백질 발현을 위한 폴리A 신호서열이 포함될 수 있다.
본 발명에서 선별 마커(selective marker)는 항생제저항성 유전자일 수 있으며, 이러한 항생제저항성 유전자로 될 수 있는 유전자는 현재 다수가 공지되어 있다(예를 들어, 카나마이신, 네오마이신, 앰피실린, 테트라사이클린 등). 따라서, 당업자는 상기 공지된 항생제저항성 유전자들로부터 원하는 유전자를 취사선택하여 사용하는 것이 가능하며 이러한 유전자의 구체적인 종류는 본 발명의 본질을 구성하는 것은 아니다. 뿐만 아니라, 이러한 항생제저항성 유전자의 도입은 형질전환체를 선발하기 위한 것이므로, 선발에 사용될 수 있는 유전자라면 어떠한 것도 도입될 수 있다. 따라서, 항생제저항성 유전자에만 한정되는 것은 아니다. 바람직하게는 본 발명의 항생제저항성 유전자는 카나마이신 또는 네오마이신 저항성 유전자일 수 있다.
본 발명의 발현카세트에는 본 발명의 발현카세트의 기본 구조가 동일 또는 유사하는 한 코돈 degeneracy 등 당업자에게 공지된 방식에 따른 염기서열이 다소간의 변화된 발현카세트도 포함한다. 아울러, 서열목록의 N-말단과 C-말단이 원형을 이루는 것은 당업자에게 자명하다.
한편, 본 발명은 본 발명의 재조합 카세트로 형질전환한 세포를 제공한다.
본 발명의 재조합 발현카세트는 당 분야에 공지된 방법을 이용하여 숙주내로 도입할 수 있다. 그 예로는 이에 한정되지는 아니하나, 염화칼슘 및 열 쇼크법, 입자 총 충격법(particle gun bombardment), 실리콘 탄화물 위스커(Silicon carbide whiskers), 초음파 처리(sonication), 전기천공법(electroporaion), PEG-매게 융합법, 미세사출법, 미세주입법, 리포좀 매개법 및 진공침윤법 등을 사용할 수 있다.
상기 숙주 세포로는 동물, 식물, 효모 및 박테리아의 세포일 수 있으며, 바람직하게는 박테리아 외의 경우 외부로부터 도입되는 벡터를 잘 받아들일 수 있고, 세포질과 핵 등의 세포내 소기관의 경계가 뚜렷하게 구별되는 세포가 바람직하다. 더 바람직하게는 CHO-k1(ATCC CCL-61, Cricetulus griseus, hamster, Chinese), HEK293(ATCC CRL-1573, Homo sapiens, human), HeLa(ATCC CCL-2, Homo sapiens, human), SH-SY5Y(ATCC CRL-2266, Homo sapiens, human), Swiss 3T3(ATCC CCL-92, Mus musculus, mouse), 3T3-L1(ATCC CL-173, Mus musculus, mouse), NIH/3T3(ATCC CRL-1658, Mus musculus, mouse), L-929(ATCC CCL-1, Mus musculus, mouse), Rat2(ATCC CRL-1764, Rattus norvegicus, rat), RBL-2H3(ATCC CRL-2256, Rattus norvegicus, rat), MDCK(ATCC CCL-34, Canis familiaris)일 수 있다. 또한 그 밖에 각종 줄기세포, 각종 조직에서 추출된 세포 및 인위적으로 만들어진 유사 세포막 구조물일 수 있다.
한편, 본 발명에서 사용된 표준 재조합 DNA 및 분자 클로닝 기술은 당해 분야에 널리 공지되어 있고, 다음 문헌에 기재되어 있다(Sambrook, J., Fritsch, E. F. and Maniatis, T., Molecular Cloning: A Laboratory Manual, 2nd ed., Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989); by Silhavy, T. J., Bennan, M. L. and Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1984); and by Ausubel, F. M. et al., Current Protocols in Molecular Biology, published by Greene Publishing Assoc. and Wiley-lnterscience (1987)).
본 발명은 상술한 핵-비의존적 세포질 내에서 DdRp에 의한 유전자 발현 조절서열을 포함하는 개선된 발현카세트를 제공한다.
본 발명에 있어서, 본 발명의 발현카세트는 대장균 유래 플라스미드, 바실러스 서브틸리스 유래 플라스미드, 효모 유래 플라스미드 및 Ti 플라스미드 등의 플라스미드 벡터, 코즈미드 벡터, 아데노바이러스(Lockett LJ, et al.,Clin. Cancer Res. 3:2075-2080(1997)), 아데노-관련바이러스(Adeno associated viruses: AAV)(Lashford LS., et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager (1999)), 레트로바이러스 (Gunzburg WH, et al., Gene Therapy Technologies, Applications and Regulations Ed. A. Meager, (1999)), 렌티바이러스(Wang G. et al., J. Clin. Invest. 104(11):R55-62(1999)), 헤르페스심플렉스 바이러스(Chamber R., et al., Proc. Natl. Acad. Sci USA 92:1411-1415(1995)), 백시니아 바이러스 (Puhlmann M. et al., Human Gene Therapy 10:649-657(1999)), 리오바이러스, 폭스바이러스 (GCE, NJL, Krupa M, Esteban M., The poxvirus vectors MVA and NYVAC as gene delivery systems for vaccination against infectious diseases and cancer Curr Gene Ther 8(2):97-120(2008)), 셈리키 포리스터 바이러스, 폴리머 (Hwang et al., In vitro and In vivo Transfection Efficiency of Human Osteoprotegerin Gene using Non-Viral Polymer Carriers., Korean J. Bone Metab. 13(2):119-128(2006)), 리포좀 (Methods in Molecular Biology, Vol 199, S.C. Basu and M. Basu (Eds.), Human Press 2002), 나노물질 또는 니오좀에 적용될 수 있다.
1. 플라스미드
플라스미드는 세균 세포내에 독립적으로 존재하는 원형의 DNA분자이다. 플라스미드는 거의 항상 하나 이상의 유전자를 가지고 있으며 이들 유전자는 종종 숙주세균에 의해 나타나는 유용한 특징을 담당하고 있다. 예를 들어, 항생제의 정상적인 독성농도에서 생존하는 능력은 항생제 저항성 유전자를 가진 플라스미드가 세균내에 존재하기 때문이다. 실험실에서 이러한 항생제 저항성은 종종 선별 마커(selectable marker)로서 이용된다.
모든 플라스미드는 복제원점(replication origin; 숙주 세포의 복제효소가 인식할 수 있는 부위를 말하며, 이 부위에서부터 복제가 시작된다.) 역할을 할 수 있는 DNA 서열을 적어도 하나 가지고 있으며, 따라서 주 세균 염색체(main bacterial chromosome)와는 독립적으로 세포내에서 복제할 수 있다. 어떤 유형의 플라스미드는 세균 염색체 안으로 자신을 삽입시킴으로써 복제할 수 있다. 이렇게 통합하는 플라스미드(episome이라 부름)들은 수많은 세포분열 동안 이 형태를 안정적으로 유지할 수 있다. 그러나 어떤 단계에서는 excision(통합되는 과정의 역과정)됨으로써 독립적인 요소로 존재한다.
Selectable marker란 벡터에 의해 운반된 유전자로서, 이 벡터 또는 재조합 DNA분자를 가진 세포의 특징이 인식될 수 있도록 해주는 유전자를 말한다.
플라스미드의 크기의 범위는 가장 작은 것은 1.0 kb로부터 가장 큰 것은 250 kb 이상까지이다. Copy number란 하나의 세균 세포에서 정상적으로 발견되는 플라스미드의 수를 말한다. Copy number를 조절하는 인자는 잘 이해되지 않았지만, 각 플라스미드는 1~50개 이상의 특징적인 수를 가지고 있다.
플라스미드가 세균에 널리 분포하고 있긴 하지만 다른 생물체에서도 그렇게 보편적인 것은 결코 아니다. 가장 많이 연구된 진핵세포성 플라스미드(eukaryotic plasmid)는 2㎛ circle로서 효모에 존재한다. 2㎛ 플라스미드의 발견은 이것이 숙주로서 매우 중요한 산업적 생물체의 유전자를 클로닝하기 위한 벡터의 제조를 가능하도록 했기 때문에 매우 운이 좋은 것이었다. 그러나 다른 진핵 생물에서는 플라스미드가 발견되지 않고 있다.
2. 아데노바이러스
아데노바이러스는 중간 정도의 지놈 크기, 조작의 편의성, 높은 타이터, 광범위한 타깃세포 및 우수한 감염성 때문에 유전자 전달 벡터로서 많이 이용되고 있다. 지놈의 양 말단은 100-200 bp의 ITR (inverted terminal repeat)를 포함하며, 이는 DNA 복제및 패키징에 필수적인 시스 엘리먼트이다. 지놈의 E1 영역(E1A 및 E1B)은 전사 및 숙주 세포 유전자의 전사를 조절하는 단백질을 코딩한다. E2 영역(E2A 및 E2B)은 바이러스 DNA 복제에 관여하는 단백질을 코딩한다. 현재 개발된 아데노바이러스 벡터 중에서, E1 영역이 결여된 복제불능 아데노바이러스가 많이 이용되고 있다. 한편, E3 영역은 통상적인 아데노바이러스 벡터에서 제거되어 외래 유전자가 삽입되는 자리를 제공한다 (Thimmappaya, B. et al., Cell, 31:543-551(1982); 및 Riordan, J. R. et al.,Science, 245:1066-1073(1989)). 따라서, 본 발명의 유전자발현 조절서열은 E1A 유전자의 프로모터 서열 위치에 삽입되어 E1A 유전자의 발현을 조절할 수 있다. 또한, 본 발명의 유전자발현 조절서열-발현 유전자 카세트는 결실된 E1 영역(E1A 영역 및/또는 E1B 영역, 바람직하게는 E1B 영역) 또는 E3 영역에 삽입되는 것이 바람직하고, 보다 바람직하게는 결실된 E1 영역에 삽입된다. 또한, 본 발명의 유전자발현 조절서열-발현 유전자 카세트는 결실된 E4 영역에도 삽입될 수 있다. 본 명세서에서 바이러스 지놈 서열과 관련하여 사용되는 용어, "결실"은 해당 서열이 완전히 결실된 것뿐만 아니라, 부분적으로 결실된 것도 포함하는 의미를 가진다.
또한, 아데노바이러스는 야생형 지놈의 약 105%까지 패킹할 수 있기 때문에, 약 2 kb를 추가적으로 패키징할 수 있다(Ghosh-Choudhury et al., EMBO J., 6:1733-1739(1987)). 따라서, 아데노바이러스에 삽입되는 상술한 외래 서열은 아데노바이러스의 지놈에 추가적으로 결합시킬 수도 있다.
아데노바이러스에 의해 운반되는 외래 유전자는 에피좀과 동일한 방식으로 복제되며, 이에 숙주세포에 대해 유전적 독성이 매우 낮다. 따라서, 본 발명의 아데노바이러스 유전자 전달 시스템을 이용한 유전자 치료가 매우 안전할 것으로 판단된다.
3. 레트로바이러스
레트로바이러스는 자신의 유전자를 숙주의 지놈으로 삽입시키고, 대량의 외래 유전 물질을 운반할 수 있으며, 감염시킬 수 있는 세포의 스펙트럼이 넓기 때문에 유전자 전달 벡터로서 많이 이용되고 있다.
레트로바이러스 벡터를 구축하기 위하여, 운반하고자 하는 목적 뉴클레오타이드 서열은 레트로바이러스의 서열 대신에 레트로바이러스 지놈에 삽입되어 복제불능의 바이러스를 생산한다. 바이리온을 생산하기 위하여, gag, pol 및 env 유전자를 포함하지만 LTR(long terminal repeat)와 Ψ서열은 없는 패키징 세포주를 구축한다. 운반하고자 하는 목적 뉴클레오타이드 서열, LTR 및 Ψ서열을 포함하는 재조합 플라스미드를 상기 세포주에 이입하면, Ψ서열은 재조합 플라스미드의 RNA 전사체의 생산을 가능하게 하며, 이 전사체는 바이러스로 패키징되고, 바이러스는 배지로 배출된다. 재조합 레트로바이러스를 함유하는 배지를 수집하고 농축하여 유전자 전달 시스템으로 이용한다.
2세대 레트로바이러스 벡터를 이용한 유전자 전달이 발표되었다. 몰로니 뮤라인 류케미아 바이러스의 변이체를 제조하였고, 여기에서 EPO(erythropoietin) 서열을 엔벨로프 부위에 삽입하여 새로운 결합 특성을 갖는 키메릭 단백질을 생산하였다. 본 발명의 유전자 전달 시스템도 이와 같은 2세대 레트로바이러스 벡터의 구축 전략에 따라 제조할 수 있다.
4. AAV 벡터
아데노-관련 바이러스 (AAV)는 비분열 세포을 감염시킬 수 있고, 다양한 종류의 세포에 감염할 수 있는 능력을 갖고 있기 때문에 본 발명의 유전자 전달 시스템으로 적합하다. AAV 벡터의 제조 및 용도에 대한 상세한 설명은 미국 특허 제5,139,941 호 및 제4,797,368 호에 상세하게 개시되어 있다. 유전자 전달 시스템으로서의 AAV에 대한 연구는 LaFace et al, Viology, 162:483486(1988), Zhou et al., Exp. Hematol. (NY), 21:928-933(1993), Walsh et al, J. Clin. Invest., 94:1440-1448(1994) 및 Flotte et al., Gene Therapy, 2:29-37(1995)에 개시되어 있다. 최근에, AAV 벡터는 낭포성 섬유증의 치료제로서 임상 I을 실시하고 있다.
전형적으로, AAV 바이러스는 두 개의 AAV 말단 리피트가 옆에 위치되어 있는 목적의 유전자 서열(릴랙신 유전자 및 운반하고자 하는 목적 뉴클레오타이드 서열을 포함하는 플라스미드 (McLaughlin et al., J. Virol., 62:1963-1973(1988); 및 Samulski et al., J. Virol., 63:3822-3828(1989)) 및 말단 리피트가 없는 야생형 AAV 코딩 서열을 포함하는 발현 플라스미드(McCarty et al., J. Virol., 65:2936-2945( 1991))를 동시 형질주입시켜 제조된다.
5. 다른 바이러스 벡터
다른 바이러스 벡터들도 본 발명의 유전자 전달 시스템으로 이용할 수 있다. 배시니아 바이러스, 렌티바이러스 또는 헤르페스 심플렉스 바이러스, 리오바이러스, 폭스바이러스, 셈리키 포리스터 바이러스로부터 유래된 벡터들도, 목적 뉴클레오타이드 서열을 세포내로 운반할 수 있는 운반 시스템으로 이용할 수 있다.
6. 폴리머
비바이러스성 유전자 전달체로서 폭넓게 사용되는 폴리머계 전달체로는 젤라틴, 키토산, PLL(poly-LLysine) 및 PEI(polyethyleneamine) 등이 이용되고 있다. 폴리머계 유전자 전달체들의 장점은 면역반응과 급성독성의 발현율이 낮고 제조법이 간단하며 대량생산이 가능하다는 점이다.
7. 리포좀 및 니오좀
리포좀은 수상에 분산된 인지질에 의해 자동적으로 형성된다. 외래 DNA 분자를 리포좀으로 성공적으로 세포 내로 운반한 예는 Nicolau 및 Sene, Biochim. Biophys. Acta, 721:185-190(1982) 및 Nicolau et al., Methods Enzymol., 149:157-176(1987)에 개시되어 있다. 한편, 리포좀을 이용한 동물세포의 형질주입에 가장 많이 이용되는 시약으로는 Lipofectamine(Gibco BRL)이 있다. 운반하고자 하는 목적 뉴클레오타이드 서열을 내포한 리포좀은 엔도사이토시스, 세포 표면에로의 흡착 또는 플라즈마 세포막과의 융합 등의 기전을 통해 세포와 상호 작용하여 세포내로 운반하고자 하는 목적 뉴클레오타이드 서열을 운반한다.
리포좀이 인지질을 이용하여 만들어지는 것에 반하여 니오좀(niosome)은 사용하고 비-이온성 계면활성제(nonionic surfactant) 및 콜레스테롤(cholesterol)의 혼합으로 구성된 이중막 수송체로 극성 및 비극성 물질을 봉입할 수 있고, 삼투압적으로 활성이 있으며, 인지질 등에 의한 지질미립자의 운반체인 리포좀에 비하여 안정하고, 또한 제조시 사용되는 계면활성제가 보관 및 취급 시에 특별한 조건이 필요하지 않다는 장점을 가진다.
8. 나노물질
본 명세서 상의 용어 나노물질은 수 내지 수백 나노미터의 크기를 갖는 생체 적합성 고분자 물질을 의미하는 것으로서, 예를 들면, 폴리에틸렌글리콜(polyetheleneglycol, PEG), 폴리락타이드(poly-lactide, PLA), 폴리글리콜리드(polyglycolide, PGA), 폴리락티드코글리콜리드(poly-lactide-co-glycolide, PLGA), 폴리카프로락톤(poly-ε-carprolactone, PCL), 히알루론산(hyaluronic acid, HA), 키토산(chitosan), 또는 혈청 알부민이 이에 해당할 수 있다.
한편, 상술한 본 발명의 유전자 전달 시스템을 세포내로 도입하는 방법은 당업계에 공지된 다양한 방법을 통해 실시될 수 있다.
본 발명에서, 유전자 전달 시스템이 바이러스 벡터에 기초하여 제작된 경우에는, 당업계에 공지된 바이러스 감염 방법에 따라 실시된다. 바이러스 벡터를 이용한 숙주 세포의 감염은 상술한 인용문헌에 기재되어 있다.
본 발명에서 유전자 전달 시스템이 내이키드 (naked) 재조합 DNA 분자 또는 플라스미드인 경우에는, 미세 전환법 (Capecchi, M.R., Cell, 22:479(1980); 및 Harland와 Weintraub, J. Cell Biol. 101:1094-1099(1985)), 칼슘 포스페이트 침전법 (Graham, F.L. et al., Virology, 52:456(1973); 및 Chen과 Okayama, Mol. Cell. Biol. 7:2745-2752(1987)), 전기 천공법 (Neumann, E. et al., EMBO J., 1:841(1982); 및 Tur-Kaspa et al., Mol. Cell Biol., 6:716-718(1986)), 리포좀-매개 형질주입법 (Wong, T.K. et al., Gene, 10:87(1980); Nicolau 및 Sene, Biochim. Biophys. Acta, 721:185-190(1982); 및 Nicolau et al., Methods Enzymol., 149:157-176(1987)), DEAE-덱스트란 처리법 (Gopal, Mol. Cell Biol., 5:1188-1190(1985)), 및 유전자 밤바드먼트(Yang et al., Proc. Natl. Acad. Sci., 87:9568-9572(1990)) 방법에 의해 유전자를 세포내로 이입시킬 수 있다.
Ⅶ. 약학 조성물
본원에 기재된 유전체 편집 RNA/DNA 시스템은 약학 조성물의 형태로 존재할 수 있다. 본 발명에 따른 약학 조성물은 본 발명에 따른 하나 이상의 핵산 분자, 바람직하게는 유전체 편집 RNA/DNA 시스템을 포함할 수 있다.
본 발명에 따른 약학 조성물은 제약상 허용 가능한 희석제및/또는 제약상 허용 가능한 부형제및/또는 제약상 허용 가능한 담체 및/또는 제약상 허용 가능한 운반체를 포함한다. 제약상 허용 가능한 담체, 운반체, 부형제또는 희석제의 선택은 특별히 제한되지 않는다. 당업계에 공지된 임의의 적합한 제약상 허용 가능한 담체, 운반체, 부형제또는 희석제가 사용될 수 있다.
본 발명에서, 약학 조성물은 용매, 예컨대 수성 용매 또는 RNA의 무결성을 보존할 수 있게 하는 임의의 용매를 추가로 포함할 수 있다. 바람직한 일 실시형태에서, 약학 조성물은 RNA를 포함하는 수용액이다.
수용액은 선택적으로 용질, 예를 들면, 생리식염수를 포함할 수 있다.
본 발명에서, 약학 조성물은 동결 건조된 조성물의 형태이다. 동결 건조된 조성물은 각각의 수성 조성물을 동결 건조시킴으로써 얻을 수 있다.
약학 조성물은 적어도 하나의 양이온성 실체를 포함한다. 일반적으로, 양이온성 지질, 양이온성 중합체 및 양전하를 갖는 다른 물질은 음으로 하전된 핵산과 복합체를 형성할 수 있다. 양이온성 화합물, 바람직하게는 양이온성 또는 폴리양이온성 펩티드 또는 단백질과 같은 폴리양이온성 화합물과의 복합체화에 의해 본 발명에 따른 RNA를 안정화시키는 것이 가능하다. 일 실시형태에서, 본 발명에 따른 약학 조성물은 프로타민, 폴리에틸렌 이민, 폴리-L-리신, 폴리-L-아르기닌, 히스톤 또는 양이온성 지질로 이루어진 군으로부터 선택된 적어도 하나의 양이온성 분자를 포함한다.
본 발명에 따르면, 양이온성 지질은 양이온성 양친매성 분자, 예를 들어 하나 이상의 친수성 및 친유성 잔기를 포함하는 분자이다. 양이온성 지질은 모노양이온성 또는 폴리양이온성일 수 있다. 양이온성 지질은 전형적으로 스테롤, 아실 또는 디아실 사슬과 같은 친유성 잔기를 가지며, 전반적인 순 양전하를 갖는다. 지질의 헤드기는 일반적으로 양전하를 띠고 있다. 양이온성 지질은 바람직하게는 1 내지 10가의 양전하, 보다 바람직하게는 1 내지 3 가의 양전하, 및 더욱 바람직하게는 1가의 양전하를 갖는다. 양이온성 지질의 예로는 1,2-디-O-옥타데세닐-3-트리메틸암모늄 프로판 (DOTMA); 디메틸디옥타데실암모늄 (DDAB); 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP); 1,2-디올레오일-3-디메틸암모늄-프로판 (DODAP); 1,2-디아실옥시-3-디메틸암모늄 프로판s; 1,2-디알킬옥시-3-디메틸암모늄 프로판; 디옥타데실디메틸 암모늄 클로라이드 (DODAC), 1,2-디미리스토일옥시프로필-1,3-디메틸하이드록시에틸 암모늄 (DMRIE), 및 2,3-디올레오일옥시-N-[2(스페르민 카복사미드)에틸]-N,N-디메틸-1-프로파나뮴 트리플루오로아세테이트 (DOSPA)를 포함하지만, 이에 한정되는 것은 아니다. 양이온성 지질은 또한 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판 (DLinDMA)을 포함하는 삼차 아민기를 갖는 지질을 포함한다.
양이온성 지질은 본원에 기재된 바와 같이, 리포좀, 에멀젼 및 리포플렉스와 같은 지질 제형에서 RNA를 제형화하는데 적합하다. 전형적으로 양전하는 적어도 하나의 양이온성 지질에 의해 기여되고 음전하는 RNA에 의해 기여된다. 일 실시형태에서, 약학 조성물은 양이온성 지질 이외에 적어도 하나의 헬퍼 지질을 포함한다. 헬퍼 지질은 중성 또는 음이온성 지질일 수 있다. 헬퍼 지질은 자연성 지질, 예컨대 인지질, 또는 자연성 지질의 유사체, 또는 자연성 지질과 유사하지 않은 완전 합성 지질, 또는 지질 유사 분자일 수 있다. 약학 조성물이 양이온성 지질 및 헬퍼 지질을 모두 포함하는 경우, 양이온성 지질 대 중성 지질의 몰비는 제형의 안정성 등의 관점에서 적절하게 결정될 수 있다.
본 발명에 따른 약학 조성물은 프로타민을 포함한다. 본 발명에 따르면, 프로타민은 양이온 담체 제제로서 유용하다. 용어 "프로타민"은 아르기닌이 풍부하고 어류와 같은 동물의 정자 세포에서 체세포 히스톤 대신 DNA와 특히 관련이 있다고 발혀진 비교적 저분자량의 다양한 강염기성 단백질을 지칭한다. 특히, "프로타민"이라는 용어는 어류 정자에서 발견되는 단백질로, 강염기성이며 물에 용해되고 열로 응고되지 않으며 다수의 아르기닌 단량체를 포함하는 단백질을 지칭한다. 본 발명에 따르면, 본원에서 사용되는 "프로타민"이라는 용어는 자연성 또는 생물학적 원천으로부터 수득되거나 유도된 임의의 프로타민 아미노산 서열을 포함하는 것으로, 상기 아미노산 서열 또는 이의 단편의 다합체 형태 및 이의 단편을 포함하는 것을 의미한다. 또한, 이 용어는 인공적이고 특정 목적을 위해 특별히 설계된 것으로, 자연성 또는 생물학적 원천으부터 분리될 수 없는 (합성된) 폴리펩티드를 포함한다.
본 발명의 조성물은 하나 이상의 보조제를 포함할 수 있다.
본 발명에 따른 약학 조성물은 완충될 수 있다(예를 들어, 아세트산염 완충액, 구연산염 완충액, 숙신산염 완충액, 트리스 완충액, 인산염 완충액으로 완충한다).
유전체 편집 RNA/DNA 시스템-함유 입자
본 발명의 유전체 편집 RNA/DNA 시스템은 RNA와 DNA로 구성되며, 전자는 단일가닥 RNA 절편이며 후자는 환형인 플라스미드이다. 비보호된 RNA의 불안정성 때문에, 본 발명의 유전체 편집 RNA/DNA 시스템을 복합체 형태 또는 캡슐화된 형태로 제공하는 것이 유리하다. 각각의 약학 조성물이 본 발명에 제공된다.
특히, 본 발명의 약학 조성물은 핵산-함유 입자, 바람직하게는 유전체 편집 RNA/DNA 시스템-함유 입자를 포함한다. 각각의 약학 조성물은 미립자 제형으로 지칭된다. 본 발명에 따른 미립자 제형에서, 입자는 본 발명에 따른 핵산 및 핵산 전달에 적합한 제약상 허용 가능한 담체 또는 제약상 허용 가능한 운반체를 포함한다.
본 발명의 유전체 편집 RNA/DNA 시스템-함유 입자는 예를 들어 단백성 입자 형태 또는 지질-함유 입자 형태일 수 있다. 적합한 단백질 또는 지질은 입자 형성 제제로 지칭된다.
본 발명에 따른 RNA/DNA 시스템이 미립자 제형으로 제형화되는 경우, 각 RNA 종(DdRp RNA 발현 카세트, 및 유전체 편집에 적합한 단백질을 코딩하는 RNA와 같은 임의의 부가적인 RNA 종) 및 DNA 종(auto-DdRp 발현구조체 및 유전체 편집 도구 DNA 발현 카세트와 같은 임의의 부가적인 DNA 종)을 미립자 제형으로서 제형화할 수 있다. RNA 종 및 DNA종을 각각의 개별 미립자 제형로 제형화할 수도 있고, 유전체 편집 RNA/DNA 시스템을 하나의 미립자 제형으로 할 수도 있다.
개별 미립자 제형은 별개의 실체로서, 예를 들어 별도의 용기에서 존재할 수 있다. 이러한 제형은 각각의 핵산을 개별적으로 (전형적으로 각각 유전체 편집 RNA/DNA 시스템 함유 용액의 형태로) 입자 형성 제제와 함께 제공하여, 입자의 형성을 가능하게 함으로써 수득할 수 있다. 각각의 입자는 입자가 형성될 때 제공되는 특정 핵산을 독점적으로 함유할 것이다 (개별 미립자 제형).
본 발명에 따른 약학 조성물은 둘 이상의 개별적인 입자 제형을 포함한다. 각각의 약학 조성물은 혼합된 미립자 제형으로 지칭된다. 본 발명에 따른 혼합된 미립자 제형은 개별적인 미립자 제형을 혼합한 후에 상기한 바와 같이 개별 미립자 제형을 따로 따로 형성하여 얻을 수 있다.
혼합 단계에 의해, 유전체 편집 RNA/DNA 시스템-함유 입자가 혼합된 집단을 포함하는 하나의 제형이 수득 가능하다 (예컨대 입자의 제1 집단은 본 발명에 따른 DNA 발현 카세트를 함유할 수 있고, 입자의 제2 제형은 본 발명에 따른 RNA 발현 카세트를 함유할 수 있다). 미립자 집단은 개별 미립자 제형의 혼합된 집단을 포함한 하나의 용기 내에 함께 있을 수 있다.
대안적으로, 약학 조성물의 모든 유전체 편집 RNA/DNA 시스템이 조합된 미립자 제형으로서 함께 제형화될 수 있다. 이러한 제형은 모든 유전체 편집 RNA/DNA 시스템의 조합된 제형 (전형적으로 조합된 용액)를 입자-형성 제제와 함께 제공하여, 입자의 형성을 가능하게 함으로써 수득할 수 있다.
혼합된 미립자 제형과는 대조적으로, 조합된 미립자 제형은 전형적으로 유전체 편집 RNA/DNA 시스템을 포함하는 입자를 포함할 것이다. 조합된 미립자 조성물에서, 유전체 편집 RNA/DNA 시스템이 전형적으로 단일 입자 내에 함께 존재한다.
본 발명의 미립자 제형은 나노미립자 제형이다. 이 실시형태에서, 본 발명에 따른 조성물은 나노입자의 형태로 본 발명에 따른 핵산을 포함한다. 나노미립자 제형은 다양한 프로토콜과 다양한 복합 화합물로 얻을 수 있다. 지질, 중합체, 올리고머 또는 양친매체는 나노미립자 제형의 전형적인 성분이다.
용어 "나노입자"는 일반적으로 직경이 1000 나노미터(nm) 이하인 핵산의 전신투여, 특히 비경구 투여에 적합한 입자를 형성하는 직경을 갖는 임의의 입자를 지칭한다. 일 실시형태에서, 나노입자는 평균 직경이 약 50 nm 내지 약 1000 nm, 바람직하게는 약 50 nm 내지 약 400 nm, 바람직하게는 약 100 nm 내지 약 300 nm, 예컨대 약 150 nm 내지 약 200 nm의 범위를 갖는다. 일 실시형태에서, 나노입자는 직경이 약 200 내지 약 700 nm, 약 200 내지 약 600 nm, 바람직하게는 약 250 내지 약 550 nm, 특히 약 300 내지 약 500 nm 또는 약 200 내지 약 400 nm의 범위를 갖는다.
동적 광산란에 의해 측정된 바와 같이, 본원에 기재된 나노입자의 다분산지수(PI)는 0.5이하, 바람직하게는 0.4 이하 또는 더더욱 바람직하게는 0.3 이하이다. "다분산지수"(PI)는 입자 혼합물에서 개별 입자 (예컨대 리포좀)의 균질 또는 불균질적 크기 분포를 측정한 것으로, 혼합물 내의 입자 분포의 폭을 나타낸다. PI는 예를 들어 WO 2013/143555 A1에 기술된 바와 같이 결정될 수 있다.
"나노미립자 제형" 또는 유사한 용어는 적어도 하나의 나노입자를 함유하는 임의의 미립자 제형를 지칭한다. 나노미립자 조성물은 나노입자의 균일한 집합체이다. 나노미립자 조성물은 리포좀 제형과 같은 지질-함유 약학 제형 또는 에멀젼이다.
지질-함유 약학 조성물
본 발명의 약학 조성물은 적어도 하나의 지질을 포함한다. 바람직하게는, 적어도 하나의 지질은 양이온성 지질이다. 상기 지질-함유 약학 조성물은 본 발명에 따른 핵산을 포함한다. 본 발명에 따른 약학 조성물은 소포, 예를 들어 리포좀에 캡슐화된 유전체 편집 RNA/DNA 시스템을 포함한다. 본 발명에 따른 약학 조성물은 에멀젼의 형태로 유전체 편집 RNA/DNA 시스템을 포함한다. 본 발명에 따른 약학 조성물은 양이온성 화합물과의 복합체 중에 RNA를 포함함으로써, 예를 들어, 소위 리포플렉스 또는 폴리플렉스를 형성한다. 리포좀과 같은 소포 내 유전체 편집 RNA/DNA 시스템의 캡슐화는 예를 들어 지질/유전체 편집 RNA/DNA 시스템 복합체와는 다르다. 예를 들어, 지질/유전체 편집 RNA/DNA 시스템 복합체는 유전체 편집 RNA/DNA 시스템이 예를 들어 미리 형성된 리포좀과 혼합된 경우에 수득된다.
본 발명에 따른 약학 조성물은 소포에 캡슐화된 유전체 편집 RNA/DNA 시스템를 포함한다. 이러한 제형은 본 발명에 따른 특정 미립자 제형이다. 소포는 구형의 껍데기로 감싸진 지질 이중층으로, 작은 공간을 둘러싸고 그 공간을 소포 외부의 공간과 분리한다. 전형적으로, 소포 내의 공간은 수성 공간, 즉 물을 포함한다.
전형적으로, 소포외부의 공간은 수성 공간, 즉 물을 포함한다. 지질 이중층은 하나 이상의 지질(소포-형성 지질)에 의해 형성된다. 소포를 둘러싸고 있는 막은 원형질막과 유사한 라멜라 형상이다.
본 발명에 따른 소포는 다중 라멜라 소포, 단일 라멜라 소포 또는 이들의 혼합물일 수 있다. 소포 내에 캡슐화될 때, 유전체 편집 RNA/DNA 시스템은 전형적으로 임의의 외부 매질로부터 분리된다. 따라서 그것은 자연성 바이러스의 보호된 형태와 기능적으로 동등한 보호된 형태로 존재한다. 적합한 소포는 본원에 기재된 바와 같은 입자, 특히 나노입자이다.
예를 들어, 유전체 편집 RNA/DNA 시스템은 리포좀에 캡슐화될 수 있다. 이 실시형태에서, 약학 조성물은 리포좀 제형이거나 이를 포함한다. 리포좀 내의 캡슐화는 전형적으로 RNase 분해로부터 유전체 편집 RNA/DNA 시스템을 보호할 것이다. 리포좀은 일부 외부 유전체 편집 RNA/DNA 시스템을 포함할 수 있지만, 유전체 편집 RNA/DNA 시스템의 적어도 절반(이상적으로는 모두)은 리포좀의 코어 내에 캡슐화된다.
리포좀은 종종 인지질과 같은 소포-형성 지질의 하나 이상의 이중층을 가진 미세한 지질 소포이고 약물, 예를 들어 유전체 편집 RNA/DNA 시스템을 캡슐화할 수 있다. 다중 라멜라 소포 (MLV), 소형 단일 라멜라 소포(SUV), 대형 단일 라멜라 소포 (LUV), 입체적으로 안정화된 리포좀 (SSL), 다포체 소포 (MV) 및 대형 다포체 소포 (LMV)뿐만 아니라 당업계에 공지된 다른 이중층 형태를 포함하는 리포좀의 다른 유형을 채용할 수 있으나, 이에 한정되는 것은 아니다. 리포좀의 크기 및 층상도는 제조 방법에 따라 달라질 것이다. 지질이 라멜라 형상, 육방정 및 역상 육방정 형상, 입방 형상, 미셀, 단층으로 구성된 역 미셀을 포함하는, 수성 매질에서 존재할 수 있는 다른 여러 형태의 초분자성 구성이 있다. 또한, 이들 형상들은 DNA 또는 RNA와의 조합으로 수득될 수 있으며, RNA 및 DNA와의 상호작용은 실질적으로 형상 상태에 영향을 줄 수 있다. 이러한 형상은 본 발명의 나노미립자 유전체 편집 RNA/DNA 시스템 제형에 존재할 수 있다.
리포좀은 공지된 표준 방법을 사용하여 형성할 수 있다. 각각의 방법은 역 증발 방법, 에탄올 주입 방법, 탈수-재수화 방법, 초음파 처리 또는 다른 적절한 방법을 포함한다. 리포좀 형성 후, 실질적으로 균질한 크기 범위를 갖는 리포좀 집단을 얻도록 리포좀의 크기를 바꿀 수 있다.
유전체 편집 RNA/DNA 시스템은 적어도 하나의 양이온성 지질을 포함하는 리포좀에 존재한다. 각각의 리포좀은 적어도 하나의 양이온성 지질이 사용하는 경우, 단일 지질 또는 지질의 혼합물로부터 형성될 수 있다. 바람직한 양이온성 지질은 양성자화될 수 있는 질소 원자를 가지며; 바람직하게는, 이러한 양이온성 지질은 삼차 아민기를 갖는 지질이다. 삼차 아민기를 갖는 특히 적합한 지질은 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판 (DLinDMA)이다. 일 실시형태에서, 본 발명에 따른 RNA는 리포좀 제형으로 존재한다: RNA를 포함하는 수성 코어를 캡슐화하는 지질 이중층을 갖는 리포좀으로서, 지질 이중층은 pKa가 5.0 내지 7.6의 범위인 바람직하게는 삼차 아민기를 갖는 지질을 포함한다. 삼차 아민기를 갖는 바람직한 양이온성 지질은 DLinDMA (pKa 5.8)를 포함한다.
각각의 화합물을 포함하는 리포좀은 특히 유전체 편집 RNA/DNA 시스템의 캡슐화에 적합하여 유전체 편집 RNA/DNA 시스템의 리포좀 전달에 적합하다. 본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하며, 여기서 리포좀은 적어도 하나의 양이온성 지질을 포함하며, 그 헤드기는 양성자화될 수 있는 적어도 하나의 질소원자(N)를 포함하며, 리포좀 및 RNA는 N:P 비율이 1:1 내지 20:1이다. 본 발명에 따르면, "N:P 비율"은 지질-함유 입자 (예컨대 리포좀)에 포함된 유전체 편집 RNA/DNA 시스템에서의 인원자(P)에 대한 양이온성 지질 중의 질소원자(N)의 몰비를 지칭한다. 1:1과 20:1 사이의 N:P 비율은 리포좀의 순 전하와 척추 세포로의 유전체 편집 RNA/DNA 시스템 전달 효율에 연관됨을 시사하는 것이다.
본 발명에 따른 유전체 편집 RNA/DNA 시스템은 폴리에틸렌 글리콜 (PEG) 부분을 포함하는 적어도 하나의 지질을 포함하는 리포좀 제형에 존재하며, 여기서 유전체 편집 RNA/DNA 시스템가 PEG화된 리포좀 내에 캡슐화되어 PEG 부분이 리포좀의 외부에 존재한다.
본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하고,리포좀은 직경이 60-180 nm 범위를 갖는다.
본 발명에 따른 유전체 편집 RNA/DNA 시스템은 리포좀 제형 내에 존재하고, 유전체 편집 RNA/DNA 시스템-함유 리포좀이 0 또는 음성에 가까운 순 전하를 갖는다.
본 발명에 따른 유전체 편집 RNA/DNA 시스템은 에멀젼의 형태로 존재한다. 에멀젼은 종래에 RNA 분자와 같은 핵산 분자를 세포에 전달하는 데 사용되는 것으로 기재되어 있다. 본 발명에서 바람직한 것은 수중유형 에멀젼이다. 각각의 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다. 보다 바람직한 것은 본 발명에 따른 유전체 편집 RNA/DNA 시스템이 에멀젼 입자와 복합체화된 양이온성 수중유형 에멀젼이다. 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다.
양이온성 지질은 음으로 하전된 유전체 편집 RNA/DNA 시스템과 상호작용하여 에멀젼 입자에 유전체 편집 RNA/DNA 시스템을 고정시킨다. 수중유형 에멀젼에서, 에멀젼 입자는 수성 연속 상에 분산된다. 예를 들어, 에멀젼 입자의 평균 직경은 전형적으로 약 80 nm 내지 180nm일 수 있다.
본 발명의 약학 조성물은 양이온성 수중유형 에멀젼이고, 여기서 에멀젼 입자는 오일 코어 및 양이온성 지질을 포함한다. 본 발명에 따른 유전체 편집 RNA/DNA 시스템은 양이온성 지질을 포함하는 에멀젼의 형태로 존재할 수 있고, 에멀젼의 N:P 비율이 적어도 4:1이다.
본 발명에 따른 유전체 편집 RNA/DNA 시스템은 양이온성 지질 에멀젼의 형태로 존재할 수 있다. 특히, 조성물은 양이온성 수중유형 에멀젼의 입자와 복합체화된 유전체 편집 RNA/DNA 시스템을 포함할 수 있으며, 여기서 오일/지질의 비율은 적어도 약 8:1 (몰:몰)이다.
본 발명에 따른 약학 조성물은 리포플렉스의 형태로 유전체 편집 RNA/DNA 시스템을 포함한다. "리포플렉스" 또는 "유전체 편집 RNA/DNA 시스템 리포플렉스"라는 용어는 지질 및 유전체 편집 RNA/DNA 시스템과 같은 핵산의 복합체를 지칭한다. 리포플렉스는 양이온성 (양성 하전된) 리포좀과 음이온성 (음성 하전된) 핵산으로 형성될 수 있다. 양이온성 리포좀은 또한 중성 "헬퍼" 지질을 포함할 수 있다. 가장 간단한 경우에, 리포플렉스는 핵산을 특정 혼합 프로토콜로 리포좀과 혼합함으로써 자발적으로 형성되지만, 다양한 다른 프로토콜이 적용될 수 있다. 양성 하전된 리포좀과 음성 하전된 핵산 사이의
정전기적 상호작용이 리포플렉스 형성의 원동력임을 이해할 수 있다. 본 발명에서, 유전체 편집 RNA/DNA 시스템리포플렉스 입자의 순 전하는 0에 가깝거나 음성이다. 유전체 편집 RNA/DNA 시스템 및 리포좀의 전기적-중성 또는 음성 하전된 리포플렉스는 전신 투여 후 세포에서 실질적인 유전체 편집 RNA/DNA 시스템 발현을 유도할 수 있다.
따라서, 본 발명에서, 본 발명에 따른 약학 조성물은 나노입자, 바람직하게는 리포플렉스 나노입자의 형태로 유전체 편집 RNA/DNA 시스템을 포함하며, 여기서 (i) 나노입자 내의 양전하의 수가 나노입자 내의 음전하의 수를 초과하지 않고 및/또는 (ii) 나노입자가 중성 또는 순 음전하를 띠며, 및/또는 (iii) 나노입자에서 음전하에 대한 양전하의 전하 비율이 1.4:1 이하이며, 및/또는 (iv) 나노입자의 제타전위는 0 이하이다.
제타전위는 콜로이드성 시스템에서 전기역학적 전위에 대한 과학 용어이다. 본 발명에서, (a) 제타전위 및 (b) 나노입자 내의 유전체 편집 RNA/DNA 시스템에 대한 양이온성 지질의 전하 비율은 계산될 수 있다. 요약하면, 입자의 순 전하가 0 또는 음에 가깝거나 음성인, 정의된 입자 크기를 갖는 나노미립자 리포플렉스 제형인 약학 조성물은 본 발명과 관련하여 바람직한 약학 조성물이다.