配列表
添付の配列表に列挙されている核酸配列およびアミノ酸配列は、37C.F.R.1.822において定義されている通り、ヌクレオチド塩基については標準的な文字略語、およびアミノ酸については3文字コードを使用して示されている。各核酸配列の一方の鎖のみが示されているが、示されている鎖への言及のいずれにも相補鎖が含まれると理解されたい。配列表は、2020年9月30日に作成された157KBのASCIIテキストファイルとして提出され、それは参照により本明細書に組み込まれる。添付の配列表において:
配列番号1および2は、それぞれ、全長YFPを発現させるために使用したN末端配列およびC末端配列である。配列番号1、CMVプロモーターnt1~543、YFPコード配列nt544~1032、合成イントロンnt1033~1436、および非翻訳ポリA領域nt1437~1491。配列番号2、CMVプロモーターnt1~522、合成イントロンnt523~904、YFPコード配列nt905~1141、およびnt1142~1302は非翻訳ポリA領域である。
配列番号3および4は、それぞれ、所望の全長タンパク質を発現させるために使用することができる5’イントロン配列および3’イントロン配列であり、ここで、全長タンパク質のN末端部分を配列番号3のnt1に付加することができ、全長タンパク質のC末端部分を配列番号4のnt382に付加することができる。
配列番号5および6は、それぞれ、全長YFPを発現させるために使用したN末端コード配列およびC末端コード配列である。
配列番号7は、例示的な合成イントロン二量体形成ドメインである(図10E)。
配列番号8は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10F)。
配列番号9は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10G)。
配列番号10は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10H)。
配列番号11は、結合ドメインを有さない例示的な合成イントロンである(図10I)。
配列番号12は、二量体形成ドメインを有する例示的な合成イントロンである(図10J)。
配列番号13は、二量体形成ドメインを有する例示的な合成イントロンである(図10K)。
配列番号14は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10L)。
配列番号15は、DISEのみを有する例示的な合成イントロンである(図10M)。
配列番号16は、HHrzを有さない例示的な合成イントロンである(図10N)。
配列番号17は、イントロンスプライシングエンハンサーを有さない例示的な合成イントロンである(図10O)。
配列番号18は、結合ドメインを有する例示的なU12依存性イントロンである(図10P)。
配列番号19は、結合ドメインを有する例示的なU12依存性イントロンである(図10Q)。
配列番号20および21は、それぞれ、全長Abca4をもたらすRNA(プレmRNA)を発現させるために使用したN末端DNA配列およびC末端DNA配列である。配列番号20において、N末端Abca4コード領域に対応する配列がnt22~3702に存在し、nt3703~3912は合成イントロンであり、3921~3969は非翻訳ポリA領域である。配列番号20は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、nt3782~3794のM2イントロンスプライシングエンハンサー、およびnt3801~3975のキッシングループ二量体形成ドメインも含有する。配列番号21において、nt1~228は合成イントロンであり、nt229~3366はC末端Abca4コード領域であり、3367~3447はFLAGエピトープタグであり、nt3476~3607は非翻訳ポリA領域(シグナル)である。配列番号21は、nt3~114のキッシングループ二量体形成ドメイン、nt121~133のM2イントロンスプライシングエンハンサー、nt140~163のcTNTイントロンスプライシングエンハンサー、nt175~187のM2イントロンスプライシングエンハンサー、nt194~201の分岐点モチーフ、nt207~226のポリピリミジントラクト、およびnt228にスプライスアクセプターも含有する。
配列番号22および23は、それぞれ、長い全長YFPをもたらすRNA(プレmRNA)を発現させるために使用したN末端DNA配列およびC末端DNA配列あり、それぞれスプライスエンハンサーを含む。配列番号22において、N末端YFPコード領域はnt22~3702であり、nt3703~3912は合成イントロンであり、3921~3969は非翻訳ポリA領域である。配列番号22は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、3782~3794にM2イントロンスプライシングエンハンサー、および3801~3975にキッシングループ二量体形成ドメインも含有する。配列番号23において、nt1~225は合成イントロンであり、nt226~3747はC末端YFPコード領域であり、nt3748~3912は非翻訳ポリA領域である。配列番号23は、nt3~114のキッシングループ二量体形成ドメイン、nt118~130のM2イントロンスプライシングエンハンサー、nt137~160のcTNTイントロンスプライシングエンハンサー、nt172~184のM2イントロンスプライシングエンハンサー、nt191~198の分岐点モチーフ、nt204~223のポリピリミジントラクト、およびnt225にスプライスアクセプターを含む。
配列番号24および25は、それぞれ、全長ヒト第VIII因子をもたらすRNA(プレmRNA)を発現させるために使用したN末端配列およびC末端配列である。配列番号24において、N末端HAエピトープタグntを有するN末端FVIIIコード領域がnt22~3561に存在し、nt3562~3771は合成イントロンであり、nt3780~3828は非翻訳ポリA領域である。配列番号24は、nt3562~3570のスプライスドナー、nt3573~3596のラットFGFR2 DISE、nt3606~3629のcTNTイントロンスプライシングエンハンサー、nt3641~3653のM2イントロンスプライシングエンハンサー、およびnt3660~3834のキッシングループ二量体形成ドメインも含有する。配列番号25において、nt1~225は合成イントロンであり、nt226~3636はC末端FVIIIコード領域であり、nt3665~3797は非翻訳ポリA領域である。配列番号25は、nt3703~3711のスプライスドナー、nt3714~3737のラットFGFR2 DISE、nt3747~3770のcTNTイントロンスプライシングエンハンサー、3782~3794のM2イントロンスプライシングエンハンサー、およびnt3801~3975のキッシングループ二量体形成ドメインも含有する。
配列番号26~136は、本明細書に提示される系で使用することができる例示的なスプライシングエンハンサーである(例えば、図6Aの118、120、156)。
配列番号137および138は、例示的なスプライスドナー配列である。
配列番号139および140は、それぞれ、HIV-1に基づくキッシングループ二量体形成ドメインのN断片およびC断片である。
配列番号141および142は、それぞれ、HIV-2に基づくキッシングループ二量体形成ドメインのN断片およびC断片である。
配列番号143は、例示的な潜在スプライスアクセプター配列である。
配列番号144は、例示的な分岐点コンセンサス配列である。
配列番号145および146は、それぞれ、全長YFPを発現させるために配列番号2(C末端断片)と一緒に使用したN配列および中間配列である。配列番号145において、nt1~543はCMVプロモーター配列であり、nt544~849はN末端YFPコード領域であり、nt850~1305は合成イントロンである。配列番号146において、nt1~522はCMVプロモーター配列であり、nt523~901は合成イントロンであり、nt902~1084は中間YFPコード領域であり、nt1085~1543は非翻訳ポリA領域である。
配列番号147および148は、それぞれ、全長Flpoを発現させるために使用した5’合成配列および3’合成配列である。配列番号147において、nt1~540はCMVプロモーター配列であり、nt541~1112はN末端Flpoコード領域であり、nt1113~1571は合成イントロンである。配列番号148において、nt1~522はCMVプロモーター配列であり、nt523~904は合成イントロンであり、nt905~1604はC末端Flpoコード領域であり、nt1605~1765は非翻訳ポリA領域である。
配列番号149および150は、例示的な低多様性配列である。
配列番号151および152は、例示的なスプライスドナーコンセンサス配列である。
配列番号153は、HIV-2キッシングループ二量体形成ドメイン(配列番号141および142、図17B)に基づく例示的なキッシングループである。
配列番号154は、例示的なコザック増強開始コドンである。
配列番号155および156は、マウスOtofコード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号155は、N末端Otof RNAを生成するために使用される。配列番号155は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4263~4311のポリアデニル化シグナルを含む。配列番号155は、N末端Otof RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~546;5’オトフェルリンコード配列nt547~4044;5’合成イントロン配列nt4045~4142;5’三峰性キッシングループ二量体形成ドメインnt4143~4254;およびnt4255~4262のリンカー。配列番号155は、C末端Otof RNAを生成するために使用される。それは、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt3335~3467のポリアデニル化シグナルを含む。それは、C末端Otof RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’オトフェルリンコード配列nt748~3225;C末端3×Flagタグnt3226~3306;およびnt3307~3334のリンカー。
配列番号157および158は、ヒトミオシンVIIA(Myo7a)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号157は、N末端Myo7a RNAを生成するために使用される。配列番号157は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4344~4392のポリアデニル化シグナルを含む。配列番号157は、N末端Myo7A RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~543;5’Myo7aコード配列nt544~4125;5’合成イントロン配列nt4126~4223;5’三峰性キッシングループ二量体形成ドメインnt4224~4335;およびnt4336~4343のリンカー。配列番号158は、C末端Myo7a RNAを生成するために使用される。配列番号158は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt3923~4055のポリアデニル化シグナルを含む。配列番号158は、C末端Myo7a RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’Myo7aコード配列nt748~3813;C末端3×Flagタグnt3814~3894;およびnt3895~3922のリンカー。
配列番号159および160は、VPR転写活性化因子ドメインと融合した全長の酵素的に不活性型のCas9(dCas9-VPR)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号159は、N末端DCas9-VPR RNAを生成するために使用される。配列番号159は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびnt4112~4161のポリアデニル化シグナルを含む。配列番号159は、N末端DCas9-VPR RNAエレメントを以下の通りコードする:コザック配列を含む5’非翻訳領域nt523~543;5’DCas9-VPRコード配列nt544~3894;5’合成イントロン配列nt3895~3992;5’三峰性キッシングループ二量体形成ドメインnt3993~4104;およびリンカーnt4105~4112。配列番号160は、C末端DCas9-VPR RNAを生成するために使用される。配列番号160は、nt1~522のヒトCMVエンハンサーおよびプロモーター、nt523の推定転写開始部位、およびポリアデニル化シグナルzt nt3278~3410を含む。配列番号160は、C末端DCas9-VPR RNAエレメントを以下の通りコードする:3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’DCas9-VPRコード配列nt748~3249;およびnt3250~3277のリンカー。
配列番号161および162は、全長ヒト化Cas9プライムエディター(プライムエディター)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号161は、N末端プライムエディター配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~543;5’プライムエディターコード配列nt544~3894;5’合成イントロン配列nt3895~3992;5’三峰性キッシングループ二量体形成ドメインnt3993~4104;リンカーnt4105~4112;ポリアデニル化シグナルnt4112~4161。配列番号162は、C末端プライムエディター配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’プライムエディターコード配列nt748~3750;リンカーnt3751~3778;ポリアデニル化シグナルnt3779~3911。
配列番号163および164は、全長ヒト化シトシン塩基エディター(AncBE4)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号163は、N末端AncBE4配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~540;5’AncBE4コード配列nt541~2892;5’合成イントロン配列nt2893~2990;5’三峰性キッシングループ二量体形成ドメインnt2991~3102;リンカーnt3103~3110;ポリアデニル化シグナルnt3111~3159。配列番号164は、C末端AncBE4配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’AncBE4コード配列nt748~3957;リンカーnt3958~3982;ポリアデニル化シグナルnt3983~4115。
配列番号165および166は、全長ヒト化アデニン塩基エディター(Abe8e)コード配列をin vivoで発現させるために使用することができる例示的な構築物である。配列番号165は、N末端Abe8e配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~540;5’Abe8eコード配列nt541~2706;5’合成イントロン配列nt2707~2804;5’三峰性キッシングループ二量体形成ドメインnt2805~2916;リンカーnt2917~2924;ポリアデニル化シグナルnt2925~2973。配列番号166は、C末端Abe8e配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列nt637~747;3’Abe8eコード配列nt748~3399;リンカーnt3400~3427;ポリアデニル化シグナルnt3428~3560。
配列番号167は、例示的なキッシングループドメイン(GATTTTTGACCTGCTCGATTGTCCACTGCGAGCAGGTCTTTTGGAGTCGGGCGAGGCGGAAGCCCGACTCCTTTTGGCATGCACGCTAGCCGCGTCGTGCATGCCTTTTATC)である。
配列番号168は、例示的なISE、M2(GGGTTATGGGACC)である。
配列番号169は、例示的なISE、cTNT(GGCTGAGGGAAGGACTGTCCTGGG)である。
配列番号170は、例示的なDISE、ラット FGFR2(CTCTTTCTTTCCATGGGTTGGCCT)である。
配列番号171および172は、全長YFPコード配列を発現させるために使用することができる例示的な構築物である。配列番号171は、N末端YFP配列を以下の通りコードする:ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;コザック配列を含む5’非翻訳領域nt523~543;5’スタッファーオープンリーディングフレームnt544~3654;自己切断性2A配列nt3655~3729;5’黄色蛍光タンパク質セグメントnt3730~4224;5’合成イントロン配列(可変)nt4225~4294;5’三峰性キッシングループ二量体形成ドメイン(大文字):4295~4406;リンカーnt4407~4414;ポリアデニル化シグナルnt4415~4463。配列番号172は、C末端YFP配列を以下の通りコードする:名称:3’イントロンスクリーニング分割YFP;ヒトCMVエンハンサーおよびプロモーターnt1~522;推定転写開始部位nt523;3’三峰性キッシングループ二量体形成ドメインnt525~636;3’合成イントロン配列(可変)nt637~706;3’yfpコード配列nt707~940;自己切断性2A配列nt941~1006;3’スタッファーオープンリーディングフレームnt1007~4228;リンカーnt4229~4265;ポリアデニル化シグナルnt4257~4388。
配列番号173~180は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号181は、スクランブル配列である。
配列番号182~196は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号197~198は、スクランブル配列である。
配列番号199~203は、例示的なイントロンスプライシングエンハンサー配列である。
配列番号204は、スクランブル配列である。
配列番号205は、例示的な分岐点配列(TACTAACA)である。
配列番号206は、例示的なポリアデニル化シグナルAATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGである。
詳細な説明
特に断りのない限り、技術用語は従来の使用に従って使用されている。分子生物学における一般的な用語の定義は、Benjamin Lewin, Genes VII, published by Oxford University Press, 1999;Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994;およびRobert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995;および他の同様の参考文献において見いだすことができる。
本明細書で使用される場合、「1つの(a)」、「1つの(an)」、および「その(the)」という単数形は、文脈によりそうでないことが明白に示されない限り、単数ならびに複数の両方を指す。本明細書で使用される場合、「含む(comprises)」という用語は、「含む(includes)」を意味する。したがって、「核酸分子を含む(comprising a nucleic acid molecule)」は、他の要素を排除せず、「核酸分子を含む(including a nucleic acid molecule)」を意味する。核酸に関して示されるありとあらゆる塩基サイズは、別段の指定のない限り、おおよそのものであり、説明目的で提示されることもさらに理解されるべきである。本明細書に記載のものと同様または同等である多くの方法および材料を使用することができるが、特定の適切な方法および材料を以下に記載する。矛盾する場合は、用語の説明を含めた本明細書が支配する。さらに、材料、方法および実施例は単に例示的なものであり、それに限定されるものではない。特許出願および特許を含めた全ての参考文献、ならびにGenBank受託番号は、それらの全体が参照により本明細書に組み込まれる。
本明細書に開示される種々の実施形態の概説を容易にするために、以下の特定の用語に関する説明を提示する:
投与:対象に、本明細書に提示される治療用核酸分子または他の治療剤などの作用物質を任意の効果的な経路によって提供または与薬すること。例示的な投与経路としては、これだけに限定されないが、注射(例えば、皮下、筋肉内、皮内、腹腔内、髄腔内、腫瘍内、骨内、および静脈内など)、経皮、鼻腔内、および吸入経路が挙げられる。投与は全身性のものまたは局所的なものであり得る。
アプタマー:特定の標的作用物質または分子に高い親和性および特異性で結合する核酸分子(例えば、DNAまたはRNAなど)。アプタマーは、本明細書に開示される核酸分子に二量体形成ドメインとして使用することができる。一実施例では、2つのアプタマーが互いに、例えば、標準的な塩基対合、非標準的な塩基対相互作用、非塩基対合相互作用、またはこれらの組合せによって結合して、二量体形成を媒介し得る。一実施例では、アプタマーにより、アプタマーによって認識される1つまたは複数の標的の存在下でのみ、RNA二量体形成(およびその後の組換え)が可能になる。アプタマーは、試験管内進化法(systematic evolution of ligands by exponential enrichment)(SELEX)と称されるコンビナトリアル選択プロセスによって得られている(例えば、Ellington et al., Nature 1990, 346, 818-822;Tuerk and Gold Science 1990, 249, 505-510;Liu et al., Chem. Rev. 2009, 109, 1948-1998;Shamah et al., Acc. Chem. Res. 2008, 41, 130-138;Famulok, et al., Chem. Rev. 2007, 107, 3715-3743;Manimala et al., Recent Dev. Nucleic Acids Res. 2004, 1, 207-231;Famulok et al., Acc. Chem. Res. 2000, 33, 591-599;Hesselberth, et al., Rev. Mol. Biotech. 2000, 74, 15-25;Wilson et al., Annu. Rev. Biochem. 1999, 68, 611-647;Morris et al., Proc. Natl. Acad. Sci. U.S.A. 1998, 95, 2902-2907を参照されたい)。そのようなプロセスにおいて、目的の標的分子に結合することができるDNA分子またはRNA分子は、1014~1015種の異なる配列からなる核酸ライブラリーから、選択、増幅および変異の反復ステップによって選択される。アプタマーのそれらの標的に対する親和性は抗体の親和性と競合し得、解離定数はピコモル濃度範囲の低さである(Morris et al., Proc. Natl. Acad. Sci. U.S.A. 1998, 95, 2902-2907;Green et al., Biochemistry 1996, 35, 14413-14424)。
アデノシンなどの小有機分子から、トロンビンなどのタンパク質、さらにはウイルスおよび細胞までの広範囲の標的に対して特異的なアプタマーが同定されている(Liu et al., Chem. Rev. 2009, 109, 1948-1998;Lee et al., Nucleic Acids Res. 2004, 32, D95-D100;Navani and Li, Curr. Opin. Chem. Biol. 2006, 10, 272-281;Song et al., TrAC, Trends Anal. Chem. 2008, 27, 108-117)。例えば、金属イオン、例えば、Zn(II)(Ciesiolka et al., RNA 1: 538-550, 1995)およびNi(II)(Hofmann et al., RNA、3: 1289-1300, 1997);ヌクレオチド、例えば、アデノシン三リン酸(ATP)(Huizenga and Szostak, Biochemistry, 34: 656-665, 1995);およびグアニン(Kiga et al., Nucleic Acids Res., 26: 1755-60, 1998);補因子、例えば、NAD(Kiga et al., Nucleic Acids Res., 26: 1755-60, 1998)およびフラビン(Lauhon and Szostak, J. Am. Chem. Soc., 117: 1246-57, 1995);抗生物質、例えば、バイオマイシン(Wallis et al., Chem. Biol. 4: 357-366, 1997)およびストレプトマイシン(WallaceおよびSchroeder, RNA 4: 112-123, 1998);タンパク質、例えば、HIV逆転写酵素(Chaloin et al., Nucleic Acids Res., 30: 4001-8, 2002)およびC型肝炎ウイルスRNA依存性RNAポリメラーゼ(Biroccio et al., J. Virol. 76: 3688-96, 2002);毒素、例えば、コレラ全毒素およびブドウ球菌エンテロトキシンB(Bruno and Kiel, BioTechniques, 32:pp. 178-180 and 182-183, 2002);ならびに細菌胞子、例えば、炭疽菌(Bruno and Kiel, Biosensors & Bioelectronics, 14: 457-464, 1999)を認識するアプタマーが利用可能である。
結合:2つの二量体形成ドメイン間など、1つの核酸分子と別の核酸分子(またはそれ自体)のハイブリダイゼーション、またはアプタマーとその標的の結合などの、2つの物質または分子間の会合。オリゴヌクレオチド分子と別の核酸分子は、それらのオリゴヌクレオチド分子と標的核酸の間に結合の検出を可能にする十分な数の相補的な塩基対が存在する場合、結合するまたは安定に結合する。一部の実施例では、核酸分子間の結合は直接起こり得る。一部の実施例では、核酸分子間の結合は、間接的に、例えば中間分子を通じて起こり得る。直接結合または間接結合のいずれも標準的な塩基対合によって、非標準的な塩基対相互作用によって、非塩基対相互作用によって、またはこれらの組合せで起こり得る。非標準的な塩基対相互作用は、これだけに限定されないが、フーグスティーン塩基対およびゆらぎ塩基対を含めた当業者に公知の任意の安定化の手段によって起こり得る。非塩基対相互作用は、中間分子を通じた結合を含み得る。一部の実施例では、直接結合は、キッシングループ二量体形成ドメイン間のものである。一部の実施例では、直接結合は低多様性二量体形成ドメイン間のものである。一部の実施例では、直接結合はアプタマー領域間のものである。一部の実施例では、アプタマー領域間の直接結合は非標準的な塩基対相互作用を伴う。一部の実施例では、アプタマー領域間の直接結合は標準的な塩基対合および非標準的な塩基対相互作用を伴う。一部の実施例では、間接結合は核酸架橋を通じて起こる。一部の実施例では、核酸架橋はmRNAである。核酸架橋の非限定的な例は図7Bに示されている。一部の実施例では、間接結合はアプタマー分子を通じて起こる。アプタマー分子を通じた間接結合の非限定的な例は図7Aに示されている。一部の実施形態では、アプタマー分子を通じた間接結合はアプタマー分子と結合領域の間の非塩基対相互作用を伴う。一部の実施形態では、アプタマー分子を通じた間接結合はアプタマー分子と結合領域の間の非塩基対相互作用、および結合領域間の塩基対合相互作用を伴う。
C末端部分:タンパク質のC末端残基またはその付近から始まる連続した一続きのアミノ酸を含むタンパク質配列の領域。タンパク質のC末端部分は、連続した一続きのアミノ酸(例えば、いくつかのアミノ酸残基)によって定義することができる。
がん:異常なまたは制御されない細胞成長を特徴とする悪性腫瘍(malignant tumor)。多くの場合がんに関連する他の特色としては、転移、近隣の細胞の正常機能への干渉、サイトカインまたは他の分泌産物の異常なレベルでの放出、および炎症応答または免疫学的応答の抑制または増悪、周囲または遠位の組織または器官、例えば、リンパ節などへの浸潤が挙げられる。「転移性疾患」は、元の腫瘍部位を離れ、例えば血流またはリンパ系を介して体の他の部分に移動するがん細胞を指す。
相補性:核酸の、別の核酸配列と従来のワトソン・クリック塩基対合または他の従来のものではない型のいずれかによって水素結合(複数可)を形成する能力。パーセント相補性は、第2の核酸配列と水素結合(例えば、ワトソン・クリック塩基対合)を形成することができる、核酸分子内の残基のパーセンテージを示す(例えば、10個のうち5個、6個、7個、8個、9個、10個であれば、50%相補的、60%相補的、70%相補的、80%相補的、90%相補的、および100%相補的である)。「完全に相補的」とは、核酸配列の連続した残基の全てが第2の核酸配列内の同じ数の連続した残基と水素結合することを意味する。「実質的に相補的」とは、本明細書で使用される場合、相補性の程度が、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、11ヌクレオチド、12ヌクレオチド、13ヌクレオチド、14ヌクレオチド、15ヌクレオチド、16ヌクレオチド、17ヌクレオチド、18ヌクレオチド、19ヌクレオチド、20ヌクレオチド、21ヌクレオチド、22ヌクレオチド、23ヌクレオチド、24ヌクレオチド、25ヌクレオチド、30ヌクレオチド、35ヌクレオチド、40ヌクレオチド、45ヌクレオチド、50ヌクレオチド、もしくはそれよりも長い領域にわたって少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、もしくは100%であることを指すか、または、2つの核酸がストリンジェントな条件下でハイブリダイズすることを指す。したがって、一部の実施例では、第1の二量体形成ドメインと第2の二量体形成ドメインは、互いに完全に相補的である(例えば、100%)。他の例では、第1の二量体形成ドメインと第2の二量体形成ドメインは、互いに実質的に相補的である(例えば、少なくとも80%)。
接触:固体または液体の形態を含め、直接の物理的な関連に置かれること。接触は、in vitroもしくはex vivoでは、例えば、試薬を試料(例えば、細胞を含有するものなど)に添加することによって、またはin vivoでは対象に投与することによって生じさせることができる。
ダウンレギュレートされたまたはノックダウンされた:標的核酸またはタンパク質などの分子の発現に関して使用される場合、標的RNAまたはタンパク質の産生の低減をもたらすが、一部の実施例では標的RNA産物または標的RNA機能の完全な排除をもたらすものではない任意のプロセスを指す。一実施例では、ダウンレギュレーションまたはノックダウンは、検出可能な標的核酸/タンパク質の発現または活性の完全な排除をもたらすものではない。一部の実施例では、標的核酸のダウンレギュレーションまたはノックダウンは、標的RNAの翻訳を低減し、したがって、対応するタンパク質の存在を低減し得るプロセスを含む。本明細書に開示される系を、任意の標的核酸/目的のタンパク質をダウンレギュレートするために使用することができる。
ダウンレギュレーションまたはノックダウンは、標的核酸/タンパク質の任意の検出可能な低減を含む。ある特定の実施例では、細胞または無細胞系における検出可能な標的核酸/タンパク質は、対照(対応する無処理の細胞または試料において検出される標的核酸/タンパク質の量など)と比較して少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%低減する(例えば、40%~90%、40%~80%または50%~95%の低減など)。一実施例では、対照は、正常な細胞(例えば、本明細書に提示されるRNA組換えのための核酸分子を含まない非組換え細胞)における発現の相対量である。
有効量:有益なまたは所望の結果をもたらすために十分である、作用物質(それぞれがジストロフィンなどの治療用タンパク質の異なる部分をコードする複数のベクターを提供する系など)の量。有効量はまた、有益なまたは所望の結果をもたらすために十分である、正しく結合したRNAまたは産生される治療用タンパク質の量も指し得る。
有効量(治療有効量とも称される)は、処置される対象および疾患状態、対象の体重および年齢、疾患状態の重症度、投与様式などの1つまたは複数に応じて変動し得、それは当業者が決定することができる。有益な治療効果としては、診断的決定の実施可能性;疾患、症状、障害、または病的状態の好転;疾患、症状、障害または状態の発症の減少または防止;および疾患、症状、障害または病的状態を概ね打ち消すことを挙げることができる。
一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、遺伝子疾患またはがんなどの疾患を処置するために十分なものである。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者の生存時間を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者の生存時間を、例えば、少なくとも6カ月、少なくとも9カ月、少なくとも1年、少なくとも1.5年、少なくとも2年、少なくとも2.5年、少なくとも3年、少なくとも4年、少なくとも5年、少なくとも10年、少なくとも12年、少なくとも15年、または少なくとも20年(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の可動性を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の可動性を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の認知能力を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(DMD患者など)の呼吸機能を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(血友病患者など)の血液凝固を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(アッシャー症候群またはスタルガルト病の患者など)の視覚を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置される患者(アッシャー症候群の患者など)の聴覚を、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも99%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、少なくとも500%、または少なくとも600%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)増大させるために十分な量である。
一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置されるDMD患者の腓腹筋サイズを、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または少なくとも95%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)減少させるために十分な量である。一実施形態では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の「有効量」は、処置されるDMD患者の心筋症筋肉のサイズを、例えば、少なくとも10%、少なくとも20%、少なくとも25%、少なくとも50%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または少なくとも95%(本明細書に提示される2つまたはそれよりも多くの合成核酸分子を投与しない場合と比較して)減少させるために十分な量である。一部の実施例では、これらの効果の組合せが実現される。
増大/増加(increase)または低減/減少(decrease):それぞれ、対照値(本明細書で提供される2つまたはそれよりも多くの合成核酸分子の投与がないなど、治療剤なしを表す値)からの数量の統計的に有意な正の変化または負の変化。増大/増加は正の変化であり、例えば、対照値と比較して少なくとも50%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%または少なくとも500%の増大/増加である。低減/減少は負の変化であり、例えば、対照値と比較して少なくとも20%、少なくとも25%、少なくとも50%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または少なくとも100%の低減/減少である。一部の実施例では、低減/減少は100%未満、例えば、90%以下、95%以下、または99%以下の低減/減少である。
ハイブリダイゼーション:核酸のハイブリダイゼーションは、2つの核酸分子が互いにある量の水素結合をなす場合に生じる。ハイブリダイゼーションのストリンジェンシーは、核酸周囲の環境条件、ハイブリダイゼーション方法の性質、ならびに使用される組成物および核酸の長さに応じて変動し得る。特定の程度のストリンジェンシーを達成するために必要なハイブリダイゼーション条件に関する算出は、Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 2001);およびTijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes Part I, Chapter 2(Elsevier, New York, 1993)において考察されている。Tmは、核酸の所与の鎖の50%がその相補鎖とハイブリダイズする温度である。
単離された:「単離された」生物学的成分(例えば、核酸分子またはタンパク質)は、その成分が存在する生物体の細胞または組織内の他の生物学的成分、例えば、他の細胞(例えば、RBC)、染色体および染色体外DNAおよびRNA、ならびにタンパク質から実質的に分離されているか、それとは別に作製されているか、またはそれから離して精製されている。「単離された」核酸およびタンパク質は、標準的な精製方法によって精製された核酸およびタンパク質を含む。この用語は、宿主細胞において組換え発現によって調製された核酸およびタンパク質ならびに化学的に合成された核酸およびタンパク質も包含する。
キッシングループ/キッシングステムループ:2つのヘアピンループ間の塩基がペア相互作用を形成する場合に形成されるRNA構造。これらの分子間「キッシング相互作用」は、1つのヘアピンループ内の対合していないヌクレオチドが、別のヘアピンループ内の対合していないヌクレオチドと塩基対合して、安定な相互作用複合体を形成する場合に生じる。例として図9Aを参照されたい。
N末端部分:タンパク質のN末端残基から始まる連続した一続きのアミノ酸を含むタンパク質配列の領域。タンパク質のN末端部分は、連続した一続きのアミノ酸(例えば、いくつかのアミノ酸残基)によって定義することができる。
天然に存在しない、合成の、または操作された:本明細書では互換的に使用され、人間の手の関与を示す用語。これらの用語は、核酸分子またはポリペプチドについて言及する場合、その核酸分子またはポリペプチドが、それらが天然では天然に関連し、天然に見いだされる少なくとも1つの他の成分を少なくとも実質的に含まないことを示す。さらに、これらの用語は、核酸分子またはポリペプチドが天然に見いだされない配列を有することを示し得る。
核酸分子:天然のヌクレオチド/リボヌクレオチド、および/または、天然に存在するヌクレオチドと同様に核酸分子とハイブリダイズする、天然のヌクレオチド/リボヌクレオチドの類似体を含み得るデオキシリボヌクレオチド(DNA)またはリボヌクレオチド(RNA)ポリマー。核酸分子は、一本鎖(ss)DNAまたはRNA分子または二本鎖(ds)核酸分子であり得る。RNAまたはmRNAは、本明細書で使用される場合、プレmRNA分子、または成熟RNA転写物を指し得る。プレmRNA分子は、プロセシングによって除去される配列、例えば、本明細書に記載の二量体形成ドメインの結合後にスプライシングによって除去されるイントロン配列を含む。本明細書に記載の核酸分子は、例えば、DNA発現ベクターに関してはDNA上のプロモーターによりRNAが転写されるところのDNA分子であり得る。
作動可能に連結した:第1の核酸配列が第2の核酸配列との機能的関係に置かれている場合、第1の核酸配列は第2の核酸配列に作動可能に連結している。例えば、プロモーターが核酸配列の発現に影響を及ぼす、例えば、プロモーターが、スプライスされるとタンパク質(例えば、DMD、第8因子、第9因子、またはABCA4コード配列の一部など)の発現をもたらし得るプレmRNAの転写に影響を及ぼす場合、プロモーター配列はその核酸配列に作動可能に連結している。
薬学的に許容される担体:本発明において有用な薬学的に許容される担体は従来のものである。Remington's Pharmaceutical Sciences, by E. W. Martin, Mack Publishing Co., Easton, PA, 15th Edition (1975)には、本明細書に開示される核酸分子などの治療剤の薬学的送達に適した組成物および製剤が記載されている。
一般に、担体の性質は、使用される特定の投与形式に依存する。例えば、非経口製剤は、通常、例えば、水、生理的食塩水、平衡塩類溶液、水性デキストロース、グリセロールなどの薬学的にかつ生理的に許容される流体を含む注射可能な流体をビヒクルとして含む。投与される医薬組成物は、生物学的に中性の担体に加えて、微量の無毒性補助物質、例えば、湿潤剤または乳化剤、保存剤、およびpH緩衝剤など、例えば、酢酸ナトリウムまたはソルビタンモノラウレートを含有し得る。
ポリペプチド、ペプチドおよびタンパク質:任意の長さのアミノ酸のポリマーを指す。ポリマーは直鎖であっても分枝であってもよく、修飾されたアミノ酸を含んでもよく、また、非アミノ酸によって中断されていてもよい。この用語は、修飾されたアミノ酸ポリマー;例えば、ジスルフィド結合の形成、グリコシル化、脂質付加、アセチル化、リン酸化、または標識成分とのコンジュゲーションなどの任意の他の操作を受けたアミノ酸ポリマーも包含する。本明細書で使用される場合、「アミノ酸」という用語は、グリシンおよびD光学異性体またはL光学異性体の両方、ならびにアミノ酸類似体およびペプチド模倣体を含めた、天然アミノ酸および/または天然ではないアミノ酸または合成アミノ酸を含む。一実施例では、タンパク質は、遺伝子疾患などの疾患に関連付けられるものである(例えば、表1参照)。一実施例では、タンパク質は、がんなどの疾患の処置に使用されるものなどの治療用タンパク質である。一実施例では、タンパク質は、少なくとも50アミノ酸の長さ、少なくとも100アミノ酸の長さ、少なくとも500アミノ酸の長さ、少なくとも1000アミノ酸の長さ、少なくとも1500アミノ酸の長さ、例えば、少なくとも2000アミノ酸、少なくとも2500アミノ酸、少なくとも3000アミノ酸、または少なくとも5000アミノ酸である。
ポリピリミジントラクト:転写後修飾のプロセスの間にRNAスプライシングを行うために特殊化されたタンパク質複合体であるスプライソソームのアセンブリを促進する、プレメッセンジャーRNA(mRNA)の領域。このトラクトは、主にウラシルなどのピリミジンヌクレオチドであり得、一部の実施例では、15~20塩基対の長さであり、スプライスされるイントロンの3’末端の約5~40塩基対前に位置する。
プロモーター/エンハンサー:核酸配列の転写を方向付ける一群の核酸制御配列。プロモーターは、転写の開始部位近くに必要な核酸配列、例えば、ポリメラーゼII型プロモーターの場合ではTATAエレメントを含む。プロモーターはまた、必要に応じて、転写の開始部位から数千塩基対ものところに位置し得る遠位のエンハンサーまたはリプレッサーエレメントも含む。一部の実施例では、プロモーター配列+その対応するコード配列は、AAVの容量よりも大きい。一部の実施例では、標的タンパク質のプロモーター配列は、少なくとも3500nt、少なくとも4000nt、少なくとも5000nt、またはさらには少なくとも6000ntである。
「構成的プロモーター」は、絶えず活性であり、外部のシグナルまたは分子による調節を受けないプロモーターである。対照的に、「誘導性プロモーター」の活性は、外部のシグナルまたは分子(例えば、転写因子)によって調節される。構成的プロモーターおよび誘導性プロモーターのどちらも本明細書に提示される方法および系において使用することができる(例えば、Bitter et al., Methods in Enzymology 153: 516-544, 1987を参照されたい)。組織特異的プロモーターは、本明細書に提示される方法および系において、例えば、主に所望の組織または目的の細胞、例えば、筋肉、ニューロン、骨、皮膚、血液、特定の器官(例えば、肝臓、膵臓)、または特定の細胞型(例えば、リンパ球)における発現を方向付けるために使用することができる。一部の実施例では、本明細書で使用されるプロモーターは、発現させる標的タンパク質に対して内因性である。一部の実施例では、本明細書で使用されるプロモーターは、発現させる標的タンパク質に対して外因性である。
プロモーター依存性遺伝子発現を細胞型特異的、組織特異的に制御可能にする、または外部のシグナルもしくは作用物質による誘導性にするために十分であるプロモーターエレメントも包含され、そのようなエレメントは、遺伝子の5’領域または3’領域に位置し得る。組換えDNAまたは合成技法によって作製されたプロモーターを使用して核酸配列の転写をもたらすこともできる。
本明細書に提示される方法および系と共に使用することができる例示的なプロモーターとしては、これだけに限定されないが、SV40プロモーター、サイトメガロウイルス(CMV)プロモーター(必要に応じてCMVエンハンサーを伴う)、pol IIIプロモーター(例えば、U6プロモーターおよびH1プロモーター)、pol IIプロモーター(例えば、レトロウイルスラウス肉腫ウイルス(RSV)LTRプロモーター(必要に応じてRSVエンハンサーを伴う)、ジヒドロ葉酸レダクターゼプロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、およびEF1αプロモーター)が挙げられる。
組換え:組換え核酸分子またはタンパク質配列は、天然に存在しない配列を有するか、または、2つの、そうでなければ分離されている配列のセグメントの人工的な組合せによって作出された配列を有するものである(例えば、ジストロフィンコード配列の一部、例えば、コード配列の約3分の1、半分、または3分の2を含むウイルスベクター)。この人工的な組合せは、例えば、単離された核酸のセグメントの化学合成または人工的な操作によって、例えば、遺伝子操作技法によって達成することができる。同様に、組換えまたはトランスジェニック細胞は、組換え核酸分子を含有するものである。
配列同一性:アミノ酸(またはヌクレオチド)配列間の類似性は、他には配列同一性と称される、配列間の類似性に関して表される。配列同一性は、パーセンテージ同一性(または類似性または相同性)に関して測定される頻度が高い;パーセンテージが高いほど、2つの配列の類似性が大きい。
比較のために配列をアラインメントする方法は公知である。種々のプログラムおよびアラインメントアルゴリズムが、Smith and Waterman, Adv. Appl. Math. 2:482, 1981;Needleman and Wunsch, J. Mol. Biol. 48:443, 1970;Pearson and Lipman, Proc. Natl. Acad. Sci. U.S.A. 85:2444, 1988;Higgins and Sharp, Gene 73:237, 1988;Higgins and Sharp, CABIOS 5:151, 1989; Corpet et al., Nucleic Acids Research 16:10881, 1988;およびPearson and Lipman, Proc. Natl. Acad. Sci. U.S.A. 85:2444, 1988に記載されている。Altschul et al., Nature Genet. 6:119, 1994には、配列アラインメント法および相同性の算出に関する詳細な考察が提示されている。
配列解析プログラムblastp、blastn、blastx、tblastnおよびtblastxと関連して使用するためのNCBI Basic Local Alignment Search Tool(BLAST)(Altschul et al., J. Mol. Biol. 215: 403, 1990)がNational Center for Biotechnology Information(NCBI、Bethesda、MD)およびインターネットを含めたいくつかの供給源から入手可能である。このプログラムを使用してどのように配列同一性を決定するかの説明は、インターネット上のNCBIウェブサイトで入手可能である。
ネイティブなタンパク質またはコード配列(例えば、DMD、第8因子、第9因子、またはABCA4配列)のバリアントは、一般には、NCBI Blast 2.0、デフォルトパラメータに設定されたギャップ挿入blastpを使用してアミノ酸配列とのアラインメント全長にわたって計数して、少なくとも約80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有することを特徴とする。約30アミノ酸を超えるアミノ酸配列の比較に関しては、Blast 2配列関数を用い、デフォルトパラメータ(ギャップ存在コスト(gap existence cost)11、および1残基当たりのギャップコスト(per residue gap cost)1)に設定されたデフォルトのBLOSUM62行列を使用する。短いペプチド(およそ30アミノ酸未満)をアラインメントする場合には、Blast 2配列関数を使用し、デフォルトパラメータ(オープンギャップ(open gap)9、エクステンションギャップ(extension gap)1ペナルティ)に設定されたPAM30行列を用いてアラインメントを実施すべきである。参照配列に対してさらに大きな類似性を有するタンパク質は、この方法によって評価した場合、ますます大きなパーセンテージ同一性、例えば、少なくとも95%、少なくとも98%、または少なくとも99%の配列同一性を示す。配列の全体未満を配列同一性について比較する場合、ホモログおよびバリアントは、一般には、10~20アミノ酸の短いウインドウにわたって少なくとも80%の配列同一性を有し、参照配列に対するそれらの類似性に応じて少なくとも85%または少なくとも90%または少なくとも95%の配列同一性を有し得る。そのような短いウインドウにわたって配列同一性を決定するための方法は、インターネット上のNCBIウェブサイトで入手可能である。これらの配列同一性の範囲は単にガイダンスとして提供され、提供された範囲外の極めて意義深いホモログを得ることができる可能性がある。
本明細書に開示される核酸配列のバリアント(例えば、合成イントロン配列およびコード配列)は、一般には、デフォルトパラメータに設定されたNCBI Blast 2.0、ギャップ挿入blastnを使用し、核酸配列とのアラインメント全長にわたって計数して、少なくとも約80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有することを特徴とする。これらの配列同一性の範囲は単にガイダンスとして提供され、提供された範囲外の機能的配列を得ることができる可能性があることが当業者には理解されよう。
対象:哺乳動物、例えば、ヒト。哺乳動物としては、これだけに限定されないが、マウス、サル、ヒト、農場動物、競技動物、および愛玩動物が挙げられる。一実施形態では、対象は、非ヒト哺乳動物対象、例えば、サルもしくは他の非ヒト霊長類、マウス、ラット、ウサギ、ブタ、ヤギ、ヒツジ、イルカ、イヌ、ネコ、ウマ、またはウシである。一部の実施例では、対象は、マウス、ウサギ、またはラットなどの実験動物/生物体である。一部の実施例では、本明細書に開示される方法を使用して処置される対象はヒトである。
一部の実施例では、対象は、本明細書に開示される方法を使用して処置することができる、表1に列挙されているものなどの遺伝子疾患を有する。一部の実施例では、本明細書に開示される方法を使用して処置される対象は遺伝子疾患を有するヒト対象である。一部の実施例では、本明細書に開示される方法を使用して処置される対象はがんを有するヒト対象である。
治療剤:対象に投与されるといくらかの有益な効果をもたらす1つまたは複数の分子または化合物を指す。本明細書に開示される合成核酸分子および本明細書に提示される系は治療剤である。有益な治療効果としては、診断的決定の実施が可能になること;疾患、症状、障害、または病的状態の好転;疾患、症状、障害または状態の発症の減少または防止;および疾患、症状、障害または病的状態を概ね打ち消すことを挙げることができる。
形質導入された、形質転換された、およびトランスフェクトされた:ウイルスまたはベクターにより核酸分子が細胞に移入された場合、ウイルスまたはベクターにより細胞への「形質導入」がなされた。細胞は、核酸の細胞ゲノムへの組み入れによってか、またはエピソーム複製によってのいずれかで核酸が細胞によって安定に複製される場合、細胞に形質導入された核酸により「形質転換」または「トランスフェクト」されたものである。
これらの用語は、ウイルスベクターを用いたトランスフェクション、プラスミドベクターを用いた形質転換、ならびに電気穿孔、リポフェクション、パーティクルガン加速および当技術分野における他の方法によるネイキッドDNAの導入を含めた、核酸分子をそのような細胞に導入することができる全ての技法を包含する。一部の実施例では、方法は、化学的方法(例えば、リン酸カルシウムトランスフェクション)、物理的方法(例えば、電気穿孔、微量注射、粒子衝撃)、融合(例えば、リポソーム)、受容体媒介性エンドサイトーシス(例えば、DNA-タンパク質複合体、ウイルスエンベロープ/カプシド-DNA複合体)および組換えウイルスなどのウイルスによる生物学的感染である(Wolff, J. A.、ed, Gene Therapeutics, Birkhauser, Boston, USA, 1994)。核酸分子を細胞に導入するための方法は公知である(例えば、米国特許第6,110,743号を参照されたい)。これらの方法を使用して、本明細書に開示される核酸分子を細胞に形質導入することができる。
導入遺伝子:例えばAAVなどのベクターによって供給される、外因性遺伝子。一実施例では、導入遺伝子は、例えば、プロモーター配列に作動可能に連結した、標的タンパク質の一部、例えば、標的タンパク質の約3分の1、半分、または3分の2をコードする。一実施例では、導入遺伝子は、例えば、プロモーター配列に作動可能に連結した、ジストロフィンコード配列の一部、例えば、ジストロフィンコード配列(または他の治療薬コード配列、例えば、表1に列挙されているタンパク質をコードするもの)の約3分の1、半分、または3分の2を含む。
処置すること(treating)、処置(treatment)、および治療(therapy):症状の軽減、寛解、減少などの任意の客観的または主観的パラメータ、または状態を患者がより耐えられるものにすること、退化もしくは減退の速度を緩徐化すること、退化の最終点を衰弱がより小さいものにすること、対象の身体もしくは精神的ウエルビーイングを改善すること、または生存の長さを延長することを含めた、傷害、病変または状態の減弱または好転に関する任意の成功または成功のしるし。処置は、身体検査、血液検査および他の臨床検査などの結果を含めた客観的または主観的パラメータによって評価することができる。一部の実施例では、本明細書に開示される方法を用いた処置により、遺伝子疾患に付随する症状の数または重症度の低減、例えば、処置される、遺伝子疾患を有する患者の生存時間の増大がもたらされる。
一部の実施例では、本明細書に開示される方法を用いた処置により、DMDまたは他の遺伝子疾患に付随する症状の数または重症度の低減、例えば、生存の増加、可動性(例えば、歩行、よじのぼり)の増大、認知能力の改善、腓腹筋サイズの低下、心筋症の低減、視覚の改善、聴覚の改善、血液凝固の改善、または呼吸機能の改善がもたらされる。一部の実施例では、これらの効果の組合せが実現される。
腫瘍、新形成、悪性疾患またはがん:新生物は、過剰な細胞分裂に起因する組織または細胞の異常な成長である。新生物の成長により、腫瘍が生じ得る。個体における腫瘍の量は、腫瘍の数、体積、または重量として測定することができる「腫瘍量」である。転移しない腫瘍は「良性」と称される。周囲の組織に浸潤し、かつ/または転移する可能性がある腫瘍は「悪性」と称される。「非がん組織」は、悪性新生物が形成されるものと同じ器官に由来するが、新生物の特徴的な病変を有さない組織である。一般に、非がん組織は、組織学的に正常に見える。「正常組織」は、ある器官に由来する組織であり、ここで、当該器官は、がんまたは当該器官の別の疾患もしくは障害の影響を受けていない。「がんを有さない」対象は、当該器官のがんを有すると診断されておらず、検出可能ながんを有していない。
本明細書に開示される方法および系を用いて処置することができるがんなどの例示的な腫瘍としては、固形腫瘍、例えば、乳癌(例えば、小葉癌および腺管癌)、肉腫、肺癌(例えば、非小細胞癌、大細胞癌、扁平上皮癌、および腺癌)、肺の中皮腫、結腸直腸腺癌、胃癌、前立腺腺癌、卵巣癌(例えば、漿液性嚢胞腺癌および粘液性嚢胞腺癌)、卵巣胚細胞腫瘍、精巣癌および胚細胞腫瘍、膵臓腺癌、胆管腺癌、肝細胞癌、膀胱癌(例えば、移行上皮癌、腺癌、および扁平上皮癌を含む)、腎細胞腺癌、子宮内膜癌(例えば、腺癌およびミュラー管混合腫瘍(癌肉腫)を含む)、子宮頚内膜癌、子宮頸外膜癌、および膣癌(例えば、子宮頚内膜、子宮頸外膜、および膣のそれぞれの腺癌および扁平上皮癌)、皮膚の腫瘍(例えば、扁平上皮癌、基底細胞癌、悪性黒色腫、皮膚付属器腫瘍(skin appendage tumor)、カポジ肉腫、皮膚リンパ腫、皮膚付属器腫瘍(skin adnexal tumor)および種々の型の肉腫およびメルケル細胞癌)、食道癌、上咽頭癌および中咽頭癌(上咽頭および中咽頭の扁平上皮癌および腺癌を含む)、唾液腺癌、脳および中枢神経系の腫瘍(例えば、グリア起源の腫瘍、ニューロン起源の腫瘍、および髄膜起源の腫瘍を含む)、末梢神経の腫瘍、軟部組織肉腫、および骨および軟骨の肉腫、ならびにリンパ腫瘍(B細胞およびT細胞悪性リンパ腫を含む)が挙げられる。一実施例では、腫瘍は腺癌である。
方法および系はまた、液性腫瘍、例えば、リンパ性、白血球、または他の型の白血病を処置するために使用することもできる。特定の例では、処置される腫瘍は、白血病(例えば、急性リンパ芽球性白血病(ALL)、慢性リンパ球性白血病(CLL)、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、ヘアリー細胞白血病(HCL)、T細胞前リンパ球性白血病(T-PLL)、大顆粒リンパ球性白血病、および成人T細胞白血病)、リンパ腫(例えば、ホジキンリンパ腫および非ホジキンリンパ腫)、ならびに骨髄腫などの、血液の腫瘍である。
アップレギュレートされた:標的核酸/タンパク質などの分子の発現に関して使用される場合、標的核酸/タンパク質の産生の増加をもたらす任意のプロセスを指す。一部の実施例では、標的RNAのアップレギュレーションまたは活性化は、標的RNAの翻訳を増加させ、したがって、対応するタンパク質の存在を増加し得るプロセスを含む。
アップレギュレーションは、標的核酸/タンパク質の任意の検出可能な増加を含む。ある特定の実施例では、細胞または無細胞系における検出可能な標的核酸/タンパク質の発現が、対照(本明細書に提示される核酸分子を用いた処理を行っていない、対応する試料において検出される標的核酸/タンパク質の量など)と比較して、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも400%、または少なくとも500%増加する。一実施例では、対照は、正常な細胞(例えば、本明細書に提示される系を含まない非組換え細胞)における発現の相対量である。
ために十分な条件下で(under conditions sufficient for):所望の活性を可能にする任意の環境を説明するために使用される句。一実施例では、所望の活性は、疾患の処置に必要なタンパク質の発現または活性の増大である。一実施例では、所望の活性は、例えば、本明細書に開示される方法および系を使用した、in vivoにおけるDMD(または表1に列挙されている他の遺伝子疾患)などの遺伝子疾患の処置またはその進行の緩徐化である。
ベクター:宿主細胞において複製するおよび/または宿主細胞に組み込まれるベクターの能力を妨害することなく外来核酸分子を導入することができる核酸分子。ベクターとしては、これだけに限定されないが、一本鎖、二本鎖、または部分的に二本鎖の核酸分子;1つまたは複数の遊離末端を含む核酸分子、遊離末端を含まない(例えば、環状)核酸分子;DNA、RNA、または両方を含む核酸分子;および他の種類のポリヌクレオチドが挙げられる。
ベクターは、複製開始点などの、宿主細胞における複製を可能にする核酸配列を含み得る。ベクターは、1つまたは複数の選択マーカー遺伝子および他の遺伝子エレメントも含み得る。組込みベクターは、それ自体を宿主核酸に組み込むことが可能である。発現ベクターは、挿入された遺伝子(1つまたは複数)の転写および翻訳を可能にするために必要な調節配列を含有するベクターである。
ベクターの型の1つは「プラスミド」であり、これは、標準的な分子クローニング技法によってなどで追加的なDNAセグメントを挿入することができる環状二本鎖DNAループを指す。別の型のベクターはウイルスベクターであり、ウイルス(例えば、レトロウイルス、複製欠損レトロウイルス、アデノウイルス、複製欠損アデノウイルス、およびアデノ随伴ウイルス)へのパッケージングのためのウイルス由来のDNAまたはRNA配列がベクター内に存在する。ウイルスベクターは、宿主細胞へのトランスフェクションのためにウイルスによって運ばれるポリヌクレオチドも含む。一部の実施形態では、ベクターはレンチウイルスベクター(例えば、組込み欠損レンチウイルスベクター)またはアデノ随伴ウイルス(AAV)ベクターである。
一部の実施形態では、ベクターは、AAV血清型AAV9またはAAVrh.10などのAAVである。一部の実施形態では、ベクターは、例えば静脈内投与後に血液脳関門を透過することができるものである。アデノ随伴ウイルス血清型rh.10(AAV.rh10)ベクターは血液脳関門を部分的に透過し、高レベルかつ広がった導入遺伝子発現をもたらす。
II.いくつかの実施形態の概要
遺伝子疾患に罹患している患者を治癒させるための1つの手法は、遺伝子置換療法(一般に遺伝子療法と称される)である。そのような手法では、欠陥のある遺伝子を、例えばウイルスベクターによって送達されるその遺伝子のインタクトなバージョンで置き換え、それにより、数カ月から数年までの持続的な発現が実現される。アデノ関連ウイルス(AAV)は臨床的な遺伝子置換療法に使用されてきたが、パッケージング容量が制限される(例えば、約5kb未満)。したがって、約5kbというサイズの制限を超える遺伝子の遺伝子置換を実現するためには、このパッケージングの制限を克服するための戦略が必要である。例えば、一部のプロモーターが単独で、コード配列が単独で、またはプロモーターとコード配列の組合せで、AAVの約5kbというサイズの制限を超える。したがって、そのようなプロモーターおよびコード配列によってコードされるそのようなタンパク質を、本明細書に開示される系を使用して発現させることができる。
AAVのカーゴの制限を克服するための先行方法では、疾患の処置のために十分な数の細胞において十分なレベルの標的タンパク質を産生させるために必要な効率が実現されていないと思われる。例えば、ジストロフィンは約11kbであるので、最低3つの、AAVのパッケージングの制限に適合する断片として送達する必要がある。
2つのRNA分子の、これらのRNA断片の一方または両方の天然に存在するイントロン配列を使用したスプライシング媒介性組換えは非効率的である。第1に、これらの天然のイントロン配列は、天然に存在するイントロン由来の配列であり、4種のRNAヌクレオチド全ての混合で構成される。そのような配列は、分子間相互作用に利用可能になるのではなく強力な分子内塩基対を形成することによりトランス相互作用を妨害し得る構造に折りたたまれる傾向がある。第2に、高等真核生物におけるエクソン定義はイントロンではなくエクソンによって駆動されるので、これらの天然に存在するイントロン配列はスプライソソーム成分を強力に誘引するように進化していない。以前の戦略のこれらの2つの制限は、本発明において、天然には見いだされない合成イントロン配列を設計することによって対処される。これらの合成配列は、スプライソソーム動員を強力に誘引および刺激する一方で、2つのRNA断片が1つにまとまることを妨害する二次構造(および一部の実施例では三次構造などの他の構造)を最小化するエレメントを含有する。
本発明者らは、大きな遺伝子のコード配列を複数の一連の断片から効率的に再構成するために使用することができる、新規の核酸に基づくエレメントを開発した。本明細書に開示される方法および系は先行方法とは異なる。本明細書に開示される高度に効率的な合成イントロンには、非共有結合により連結したRNA(プレmRNA)間でのRNAスプライシング反応を効率的に駆動するRNAエレメント(またはこれらのエレメントをコードするDNA)の最適な配置を利用する。当該方法/系は、遺伝子疾患を処置するためのタンパク質の治療レベルにより密接に近づく高レベルの機能的タンパク質を生じさせるので、トランス-スプライシングを利用する以前の試みからの著しい前進である。この革新は、相補鎖を有する(本質的に低いシス結合能も有する)第2のRNAとのトランス相互作用に干渉する強力なシス結合相互作用を形成することが本質的に不可能である非天然RNAドメインを選択することに基づく。これらの最適化された二量体形成ドメインおよび/または合成イントロンは、RNAスプライシングを容易にする最適化されたモチーフ(スプライスドナー、スプライスアクセプター、スプライスエンハンサー、およびスプライス分岐点配列を含む)と組み合わせて使用される非天然配列(例えば、ヒト細胞において見いだされず、かつ/または別の生物系において見いだされない配列)を含み得る。合成核酸は、非天然核酸配列、例えば、ヒト細胞において見いだされず、かつ/または別の生物系において見いだされない配列であり得る。本発明では、RNA鎖のトランス二量体形成を、効率的なスプライシングを媒介する妥当なRNAモチーフに関して最適化することにより、in vivoおよびin vitroにおいて、高レベルの機能的タンパク質を産生する同じ細胞において2つまたは3つの異なるRNAを正確にかつ効率的に共有結合により連結することができることが初めて実証される。最終的にシスでのRNAスプライシングが後に続いてDNA組換え部位が成熟転写物から削除されるDNA組換えによってDNAレベルで非効率的な組合せがもたらされる「ハイブリッド」手法とは異なり、本明細書に開示される方法/系では、2つのタンパク質コードRNA断片がプレmRNAレベルで結合し、非機能的および/または有害な産物をコードする組換え産物が産生されるリスクがより低い、より効率的な反応が促進される。
データから、効率的な合成RNA二量体形成および組換えドメイン(sRdRドメイン、RNA末端結合(REJ)ドメインとも称される)を使用することにより、同じ細胞において発現させた2つまたは3つの別々の遺伝子断片から目的の遺伝子を効率的に再構成することができることが実証される。これらの結果から、本明細書に開示される方法および系の、それぞれデュシェンヌ型筋ジストロフィーおよび血友病A、またはスタルガルト病を処置するために、ジストロフィンまたは血液凝固第VIII因子、またはATP結合カセットサブファミリーAメンバー4(Abca4)のような大きな遺伝子をAAVを使用して再構成する能力が示される。これらの知見に基づいて、大きなタンパク質の発現が役立つものなどの他の遺伝子疾患(例えば、表1に列挙されている障害を参照されたい)を同様に処置することができる。他の適用としては、研究およびバイオテクノロジーへの適用が挙げられる。
断片化された遺伝子を複数のAAVから再構成するための既存の戦略に伴う制限のいくつかに対処するために、標的細胞において2つまたはそれよりも多くの個々の合成RNA分子を連続してアラインメントし、組み換える系を本明細書において提供する。個々の合成RNA分子は、それぞれが、二量体形成ドメインおよびRNAスプライシングに必要なエレメントを含有する合成イントロン配列を含み、それにより、二量体形成ドメインが互いに正しい順序で結合すると、個々の断片の効率的なRNA組換えが媒介される。一実施例では、2つの断片からのコード配列の再構成は、第1の合成イントロン(A)をN末端コード断片の3’末端に付加し、相補的な第2の合成のドメイン(A’)をC末端コード断片の5’末端に付加することによって実現される。2つのRNAは細胞の内在性RNAスプライシング機構(すなわち、スプライソソーム機構)によって組み換えられる。合成イントロンドメインは、二機能性エレメント:(1)組み換えられる両半分(two halves)間の塩基対合を媒介するための二量体形成ドメイン、および(2)2つのRNA分子の効率的な再構成を媒介するためにスプライシング機構を効率的に動員するように最適化されたドメインを含有する。一部の実施例では、合成イントロンは、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166に提示される任意の合成イントロンに対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する配列を含む(例えば、図10A~10Zを参照されたい)。一部の実施例では、合成イントロンは、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166に提示される任意の合成イントロンに対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するが、提示されるプロモーター配列を伴わない配列によってコードされるRNA分子である。配列番号1、2、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166に提示される分子はいずれも、改変してタンパク質コード部分(例えば、図6Aの114および164)を目的の別のタンパク質コード配列で置き換えることができる(例えば、配列番号1、2、22または23のYFPコード配列を治療用タンパク質コード配列で置き換えることができる)ことが当業者には理解されよう。したがって、配列番号1、2、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166に提示される任意の合成イントロン部分に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有する合成イントロン分子(例えば、配列番号22のnt3703~3975および配列番号23のnt1~225)も本明細書に提示される。配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166に提示される任意の合成イントロンに対して少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を有するが、提示されるプロモーター配列を伴わない配列によってコードされる合成イントロンRNA分子も提供される)。
例示的な二量体形成ドメインを、それらの内部の二次/三次構造が最小限になる/最適化されるようにバイオインフォマティクスにより選択した。試験した二量体形成ドメインは、分子内アニーリングを回避するために、長いひと続きの、多様性が低いヌクレオチド配列を含有するものであった。分子内アニーリングを回避することにより、これらの二量体形成ドメインは開いた構成で存在し、したがって、対応する相補的な二量体形成ドメイン配列との対合に利用可能になる。合成イントロンドメインは、スプライシング機構の効率的な動員をもたらすイントロンスプライス増強エレメントを含有する。
本明細書に開示されるRNA分子は、少なくとも、相補的な二量体形成ドメインと結合させてRNAの効率的なスプライシングおよび組換えを可能にするために利用可能な、開いた、利用可能な一本鎖領域を有するように設計される。一部の実施例では、これは、結合ドメインにプリンのみまたはピリミジンのみを利用することによって実現される。プリンがそれら自体と対合することができないこと(ピリミジンも同様)に起因して、これらのひと続きのRNAは、開いた予測される構造を有する。
RNA分子は細胞において一本鎖として存在する。一本鎖であることで、RNA分子は本質的にそれら自体とハイブリダイズしやすく、それにより、強力な二次構造および三次構造を形成する。最も安定な塩基対はGとC、AとU、およびGとUのゆらぎ対である。熱力学的に、2つの塩基の対合が開いた構成よりも選好される。効率的な合成核酸分子を設計するためには、互いに相補性を有する2つの二量体形成ドメインが開いた構成で存在し、したがって、二量体形成ドメインが分子間塩基対合に利用可能になるようにする。合成核酸分子の他の部分間の分子内塩基対合を回避するために、適合しない塩基を含有する長いひと続きの多様でない配列を含めることができる。例えば、長いひと続きの、ピリミジン(すなわち、CおよびT)またはプリン(すなわち、AおよびG)を合成核酸分子内に存在させることができる。ピリミジンは他のピリミジンと標準の塩基対を形成することができず、プリンは他のプリンと標準の塩基対を形成することができない。そのような一続きの、プリンまたはピリミジンは、2~3塩基から200~300塩基までにわたり得る。これらのひと続きは分子内で結合することができないので、相補的な断片との分子間塩基対合に利用可能である。例えば、合成核酸分子AおよびA’を、Aがピリミジンストレッチ(例えば、5’-CCUU(...)CCUU-3’)を含有し、A’が相補的なプリン配列(例えば、5’-AAGG(...)AAGG-3’)を含有するように構成することができる。
本明細書に開示される合成核酸分子(例えば、RNAまたはRNAをコードするDNA)を、ゲノム内の正しくない部位へのあらゆるオフターゲットの結合が最小限になるように設計する。オフターゲットの結合は、核酸分子の配列を変更することによって低減することができる。
開いた合成核酸構成を実現するために一続きの低多様性RNA塩基を使用するという同じ設計原理を、二量体形成ドメインにおける一続きの一塩基の使用、例えば、一連のCと塩基対合する一連のG、および一連のUと塩基対合する一連のAの使用に拡張することができる。
2つまたはそれよりも多くの合成核酸分子の組換えを増加させるために、以下の方法を使用することができる。RNAスプライシングは、イントロンの5’末端(スプライスドナー部位)およびイントロンの3’末端(スプライスアクセプター部位、それに付随する分岐点配列およびポリピリミジントラクトと共に)へのスプライソソーム成分の動員に依存する。異なるリボ核タンパク質がイントロンにタンパク質関連低分子核内RNA(snRNA)とイントロン配列の塩基対合を通じて動員される。完全にマッチするコンセンサス配列をRNA二量体形成および組換えドメイン内に置くことにより、スプライソソーム成分の動員を容易にすることができ、それにより今度はスプライソソーム媒介性組換えの効率を増強する。以前に特徴付けられたイントロンスプライスエンハンサー配列により、イントロンスプライスエンハンサーと称される追加的なスプライシング促進因子を動員することができる。
一部の実施例では、RNAスプライシング配列に天然に存在するRNA配列を使用する代わりに、コンセンサス配列を使用する。例えば、スプライスドナー、スプライスアクセプター、スプライスエンハンサーおよびスプライス分岐点配列を含めた、スプライシングに関与する任意の配列にコンセンサス配列を使用することができる。これらの合成核酸分子を用い、ex vivo、in vitro、またはin vivoで細胞において2つ(またはそれよりも多く)のRNA分子を順次結合することができる。合成核酸分子は、コードされる合成イントロンドメインの外側に、任意のプロモーターおよびコード配列を含み得る。例えば、2つの合成核酸分子に単一の遺伝子の両半分を担持させることができる。これをin vitroおよびin vivoにおいて、黄色蛍光タンパク質(YFP)の両半分を再構成することによって試験し、効率的であることが示された(図3A~3D参照)。
合成核酸分子のモジュラー性により、最適化された相補的な二量体形成ドメインのコンビナトリアルセットを使用した複数のRNA断片の一連の組換え(すなわち、>2)の実現の効率を試験することが可能になった(図4A~4B)。トランスフェクトされた細胞の>80%で3分割黄色蛍光タンパク質が効率的に再構成され、高レベルで発現された。
これらの結果から、単一の遺伝子療法用ベクター、例えばAAVに収めるには長すぎるプロモーターおよび/またはコード配列を有する、疾患を引き起こす遺伝子(または治療用タンパク質)を発現させる場合などに、少なくとも3つの異なる合成核酸分子から単一のRNA分子を再構成することができることが実証される。
一部の実施例では、本発明の組成物、系、キット、および方法の合成核酸分子、例えば合成DNA分子は、逆転写酵素によるRNAウイルスゲノムの転写によって作製される。
本明細書に開示される系により、個々の断片間の効率的なRNA組換えが可能になる。一部の実施例では、本開示の組成物、系または方法を使用して実現される再構成(すなわち、スプライシングまたは組換え)効率を、当業者に公知の任意の適切な方法を使用して決定する。一部の実施例では、再構成効率は、対照RNAと比べた正しく結合されたRNAの尺度、または対照タンパク質と比べた全長タンパク質またはタンパク質活性の尺度によって表される。一部の実施例では、対照RNAは結合していないRNAであり、その場合、再構成効率は、結合していないRNAと比べた結合したRNAの尺度によって表される。この測定は、結合部RNAおよび結合していない3’RNA種3’を検出し、比較することによって行うことができる(例えば、結合部RNA:3’RNA)。2つよりも多くのRNAを結合させる一部の実施例では、結合部のいずれかまたは全てにおける結合を評価する。一部の実施例では、再構成効率は、タンパク質断片または不活性タンパク質と比べた全長タンパク質または活性タンパク質の尺度によって表される。
一部の実施例では、再構成、組換えまたはスプライシングの効率(異なるRNA分子上に存在する2つもしくはそれよりも多くの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度)は、約10%~約100%である。一部の実施例では、再構成効率は約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くても約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、2つの異なるコード配列は、約3200nt~9000nt、例えば、約4000~9000nt、約4400~9000nt、約3200~4000nt、約3200~3600nt、例えば、約4500nt、約4000nt、約3800nt、約3600nt、または約3200ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、2つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くても約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、2つの異なるコード配列は、約4000ntの転写物をコードする)は、約40%~約60%、例えば、約40%~約50%、約42%~約47%、例えば、約45%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、2つの異なるコード配列は、約3800ntの転写物をコードする)は、約40%~約60%、例えば、約40%~約50%、約42%~約47%、例えば、約45%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、2つの異なるコード配列は、約3600ntの転写物をコードする)は、約25%~約50%、例えば、約30%~約40%、例えば、約35%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する2つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、2つの異なるコード配列は、約3200ntの転写物をコードする)は、約25%~約50%、例えば、約30%~約40%、例えば、約35%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する3つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、3つの異なるコード配列は、約3200nt~約13,500nt、例えば、約4000nt~約5,000nt、約4000nt~約13,500nt、約6000nt~約12,000nt、約6000nt~約10,000nt、または約8000nt~約12,000nt、例えば、最大約13,500ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、3つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くても約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、再構成、組換えまたはスプライシングの効率(本実施例では、異なるRNA分子上に存在する4つの異なるコード配列の正しい結合、および/または所望の全長タンパク質の産生の尺度であり、ここで、4つの異なるコード配列は、約3200nt~約18,000nt、例えば、約4000nt~約18,000nt、約4000nt~約5,000nt、約10,000nt~約18,000nt、約15,000nt~約18,000nt、または約12,000nt~約15,000nt、例えば、最大約18,000ntの転写物をコードする)は、約10%~約100%である。一部の実施例では、4つの部分からなる系を使用した再構成効率は、約10%~約15%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約15%~約20%、約15%~約25%、約15%~約30%、約15%~約40%、約15%~約50%、約15%~約60%、約15%~約70%、約15%~約80%、約15%~約90%、約15%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、再構成効率は、約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、再構成効率は、少なくとも約10%、約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、再構成効率は、多くても約15%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、本開示の組成物、系または方法を、当業者に公知の任意の適切な方法を使用してRNAまたはタンパク質の産生レベルを決定することによって評価する。一部の実施例では、RNA産生レベルは、対照RNAと比べた正しく結合されたRNAの尺度、または対照と比べた全長タンパク質の尺度によって表される。一部の実施例では、対照RNAは対応する変異体RNAまたは内因性RNAである。例えば、トランスフェクトされた細胞において産生された結合したRNAの量の変異体または内因性RNAの量に対する比をトランスフェクトされていない細胞における同じ比と比較して、正しく結合されたRNAの産生レベルを決定する。一部の実施例では、正しく結合されたRNA、全長タンパク質、またはタンパク質活性の量の、対照RNAの量、または対照タンパク質の量もしくは活性に対する比を比較する。
一部の実施例では、実現されるRNA産生レベルは5%~100%である。一部の実施例では、実現されるRNA産生レベルは約5%~約100%である。一部の実施例では、実現されるRNA産生レベルは約5%~約10%、約5%~約20%、約5%~約25%、約5%~約30%、約5%~約40%、約5%~約50%、約5%~約60%、約5%~約70%、約5%~約80%、約5%~約90%、約5%~約100%、約10%~約20%、約10%~約25%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約10%~約100%、約20%~約25%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約20%~約100%、約25%~約30%、約25%~約40%、約25%~約50%、約25%~約60%、約25%~約70%、約25%~約80%、約25%~約90%、約25%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約80%、約60%~約90%、約60%~約100%、約70%~約80%、約70%~約90%、約70%~約100%、約80%~約90%、約80%~約100%、または約90%~約100%である。一部の実施例では、実現されるRNA産生レベルは、約5%、約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。一部の実施例では、実現されるRNA産生レベルは、少なくとも約5%、約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、または約90%である。一部の実施例では、実現されるRNA産生レベルは、多くても約10%、約20%、約25%、約30%、約40%、約50%、約60%、約70%、約80%、約90%、または約100%である。
一部の実施例では、タンパク質産生レベルは、対照タンパク質の全長タンパク質またはタンパク質活性の量と比べた全長タンパク質またはタンパク質活性の量の尺度によって表される。一部の実施例では、対照タンパク質は、対応する変異体タンパク質または内因性タンパク質である。例えば、トランスフェクトされた細胞において産生された全長タンパク質またはタンパク質活性の量の変異体または内因性タンパク質の量に対する比をトランスフェクトされていない細胞における同じ比と比較する。一部の実施例では、対照タンパク質は、例えば、対照全長タンパク質を発現するように操作された細胞(ここで、細胞は本発明の構築物をトランスフェクトされていない)または対照全長タンパク質を発現する正常な対象由来のトランスフェクトされていない細胞において産生される全長タンパク質であり、タンパク質産生レベルは、トランスフェクトされた細胞におけるタンパク質の量または活性を測定し、それを対照タンパク質のものと比較することによって決定される。一部の実施例では、対照タンパク質は、構築物をトランスフェクトされた細胞またはトランスフェクトされていない細胞において産生されるタンパク質の変異体形態であり、全長タンパク質またはタンパク質活性の量を対照タンパク質のものと比較して、タンパク質産生レベルを決定する。一部の実施例では、全長タンパク質またはタンパク質活性の量を内因性タンパク質またはハウスキーピングタンパク質のものと比較して、タンパク質産生レベルを決定する。
一部の実施例では、実現されるタンパク質産生レベルは、約1%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%~約20%、約10%~約30%、約10%~約40%、約10%~約50%、約10%~約60%、約10%~約70%、約10%~約75%、約10%~約80%、約10%~約85%、約10%~約90%、約10%~約100%、約20%~約30%、約20%~約40%、約20%~約50%、約20%~約60%、約20%~約70%、約20%~約75%、約20%~約80%、約20%~約85%、約20%~約90%、約20%~約100%、約30%~約40%、約30%~約50%、約30%~約60%、約30%~約70%、約30%~約75%、約30%~約80%、約30%~約85%、約30%~約90%、約30%~約100%、約40%~約50%、約40%~約60%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約100%、約50%~約60%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約100%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約100%、約85%~約90%、約85%~約100%、または約90%~約100%である。一部の実施例では、実現されるタンパク質産生レベルは、約10%、約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約100%である。一部の実施例では、実現されるタンパク質産生レベルは、少なくとも約10%、約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、または約90%である。一部の実施例では、実現されるタンパク質産生レベルは、多くても約20%、約30%、約40%、約50%、約60%、約70%、約75%、約80%、約85%、約90%、または約100%である。
一部の実施例では、実現されるタンパク質活性レベルは、約50%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%~約55%、約50%~約60%、約50%~約65%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約95%、約50%~約100%、約55%~約60%、約55%~約65%、約55%~約70%、約55%~約75%、約55%~約80%、約55%~約85%、約55%~約90%、約55%~約95%、約55%~約100%、約60%~約65%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約95%、約60%~約100%、約65%~約70%、約65%~約75%、約65%~約80%、約65%~約85%、約65%~約90%、約65%~約95%、約65%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約95%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約95%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約95%、約80%~約100%、約85%~約90%、約85%~約95%、約85%~約100%、約90%~約95%、約90%~約100%、または約95%~約100%である。一部の実施例では、実現されるタンパク質活性レベルは、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。一部の実施例では、実現されるタンパク質活性レベルは、少なくとも約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約95%である。一部の実施例では、実現されるタンパク質活性レベルは、多くても約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、または約100%である。
一部の実施例では、細胞において産生される正しく結合されたRNAまたは全長タンパク質の量は、特定の状態または疾患に関して当業者によって理解される通り、対象における状態または疾患を好転または治癒させるために十分なものである。一部の実施例では、細胞において産生される正しく結合されたRNAまたは全長タンパク質の量は有効量である。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約50%~100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%~約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約65%、約40%~約70%、約40%~約75%、約40%~約80%、約40%~約85%、約40%~約90%、約40%~約100%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約65%、約45%~約70%、約45%~約75%、約45%~約80%、約45%~約85%、約45%~約90%、約45%~約100%、約50%~約55%、約50%~約60%、約50%~約65%、約50%~約70%、約50%~約75%、約50%~約80%、約50%~約85%、約50%~約90%、約50%~約100%、約55%~約60%、約55%~約65%、約55%~約70%、約55%~約75%、約55%~約80%、約55%~約85%、約55%~約90%、約55%~約100%、約60%~約65%、約60%~約70%、約60%~約75%、約60%~約80%、約60%~約85%、約60%~約90%、約60%~約100%、約65%~約70%、約65%~約75%、約65%~約80%、約65%~約85%、約65%~約90%、約65%~約100%、約70%~約75%、約70%~約80%、約70%~約85%、約70%~約90%、約70%~約100%、約75%~約80%、約75%~約85%、約75%~約90%、約75%~約100%、約80%~約85%、約80%~約90%、約80%~約100%、約85%~約90%、約85%~約100%、または約90%~約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量の約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約100%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量のおよそ少なくとも約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、または約90%に相当する。一部の実施例では、この量は、正常な細胞において産生されるRNAまたはタンパク質の量のおよそ多くても約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、または約100%に相当する。
組換え効率または産生レベルを決定するために使用するRNAまたはタンパク質の測定は、当業者に公知の任意の適切な方法によって行うことができる。一部の実施例では、発現された機能的タンパク質の量を例えばウエスタンブロット法によって測定することにより、組換え効率または産生レベルを決定する。一部の実施例では、例えば、2つのプローブに基づく定量的リアルタイムPCRを使用してRNA転写物を測定することにより、組換え効率または産生レベルを決定する。例えば、第1のアッセイは、3’エクソンコード配列に完全に含有される配列(3’プローブで標識)にわたる。第2のアッセイは、5’エクソンコード配列と3’エクソンコード配列の間の結合部(結合部プローブで標識)にわたる。再構成効率は、(結合部プローブ計数)/(3’プローブ計数)の比として算出することができる。「再構成効率」、「組換え効率」および「スプライシング効率」は、本明細書では互換的に使用される。
一部の実施例では、二量体形成ドメインは、約20~約1000nt、または約50~約160nt、または約50~約500nt、または約50~1000ntであり、ここで、再構成効率は、有効量の正しく結合されたRNAまたは全長タンパク質の産生をもたらすものである。一部の実施例では、二量体形成ドメインは約50~約160ntであり、ここで、再構成効率は、有効量の正しく結合されたRNAまたは全長タンパク質の産生をもたらすものである。
複数のRNA分子間の効率的な組換えの実現により、単一のAAVのパッケージングの制限を超えた導入遺伝子のAAVへのパッケージングおよび送達が可能になる。AAVパッケージングの制限は、大きな遺伝子の非存在/欠陥によって引き起こされる疾患に対する遺伝子療法の手法の主要な障害である。この系の適用の1つは、疾患を引き起こす大きな遺伝子を、パッケージング容量が制限されたウイルスベクターを使用して発現させることである。疾患および遺伝子としては、これだけに限定されないが、(疾患(遺伝子、OMIM遺伝子識別子)):1)デュシェンヌ型筋ジストロフィーおよびベッカー型筋ジストロフィー(ジストロフィン、OMIM:300377);2)ジスフェルリン異常症(ジスフェルリン、OMIM:603009);3)嚢胞性線維症(CFTR、OMIM:602421);4)アッシャー症候群1B(ミオシンVIIA、OMIM:276903);5)スタルガルト病1(ABCA4、OMIM:601691);6)血友病A(凝固第VIII因子、OMIM:300841);7)フォン・ヴィルブランド病(フォン・ヴィルブランド因子、OMIM:613160);8)マルファン症候群(フィブリリン1、OMIM:134797);9)フォンレックリングハウゼン病(神経線維腫症-1、OMIM:162200)、および聴力損失(OTOF、OMIM:603681)が挙げられる。他のものを表1に提示する。さらに、例えば、ゲノム点変異を処置するため、または遺伝子を活性化するもしくは過剰発現させるために、Cas9タンパク質(例えば、実施例20~23に例示されているものなど)を、本明細書に提示される開示される系を使用して発現させることができる。導入遺伝子の送達は、本明細書に提示される手法を使用して当該遺伝子を複数の断片に分割することによって実現することができる。
本明細書に開示される方法および系の追加的な適用としては、標的化遺伝子発現のための交差遺伝子送達(intersectional gene delivery)が挙げられる。断片化された遺伝子をコードする2つのウイルスの示差的感染/発現パターンを使用することができる。再構成されたタンパク質は、いずれのウイルスもそれ自体で発現する交差を表す重複する細胞集団において発現される。そのような適用の例としては、以下を挙げることができる:(1)タンパク質の両半分(または3つの3分の1、または他の部分)を、逆行輸送されるウイルスベクターを使用して2つ(またはそれよりも多く)の投影標的から送達して、二股のデュアル投影ニューロンを標識すること、(2)集団Aにおいて活性であるプロモーターの制御下にある1つの断片および、集団Bにおいて活性なプロモーターからの第2の断片を送達して、A∪B集団に対する特異的なタグ付け/操作を行うこと、(3)タンパク質の第1の半分を、集団Aに対するトロピズムを有するウイルスベクターを用いて送達し、第2の半分を、集団Bに対するトロピズムを有するウイルスベクターを用いて送達して、A∪B集団に対する特異的なタグ付け/操作を行うこと。またはこれらの手法の組合せ。
一実施例では、二量体形成ドメインは、例えば、(a)アプタマーによって認識される小分子トリガー、または(b)両半分に結合し、したがって、二量体形成を刺激する、細胞内に存在するタンパク質の存在下で二量体形成を容易にするためのアプタマー配列である。
一部の実施形態では、末端結合に必要なRNA-RNA相互作用を、例えば、(a)両半分に対する相同性を有するアンチセンスオリゴヌクレオチド配列(ssDNAにより誘発される二量体形成)など、他のヌクレオチドによって正にまたは負に制御することができる。そのような実施例では、両方の半分に対する相補配列を有するアンチセンスオリゴヌクレオチドが2つの分子に架橋してひとつにし、したがって、2つの分子のスプライソソーム媒介性組換えが容易になる。(b)2つの結合しているRNAのうちの一方に対する相同性を有するアンチセンスオリゴヌクレオチド配列は、2つの分子のRNA二量体形成を妨げ、遺伝子発現のためのオフスイッチの役割を果たすことができるか、または、(c)両半分に対して相同性を有する内因性細胞RNA(RNAにより誘発される二量体形成)。そのような実施例では、両方の半分に対する相補配列を有する細胞RNA(例えば、mRNAまたはレトロエレメント)が2つの分子に架橋してひとつにし、したがって、2つの分子のスプライソソーム媒介性組換えが容易になる。
これらの分子、タンパク質、またはRNA媒介性相互作用により、制御可能な/微調整された遺伝子発現レベルが可能になる:結合ドメイン(例えば、アンチセンスオリゴヌクレオチド、小分子、内因性細胞RNA)と相互作用する分子の用量設定を行うことにより、両半分間の二量体形成効率をモジュレートして、プロモーター活性とは無関係に発現レベルを調節することができる。そのような分割方式(installment)は、狭い範囲のタンパク質の発現レベルが必要な場合に使用することができる。
III.系
2つまたはそれよりも多くのRNA分子、例えば、少なくとも2種、少なくとも3種、少なくとも4種、または少なくとも5種の異なるRNA分子(例えば、2種、3種、4種、5種、6種、7種、8種、9種または10種の異なるRNA分子)を、二量体形成配列を含有する合成イントロンを使用して組み換えるために使用することができる系が本明細書に提示される。タンパク質レベルでの2つの断片の断片化および再構成とは異なり、本明細書に開示される手法では、適切な分割点を見つけるための広範囲にわたるタンパク質操作が必要ない。RNAレベルでの再構成により、タンパク質の2つの断片のシームレス結合が可能になる。本明細書に開示される方法および系により、大きな遺伝子(および対応するタンパク質)、例えば、約4.5kbよりも大きい、少なくとも5kbよりも大きい、少なくとも5.5kbよりも大きい、少なくとも6kbよりも大きい、少なくともkbよりも大きい、少なくとも8kbよりも大きい、少なくとも8kbよりも大きい、少なくとも10kbよりも大きい、少なくとも13.5kbよりも大きい、または少なくとも18kbよりも大きいものを、2つまたはそれよりも多くの断片または部分に分けることが可能になり、そのそれぞれを別々のベクター、例えば複数のAAVによって細胞または対象に導入することができる。一実施例では、系は、2つのRNA分子を組み換えるための2つの部分を含み、ここで、例えば、標的タンパク質は、少なくとも約4500nt~約9000nt、例えば、4000nt~5000ntによってコードされる。一実施例では、系は、3のRNA分子を組み換えるための3つの部分を含み、ここで、例えば、標的タンパク質は、最大約13,500nt、例えば、約4500nt~約13,500ntまたは4000nt~5000ntによってコードされる。一実施例では、系は、4つのRNA分子を組み換えるための4つの部分を含み、ここで、例えば、標的タンパク質は、最大約18,000nt、例えば、約4500nt~約18,000ntまたは4000nt~5000ntによってコードされる。これは、ベクターにおいて利用可能な空間の制限を克服するのに役立つ。一部の実施例では、内因性プロモーターの長さが、AAVで発現されるその対応する遺伝子の容量を制限する。一部の実施例では、コード配列の長さが、AAVで発現されるその容量を制限する。一部の実施例では、内因性プロモーターの長さおよびそのコード配列の長さが、AAVで共に発現されるそれらの容量を制限する。本明細書に開示される系は、以前はAAVで発現させることが難しかったそのような長い配列を発現させるために使用することができる。
一部の実施例では、再構成される標的タンパク質は、単一遺伝子疾患、劣性遺伝子疾患、大きな遺伝子(例えば、約4500ntよりも大きい、例えば、少なくとも5kb、少なくとも5.5kb、少なくとも6kb、少なくともkb、少なくとも8kb、少なくとも8kb、少なくとも10kb、少なくとも13.5kb、もしくは少なくとも18kbのもの)の変異によって引き起こされる疾患、および/またはAAVの容量を超える(例えば、5000ntよりも大きい)遺伝子(例えば、プロモーター+コード配列)によって引き起こされる疾患などの疾患に関連するタンパク質である。そのような疾患の例としては、これだけに限定されないが、血友病A(F8遺伝子、7kbコード領域の変異によって引き起こされる)、血友病B(F9遺伝子の変異によって引き起こされる)、デュシェンヌ型筋ジストロフィー(ジストロフィン遺伝子、11kbコード領域の変異によって引き起こされる)、鎌状赤血球貧血(約3.5kbのプロモーターを有するヘモグロビンのベータグロビンドメインの変異によって引き起こされる)、スタルガルト病(ABCA4遺伝子、6.9kbコード領域の変異によって引き起こされる)、アッシャー症候群(MYO7A、7kbコード領域の変異によって引き起こされ、聴力損失および視覚障害が生じる)が挙げられる。
一実施例では、再構成される標的タンパク質は、がん、例えば、乳がん、肺がん、前立腺がん、肝臓がん、腎臓がん、脳がん、骨がん、卵巣がん、子宮がん、皮膚がん、または結腸がんなどの疾患を処置することができるものである。一実施例では、再構成される治療用標的タンパク質は、毒素、例えば、ジフテリア毒素Aもしくはシュードモナス外毒素AなどのAB毒素、または受容体結合活性を欠く形態(例えば、ジフテリア毒素DAB389、DAB486、DT388、DT390、もしくはシュードモナス外毒素A PE38もしくはPE40)である。
一部の実施例では、標的タンパク質をコードし、本明細書に開示される方法および系に使用されるRNA配列を、標的生物体または細胞における発現のためにコドン最適化する、例えば、ヒト、イヌ、ブタ、ネコ、マウス、またはラットの細胞における発現のためにコドン最適化する。したがって、一部の実施例では、RNAコード配列は、好ましいコドンを含む(例えば、利用が少ない稀なコドンを含まない)。コドン最適化は、標的生物体または細胞において豊富なtRNAレベルを同定することによって実施することができる。一部の実施例では、RNA組換え反応を最大にするために、タンパク質をコードするRNA配列を潜在スプライスドナーおよびアクセプター部位について脱富化する。
一部の実施例では、タンパク質を2つの部分、例えば、およそ2つの等しい半分(または他の割合、例えば、約1/3を発現する部分Aと約2/3を発現する部分B、または約1/4を発現する部分Aと約3/4を発現する部分Bなど)に分ける。しかし、各部分のヌクレオチドの数が同じである必要はない(または同じ数のアミノ酸をコードする必要はない)。そのような実施例では、方法に2つの合成核酸分子(例えば、RNAまたはそのようなRNAをコードするDNA)を使用することができ、そのうちの一方はタンパク質のN末端部分のコード配列を含み、他方はタンパク質のC末端部分のコード配列を含む。この基礎に基づいて、タンパク質を2つの断片または部分に分けることに加えて、目的のタンパク質を2つよりも多くの断片、例えば3つの断片に分けるまたは分割することができることが当業者には理解されよう。3つのRNA分子のイントロン配列の設計原理は2つのRNA分子のものと同様であるが、代わりに、2つの結合部のうちの一方について二量体形成ドメインの異なる対を利用する。したがって、例えば、N末端タンパク質コード配列の後には特定の結合ドメイン(例えば、第1の二量体形成配列)を有するイントロン配列が続き、中間コード配列は、第1の二量体形成配列に対する相補配列(第2の二量体形成配列)を有するイントロン配列を含む。中間コード断片の後には別の二量体形成配列(第3の二量体形成配列、第2の二量体形成配列とは異なる)を有する別のイントロン断片が続く。第3の断片はタンパク質のC末端コード配列を含み、また、第3の二量体形成配列と相補的な二量体形成配列(第4の二量体形成配列)を有するイントロン領域を含む。1つよりも多くの中間部分の使用では、2つの中間部分を、それぞれの部分が区別されることが理解されるように、例えば、中間部分および第1の中間部分、または第1の中間部分および第2の中間部分、または、第1の中間部分、第2の中間部分および第3の中間部分と称することができる。
一実施例では、所望のタンパク質をN末端部分とC末端部分に分け(例えば、大まかに半分、または等しくない配分、例えば、1/3と2/3もしくは1/4と3/4に分け)、それらを、本明細書に開示される系および方法を使用して再構成することができる。図6Aを参照すると、そのような実施例では、系は、少なくとも2つの合成核酸分子110、150を含む。各核酸分子110、150はDNAまたはRNAで構成され得る(RNAの場合、プロモーター112、152は存在しない)。一部の実施例では、110、150はそれぞれ、およそ少なくとも100ヌクレオチド/リボヌクレオチド(nt)の長さ、例えば、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、少なくとも8000nt、少なくとも10,000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntなどである。分子110、150は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
分子110は、スプライスドナー116を含むので、系の5’に位置する分子である。分子110がDNAである実施形態では、分子110は、RNA分子をコードする配列に作動可能に連結したプロモーター112を含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列114、SD116、必要に応じたDISE118、必要に応じたISE120、二量体形成ドメイン122、および必要に応じたポリアデニル化配列124を含む。任意のプロモーター112(またはエンハンサー)、例えばRNAポリメラーゼIIを利用するもの、例えば構成的プロモーターまたは誘導性プロモーターを使用することができる。一部の実施例では、プロモーター112は、筋組織(例えば、骨格筋組織もしくは心筋組織)、眼の組織(例えば、網膜組織)、内耳組織、肝組織、膵組織、肺組織、皮膚組織、骨、または腎組織において構成的に活性なものなどの、組織特異的プロモーターである。一部の実施例では、プロモーター112は、がん細胞、または正常な細胞において構成的に活性なものなどの細胞特異的プロモーターである。一部の実施例では、プロモーター112は、発現させる標的タンパク質の内因性プロモーターであり、一部の実施例では、長い(例えば、少なくとも2500nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、または少なくとも7500nt)。一部の実施例では、プロモーター112は、少なくとも約50ヌクレオチド(nt)の長さ、例えば、少なくとも100nt、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、少なくとも8000nt、少なくとも9000nt、または少なくとも10,000nt、例えば、50~10,000nt、100~5000nt、500~5000nt、または50~1000ntの長さである。一部の実施例では、分子110はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。図6Fに示されている通り、分子110がRNAである実施形態、例えば、DNAのRNAへの転写後には、分子110は、プロモーター112を含まず、114は、標的タンパク質のN末端部分のコード配列によってコードされるRNAである。一部の実施例では、分子110はRNAであり、プロモーター112を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子110(プロモーター112を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
N末端コード配列(またはそれによってコードされるRNA配列)114の3’末端の周囲のスプライスジャンクションは、分子110、150が導入される標的細胞または生物体において見いだされるコンセンサス配列とマッチし得る。ヒトでは、スプライスジャンクション配列は、U2依存性イントロンに関しては5’スプライス部位の-1位および-2位のAG(アデニン-グアニン)もしくはUG(ウラシル-グアニン)またはU12依存性イントロンに関してはAG、UG、CU(シトシン-ウラシル)、もしくはUUである。したがって、一部の実施例では、スプライスジャンクションは2ntの長さであり、N末端コード部分114の3’末端はAG、UG、CUまたはUUである。一部の実施例では、標的タンパク質の一部をコードするDNA分子は、複数のスプライスジャンクションの一部をコードする配列を、例えば、標的タンパク質のN末端部分をコードするDNA分子の3’末端、および標的タンパク質のC末端部分をコードするDNA分子の5’末端に含む。
分子110の残りの3’末端部分はイントロン130である。一部の実施例では、イントロン配列130は、およそ少なくとも10nt、例えば、少なくとも20nt、少なくとも50nt、少なくとも100nt、少なくとも250nt、少なくとも250nt、少なくとも300nt、少なくとも400nt、または少なくとも500ntの長さ、例えば、20~500nt、20~250nt、20~100nt、50~100nt、または50~200ntの長さである。N末端コード配列(またはそれによってコードされるRNA)114のすぐ後ろはスプライスドナー(SD)116(例えば、SDヒトコンセンサス配列などのSDコンセンサス配列)である。したがって、イントロン配列130のSD116はN末端コード配列114に対して3’側にある。SD116はRNA分子に結合するためのスプライソソーム成分の認識配列を形成する。SD116の配列は、分子110、150が導入される標的細胞または生物体において見いだされるSDコンセンサス配列であり得る。一部の実施例では、SD116は、少なくとも2nt、例えば、少なくとも5nt、または少なくとも10ntの長さ、例えば、2~10nt、2~8nt、2~5または5~10ntである。SD116を使用してU2またはU12依存性スプライシング機構を動員することができる。一実施例では、U2依存性スプライシングをヒト細胞において使用し、SD116配列はGUAAGUAUUを含むかまたはGUAAGUAUUである。一実施例では、U12依存性スプライシングをヒト細胞において使用し、SD116配列はAUAUCCUUUUUA(配列番号137)またはGUAUCCUUUUUA(配列番号138)を含むかまたはAUAUCCUUUUUA(配列番号137)またはGUAUCCUUUUUA(配列番号138)である。全体を通して、RNA配列はヌクレオチドA、G、TおよびCを使用して記載することができ、DNA配列はヌクレオチドA、G、UおよびCを使用して記載することができることが理解される。
イントロン配列130は、必要に応じて、スプライソソームの作用を刺激する(例えば、活性を増大させる)、下流イントロンスプライスエンハンサー(DISE)118およびイントロンスプライスエンハンサー(ISE)120と称されるスプライシングエンハンサー配列のセットのうちの一方または両方を含む。一部の実施例では、イントロン配列130は、少なくとも2つのスプライシングエンハンサー配列、例えば、少なくとも3つ、少なくとも4つ、または少なくとも5つのスプライシングエンハンサー配列を含む。例示的なスプライシングエンハンサー配列はDISE118およびISE120を含む。一部の実施例では、1つまたは複数のスプライシングエンハンサー配列118、120をイントロン配列130に含めることにより、スプライシング効率が少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも75%、少なくとも80%、少なくとも90%または少なくとも95%上昇する。使用することができる例示的なスプライシングエンハンサー配列は、配列番号26~136、151、および152、ならびにGGGTTT、GGTGGT、TTTGGG、GAGGGG、GGTATT、GTAACG、GGGGGTAGG、GGAGGGTTT、GGGTGGTGT TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、TCTTT、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTT、CTCTG、GGG、GGG(N)2-4GGG、TGGG、YCAY、UGCAUG、または3x(G3~6N1~7)に提示される。一部の実施例では、DISE118は、存在する場合、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、少なくとも25nt、少なくとも50nt、少なくとも75nt、または少なくとも100ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、5~100nt、10~25nt、10~20nt、または20~75ntであってよく、DISE118の配列は、CUCUUUCUUUTCCAUGGGUUGGCU(配列番号134)、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTTまたはCTCTGであるかまたはそれを含む。一部の実施例では、ISE120は、存在する場合、およそ少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも40nt、または少なくとも50ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、20~25nt、10~25nt、10~20nt、または20~40ntの長さであり得る。一実施例では、ISE120の配列は、GGCUGAGGGAAGGACUGUCCUGGG(配列番号135)、GGGUUAUGGGACC(配列番号136)、TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、またはTCTTTであるかまたはそれを含む。一部の実施例では、イントロン配列130は、少なくとも2つ、少なくとも3つ、または少なくとも4つのISE120を含む。一部の実施例では、ISE120は、配列番号173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、199、200、201、202、または203に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する少なくとも1つの配列、例えば、少なくとも2つ、少なくとも3つのそのような配列、例えば、1つ、2つ、3つ、4つまたは5つのそのような配列であるかまたはそれを含む。一部の実施例では、DISE118は、配列番号173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、199、200、201、202、または203に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する少なくとも1つの配列、例えば、少なくとも2つ、少なくとも3つのそのような配列、例えば、1つ、2つ、3つ、4つまたは5つのそのような配列であるかまたはそれを含む。
SD116(および存在する場合、エンハンサー配列118、120も)の3’側に、N末端コード配列(またはそれによってコードされるRNA)114とC末端コード配列154をひとつに合わせるために使用される二量体形成ドメイン122が続く。分子110のイントロン配列130部分は、必要に応じて、3’末端に、その断片の転写を終結させるポリアデニル化部位124を含み得る。一部の実施例では、ポリアデニル化配列124は、少なくとも15個のA、例えば、15~30個または15~20個のAのポリA配列である。
一部の実施例では、第1の二量体形成ドメイン122(および分子150の第2の二量体形成ドメイン154)は、複数の対合していないヌクレオチドを含む(すなわち、分子110自体の構造内で対合していない)。二量体形成ドメイン内に対合していないヌクレオチドを有することにより、5’(または第1の)二量体形成ドメイン122と3’(または第2の)二量体形成ドメイン154が塩基対合を通じて相互作用することが可能になる。この相互作用を通じて、分子110と150が近傍に保たれ、それにより、スプライソソームがN末端コード領域(またはそれによってコードされるRNA)114とC末端コード領域(またはそれによってコードされるRNA)164を結合することによって2つの分子を組み換えるように促される。
一実施例では、二量体形成ドメイン122(および154)は多様性が限られたヌクレオチドを含有する「低多様性配列」を含み、したがって、各分子110、150の二次構造において二量体形成ドメイン122(および154)自体がステムループを形成する可能性は低い。そのような低多様性二量体形成ドメイン122(および154)は、タンパク質のN末端およびC末端をコードするDNA(またはそれによってコードされるRNA)114、164の配列とは無関係に、比較的開いた構成であり得る。これにより、第1の二量体形成ドメイン122のヌクレオチドを対応する分子150の第2の二量体形成ドメイン154との塩基対の形成に利用可能にすることが可能になり、それにより、その後のN末端コード配列(またはそれによってコードされるRNA)114とC末端コード配列(またはそれによってコードされるRNA)164の結合が可能になる。一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、ステムを形成し得る配列が散在する低多様性配列を含み、それにより、シュードノット形成の非存在下で開いており、塩基対合に利用可能な局所的なRNAループがもたらされる(図6B)。例示的な低多様性配列は、繰り返される一連のU(例えば、30~500個のU)、繰り返される一連のA(例えば、30~500個のAなど)、繰り返される一連のG(例えば、30~500個のG)、繰り返される一連のC(例えば、30~500個のC)、AおよびGのみを含有する混合物(例えば、30~500個のAおよびG、例えば、繰り返され得るAAAGAAGGAA(...)(配列番号149))、CおよびUのみを含有する混合物(例えば、30~500個のCおよびU、例えば、繰り返され得るCUUUCUUUUCUU(...)(配列番号150))を含む。他の例示的な低多様性配列は、低多様性配列によって挟まれたヘリックスを形成する相補配列を含む。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、プリンのみを含むか、またはピリミジンのみを含む。一実施例では、第1の二量体形成ドメイン122はプリンのみを含み、一方、第2の二量体形成ドメイン154ピリミジンのみを含む。別の例では、第1の二量体形成ドメイン122はピリミジンのみを含み、一方、第2の二量体形成ドメイン154はプリンのみを含む。プリンはそれら自体で対合することができないので(ピリミジンも同様に)、これらの一続きのRNAは、開いた予測される構造を有する。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154は、スプライスドナーコンセンサス配列NNNAGGUNNNN(配列番号151)またはNNNUGGUNNNN(配列番号152)(式中、Nは任意のヌクレオチドを指す)と同様の配列などの、RNA組換えと競合する可能性がある潜在スプライスアクセプターを含まない。一部の実施例では、第1の二量体形成ドメイン122は、1000nt以下、例えば750nt以下、または500ntを超える、例えば、6~1000nt、10~1000nt、20~1000nt、30~1000nt、30~750nt、30~500nt、50~500nt、50~100nt、もしくは100~250ntである。一部の実施例では、第1の二量体形成ドメイン122は、50ntよりも大きい、例えば、少なくとも51nt、少なくとも100nt、少なくとも150nt、少なくとも161nt、または少なくとも170nt、例えば、51~159nt、51~150nt、51~120nt、51~100nt、もしくは51~70ntである。一部の実施例では、第1の二量体形成ドメイン122は、160ntよりも大きい、例えば、少なくとも161nt、少なくとも170nt、少なくとも180nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、少なくとも600nt、少なくとも700nt、少なくとも800nt、少なくとも900nt、もしくは少なくとも1000nt、例えば、161~100nt、161~500nt、161~300nt、161~200nt、もしくは161~170ntである。一部の実施例では、第1の二量体形成ドメイン122は、50nt未満、例えば、6~49nt、6~45nt、6~40nt、6~30nt、6~20nt、または6~10ntである。
一部の実施例では、二量体形成ドメインは、20~160nt、50~500nt、または500~1000ntである。一部の実施例では、二量体形成ドメインは、約20nt~約160ntである。一部の実施例では、二量体形成ドメインは、約20nt~約40nt、約20nt~約50nt、約20nt~約70nt、約20nt~約90nt、約20nt~約100nt、約20nt~約110nt、約20nt~約120nt、約20nt~約130nt、約20nt~約140nt、約20nt~約150nt、約20nt~約160nt、約40nt~約50nt、約40nt~約70nt、約40nt~約90nt、約40nt~約100nt、約40nt~約110nt、約40nt~約120nt、約40nt~約130nt、約40nt~約140nt、約40nt~約150nt、約40nt~約160nt、約50nt~約70nt、約50nt~約90nt、約50nt~約100nt、約50nt~約110nt、約50nt~約120nt、約50nt~約130nt、約50nt~約140nt、約50nt~約150nt、約50nt~約160nt、約70nt~約90nt、約70nt~約100nt、約70nt~約110nt、約70nt~約120nt、約70nt~約130nt、約70nt~約140nt、約70nt~約150nt、約70nt~約160nt、約90nt~約100nt、約90nt~約110nt、約90nt~約120nt、約90nt~約130nt、約90nt~約140nt、約90nt~約150nt、約90nt~約160nt、約100nt~約110nt、約100nt~約120nt、約100nt~約130nt、約100nt~約140nt、約100nt~約150nt、約100nt~約160nt、約110nt~約120nt、約110nt~約130nt、約110nt~約140nt、約110nt~約150nt、約110nt~約160nt、約120nt~約130nt、約120nt~約140nt、約120nt~約150nt、約120nt~約160nt、約130nt~約140nt、約130nt~約150nt、約130nt~約160nt、約140nt~約150nt、約140nt~約160nt、または約150nt~約160ntである。一部の実施例では、二量体形成ドメインは、約20nt、約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、約150nt、または約160ntである。一部の実施例では、二量体形成ドメインは、少なくとも約20nt、約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、または約150ntである。一部の実施例では、二量体形成ドメインは、多くても約40nt、約50nt、約70nt、約90nt、約100nt、約110nt、約120nt、約130nt、約140nt、約150nt、または約160ntである。
一部の実施例では、二量体形成ドメインは、約50nt~約500ntである。一部の実施例では、二量体形成ドメインは、約50nt~約100nt、約50nt~約150nt、約50nt~約200nt、約50nt~約250nt、約50nt~約300nt、約50nt~約350nt、約50nt~約400nt、約50nt~約500nt、約100nt~約150nt、約100nt~約200nt、約100nt~約250nt、約100nt~約300nt、約100nt~約350nt、約100nt~約400nt、約100nt~約500nt、約150nt~約200nt、約150nt~約250nt、約150nt~約300nt、約150nt~約350nt、約150nt~約400nt、約150nt~約500nt、約200nt~約250nt、約200nt~約300nt、約200nt~約350nt、約200nt~約400nt、約200nt~約500nt、約250nt~約300nt、約250nt~約350nt、約250nt~約400nt、約250nt~約500nt、約300nt~約350nt、約300nt~約400nt、約300nt~約500nt、約350nt~約400nt、約350nt~約500nt、または約400nt~約500ntである。一部の実施例では、二量体形成ドメインは、約50nt、約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、約400nt、または約500ntである。一部の実施例では、二量体形成ドメインは、少なくとも約50nt、約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、または約400ntである。一部の実施例では、二量体形成ドメインは、多くても約100nt、約150nt、約200nt、約250nt、約300nt、約350nt、約400nt、または約500ntである。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122および154の配列をin silico構造予測スクリーニング(例えば、RNAフォールディング構造予測を使用して、可能性のある二量体形成ドメイン配列のライブラリーをスクリーニングする;二量体形成ドメインおよび対応する抗二量体形成ドメインの両方における対合していないヌクレオチドの割合が大きい配列を選択する)、低多様性ヌクレオチド設計(例えば、二量体形成ドメインを、それ自体と折りたたむことができない配列であるUのみ、Aのみ、Cのみ、Gのみ、R(GおよびA)のみ、またはY(UおよびC)のみのリピート配列などの一続きの低多様性配列を含むように設計する)、または経験的スクリーニング(例えば、二量体形成ドメインおよび対応する抗二量体形成ドメインのライブラリーを合成し、最大の組換え効率についてスクリーニングする)によって決定する。
一部の実施例では、第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154の配列を、それらの対応物との強力なキッシングループ相互作用を形成することができる相補的なRNAヘアピン構造(ステムループとも称される)を含有するように設計する。一部の実施例では、コード配列の3つまたはそれよりも多くの部分を結合するために、3個またはそれよりも多くの二量体形成ドメイン、例えば、4個またはそれよりも多くまたは5個またはそれよりも多くの二量体形成ドメイン、例えば、3個、4個、5個、6個、7個、8個、9個または10個の二量体形成ドメインを使用する場合にキッシングループを使用する(例えば、図6E)。キッシングループの各ヘアピンループ(またはステムループ)は、非相補配列の領域(例えば、ループを形成する)によって分離された少なくとも2つの相補配列(例えば、ステムを形成する)で構成される。一部の実施例では、二量体形成ドメインは、1個またはそれよりも多く(例えば、少なくとも2個、少なくとも3個、少なくとも4個、または少なくとも5個、例えば、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、もしくは20個)のループで構成され得る。複数のループを用いる一部の実施例では、ループの全部または一部を繰り返すことができる。複数のループを用いる一部の実施例では、全部または一部のループは異なり得る。一部の実施例では、各相補配列は約4~100ntであり、約3~20ntのループによって分離されている。2つの相補配列間の塩基対合により、例えば、少なくとも4bp、少なくとも5bp、少なくとも10bp、少なくとも20bp、少なくとも30bp、少なくとも40bp、少なくとも50bp、少なくとも75bp、少なくとも90bp、または少なくとも100bp、例えば、4~100bp、5~75bp、または10~50bpのヘリックス(またはステム)がもたらされる。一部の実施例では、ループ部分は、少なくとも3nt、少なくとも5nt、少なくとも10nt、少なくとも15nt、または少なくとも20nt、例えば、3~20nt、5~15ntもしくは5~10ntであり、ここで、ループは塩基対合していない。2つのヘアピンループ間の相補配列により、塩基対合、およびキッシングループ/キッシングステムループ相互作用の生成がもたらされる。一部の実施例では、2つのヘアピンループ間の相補配列は、1つのループの少なくとも3ヌクレオチドと第2のループの少なくとも3ヌクレオチドの間、例えば、第1のループの少なくとも4nt、少なくとも5nt、少なくとも6nt、少なくとも7nt、少なくとも8nt、少なくとも9nt、少なくとも10nt、少なくとも11nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも19nt、または少なくとも20nt(例えば、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntまたは20nt)と、第2のループの少なくとも4nt、少なくとも5nt、少なくとも6nt、少なくとも7nt、少なくとも8nt、少なくとも9nt、少なくとも10nt、少なくとも11nt、少なくとも12nt、少なくとも13nt、少なくとも14nt、少なくとも15nt、少なくとも16nt、少なくとも17nt、少なくとも19nt、または少なくとも20nt(例えば、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntまたは20nt)の間に存在する。一部の実施例では、2つのヘアピンループ間の相補配列は、総ループ配列の少なくとも15%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、または100%の間で存在する。
一部の場合では、キッシングループのステムを、2つのRNA分子間でトランスに塩基対合するように選択する。そのような実施例では、1つの分子上の1つのヘアピンループと第2の分子上の別のヘアピンループのキッシングループ相互作用の形成後、最初のヘアピンループのそれぞれのステム(またはヘリックス)領域が、鎖置換/侵入および2重鎖形成の伸長を通じて2つのRNA分子間でトランスに塩基対合し得る。一部の実施例では、最初のループ配列内で、2重鎖形成の伸長後にヌクレオチドの最大約85%が塩基対合していないまま残り得る(例えば、ヌクレオチドの約15%が2つのループ間で対合している)。一部の実施例では、キッシングループは、HIV-1 DISループに基づくものであり(配列番号139および140、図17A)、6ヌクレオチドの相補配列の5’側に2つのAヌクレオチド、続いて、3’側に1つのAヌクレオチドを含む(例えば、AANNNNNNA、式中、NはA、U、G、またはCのいずれであってもよい)。一部の実施例では、キッシングループは、HIV-2キッシングループ二量体形成ドメインに基づくものであり(配列番号141および142、図17B)、6ヌクレオチドの相補配列の5’側にGヌクレオチドおよびAヌクレオチド、続いて、3’側に3つのAヌクレオチドを含む(例えば、GANNNNNNAAA(配列番号153)、式中、Nは、A、U、G、またはCであり得る)。
1つの構成では、伸長した2重鎖における高いパーセンテージのマッチをもたらす最初のステムにミスマッチが含まれることにより、2重鎖形成の伸長が選好される。したがって、一部の実施例では、ヘアピンループのヘリックスまたはステム領域は、最初に対合していない塩基対を最大30%含有し得る(例えば、塩基対の30%以下、20%以下、15%以下、10%以下、5%以下、または1%以下、例えば、1~30%、5~30%、10~30%、または25~30%が最初に対合していない)。対合していないこれらの領域は、バルジ、ミスマッチ、または内部ループを形成し得る。
2つのヘアピンループの相互作用(キッシングループ相互作用)に加えて、他の形態のループ相互作用を第1の二量体形成ドメインおよび第2の二量体形成ドメイン122、154に対して利用することができる。一実施例では、ループはバルジであり、塩基対合したヘリックスの一方の鎖は、ステム構造からはみ出た1つまたは複数のヌクレオチドを含有する。例示的なバルジは、少なくとも1nt、少なくとも2nt、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10ntまたは少なくとも20nt、例えば、1~20nt、1~15nt、1~10nt、もしくは5~10nt、または1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntもしくは20ntである。一実施例では、ループは内部ループであり、例えば、ヘリックス内の1つまたはそれよりも多くのヌクレオチドがミスマッチであり、その結果、ミスマッチの位置で内部ループによって中断されたヘリックスが生じる。一部の実施例では、ヘリックスは、鎖のそれぞれにおいて少なくとも4nt(例えば、少なくとも5nt、少なくとも10nt、少なくとも20nt、少なくとも30nt、少なくとも40nt、少なくとも50nt、少なくとも75nt、少なくとも90nt、または少なくとも100nt、例えば、4~100nt、5~75nt、または10~50nt、例えば、4~100nt)であり、内部ループの両側において少なくとも1nt(例えば、鎖のそれぞれにおいて少なくとも2nt、少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10ntもしくは少なくとも20nt、例えば、1~20nt、1~15nt、1~10nt、もしくは5~10nt、または1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19ntもしくは20nt)である。一実施例では、ループは多分枝ループであり、3つのヘリックスまたはステムが、1つまたは複数の対合していないヌクレオチドにより3つのヘリックスが接続された三角形を形成する(from)。一部の実施例では、ヘリックスのそれぞれは少なくとも4bp(例えば、少なくとも5bp、少なくとも10bp、少なくとも20bp、少なくとも30bp、少なくとも40bp、少なくとも50bp、少なくとも75bp、少なくとも90bp、または少なくとも100bp、例えば、4~100bp、5~75bp、または10~50bp)であり、三角形を形成する対合していないヌクレオチドは少なくとも3nt(例えば、少なくとも4nt、少なくとも5nt、少なくとも10nt、少なくとも20、少なくとも15、少なくとも30、少なくとも40、少なくとも50、または少なくとも60nt、例えば、3~60nt、3~30nt、3~25nt、または5~20nt、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、2、25、30、35、40、45、50、55または60ヌクレオチド)である。キッシング相互作用はこれらの型のループの任意の2つの間(例えば、それぞれが1つまたは複数のヘリックスを含む2つまたはそれよりも多くの結合ドメインの間)で生じ得る。一部の実施例では、最初のループキッシング相互作用後に2重鎖形成の伸長を可能にするために、一方の二量体形成ドメイン(例えば、第1の二量体形成ドメイン122)内のヘリックスは他方の結合ドメイン(例えば、第2の二量体形成ドメイン154)内に直接対応物を有する。一部の実施例では、ループを生成するためのヘリックスを含有する二量体形成ドメインは、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)が相互作用すると単一のキッシングステムループを形成する。一部の実施例では、ヘリックスを含有する二量体形成ドメインは、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)が相互作用すると、キッシングループ相互作用のための複数のループを形成する。一部の実施例では、1つまたは複数の二量体形成ドメイン(例えば、図6Aの122)は、バルジ、一塩基バルジ、ミスマッチまたは内部ループ、またはG-Uゆらぎ対が含まれることによって不安定化するヘリックスを含有するが、他方の結合ドメイン(例えば、図6Aの154)とマッチして、最初のキッシング/対合後の2重鎖形成の伸長が選好される。一部の実施例では、1つまたは複数の二量体形成ドメイン(例えば、図6Aの122)は、不安定化されたヘリックスを含有し、これが安定化されると(例えば、テオフィリン切り換えキッシングループ)、第2の二量体形成ドメイン(例えば、図6Aの122)とループ-ループ相互作用(例えば、キッシング/対合)を通じて相互作用することができるループが露出する。
一部の実施例では、これらのステムループは、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも50nt、少なくとも75nt、または少なくとも100ntの長さ、例えば、10~50nt、20~25nt、10~100nt、10~20nt、または20~40ntの長さを含有する。各二量体形成ドメインは、個々のステムループを少なくとも1個、例えば、個々のステムループを少なくとも2個、少なくとも5個、少なくとも10個、少なくとも15個、または少なくとも20個、例えば、1~20個、2~5個または1~10個含有し得る。
一部の実施例では、コード配列の3~10個の部分を2~9個のキッシングループによって結合する、例えば、3個の部分を2個のキッシングループによって結合する、4個の部分を3個のキッシングループによって結合するなどであり、ここで、2~9個のキッシングループのそれぞれは異なるものである。一部の実施例では、キッシングループは、複数のステムループ、例えば、2~20個のステムループを含む。一部の実施例では、キッシングループ内の複数のステムループのそれぞれは同じものである。一部の実施例では、キッシングループ内の複数のステムループのそれぞれは異なるものである。一部の実施例では、二量体形成ドメインは、1~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ~2個のステムループ、1個のステムループ~3個のステムループ、1個のステムループ~4個のステムループ、1個のステムループ~5個のステムループ、1個のステムループ~6個のステムループ、1個のステムループ~7個のステムループ、1個のステムループ~8個のステムループ、1個のステムループ~9個のステムループ、1個のステムループ~10個のステムループ、1個のステムループ~15個のステムループ、1個のステムループ~20個のステムループ、2個のステムループ~3個のステムループ、2個のステムループ~4個のステムループ、2個のステムループ~5個のステムループ、2個のステムループ~6個のステムループ、2個のステムループ~7個のステムループ、2個のステムループ~8個のステムループ、2個のステムループ~9個のステムループ、2個のステムループ~10個のステムループ、2個のステムループ~15個のステムループ、2個のステムループ~20個のステムループ、3個のステムループ~4個のステムループ、3個のステムループ~5個のステムループ、3個のステムループ~6個のステムループ、3個のステムループ~7個のステムループ、3個のステムループ~8個のステムループ、3個のステムループ~9個のステムループ、3個のステムループ~10個のステムループ、3個のステムループ~15個のステムループ、3個のステムループ~20個のステムループ、4個のステムループ~5個のステムループ、4個のステムループ~6個のステムループ、4個のステムループ~7個のステムループ、4個のステムループ~8個のステムループ、4個のステムループ~9個のステムループ、4個のステムループ~10個のステムループ、4個のステムループ~15個のステムループ、4個のステムループ~20個のステムループ、5個のステムループ~6個のステムループ、5個のステムループ~7個のステムループ、5個のステムループ~8個のステムループ、5個のステムループ~9個のステムループ、5個のステムループ~10個のステムループ、5個のステムループ~15個のステムループ、5個のステムループ~20個のステムループ、6個のステムループ~7個のステムループ、6個のステムループ~8個のステムループ、6個のステムループ~9個のステムループ、6個のステムループ~10個のステムループ、6個のステムループ~15個のステムループ、6個のステムループ~20個のステムループ、7個のステムループ~8個のステムループ、7個のステムループ~9個のステムループ、7個のステムループ~10個のステムループ、7個のステムループ~15個のステムループ、7個のステムループ~20個のステムループ、8個のステムループ~9個のステムループ、8個のステムループ~10個のステムループ、8個のステムループ~15個のステムループ、8個のステムループ~20個のステムループ、9個のステムループ~10個のステムループ、9個のステムループ~15個のステムループ、9個のステムループ~20個のステムループ、10個のステムループ~15個のステムループ、10個のステムループ~20個のステムループ、または15個のステムループ~20個のステムループを含む。一部の実施例では、二量体形成ドメインは、1個のステムループ、2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、15個のステムループ、または20個のステムループを含む。一部の実施例では、二量体形成ドメインは、少なくとも1個のステムループ、2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、または15個のステムループを含む。一部の実施例では、二量体形成ドメインは、多くても2個のステムループ、3個のステムループ、4個のステムループ、5個のステムループ、6個のステムループ、7個のステムループ、8個のステムループ、9個のステムループ、10個のステムループ、15個のステムループ、または20個のステムループを含む。
2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)が、コード配列の組換えを生じさせるために十分に、互いに結合するまたは相互作用することを可能にする他の機構を使用することができる。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)は、互いに、例えば、非塩基対合相互作用を通じて相互作用することができるか、または、共通の分子(例えば、タンパク質、ATP、金属イオン、補因子、または合成リガンド)に結合することができる、核酸アプタマー(例えば、RNAアプタマー)である。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)は、互いにはハイブリダイズしないが、両方とも(または全て)同じ架橋核酸分子とハイブリダイズする。一部の実施例では、そのような架橋核酸分子を細胞、組織、または生物体に外因的に提供することができる。一部の実施例では、そのような架橋核酸分子は細胞内部のDNAまたはRNA配列、例えば、転写物またはゲノム遺伝子座であり得る。一部の実施例では、2つまたはそれよりも多くの二量体形成ドメイン(例えば、図6Aの122、154)は互いに、例えば非塩基対合相互作用を通じて相互作用することができる配列である。
分子150は、3’に位置する分子であり、スプライスアクセプター(SA)162および第2の二量体形成ドメイン154を含む。分子150がDNAである実施形態では、分子150は、第2のプロモーター152、続いて、イントロン配列170を含む。プロモーター152をイントロン配列170に作動可能に連結することができる。構成的プロモーターまたは誘導性プロモーターの任意のプロモーター152を使用することができる。一部の実施例では、プロモーター152は、筋組織(例えば、骨格筋組織もしくは心筋組織)、眼の組織(例えば、網膜組織)、内耳組織、肝組織、膵組織、肺組織、皮膚組織、骨、または腎組織において構成的に活性なものなどの組織特異的プロモーターである。一部の実施例では、プロモーター112は、がん細胞、または正常な細胞において構成的に活性なものなどの細胞特異的プロモーターである。一部の実施例では、プロモーター112は、発現させる標的タンパク質の内因性プロモーターであり、一部の実施例では、長い(例えば、少なくとも2500nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、または少なくとも7500nt)。一部の実施例では、プロモーター112は、少なくとも約50ヌクレオチド(nt)の長さ、例えば、少なくとも100nt、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、少なくとも8000nt、少なくとも9000nt、または少なくとも10,000nt、例えば、50~10,000nt、100~5000nt、500~5000nt、または50~1000ntの長さである。一部の実施例では、プロモーター112とプロモーター152は同じプロモーターである。他の例では、プロモーター112とプロモーター152は異なるプロモーターである。一部の実施例では、分子150はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。図6Fに示されている通り、分子150がRNAである、例えば、DNAからRNAへの発現後の実施形態では、分子150はもはやプロモーター152を含まず、164は、標的タンパク質のC末端部分のコード配列によってコードされるRNAである。一部の実施例では、分子150はRNAであり、プロモーター152を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子150(プロモーター152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
イントロン配列170は、第2の二量体形成ドメイン154、必要に応じたISE156、分岐点158、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162を含む。一部の実施例では、イントロン配列130は、およそ少なくとも10nt、例えば、少なくとも20nt、少なくとも30nt、少なくとも50nt、少なくとも100nt、少なくとも250nt、少なくとも250nt、少なくとも300nt、少なくとも400nt、または少なくとも500ntの長さ、例えば、20~500、20~250、20~100、50~100、30~500、または50~200ntの長さである。
第2の二量体形成ドメイン154は、分子110の第1の二量体形成ドメイン122配列の逆相補物である配列を有する。したがって、上記の第1の二量体形成ドメイン122と同じ設計の特色および考慮事項が第2の二量体形成ドメイン154にも当てはまる。例えば、一部の実施例では、第2の二量体形成ドメイン154は、第1の二量体形成ドメイン122とキッシングループ相互作用を形成することができるステムループを含有する。一部の実施例では、第2の二量体形成ドメイン154は、RNA組換えと競合する可能性がある潜在スプライスアクセプター(例えば、NNNAGGUNNN;配列番号143)を含まない。一部の実施例では、第2の二量体形成ドメイン154は低多様性配列を有する。一部の実施例では、第2の二量体形成ドメイン154は、1000nt以下、例えば、750nt以下、または500ntを超える、例えば、30~1000nt、30~750nt、30~500nt、50~500nt、50~100nt、または100~250ntである。一部の実施例では、第2の二量体形成ドメイン154は、50ntよりも大きい、例えば、少なくとも51nt、少なくとも100nt、少なくとも150nt、少なくとも161nt、または少なくとも170nt、例えば、51~159nt、51~150nt、51~120nt、51~100nt、または51~70ntである。一部の実施例では、第2の二量体形成ドメイン154は、160ntよりも大きい、例えば、少なくとも161nt、少なくとも170nt、少なくとも180nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、少なくとも600nt、少なくとも700nt、少なくとも800nt、少なくとも900nt、または少なくとも1000nt、例えば、161~100nt、161~500nt、161~300nt、161~200nt、または161~170ntである。一部の実施例では、第2の二量体形成ドメイン154は、50nt未満、例えば、6~49nt、6~45nt、6~40nt、6~30nt、6~20nt、または6~10ntである。
第2の二量体形成ドメイン154に対して3’側は、必要に応じたISE156、分岐点配列158(例えば、分岐点コンセンサス配列)、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162である。ISE156は、分子110のISE120およびDISE118と同様に、スプライソソームを刺激して組換え反応を触媒する。一部の実施例では、イントロン配列150は、少なくとも2つのISE156、例えば、少なくとも3つ、少なくとも4つ、または少なくとも5つのISE156を含む。例示的なスプライシングエンハンサー配列はISE156を含む。一部の実施例では、1つまたは複数のスプライシングエンハンサー配列156をイントロン配列150に含めることにより、組換えまたはスプライシングの効率が少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、または少なくとも50%上昇する。使用することができる例示的なスプライシングエンハンサー配列は、配列番号26~136、151、および152、ならびにGGGTTT、GGTGGT、TTTGGG、GAGGGG、GGTATT、GTAACG、GGGGGTAGG、GGAGGGTTT、GGGTGGTGT TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、TCTTT、TGCATG、CTAAC、CTGCT、TAACC、AGCTT、TTCATTA、GTTAG、TTTTGC、ACTAAT、ATGTTT、CTCTG、GGG、GGG(N)2-4GGG、TGGG、YCAY、UGCAUG、または3x(G3~6N1~7)に提示される。一部の実施例では、ISE156は、存在する場合、およそ少なくとも3nt、少なくとも4nt、少なくとも5nt、少なくとも10nt、例えば、少なくとも20nt、少なくとも25nt、少なくとも30nt、少なくとも40nt、または少なくとも50ntの長さ、例えば、3~10nt、3~11nt、4~11nt、5~11nt、10~50nt、20~25nt、10~25nt、10~20nt、または20~40ntの長さであり得る。一実施例では、ISE156の配列は、GGCUGAGGGAAGGACUGUCCUGGG(配列番号135)、GGGUUAUGGGACC(配列番号136)、TTCAT、CCATTT、TTTTAAA、TGCAT、TGCATG、TGTGTT、CTAAC、TCTCT、TCTGT、またはTCTTTであるかまたはそれを含む。一部の実施例では、ISE120とISE156は同じ配列である。他の例では、ISE120とISE156は異なる配列である。
第2の二量体形成ドメイン154(および存在する場合にはISE156)に対して3’側は、分岐点配列158(例えば、分岐点コンセンサス配列)、ポリピリミジントラクト160、続いて、スプライスアクセプター配列162(例えば、スプライスアクセプターコンセンサス配列)である。分岐点158の配列は、標的細胞または生物体の種のコンセンサス配列に基づく。例えば、ヒトスプライシングに関しては、コンセンサス配列は、YUNAYを含み得るかまたはYUNAYであり得る。したがって、使用される配列はU2依存性イントロンに関してはCUAAC、またはU12依存性イントロンに関してはUUUUCCUUAACU(配列番号144)であり得る。
ポリピリミジントラクト160は、C、U、またはCおよびUヌクレオチドの両方、例えば、CnUyを含み(ここで、n+yは10ヌクレオチドよりも大きいかまたはそれと等しい)、また、3’スプライスジャンクションに対してヌクレオチド-3~-22を含み得る。一部の実施例では、ポリピリミジントラクト160は、少なくとも80%のYヌクレオチド(すなわち、U、C、またはUおよびCの両方)を含む。一部の実施例では、ポリピリミジントラクト160はポリCまたはポリU配列である。一部の実施例では、ポリピリミジントラクト160は少なくとも15個のU、例えば、15~30個または15~20個のUであるポリU配列である。分岐点158およびポリピリミジントラクト160は必須のスプライシング成分である。SA162の配列は、標的細胞または生物体の種のコンセンサス配列に基づくものであり得る。例えば、ヒトでは、SA配列は、U2依存性イントロンに関しては3’スプライス部位に対して-1位および-2位のAGであり、U12依存性イントロンに関してはACまたはAGであり得る。したがって、一部の実施例では、SA162は2ntの長さ、例えば、AGまたはACであり得る。
SA162のすぐ後ろは、5’末端にスプライスジャンクションを有する標的タンパク質164のC末端部分をコードするDNA配列を含むエクソン配列である。標的タンパク質164のC末端部分をコードするDNA配列の5’末端のスプライスジャンクションは分子110、150が導入される標的細胞または生物体において見いだされるコンセンサス配列とマッチし得る。一部の実施例では、スプライスジャンクションは、U2依存性イントロンに関しては3’スプライス部位に対して+1位および+2位のGAもしくはGU、またはU12依存性イントロンに関してはGUもしくはAUであり得る。したがって、一部の実施例では、スプライスジャンクションは2ntの長さであり、C末端コード部分164の5’末端はGA、GU、またはAUである。
分子150のイントロン部分170の後のエクソン配列は、標的タンパク質の第2のコード部分(例えば、半分)、例えば、C末端断片164、および必要に応じたポリアデニル化配列166を含む。したがって、分子150は、標的タンパク質のC末端部分をコードする配列164を含む。分子150の3’末端は、必要に応じて、スプライソソームのアセンブリを促進するポリアデニル化配列166を含む。一部の実施例では、ポリアデニル化配列166は、少なくとも15個のA、例えば、15~30個または15~20個のAのポリA配列である。一部の実施例では、ポリアデニル化配列166とポリアデニル化配列124は同じ配列である。他の例では、ポリアデニル化配列166とポリアデニル化配列124は異なる配列である。
一部の実施例では、N末端コード領域114および/またはC末端コード領域164はネイティブなコード配列である。例えば、コード配列は、本明細書に開示される系が導入される細胞または生物体において見いだされるもの(例えば、ヒト細胞または対象への導入の場合、ヒトコード配列)である。一部の実施例では、例えば、tRNA利用可能性を最大にするため、または潜在スプライス部位を脱富化させるため(例えば、正しくないスプライシングを減少させるかまたは回避し、正しい結合部形成を促進するため)に、N末端コード領域114および/またはC末端コード領域164をネイティブなコード配列と比べてコドン最適化する。一部の実施例では、N末端コード領域114および/またはC末端コード領域164の一部をネイティブなコード配列と比べてコドン最適化する、例えば、各結合部(例えば、114の3’末端、および164の5’末端)に隣接する約200ntをコドン最適化するかまたはエクソンスプライスエンハンサー部位(ESE)(SRタンパク質に結合する)を含有するように変更することができる。例えば、コード配列は、本明細書に開示される系が導入される細胞または生物体において見いだされないものであり得る(例えば、マウス細胞または対象への導入の場合、ヒトコード配列)。
一部の実施例では、N末端コード領域114および/またはC末端コード領域164は、天然のまたは合成のいずれかの性質であるイントロンを含み、スプライスドナー部位とアクセプター部位の両方を含有する。例えば、発現させるコード配列の内部に包埋されたイントロンを配列116の上流(例えば、約200nt上流)、N末端コード領域114の内部に含めることもでき、発現させるコード配列の内部に包埋されたイントロンを配列162の下流(例えば、約200nt下流)およびC末端コード領域164の内部を含めることもでき、あるいはその両方である。そのようなイントロンを含めることを使用して、トランス-スプライシングイントロンドナーおよびアクセプターへのスプライシング機構の付着を刺激することができる。一部の実施例では、そのような(刺激性)イントロンは、110および150を発現させる宿主に由来するものであり得る。一部の実施例では、そのような(刺激性)イントロンは、他の生物体に由来するもの、またはウイルス起源、または合成起源のものであり得る。
一部の実施例では、分子150を安定化するための配列を含めること(例えば、図6Aの150の3’非翻訳領域内の164と166の間に配置する)により、組み換えられた産物の発現効率を少なくとも25%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、または少なくとも75%、例えば、25~95%、25~75%、25~60%、25~50%、40~95%、40~60%、または50~60%上昇させることができる。一部の実施例では、組み換えられた産物の発現効率を増強するための安定化エレメントとしてウッドチャック転写後調節エレメント(WPRE)またはその短縮型(例えば、WPRE3)を3’-UTR内に含める。一部の実施例では、WPRE配列は、GenBank受託番号J04514のnt1093~1684またはWPRE3の247bpの配列に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または100%の配列同一性を有する。
図6Cに示されている通り、分子110の第1の二量体形成ドメイン122と分子150の第2の二量体形成ドメイン154の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114およびC末端コード配列164の組換えが可能になる。具体的には、N末端タンパク質コード配列114の3’末端がC末端タンパク質配列164の5’末端と2つの部分の間のシームレス結合部として融合する。
図6Dは、標的タンパク質が3つの部分、N末端部分、中間部分、およびC末端部分(各部分は同様のサイズであっても異なるサイズであってもよい)に分けられる系の概略図を示す。したがって、タンパク質を任意の数の所望のセグメントまたは部分に分けることができ、分子の妥当な数を本明細書に提示される情報を使用して設計することができることが当業者には理解されよう。そのような実施例では、系は、少なくとも3つの合成核酸分子110、200、および150を含み、ここで、分子110はタンパク質のN末端部分をコードする分子114を含み、分子200はタンパク質の中間部分をコードする分子216を含み、分子150はタンパク質のC末端部分をコードする分子164を含む。各核酸分子110、200、150はDNAで構成され得、翻訳後は、プロモーター112、202、152が存在しないRNAであり得る。一部の実施例では、110、200、150(プロモーター112、202、152を有するまたは有さない)はそれぞれ、少なくとも約100ヌクレオチド/リボヌクレオチド(nt)の長さ、例えば、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntである。分子110、150、200(プロモーター112、202、152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。2つ(またはそれよりも多く)の直交性の二量体形成ドメインを使用することに加えて、2つのイントロンのうちの一方はU2型イントロンであり得、第2のイントロンはU12型イントロンであり得る。U2依存性イントロンおよびU12依存性イントロンのスプライスドナーおよびアクセプターは、この2つの型のイントロン間でコンセンサス認識配列が異なるので、最小の交差反応性を示す。どちらの戦略(すなわち、直交性の二量体形成ドメイン、およびU2型イントロン対U12型イントロン)によっても、3つの断片の正しい順序での組換えが促進される(例えば、第1の断片が最後の断片と直接結合することが回避され、および中間断片がそれ自体で環状化することが回避される)。
図6Dの分子110は、図1Aに関して上に開示されていると同じ特色、すなわち、RNA分子をコードする配列に作動可能に連結したプロモーター112を含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列114、SD116、必要に応じたDISE118、必要に応じたISE120、二量体形成ドメイン122、および必要に応じたポリアデニル化配列124を含むが、第1の二量体形成ドメイン122は分子200の第3の二量体形成ドメイン204に対する逆相補性を有する。図6Fに示されている通り、分子110がRNAである、例えば、DNAのRNAへの発現後の実施形態では、分子110は、プロモーター112を含まず、114は、標的タンパク質のN末端部分のコード配列によってコードされるRNAである。分子110(プロモーター112を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図6Dの分子150は、図1Aに関して上に開示されているものと同じ特色、すなわち、RNA分子をコードする配列と作動可能に連結したプロモーター152を含み、RNA分子は、5’から3’に:第2の二量体形成ドメイン154、必要に応じたISE156、分岐点配列158、ポリピリミジントラクト160、スプライスアクセプター(SA)162;および標的タンパク質コード配列の5’末端にスプライスジャンクションを含む、標的タンパク質のC末端部分のコード配列164、および必要に応じてポリアデニル化配列166を含む。第2の二量体形成ドメイン154は分子200の第4の二量体形成ドメイン226に対する逆相補性を有する。分子150(プロモーター152を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
分子200によりそれぞれ分子110および分子150の二量体形成ドメイン122、154に対して逆相補性を有する二量体形成ドメインが提供されることによってN末端コード領域114とC末端コード領域164の結合が可能になる。分子200は、2つのイントロン配列230、240を含め、分子110および分子150の両方の特色を含む。具体的には、分子200がDNAである実施形態では、分子220は、RNA分子をコードする配列に作動可能に連結したプロモーター210(プロモーター112および/または152と同じものであっても異なるものであってもよい)を含み、RNA分子は、5’から3’に:第3の二量体形成ドメイン204(図6Dの分子110の第1の二量体形成ドメイン122に対して逆相補物である)、必要に応じたISE206、分岐点208、ポリピリミジントラクト210、SA212、標的タンパク質の中間部分のコード配列216であって、標的タンパク質コード配列の5’末端にスプライスジャンクションを含み、標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質の中間部分のコード配列216、SD220、必要に応じたDISE222、必要に応じたISE224、第4の二量体形成ドメイン226(図6Dの分子150の第4の二量体形成ドメイン154に対して逆相補物である)、および必要に応じたポリアデニル化配列228を含む。一部の実施例では、分子220はDNAであり、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子200がRNAである、例えば、DNAのRNAへの発現後の実施形態では、分子200はもはやプロモーター202を含まず、216は標的タンパク質の中間部分のコード配列によってコードされるRNAである。一部の実施例では、分子200はRNAであり、プロモーター202を含まず、少なくとも200nt、少なくとも300nt、少なくとも500nt、少なくとも1000nt、少なくとも2000nt、少なくとも3000nt、少なくとも4000nt、少なくとも5000nt、少なくとも6000nt、少なくとも7000nt、または少なくとも8000nt、例えば、200~10,000nt、200~8000nt、500~5000nt、または200~1000ntの長さである。分子200(プロモーター202を有するまたは有さない)は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図6Eに示されている通り、分子110の第1の二量体形成ドメイン122と分子200の第3の二量体形成ドメイン204の相互作用およびハイブリダイゼーション(塩基対合)、および分子200の第4の二量体形成ドメイン226と分子150の第2の二量体形成ドメイン154の相互作用およびハイブリダイゼーション(塩基対合)により、スプライソソーム成分によるN末端コード配列114、中間コード配列216、およびC末端コード配列164の組換えが可能になる。具体的には、3つの部分間のシームレス結合部として、N末端タンパク質コード配列114の3’末端が中間タンパク質配列216の5’末端と融合し、中間タンパク質配列216の3’末端がC末端タンパク質配列164の5’末端と融合する。
代替二量体形成ドメインが図7A~7Bおよび9Aに示されている。すなわち、互いにハイブリダイズする二量体形成ドメイン(例えば、112~204、226~154、図6D、6E)の使用に対する代替として、一実施例では、アプタマー配列を使用する。図7Aに示されている通り、合成核酸分子500、600の両方において、アプタマー配列512、602を二量体形成ドメインの代わりに使用し、アプタマーがそれらと標的(例えば、アデノシン、ドーパミン、またはカフェイン)との相互作用を介して一体となる。そのような実施例では、各分子500、600のアプタマー配列512、602が同じ配列であり得る、またはさらには異なる配列であり得る。図7Aの分子500は、図6Aの分子110に関して上に開示されているものと同じ特色を含み、DNAである場合には、RNA分子をコードする配列に作動可能に連結したプロモーターを含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列502、SD506、必要に応じたDISE508、必要に応じたISE510、第1の二量体形成ドメインの代わりに第1のアプタマー512、および必要に応じたポリアデニル化配列を含む。分子500がRNAである実施形態では、例えば、DNA分子から転写された場合、分子500はプロモーターを含まない(例えば図7Aに示されている通り)。同様に、図7Aの分子600は、図6Aの分子150に関して上に開示されているものと同じ特色を含み、DNAである場合には、RNA分子をコードする配列に作動可能に連結したプロモーターを含み、RNA分子は、5’から3’に:第2の二量体形成ドメイン154の代わりにアプタマー602(r aptamer 602)、必要に応じたISE604、分岐点606、ポリピリミジントラクト608、SA610、5’末端にスプライスジャンクションを有する、標的タンパク質のC末端部分614をコードするDNA、および必要に応じたポリアデニル化配列616を含む。分子600がRNAである実施形態では、例えば、DNA分子から転写された場合、分子500はプロモーターを含まない(例えば図7Aに示されている通り)。2つのアプタマー512、602の互いとのまたは分子700との相互作用により、スプライソソーム成分によるN末端コード配列502とC末端コード配列614の組換えが可能になる。具体的には、N末端タンパク質コード配列502の3’末端がC末端タンパク質配列614の5’末端と2つの部分の間のシームレス結合部として融合する。分子500および600は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
一部の実施例では、アプタマー配列512、602は、同じ標的700に認識する(例えば、特異的に結合する)(図7A)、またはさらには異なる標的を認識し得る(その場合、カフェイン/ドーパミンハイブリッド分子などの、各アプタマーによって特異的に認識される各分子、またはアプタマーによって認識される分子の一部を含む合成分子も本明細書に提示される系と共に投与する)。アプタマーによって認識される例示的な標的としては、細胞タンパク質、小分子、外因性タンパク質、またはRNA分子が挙げられる。
図7Bは、図7Aと同様の例を示す。二量体形成ドメイン(図7Aの512、602)はRNA分子を認識する。図7Bに示されている例では、各ドメインは、標的細胞(標的タンパク質の発現が望まれる細胞)においてのみ発現されるmRNA分子の異なる部分、例えば、がん特異的転写物を認識する。そのような実施例では、RNAで構成されるコード配列(図7Aの502、614)は、二量体形成ドメインによって認識される特定のRNA分子の存在下でのみ組み換えられる。ここで、標的タンパク質はがん細胞においてのみ発現され、正常な細胞では発現されない。そのような系により、がん細胞における標的タンパク質(例えば、がんの治療用タンパク質、例えば、毒素またはチミジンキナーゼなどの細胞傷害性酵素とガンシクロビル;したがって、一部の実施例では、標的タンパク質は毒素またはチミジンキナーゼである)の発現を制御し、正常な非がん細胞における標的タンパク質発現の望ましくない副作用を低減することが可能になる。
図7Cは、例示的な「オフスイッチ」例を提示する。ここで、結合/ハイブリダイゼーションについて競合する抗結合ドメインオリゴヌクレオチド(例えば、RNAまたはDNA)1000(1つが812の逆相補物であり、1つが912の逆相補物である2つの異なる抗結合ドメインオリゴヌクレオチド1000であり得る)を提供することにより、合成核酸分子800、900の二量体形成ドメイン812、902(互いに逆相補物である)のハイブリダイゼーション/結合を低減することができる。したがって、抗結合ドメインオリゴヌクレオチド1000は、それぞれN末端およびC末端コード部分802および914によってコードされるタンパク質の再構成に対する「オフスイッチ」として作用し得る。図7Cの分子800は、RNA分子(したがって、プロモーターを欠く)である図6Aの分子110に関して上に開示されているものと同じ特色を含み、RNA分子は、5’から3’に:標的タンパク質コード配列の3’末端にスプライスジャンクションを含む、標的タンパク質のN末端部分のコード配列802、SD806、必要に応じたDISE808、必要に応じたISE810、二量体形成ドメイン812、および必要に応じたポリアデニル化配列814を含む。同様に、図7Cの分子900は、RNA分子(したがって、プロモーターを欠く)である図6Aの分子150に関して上に開示されているものと同じ特色を含み、RNA分子は、5’から3’に:抗二量体形成ドメイン902、必要に応じたISE904、分岐点906、ポリピリミジントラクト908、SA910、標的タンパク質のC末端部分をコードするRNA914、および必要に応じたポリアデニル化配列916を含む。2つの二量体形成ドメイン812、902は、抗結合ドメインオリゴヌクレオチド1000の存在下では互いに相互作用/ハイブリダイズすることができず、したがって、N末端コード配列802とC末端コード配列914の組換えが妨げられるかまたは低減する。そのような適用を使用して、系によってコードされるタンパク質の発現を低減するかまたは排除することができる。分子800および900は、天然および/または非天然ヌクレオチドまたはリボヌクレオチドを含み得る。
図9Aは、二量体形成のために逆相補配列ハイブリダイゼーションの代わりにキッシングループ相互作用を使用する例示的な二量体形成ドメインを提示する。キッシングループ相互作用は、2つのRNAヘアピンのループ内の塩基が2つのRNA分子間に相互作用する対を形成した場合に形成される。n-yfpと標識された左側の分子は、スプライスドナー部位、下流イントロンスプライシングエンハンサーエレメント、および2つのイントロンスプライシングエンハンサーエレメントを含有する合成イントロンと連結した、yfpのN末端断片をコードするRNA分子を表す。この分子の二量体形成ドメインは3つのRNAヘアピンループを含み、それらはそれぞれがステム(RNAがそれ自体とハイブリダイズする)およびループ(RNAがそれ自体とハイブリダイズしない)で構成される。この例では、二量体形成ドメインは、3つのステムおよびループエレメント(ヘアピンループとも称される)を含有し、三峰性キッシングループ二量体形成ドメインと称される。c-yfpと標識された右側の分子は、yfpのC末端の部分をコードするRNA分子を表す。この分子は、5’から3’まで、3つのヘアピンループのセットを含有する三峰性キッシングループ二量体形成ドメインで構成される。ループ部分は、相補的なn-yfp分子上の対応するループとキッシングループ相互作用を形成し得る。三峰性キッシングループ二量体形成ドメインの後には、3つのイントロンスプライシングエンハンサー配列、分岐点配列、ポリピリミジントラクト、およびスプライスアクセプター部位を含有する合成イントロン配列が続く。合成イントロン配列の後にC末端yfpコード配列が続き、その後、ポリアデニル化シグナルを含有する3’非翻訳領域が続く。図の上部にキッシングループ相互作用の代表的な三次元レンダリングが示されている。このレンダリングは、ねじれた形態のヘアピンループがどのようにループ残基を外側に露出させ、キッシングループ相互作用に利用可能にするかを例示する。
2つの分子が結び付くと、スプライソソームによりトランス-スプライシング反応が媒介され、その結果、N末端ypfコード配列とC末端ypfコード配列が結合され、次いで、それにより全長蛍光タンパク質の発現が可能になる。
図6A~7Cおよび9Aには系に2つの合成核酸分子を使用する(すなわち、標的タンパク質コード配列を2つの合成核酸分子に分割する)実施形態が示されているが、そのような実施形態を、本明細書における教示を使用して2つよりも多くの合成核酸分子、例えば、3個、4個、5個、6個、7個、8個、9個、または10個の合成核酸分子を用いて同様に使用することができることが当業者には理解されよう。
一部の実施例では、系は、アセンブルされていない/組み換えられていない断片の発現を抑制する核酸分子を含む。そのような実施例では、全長コード配列の2つまたはそれよりも多くの部分(例えば、それぞれ図6Aの110の114、150の164)が組み換えられていない場合、核酸分子により、組み換えられなかった全長コード配列の各部分の全長タンパク質の発現が抑制される。例えば、そのような抑制性核酸分子は、RNAが核の外に出たらRNAを不安定化すること、翻訳を妨げること、シフトした開始コドンからの翻訳を刺激すること、マイクロRNA標的部位を含有すること、または、翻訳されるとタンパク質活性を抑制するかもしくはタンパク質に分解のためのフラグを立てるタンパク質デグロンもしくは不安定化ドメインを含有することができる。
一実施例では、組み換えられていないRNA分子の不安定化は、自己切断性RNA配列(例えば、ハンマーヘッド型リボザイムまたはHDVリボザイム)を合成イントロンへと、例えば、図6Aまたは6Fのイントロン配列130内の任意の位置に含めることによって実現される。一実施例では、RNA分子の切断により、RNAを安定化するポリA尾部の喪失がもたらされ、それにより、組み換えられていないタンパク質の図6Aまたは6Fのオープンリーディングフレーム114からの発現が抑制され得る。一実施例では、図6Aまたは6Fのコード配列164の一部または全部を含むオープンリーディングフレームの発現の低減をもたらし得る5’末端CAPを切断するために、自己切断性RNA配列を図6Aまたは6Fのイントロン配列170内の任意の位置に含める。一実施例では、自己切断性RNA配列をCsy4標的部位などのRNA切断酵素標的部位で置換する。
一部の実施例では、抑制性核酸分子は、図6Aまたは6Fのオープンリーディングフレーム配列164に対して-1、-2、+1、または+2ヌクレオチドシフトしたオープンリーディングフレームの翻訳を方向付ける開始コドン(ATG)またはコザック増強開始コドン(GCCGCCACCATG(配列番号154)もしくはGCCACCATGもしくはACCATG)を図6Aまたは6Fのイントロン配列170内の任意の位置に含む。一実施例では、このデコイ開始コドン戦略を使用して、抑制されるべき図6Aまたは6Fの配列164のオープンリーディングフレームから離れるように翻訳を方向付けることにより、アセンブルされていない断片の発現を低減または抑制する。
一部の実施例では、抑制性核酸分子は、1つまたは複数のマイクロRNA標的部位を図6Aまたは6Fのイントロン配列130内の任意の位置、および/または図6Aまたは6Fのイントロン配列170内の任意の位置に含む。特定の分子(例えば、図6Aまたは6Fの110または150)が核から送り出されると、マイクロRNA/低分子ヘアピン型RNA依存性分解を受け、それにより、核から送り出された結合していないRNAを分解/抑制することにより、意図されたものではない結合していない断片の発現が抑制され得る。一実施例では、そのようなマイクロRNA標的配列は、図6Aまたは6Fの分子110および150が導入される細胞、または組織、または動物において発現されることが分かっているマイクロRNAと相補的なものであり得る。一実施例では、このマイクロRNA標的配列は、細胞、または組織、または動物に導入される配列と相補的である。一実施例では、そのようなマイクロRNAを、RNAポリメラーゼIII依存性プロモーターから低分子ヘアピン型RNAの形式で発現させることができる。一実施例では、そのようなマイクロRNAをRNAポリメラーゼII依存性プロモーターから発現させ、マイクロRNAプロセシングループに包埋させる(例えば、mir30足場)ことができる。
一部の実施例では、オープンリーディングフレーム(例えば、図6の114)からの組み換えられていないタンパク質産物の不安定化を、図6Aまたは6Fのイントロン配列130における終止コドンの出現を枯渇させ、図6Aまたは6Fのイントロン配列130内の任意の位置に配置され、図6Aまたは6Fの配列114から外側に伸びたオープンリーディングフレームとインフレームである、タンパク質に分解のためのフラグを立てることができるインフレームのタンパク質シグナルをコードするRNA配列(例えば、デグロン配列)を追加的に含めることによって実現することができる。一実施例では、デグロン配列は、PEST配列のもの、またはCL1デグロン配列のものであり得る。使用するデグロン配列はプロテアソーム依存性、プロテアソーム非依存性、ユビキチン依存性、またはユビキチン非依存性経路を使用し得る。一実施例では、組み換えられていないタンパク質の不安定化を、同じまたは異なるデグロン配列のいくつかを含めることによって増強する。
一部の実施例では、図6Aのオープンリーディングフレーム配列164からの組み換えられていないタンパク質産物の不安定化は、図6の配列164内のオープンリーディングフレームとインフレームの開始コドン(ATG)、その後にデグロン配列を図6Aのイントロン配列170の任意の位置に導入することによって実現される。この例では、デグロン配列はN末端で組み換えられていないタンパク質断片と結合し、組み換えられていないタンパク質断片は分解のフラグを立てられることによって抑制される。
IV.組成物およびキット
本明細書に提示される2つまたはそれよりも多くの合成核酸分子を含む組成物およびキットが提供され、ここで、合成核酸分子は、組み換えられると全長タンパク質をコードする。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子はDNAである。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子はRNAであり、プロモーター配列を含まない。一実施例では、組成物またはキットは、本明細書に提示される2つの合成核酸分子を含み、ここで、2つの合成核酸分子はそれぞれ表1に列挙されているもの(または毒素またはチミジンキナーゼなどの治療用タンパク質)などの標的タンパク質の異なる部分をコードする(すなわち、N末端およびC末端。ここで、2つの分子間の組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される3つの合成核酸分子を含み、ここで、3つの合成核酸分子はそれぞれ表1に列挙されているもの(または毒素またはチミジンキナーゼなどの治療用タンパク質)などの標的タンパク質の異なる部分をコードする(すなわち、N末端、中間、およびC末端。ここで、3つの分子間の組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される4つまたはそれよりも多くの合成核酸分子を含み、ここで、4つまたはそれよりも多くの合成核酸分子は、それぞれ表1に列挙されているもの(または毒素またはチミジンキナーゼなどの治療用タンパク質)などの標的タンパク質の異なる部分をコードする(すなわち、N末端、第1の中間、第2の中間(および必要に応じて追加的な中間)、ならびにC末端。ここで、4つまたはそれよりも多くの合成核酸分子間の組換えが起こるとコード配列全体が生成される)。一実施例では、組成物またはキットは、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の2つまたはそれよりも多くのセットを含み、ここで、合成核酸分子の各セットは、例えば、表1に列挙されているもの(および/または毒素またはチミジンキナーゼなどの治療用タンパク質)のうちの2つまたはそれよりも多くなどの、異なる標的タンパク質をコードする。
一実施例では、組成物またはキット中の各合成核酸分子は、AAVまたは他の遺伝子療法用ベクターなどのベクターの一部である。一実施例では、組成物またはキットは、2つまたはそれよりも多くの開示される合成核酸分子を含む細胞、例えば細菌細胞または真核細胞を含み、ここで、合成核酸分子は組み換えられると全長標的タンパク質をコードする。
そのような組成物は、薬学的に許容される担体(例えば、食塩水、水、グリセロール、DMSO、またはPBS)を含み得る。一部の実施例では、組成物は、液体、凍結乾燥粉末、または凍結保存されたものである。
一部の実施例では、キットは、例えば、細胞型特異的取り込みを方向付けるため/エンドソームからの脱出を増強するため/血液脳関門の横断を可能にするなどのために送達系(例えば、リポソーム、粒子、エキソソーム、または微小胞)を含む。一部の実施例では、キットは、細菌細胞、植物細胞、昆虫細胞、または哺乳動物細胞を成長させるための妥当な媒体などの細胞培養培地または成長培地をさらに含む。一部の実施例では、キットのそのようなパーツは別々の容器に入れられている。例示的な容器としてはプラスチックまたはガラスバイアルまたは管が挙げられる。
一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子はそれぞれ別々の容器に入れられている。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子の2つまたはそれよりも多くのセットは別々の容器に入れられている。
V.処置方法
本明細書に開示される方法および系は、例えば、治療用ウイルス(例えば、AAV)によって発現させるにはタンパク質が大きすぎる場合、または治療用ウイルス(例えば、AAV)によって発現させるには完全な遺伝子配列(例えば、内因性プロモーター+コード配列)が大きすぎる場合に、任意の目的のタンパク質を発現させるために使用することができる。そのような場合では、本明細書に開示される系を使用して標的タンパク質のコード配列を2つまたはそれよりも多くの部分に分け、正しい順序で組換え、それにより、所望のときと場所でタンパク質を発現させることを可能にすることができる。
処置される対象は、表1に列挙されているものなどの単一遺伝子(monogenetic)障害を有するものなどの任意の哺乳動物であり得る。一実施例では、対象はがんを有する。したがって、ヒト、ネコ、ブタ、ラット、マウス、ウシ、ヤギ、およびイヌを開示される方法で処置することができる。一部の実施例では、対象は6カ月齢未満のヒト乳児である。一部の実施例では、対象は1歳未満のヒト乳児である。一部の実施例では、対象は若年のヒトである。一部の実施例では、対象は少なくとも18歳のヒト成人である。一部の実施例では、対象は女性である。一部の実施例では、対象は男性である。
対象を処置するために使用される本明細書に提示される2つまたはそれよりも多くの合成核酸分子を処置される対象に適合させることができる。したがって、例えば、処置される対象がイヌの場合、標的タンパク質のイヌコード配列を使用することができ、イントロン配列をイヌ細胞における発現のために最適化することができ、処置される対象がヒトの場合、標的タンパク質のヒトコード配列を使用することができ、イントロン配列をヒト細胞における発現のために最適化することができる。
本明細書に提示される2つまたはそれよりも多くの合成核酸分子は、アデノ随伴ベクター(AAV)、例えば、AAV血清型rh.10などのベクターの一部として投与することができる。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子のうちの1つを含むベクター(例えば、AAV)を、静脈内になど、全身的に投与する。したがって、コード配列を本明細書に提示される2つの合成核酸分子に分ける場合、2つのAAVを投与し、各AAVが本明細書に提示される2つの合成核酸分子のうちの1つを含む。
本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、治療有効量で、例えば、AAVとして投与する。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、ウイルスベクター(例えば、AAV)の一部である場合、対象当たり少なくとも1×1011ゲノムコピー(gc)、少なくとも1×1012gc、少なくとも2×1012gc、少なくとも1×1013gc、少なくとも2×1013gc、または対象当たり少なくとも1×1014gc、例えば、対象当たり2×1011gc、対象当たり2×1012gc、対象当たり2×1013gc、または対象当たり2×1014gcの用量で投与する。一部の実施例では、本明細書に提示される2つまたはそれよりも多くの合成核酸分子を、ウイルスベクター(例えば、AAV)の一部である場合、少なくとも1×1011gc/kg、少なくとも5×1011gc/kg、少なくとも1×1012gc/kg、少なくとも5×1012gc/kg、少なくとも1×1013gc/kg、または少なくとも4×1013gc/kg、例えば、4×1011gc/kg、4×1012gc/kg、または4×1013gc/kgの用量で投与する。
血液中のAAVカプシド特異的T細胞などの有害な症状が発生した場合、コルチコステロイドを投与することができる(例えば、Nathwani et al., N Engl J Med. 365 (25): 2357-65, 2011を参照されたい)。
本明細書に開示される方法を用いて処置することができる疾患としては、任意の血液の遺伝子疾患(例えば、鎌状赤血球症、原発性免疫不全疾患)、HIV(例えばHIV-1)、および血液悪性腫瘍またはがんが挙げられる。原発性免疫不全疾患およびそれらの対応する変異の例としては、Al-Herz et al. (Frontiers in Immunology, volume 5, article 162, April 22, 2014、その全体が参照により本明細書に組み込まれる)に列挙されているものが挙げられる。血液悪性腫瘍またはがんは、血液、骨髄、およびリンパ節に影響を及ぼす腫瘍である。例としては、白血病(例えば、急性リンパ芽球性白血病、急性骨髄性白血病、慢性リンパ球性白血病、慢性骨髄性白血病、急性単球性白血病)、リンパ腫(例えば、ホジキンリンパ腫および非ホジキンリンパ腫)、および骨髄腫が挙げられる。一部の実施例では、疾患は単一遺伝子疾患である。表1に本明細書に開示される系および方法によって標的化することができる例示的な障害および遺伝子の一覧を提示する。さらなる例がrarediseases.info.nih.gov/diseases/diseases-by-category/5/congenital-and-genetic-diseases(一覧が参照により本明細書に組み込まれる)に提示される。タンパク質の欠失(例えば、劣性変異)またはタンパク質の不足によって引き起こされるあらゆる遺伝子疾患に本明細書に開示される系および方法が有益であり得る。遺伝子のコード領域が比較的小さい場合、本明細書に開示される系および方法は、遺伝子発現を妥当な細胞型に妥当なレベルで方向付けるための組織特異的プロモーターまたは特異的非コードRNAセグメントなどの調節配列を付加するために有用である。
本明細書に開示される方法および系の使用を、表1に列挙されている障害のいずれかまたは他の公知の遺伝障害を処置するために使用することができる。本明細書に開示される方法は、がん細胞において毒素またはチミジンキナーゼなどの治療用タンパク質を発現させることが有益であり得るがんなどの他の障害を処置するためにも使用することができる。全長チミジンキナーゼを発現する本明細書に提示される2つまたはそれよりも多くの合成分子を対象に投与する場合、対象にガンシクロビルも投与する。処置により、障害の全ての特徴を100%除去する必要はないが、それらを低減することができる。特定の実施例を以下に提示するが、この教示に基づいて、他の障害の症状に同様に影響を及ぼすことができることが理解されよう。例えば、本明細書に開示される方法を使用して、対象によって発現されないかもしくは発現が低減しているタンパク質の発現を増大させること、または対象によって望ましくなく発現されるかもしくは発現が低減しているタンパク質の発現を低減することができる。例えば、本明細書に開示される方法を使用して、遺伝子疾患の望ましくない影響を処置または低減することができる。
例えば、本明細書に開示される方法および系により、ヘモグロビンの全長野生型β-グロビン鎖を発現させることによって鎌状赤血球症の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における鎌状赤血球症の症状(例えば、血液中の鎌状赤血球の存在、疼痛、虚血、壊死、貧血、血管閉塞性発作、無形成発作、脾臓血球貯留発作(splenic sequestration crisis)、および溶血性発作のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%低減する(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象における鎌状赤血球の数が減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%減少する(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法および系により、全長野生型第V因子ライデンまたはプロトロンビン遺伝子を発現させることによって血栓形成傾向の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(recipie7nt subject)における血栓形成傾向の症状(例えば、深部静脈血栓症などの血栓症、肺塞栓症、静脈血栓塞栓症、腫脹、胸痛、動悸のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象における凝固因子の活性が低下し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%の低下である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法および系により、全長野生型CD40リガンド遺伝子を発現させることによってCD40リガンド欠損症の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象におけるCD40リガンド欠損症(例えば、血清中IgMの上昇、他の免疫グロブリンの低血清中レベル、日和見感染症、自己免疫および悪性腫瘍のうちの1つまたは複数)の症状が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、レシピエント対象におけるCD40リガンド欠損の量または活性が増大し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも100%、少なくとも200%または少なくとも500%の増大である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、遺伝子欠陥に起因する原発性免疫不全疾患の望ましくない影響を処置または低減することができる。例えば、本明細書に開示される方法および系(例えばAAVを使用し、2つまたはそれよりも多くの合成核酸分子を使用して対象において欠如しているかまたは欠陥がある機能的タンパク質を発現させることができる)により、原発性免疫不全疾患の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における原発性免疫不全疾患の症状(例えば、細菌感染、真菌感染、ウイルス感染、寄生虫感染、リンパ腺腫脹、脾腫、創傷、および体重減少のうちの1つまたは複数)が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、原発性免疫不全障害を有するレシピエント対象における免疫細胞(例えば、CD8細胞などのT細胞)の数が増加し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増加である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、原発性免疫不全障害を有するレシピエント対象における感染症(例えば、細菌、ウイルス、真菌、またはこれらの組合せ)の数が一定期間にわたって(例えば、1年を超えて)減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、または少なくとも95%の減少である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、単一遺伝子障害の望ましくない影響を処置または低減することができる。例えば、本明細書に開示される方法(例えばAAVを使用し、2つまたはそれよりも多くの合成核酸分子を使用して対象において欠如しているかまたは欠陥がある機能的タンパク質を発現させることができる)により、単一遺伝子障害の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象における単一遺伝子障害の症状が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(治療用核酸分子を投与しない場合と比較して)。一実施例では、本明細書に開示される方法により、単一遺伝子障害を有するレシピエント対象では通常発現されない正常なタンパク質の量が増加し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増加である(治療用核酸分子を投与しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における血液悪性腫瘍の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、白血病を有する対象)における異常な白血球(例えばB細胞)の数が減少し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の減少である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、リンパ腫の望ましくない影響を処置または低減する、例えば、リンパ腫のサイズ、リンパ腫の体積、リンパ腫の成長速度、リンパ腫の転移を低減するために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、多発性骨髄腫の望ましくない影響を処置または低減する、例えば、レシピエント対象における異常な形質細胞の数を減少させるために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の減少である(本明細書に開示される治療を施行しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における遺伝子欠陥に起因するものなどの悪性腫瘍の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、本明細書において列挙されているがんを有する対象)におけるがん細胞の数、腫瘍のサイズ、腫瘍の体積、または転移の数が低減し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。一実施例では、本明細書に開示される治療の施行は、リンパ腫の望ましくない影響を処置または低減する、例えば、腫瘍のサイズ、腫瘍の体積、がんの成長速度、がんの転移を低減するために使用することができ、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、または少なくとも90%の低減である(本明細書に開示される治療を施行しない場合と比較して)。
例えば、本明細書に開示される方法を使用して、レシピエント対象における遺伝子欠陥に起因する神経疾患の望ましくない影響を処置または低減することができる。一実施例では、本明細書に開示される方法により、レシピエント対象(例えば、上に列挙されている神経疾患を有する対象)における神経機能が増大し、例えば、少なくとも10%、少なくとも20%、少なくとも50%、少なくとも70%、少なくとも90%、少なくとも100%、少なくとも200%、少なくとも300%、少なくとも400%、または少なくとも500%の増大である(本明細書に開示される治療を施行しない場合と比較して)。
デュシェンヌ型筋ジストロフィー(DMD)の処置
デュシェンヌ型筋ジストロフィー(DMD、MIM:310200)は、進行性の筋力低下および変性を特徴とする致死的な遺伝性疾患である。疾患が進行するにつれ、変性している筋線維が脂肪および線維化組織によって置き換えられる。DMDの起源は遺伝子ジストロフィン(MIM:300377)の欠損である。ジストロフィン遺伝子は22kbpの領域にわたり、変異を起こしやすい。したがって、DMDは、一部の場合では、疾患を引き起こす変異の家族歴を有さない患者においても散発的に顕在化し得る。DMDは、ジストロフィン異常症として公知の4つの状態のうちの1つである。この群に属する他の3つの疾患は、ベッカー型筋ジストロフィー(BMD、DMDの軽症型);DMDとBMDの中間の臨床所見;および臨床的な骨格筋疾患または随意筋疾患がほとんどまたは全く伴わないDMD関連拡張型心筋症(心疾患)である。したがって、一部の実施例では、DMD、BMD、DMDとBMDの中間の臨床所見;または臨床的な骨格筋疾患または随意筋疾患がほとんどまたは全く伴わないDMD関連拡張型心筋症(心疾患)を有する患者を、本明細書に開示される系および方法を用いて処置する。
本明細書に開示される方法および系を、ジストロフィンを発現させることによってDMDの単一遺伝子性の原因を処置するために使用することができる。ジストロフィンは、例えばジストロフィンなど、長いコード領域を有する。ジストロフィンを単一のAAVから発現させる現行の方法では、短くした/短縮されたバージョンのジストロフィン(マイクロジストロフィンおよびミニジストロフィン)を利用する。これらの短縮されたジストロフィン送達治療のいくつかが第I/II相臨床試験において試験されている(NCT03362502、NCT00428935、NCT03368742、NCT03375164)。これらの短縮されたバージョンのジストロフィンは、DMDにおけるジストロフィン欠損の最悪の結果を好転させることはできるが、短縮されたバージョンでは全長タンパク質のロッド領域およびヒンジ領域の重要なドメインが欠如しているので、全長ジストロフィンと比較して完全な機能性を有さないことが予測される。本明細書に開示される方法および系では、「多重化された」AAVの組合せを使用することにより、高い感染効率(MOI、すなわち、高力価)で導入した場合に複数のAAVウイルスを同じ細胞に効率的に感染させることができるので、AAVのトランスジェニックペイロードのサイズ制限が緩和される。
したがって、一部の実施例では、例えば、組み換えられると全長ジストロフィンコード配列が生じる、2つ、3つ、4つまたは5つの異なる合成RNA分子(それぞれ異なるAAVとして)を含むセットなど、開示される合成分子のセットの1つをそれぞれが含有する2つまたはそれよりも多くのAAVを含む組成物をDMD対象に治療有効量で投与する(例えば、i.v.)。
VI.例示的な実施形態
1.標的タンパク質を発現させるための系であって、(a)5’から3’に:標的タンパク質のN末端部分のコード配列;スプライスドナー;および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;ならびに(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子を含む、系。
2.標的タンパク質を発現させるための系であって、(a)5’から3’に:標的タンパク質のN末端部分のコード配列;スプライスドナー;および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;ならびに(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の中間部分のコード配列;第2のスプライスドナー;および第3の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子;ならびに(c)5’から3’に:第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む第3の合成核酸分子を含む、系。
3.標的タンパク質を発現させるための系であって、
(a)5’から3’に:標的タンパク質のN末端部分のコード配列、スプライスドナー、および第1の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む第1の合成核酸分子;(b)5’から3’に:第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の中間部分のコード配列;第2のスプライスドナー;および第3の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む第2の合成核酸分子;ならびに(c)5’から3’に:第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質の第1の中間部分のコード配列;第2のスプライスドナー;および第5の二量体形成ドメインを含むRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む第3の合成核酸分子;ならびに(c)5’から3’に:第5の二量体形成ドメインに結合する第6の二量体形成ドメイン;分岐点配列;ポリピリミジントラクト;スプライスアクセプター;および標的タンパク質のC末端部分のコード配列を含むRNA分子をコードする配列に作動可能に連結した第4のプロモーターを含む第4の合成核酸分子を含む、系。
4.各プロモーターが、独立に選択される、実施形態1から3までのいずれか1つの系。
5.第1のプロモーターと第2のプロモーターが同じプロモーターである;第1のプロモーターと第2のプロモーターが異なるプロモーターである;第1のプロモーター、第2のプロモーター、および第3のプロモーターが同じプロモーターである;第1のプロモーター、第2のプロモーター、および第3のプロモーターが異なるプロモーターである;第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターが同じプロモーターである;または、第1のプロモーター、第2のプロモーター、第3のプロモーターおよび第4のプロモーターが異なるプロモーターである、実施形態1から4までのいずれか1つの系。
6.第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および標的タンパク質に対して内因性のプロモーターから選択される、実施形態1から5までのいずれか1つの系。
7.第1の二量体形成ドメインと第2の二量体形成ドメイン、第3の二量体形成ドメインと第4の二量体形成ドメイン、および/または第5の二量体形成ドメインと第6の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、実施形態1から6までのいずれか1つの系。
8.直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項7に記載の組成物。
9.直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、請求項7または8の組成物。
10.直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項7または8の組成物。
11.間接結合が、核酸架橋を通じた塩基対合相互作用を含む、請求項7または8の組成物。
12.間接結合が、アプタマーとアプタマーの標的との間、または2つのアプタマー間の非塩基対合相互作用を含む、請求項7または8の組成物。
13.第1の二量体形成ドメイン、第2の二量体形成ドメイン、第3の二量体形成ドメイン、第4の二量体形成ドメイン、第5の二量体形成ドメインおよび/または第6の二量体形成ドメインが、潜在スプライスアクセプターを含まない、実施形態1から12までのいずれか1つの系。
14.直接結合しているかまたは間接的に結合しているアプタマー配列二量体形成ドメインの対を少なくとも1つ含む、実施形態1から13までのいずれか1つの系。
15.キッシングループ相互作用二量体形成ドメインの対を少なくとも1つ含む、実施形態1から14までのいずれか1つの系。
16.標的タンパク質が、疾患に関連するタンパク質、または治療用タンパク質である、実施形態1から15までのいずれか1つの系。
17.疾患が、単一遺伝子疾患である、実施形態16の系。
18.治療用タンパク質が、毒素である、実施形態17の系。
19.疾患および標的タンパク質が、表1に列挙されているものである、実施形態16から18までのいずれか1つの系。
20.第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子、および/または第4の合成核酸分子が、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子、または第4の合成核酸分子の3’末端にポリアデニル化配列をさらに含む、実施形態1から19までのいずれか1つの系。
21.第1の合成核酸分子が、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)の一方または両方をさらに含む;ならびに/または、第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ分岐点配列に対して5’側のISE、およびスプライスドナーに対して3’側かつ二量体形成ドメインに対して5’側のDISEのうちの一方または両方をさらに含む;ならびにこれらの任意の組合せである、実施形態1または4から20までのいずれか1つの系。
22.第1の合成核酸分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、またはDISEとISEの両方をさらに含む;第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;ならびに/または第3の合成核酸分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびにこれらの任意の組合せである、実施形態2または4から20までのいずれか1つの系。
23.第1の合成核酸分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、またはDISEとISEの両方をさらに含む;第2の合成核酸分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;第3の合成核酸分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびに/または第4の合成核酸分子が、第5の二量体形成ドメインに対して3’側かつ第3の分岐点配列に対して5’側のISE、第3のスプライスドナーに対して3’側かつ第5の二量体形成ドメインに対して5’側のDISE、第3のスプライスドナーに対して3’側かつ第6の二量体形成ドメインに対して5’側のISE、もしくはこれらの組合せをさらに含む;ならびにこれらの任意の組合せである、実施形態3から20までのいずれか1つの系。
24.細胞に導入されると、RNA分子を適当な順序で産生させ、組み換え、それにより、標的タンパク質の全長コード配列をもたらす、実施形態1から23までのいずれか1つの系。
25.第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のそれぞれが、別々のウイルスベクターの一部である、実施形態1から24までのいずれか1つの系。
26.ウイルスベクターが、AAVである、実施形態25の系。
27.
第1の合成核酸分子および/または第3の合成核酸分子が、スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により3’に位置するポリアデニル化尾部が切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2の合成核酸分子および/または第4の合成核酸分子が、分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により5’に位置するRNAキャップが切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2の合成核酸分子および/または第4の合成核酸分子が、スプライスアクセプターに対して3’側にあるオープンリーディングフレームに対してシフトされる開始コドンを分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの標的タンパク質断片の翻訳が低減または抑制される;
第1の合成核酸分子および/または第3の合成核酸分子が、スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第2の合成核酸分子および/または第4の合成核酸分子が、コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第1の合成核酸分子および/または第3の合成核酸分子が、デグロンタンパク質分解タグをコードする配列を、スプライスドナーに対して3’側の任意の場所にスプライスドナー部位の5’側にある標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
第2の合成核酸分子および/または第4の合成核酸分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、分岐点配列に対して5’側の任意の場所にスプライスアクセプター部位の3’側の標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
またはこれらの組合せである、
実施形態1から26までのいずれか1つの系。
28.系の任意の1つ、2つ、3つ、または4つの合成核酸分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、実施形態1から27までのいずれか1つの系。
29.系の合成核酸分子によってコードされる標的タンパク質のN末端部分のコード配列、標的タンパク質の中間部分のコード配列、または標的タンパク質のC末端部分のコード配列のそれぞれが、約1000nt~約4000nt、約1,000nt~約1,500nt、約1,000nt~約2,000nt、約1,000nt~約2,500nt、約1,000nt~約3,000nt、約1,000nt~約3,500nt、約1,000nt~約4,000nt、約1,500nt~約2,000nt、約1,500nt~約2,500nt、約1,500nt~約3,000nt、約1,500nt~約3,500nt、約1,500nt~約4,000nt、約2,000nt~約2,500nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,500nt~約3,000nt、約2,500nt~約3,500nt、約2,500nt~約4,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,500nt~約4,000nt、約1,000nt、約1,500nt、約2,000nt、約2,500nt、約3,000nt、約3,500nt、および約4,000ntから独立に選択されるサイズを有する、実施形態1から28までのいずれか1つの系。
30.それぞれ系の1つ、2つ、3つまたは4つのいずれかの合成核酸分子によってコードされる1つ、2つ、3つ、または4つのいずれかのRNAのそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態1から29までのいずれか1つの系。
31.合成核酸分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有する;
総標的タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、または約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntである;ならびに/または
2つの合成核酸分子によってコードされるRNAが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、もしくは約8,500nt~約9,000ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、および約9,000ntの総サイズを有する、
実施形態1および4から30までのいずれか1つの系。
32.合成核酸分子が、約7500nt~約15,000nt、約7,500nt~約8,500nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約14,000nt、約7,500nt~約15,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約14,000nt、約8,500nt~約15,000nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約14,000nt、約9,500nt~約15,000nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約14,000nt、約10,500nt~約15,000nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約14,000nt、約11,500nt~約15,000nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,500nt~約13,000nt、約12,500nt~約14,000nt、約12,500nt~約15,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、または約14,000nt~約15,000ntから選択される総サイズを有し、合成核酸分子が、約7,500nt、約8,500nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、約14,000nt、および約15,000ntの総サイズを有する;
総標的タンパク質コード配列が、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、もしくは約11,000nt~約12,000ntから選択され、総標的タンパク質コード配列が、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、および約12,000ntである;ならびに/または
3つの合成核酸分子によってコードされるRNAが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、もしくは約13,000nt~約13,500ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、および約13,500ntの総サイズを有する、
実施形態2および4から30までのいずれか1つの系。
33.合成核酸分子が、約10,000nt~約20,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約10,000nt~約19,000nt、約10,000nt~約20,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約11,000nt~約19,000nt、約11,000nt~約20,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約12,000nt~約19,000nt、約12,000nt~約20,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約13,000nt~約19,000nt、約13,000nt~約20,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約14,000nt~約19,000nt、約14,000nt~約20,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約15,000nt~約19,000nt、約15,000nt~約20,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約16,000nt~約19,000nt、約16,000nt~約20,000nt、約17,000nt~約18,000nt、約17,000nt~約19,000nt、約17,000nt~約20,000nt、約18,000nt~約19,000nt、約18,000nt~約20,000nt、もしくは約19,000nt~約20,000ntから選択される総サイズを有し、合成核酸分子が、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、約18,000nt、約19,000nt、および約20,000ntの総サイズを有する;
総標的タンパク質コード配列が、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、または約15,000nt~約16,000ntから選択され、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、もしくは約16,000ntであり、総標的タンパク質コード配列が、少なくとも約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、および約15,000ntである;ならびに/または、
2つの合成核酸分子によってコードされるRNAが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、もしくは約17,000nt~約18,000ntから選択される総サイズを有し、2つの合成核酸分子によってコードされるRNAが、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、および約18,000ntの総サイズを有する、
実施形態3および4から30までのいずれか1つの系。
34.RNA組換え効率が、約10%~約95%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、または約90%、または約95%である、実施形態1から33までのいずれか1つの系。
35.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、ならびに/または第5の二量体形成ドメインおよび第6の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、実施形態1から34までのいずれか1つの系。
36.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、実施形態1から35までのいずれか1つの系。
37.実施形態1から36までのいずれか1つの系を含む組成物。
38.実施形態1から37までのいずれか1つに記載のRNA分子を含む組成物。
39.実施形態1から37までのいずれか1つに記載のRNA分子を1つ、2つ、3つ、または4つ含む組成物。
40.それぞれジストロフィン、第8因子、ABCA4、またはMYO7Aの少なくとも一部分をコードする、第1の合成核酸またはRNA分子、第2の合成核酸またはRNA分子、第3の合成核酸またはRNA分子および必要に応じて第4の合成核酸またはRNA分子を含む、実施形態37から39までのいずれか1つの組成物。
41.実施形態1から36までのいずれか1つに記載のRNA分子。
42.実施形態1から41までのいずれか1つの系、または実施形態37から40までのいずれか1つの組成物を含み、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
43.細胞において標的タンパク質を発現させる方法であって、実施形態1から36までのいずれか1つの系または実施形態35から37までのいずれか1つの組成物を細胞に導入するステップと、第1の合成RNA分子と第2の合成RNA分子、第1の合成RNA分子、第2の合成RNA分子、および第3の合成RNA分子、または第1の合成RNA分子、第2の合成RNA分子、第3の合成RNA分子および第4の合成RNA分子を細胞において発現させるステップとを含み、細胞において標的タンパク質が産生される、方法。
44.細胞が、対象内に存在し、導入するステップが、系を治療有効量で対象に投与することを含む、実施形態43の方法。
45.対象における標的タンパク質をコードする遺伝子の変異によって引き起こされる遺伝子疾患を処置し、対象における機能的標的タンパク質の発現をもたらす、実施形態44の方法。
46.
遺伝子疾患がデュシェンヌ型筋ジストロフィーであり、標的タンパク質がジストロフィンである;
遺伝子疾患が血友病Aであり、標的タンパク質がF8である;
遺伝子疾患がスタルガルト病であり、標的タンパク質がABCA4である;または
遺伝子疾患がアッシャー症候群であり、標的タンパク質がMYO7Aである、
実施形態45の方法。
47.配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む核酸分子。
48.合成イントロンが、配列番号20のnt3703~3975、配列番号21のnt1~228、配列番号22のnt3703~3975、配列番号23のnt1~225、配列番号24のnt3560~3828、または配列番号25のnt1~225である、実施形態47の核酸分子。
49.タンパク質コード配列の一部をさらに含む、実施形態47または48の合成核酸分子。
50.タンパク質コード配列の一部が、タンパク質コード配列のN末端側半分、N末端側の3分の1、中間部分、C末端側半分、またはC末端側の3分の1を含む、実施形態49の合成核酸分子。
51.少なくとも1つの合成核酸分子が、実施形態47から50までのいずれか1つに記載の核酸分子を含む合成イントロンを含む、実施形態1から36までのいずれか1つの系または実施形態37から40までのいずれか1つの組成物。
52.合成核酸が、逆転写酵素によるRNAウイルスゲノムの転写によって生じたDNAである、先行する実施形態のいずれかの組成物、系、方法、またはキット。
VII.追加的な例示的な実施形態
1.標的タンパク質を発現させるための組成物であって、(a)第1のRNA分子であって、5’から3’に:(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に:(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む組成物。
2.標的タンパク質を発現させるための組成物であって、(a)第1のRNA分子であって、5’から3’に:(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に:(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第3の二量体形成ドメインを含む、第2のRNA分子;ならびに(c)第3のRNA分子であって、5’から3’に:(i)第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第3のRNA分子を含む組成物。
3.標的タンパク質を発現させるための組成物であって、(a)第1のRNA分子であって、5’から3’に:(i)標的タンパク質のN末端部分のコード配列、(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;(b)第2のRNA分子であって、5’から3’に:(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第3の二量体形成ドメインを含む、第2のRNA分子;ならびに(c)第3のRNA分子であって、5’から3’に:(i)第3の二量体形成ドメインに結合する第4の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;(v)標的タンパク質の第1の中間部分のコード配列;(vi)第2のスプライスドナー;および(vii)第5の二量体形成ドメインを含む、第3のRNA分子;ならびに(d)第4のRNA分子であって、5’から3’に:(i)第5の二量体形成ドメインに結合する第6の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第4のRNA分子を含む組成物。
4.第1の二量体形成ドメインと第2の二量体形成ドメイン、第3の二量体形成ドメインと第4の二量体形成ドメイン、および/または第5の二量体形成ドメインと第6の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、実施形態1から3までのいずれか1つの組成物。
5.直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項4の組成物。
6.直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、請求項4または5の組成物。
7.直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、請求項4または5の組成物。
8.間接結合が、核酸架橋を通じた塩基対合相互作用を含む、請求項4または5の組成物。
9.間接結合が、アプタマーとアプタマー標的剤との間、または2つのアプタマー間の非塩基対合相互作用を含む、請求項4または5の組成物。
10.第1の二量体形成ドメイン、第2の二量体形成ドメイン、第3の二量体形成ドメイン、第4の二量体形成ドメイン、第5の二量体形成ドメインおよび/または第6の二量体形成ドメインが、潜在スプライスアクセプターを含まない、実施形態1から9までのいずれか1つの組成物。
11.直接結合しているかまたは間接的に結合しているアプタマー配列二量体形成ドメインの対を少なくとも1つ含む、実施形態1から10までのいずれか1つの組成物。
12.キッシングループ相互作用二量体形成ドメインの対を少なくとも1つ含む、実施形態1から11までのいずれか1つの組成物。
13.標的タンパク質が、疾患に関連するタンパク質、または治療用タンパク質である、実施形態1から12までのいずれか1つの組成物。
14.疾患が、単一遺伝子疾患である、実施形態13の組成物。
15.治療用タンパク質が、毒素である、実施形態14の組成物。
16.疾患および標的タンパク質が、表1に列挙されているものである、実施形態13から15までのいずれか1つの組成物。
17.第1のRNA分子、第2のRNA分子、第3のRNA分子、および/または第4のRNA分子が、第1のRNA分子、第2のRNA分子、第3のRNA分子、または第4のRNA分子の3’末端にポリA尾部をさらに含む、実施形態1から16までのいずれか1つの組成物。
18.
第1のRNA分子が、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、スプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)のうちの一方もしくは両方をさらに含む;ならびに/または
第2のRNA分子が、第2の二量体形成ドメインに対して3’側かつ分岐点配列に対して5’側のISE、およびスプライスドナーに対して3’側かつ二量体形成ドメインに対して5’側のDISEのうちの一方もしくは両方をさらに含む;
またはこれらの任意の組合せである、
実施形態1または4から17までのいずれか1つの組成物。
19.
第1のRNA分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、もしくは両方をさらに含む;
RNA分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;ならびに/または
第3のRNA分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;
またはこれらの任意の組合せである、
実施形態2または4から17までのいずれか1つの組成物。
20.
第1のRNA分子が、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のDISE、第1のスプライスドナーに対して3’側かつ第1の二量体形成ドメインに対して5’側のISE、または両方をさらに含む;
第2のRNA分子が、第2の二量体形成ドメインに対して3’側かつ第1の分岐点配列に対して5’側のISE、第2のスプライスドナーに対して3’側かつ第2の二量体形成ドメインに対して5’側のDISE、第2のスプライスドナーに対して3’側かつ第3の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;
第3のRNA分子が、第4の二量体形成ドメインに対して3’側かつ第2の分岐点配列に対して5’側のISEをさらに含む;ならびに/または
第4のRNA分子が、第5の二量体形成ドメインに対して3’側かつ第3の分岐点配列に対して5’側のISE、第3のスプライスドナーに対して3’側かつ第5の二量体形成ドメインに対して5’側のDISE、第3のスプライスドナーに対して3’側かつ第6の二量体形成ドメインに対して5’側のISE、もしくはこれらの任意の組合せをさらに含む;
またはこれらの任意の組合せである、
実施形態3から17までのいずれか1つの組成物。
24.
第1のRNA分子および/または第3のRNA分子が、スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により3’に位置するポリアデニル化尾部が切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2のRNA分子および/または第4のRNA分子が、分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により5’に位置するRNAキャップが切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
第2のRNA分子および/または第4のRNA分子が、スプライスアクセプターに対して3’側にあるオープンリーディングフレームに対してシフトされる開始コドンを分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの標的タンパク質断片の翻訳が低減または抑制される;
第1のRNA分子および/または第3のRNA分子が、スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第2のRNA分子および/または第4のRNA分子が、コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が、核の外側に出るとマイクロRNA依存性分解を受ける;
第1のRNA分子および/または第3のRNA分子が、デグロンタンパク質分解タグをコードする配列を、スプライスドナーに対して3’側の任意の場所にスプライスドナー部位の5’側にある標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
第2のRNA分子および/または第4のRNA分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、分岐点配列に対して5’側の任意の場所にスプライスアクセプター部位の3’側の標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
またはこれらの任意の組合せである、
実施形態1から23までのいずれか1つの組成物。
25.標的タンパク質を発現させるための組成物であって、(a)実施形態1および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;ならびに(b)実施形態1および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子を含む組成物。
26.標的タンパク質を発現させるための組成物であって、(a)実施形態2および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;(b)実施形態2および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子;および(c)実施形態2および4から24までのいずれか1つの第3のRNA分子をコードする第3の合成DNA分子であって、(i)第3のRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む、第3の合成DNA分子を含む組成物。
27.標的タンパク質を発現させるための組成物であって、(a)実施形態3および4から24までのいずれか1つの第1のRNA分子をコードする第1の合成DNA分子であって、(i)第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;(b)実施形態3および4から24までのいずれか1つの第2のRNA分子をコードする第2の合成DNA分子であって、(i)第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子;(c)実施形態3および4から24までのいずれか1つの第3のRNA分子をコードする第3の合成DNA分子であって、(i)第3のRNA分子をコードする配列に作動可能に連結した第3のプロモーターを含む、第3の合成DNA分子;および(d)実施形態3および4から24までのいずれか1つの第4のRNA分子をコードする第4の合成DNA分子であって、(i)第4のRNA分子をコードする配列に作動可能に連結した第4のプロモーターを含む、第4の合成DNA分子を含む組成物。
28.各プロモーターが、独立に選択される、実施形態25から27までのいずれか1つの組成物。
29.
第1のプロモーターと第2のプロモーターが同じプロモーターである;
第1のプロモーターと第2のプロモーターが異なるプロモーターである;
第1のプロモーター、第2のプロモーター、および第3のプロモーターが同じプロモーターである;
第1のプロモーター、第2のプロモーター、および第3のプロモーターが異なるプロモーターである;
第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターが同じプロモーターである;または、
第1のプロモーター、第2のプロモーター、第3のプロモーターおよび第4のプロモーターが異なるプロモーターである、
実施形態25から28までのいずれか1つの組成物。
30.第1のプロモーター、第2のプロモーター、第3のプロモーター、および第4のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および標的タンパク質に対して内因性のプロモーターから選択される、実施形態25から29までのいずれか1つの組成物。
31.実施形態25から30までのいずれか1つの組成物を含む、標的タンパク質を発現させるための系。
32.細胞に導入されると、RNA分子を適当な順序で産生させ、組み換え、それにより、標的タンパク質の全長コード配列をもたらす、実施形態31の系。
33.第1のRNA分子および第2のRNA分子(2つの部分からなる系において)のそれぞれ、第1のRNA分子、第2のRNA分子および第3のRNA分子(3つの部分からなる系において)のそれぞれ、または第1のRNA分子、第2のRNA分子、第3のRNA分子および第4のRNA分子(4つの部分からなる系において)のそれぞれが、別々のウイルスベクターから転写される、実施形態31または32に記載の系。
34.ウイルスベクターが、AAVである、実施形態31から33までのいずれか1つの系。
35.系の第1の合成DNA分子、第2の合成DNA分子、第3の合成DNA分子、または第4の合成DNA分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、実施形態31から34までのいずれか1つの系。
36.系の合成DNA分子によってコードされる標的タンパク質のN末端部分のコード配列(2つの部分からなる系、3つの部分からなる系、または4つの部分からなる系において)、標的タンパク質の中間部分のコード配列(3つの部分からなる系において)、標的タンパク質の第1の中間部分のコード配列(4つの部分からなる系において)、または標的タンパク質のC末端部分のコード配列(2つの部分からなる系、3つの部分からなる系、または4つの部分からなる系において)は、約1,000nt~約4,500ntから独立に選択されるサイズをそれぞれが有し、から独立に選択されるサイズをそれぞれが有し、約1,000nt~約1,500nt、約1,000nt~約2,000nt、約1,000nt~約2,500nt、約1,000nt~約3,000nt、約1,000nt~約3,500nt、約1,000nt~約4,000nt、約1,000nt~約4,500nt、約1,500nt~約2,000nt、約1,500nt~約2,500nt、約1,500nt~約3,000nt、約1,500nt~約3,500nt、約1,500nt~約4,000nt、約1,500nt~約4,500nt、約2,000nt~約2,500nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,500nt~約3,000nt、約2,500nt~約3,500nt、約2,500nt~約4,000nt、約2,500nt~約4,500nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約4,000nt~約4,500nt、約1,000nt、約1,500nt、約2,000nt、約2,500nt、約3,000nt、約3,500nt、約4,000nt、または約4,500ntから独立に選択されるサイズをそれぞれが有する、実施形態31から35までのいずれか1つの系。
37.それぞれ系の1つ、2つ、3つ、または4つの合成DNA分子のいずれかによってコードされる1つ、2つ、3つ、または4つのRNA分子のいずれかが、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態31から36までのいずれか1つの系。
38.実施形態25および28から30までの組成物を含み、
第1の合成DNA分子および第2の合成DNA分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有する;
総標的タンパク質コード配列のサイズが、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、もしくは約7,500nt~約8,000ntから選択され、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntである;ならびに/または、
2つの合成DNA分子によってコードされるRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、または約9,000ntである、
実施形態31から37までのいずれか1つの系。
39.実施形態26および28から30までのいずれか1つの組成物を含み、
第1の合成DNA分子、第2の合成DNA分子、および第3の合成DNA分子が、約7500nt~約15,000nt、約7,500nt~約8,500nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約14,000nt、約7,500nt~約15,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約14,000nt、約8,500nt~約15,000nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約14,000nt、約9,500nt~約15,000nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約14,000nt、約10,500nt~約15,000nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約14,000nt、約11,500nt~約15,000nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,500nt~約13,000nt、約12,500nt~約14,000nt、約12,500nt~約15,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、または約14,000nt~約15,000nt、約7,500nt、約8,500nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、約14,000nt、または約15,000ntの総サイズを有する;
総標的タンパク質コード配列が、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、約11,000nt~約12,000nt、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、もしくは約12,000nt;ならびに/または、
3つの合成DNA分子によってコードされるRNA分子の合計サイズが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、約13,000nt~約13,500nt、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、または約13,500ntである、
実施形態31から36までのいずれか1つの系。
40.
実施形態27および28から30までのいずれか1つの組成物を含み、
第1の合成DNA分子、第2の合成DNA分子、第3の合成DNA分子および第4の合成DNA分子が、約10,000nt~約20,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約10,000nt~約19,000nt、約10,000nt~約20,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約11,000nt~約19,000nt、約11,000nt~約20,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約12,000nt~約19,000nt、約12,000nt~約20,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約13,000nt~約19,000nt、約13,000nt~約20,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約14,000nt~約19,000nt、約14,000nt~約20,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約15,000nt~約19,000nt、約15,000nt~約20,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約16,000nt~約19,000nt、約16,000nt~約20,000nt、約17,000nt~約18,000nt、約17,000nt~約19,000nt、約17,000nt~約20,000nt、約18,000nt~約19,000nt、約18,000nt~約20,000nt、約19,000nt~約20,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、約18,000nt、約19,000nt、もしくは約20,000ntの総サイズを有する;
総標的タンパク質コード配列が、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、もしくは約15,000nt~約16,000ntであり、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、もしくは約15,000ntである;ならびに/または
4つの合成DNA分子によってコードされるRNA分子の合計サイズが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約17,000nt~約18,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、もしくは約18,000ntである、
実施形態31から36までのいずれか1つの系。
41.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、および/または第5の二量体形成ドメインおよび第6の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%である、実施形態31から40までのいずれか1つの系。
42.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または約100%である、実施形態31から41までのいずれか1つの系。
43.RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態31から42までのいずれか1つの系。
44.実施形態31から43までのいずれか1つの系を含む組成物。
45.それぞれジストロフィン、第8因子、ABCA4、またはMYO7Aの少なくとも一部分をコードする第1のRNA分子、第2のRNA分子、第3のRNA分子および必要に応じて第4のRNA分子を含む、実施形態44の組成物。
46.実施形態31から43までのいずれか1つの系、または実施形態44および45のいずれか1つの組成物を含むキットであって、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
47.細胞において標的タンパク質を発現させる方法であって、実施形態31から43までのいずれか1つの系、または実施形態44および45のいずれか1つの組成物を細胞に導入するステップと、第1のRNA分子と第2のRNA分子、第1のRNA分子、第2のRNA分子、および第3のRNA分子、または第1のRNA分子、第2のRNA分子、第3のRNA分子および第4のRNA分子を細胞において発現させるステップとを含み、細胞において標的タンパク質が産生される、方法。
48.細胞が、対象内に存在し、導入するステップが、系を治療有効量で対象に投与することを含む、実施形態47の方法。
49.対象における標的タンパク質をコードする遺伝子の変異によって引き起こされる遺伝子疾患を処置し、対象における機能的標的タンパク質の発現をもたらす、実施形態48の方法。
50.
遺伝子疾患がデュシェンヌ型筋ジストロフィーであり、標的タンパク質がジストロフィンである;
遺伝子疾患が血友病Aであり、標的タンパク質がF8である;
遺伝子疾患がスタルガルト病であり、標的タンパク質がABCA4である;または
遺伝子疾患がアッシャー症候群であり、標的タンパク質がMYO7Aである、
実施形態49の方法。
51.1つ、2つ、3つ、または4つのRNA分子が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む、実施形態31から43までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、実施形態46のキット、または実施形態47から50までのいずれか1つの方法。
52.1つ、2つ、3つ、または4つのRNA分子が、配列番号20のnt3703~3975、配列番号21のnt1~228、配列番号22のnt3703~3975、配列番号23のnt1~225、配列番号24のnt3560~3828、および配列番号25のnt1~225から選択される合成イントロンを含む、実施形態31から43まで、および51のいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、実施形態46のキット、または実施形態47から50までのいずれか1つの方法。
53.1つ、2つ、3つ、または4つのRNA分子が、タンパク質コード配列の一部をさらに含む、実施形態31から43まで、51、および52のいずれかの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
54.タンパク質コード配列の一部が、タンパク質コード配列のN末端側半分、N末端側の3分の1、中間部分、第1の中間部分、C末端側半分、またはC末端側の3分の1を含む、実施形態31から43まで、および51から53までのいずれかの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
55.(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、または両方;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)少なくとも1つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、実施形態31から43までおよび51から54までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
56.(a)第1のRNA分子であって、5’から3’に、(i)標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、およびISE;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)3つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、実施形態31から43までおよび51から55までのいずれか1つの系、実施形態1から24まで、44および45のいずれか1つの組成物、または実施形態47から50までのいずれか1つの方法。
57.それぞれ、2つのRNA分子のうちのいずれか1つもしくは2つ、または、3つのRNA分子のうちのいずれか1つ、2つもしくは3つ、または、4つのRNA分子のうちのいずれか1つ、2つ、3つ、もしくは4つが、それぞれ、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、実施形態1および4から24までのいずれか1つの組成物、または、実施形態2および4から24までのいずれか1つの組成物、または、実施形態3および4から24までのいずれか1つの組成物。
58.総標的タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、もしくは約7,500nt~約8,000ntであり、総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、もしくは約8,000ntである;および/または、
2つのRNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、もしくは約9,000ntである、実施形態1および4から24までのいずれか1つの組成物。
59.総標的タンパク質コード配列のサイズが、約3000nt~約12,000nt、約3,000nt~約4,000nt、約3,000nt~約5,000nt、約3,000nt~約6,000nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,000nt~約8,500nt、約3,000nt~約9,000nt、約3,000nt~約1,000nt、約3,000nt~約11,000nt、約3,000nt~約12,000nt、約4,000nt~約5,000nt、約4,000nt~約6,000nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,000nt~約8,500nt、約4,000nt~約9,000nt、約4,000nt~約1,000nt、約4,000nt~約11,000nt、約4,000nt~約12,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約1,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約1,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約1,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約1,000nt、約7,500nt~約11,000nt、約7,500nt~約12,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約1,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,500nt~約9,000nt、約8,500nt~約1,000nt、約8,500nt~約11,000nt、約8,500nt~約12,000nt、約9,000nt~約1,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約1,000nt~約11,000nt、約1,000nt~約12,000nt、約11,000nt~約12,000nt、約3,000nt、約4,000nt、約5,000nt、約6,000nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約1,000nt、約11,000nt、もしくは約12,000ntである;および/または、
3つのRNA分子の合計サイズが、約7500nt~約13,500nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約7,500nt~約10,500nt、約7,500nt~約11,000nt、約7,500nt~約11,500nt、約7,500nt~約12,000nt、約7,500nt~約12,500nt、約7,500nt~約13,000nt、約7,500nt~約13,500nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約8,500nt~約10,500nt、約8,500nt~約11,000nt、約8,500nt~約11,500nt、約8,500nt~約12,000nt、約8,500nt~約12,500nt、約8,500nt~約13,000nt、約8,500nt~約13,500nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,000nt~約10,500nt、約9,000nt~約11,000nt、約9,000nt~約11,500nt、約9,000nt~約12,000nt、約9,000nt~約12,500nt、約9,000nt~約13,000nt、約9,000nt~約13,500nt、約9,500nt~約10,000nt、約9,500nt~約10,500nt、約9,500nt~約11,000nt、約9,500nt~約11,500nt、約9,500nt~約12,000nt、約9,500nt~約12,500nt、約9,500nt~約13,000nt、約9,500nt~約13,500nt、約10,000nt~約10,500nt、約10,000nt~約11,000nt、約10,000nt~約11,500nt、約10,000nt~約12,000nt、約10,000nt~約12,500nt、約10,000nt~約13,000nt、約10,000nt~約13,500nt、約10,500nt~約11,000nt、約10,500nt~約11,500nt、約10,500nt~約12,000nt、約10,500nt~約12,500nt、約10,500nt~約13,000nt、約10,500nt~約13,500nt、約11,000nt~約11,500nt、約11,000nt~約12,000nt、約11,000nt~約12,500nt、約11,000nt~約13,000nt、約11,000nt~約13,500nt、約11,500nt~約12,000nt、約11,500nt~約12,500nt、約11,500nt~約13,000nt、約11,500nt~約13,500nt、約12,000nt~約12,500nt、約12,000nt~約13,000nt、約12,000nt~約13,500nt、約12,500nt~約13,000nt、約12,500nt~約13,500nt、約13,000nt~約13,500nt、約7,500nt、約8,500nt、約9,000nt、約9,500nt、約10,000nt、約10,500nt、約11,000nt、約11,500nt、約12,000nt、約12,500nt、約13,000nt、もしくは約13,500ntである、
実施形態2および4から24までのいずれか1つの組成物。
60.総標的タンパク質コード配列のサイズが、約4000nt~約16,000nt、約5,000nt~約6,000nt、約5,000nt~約7,000nt、約5,000nt~約8,000nt、約5,000nt~約9,000nt、約5,000nt~約10,000nt、約5,000nt~約11,000nt、約5,000nt~約12,000nt、約5,000nt~約13,000nt、約5,000nt~約14,000nt、約5,000nt~約15,000nt、約5,000nt~約16,000nt、約6,000nt~約7,000nt、約6,000nt~約8,000nt、約6,000nt~約9,000nt、約6,000nt~約10,000nt、約6,000nt~約11,000nt、約6,000nt~約12,000nt、約6,000nt~約13,000nt、約6,000nt~約14,000nt、約6,000nt~約15,000nt、約6,000nt~約16,000nt、約7,000nt~約8,000nt、約7,000nt~約9,000nt、約7,000nt~約10,000nt、約7,000nt~約11,000nt、約7,000nt~約12,000nt、約7,000nt~約13,000nt、約7,000nt~約14,000nt、約7,000nt~約15,000nt、約7,000nt~約16,000nt、約8,000nt~約9,000nt、約8,000nt~約10,000nt、約8,000nt~約11,000nt、約8,000nt~約12,000nt、約8,000nt~約13,000nt、約8,000nt~約14,000nt、約8,000nt~約15,000nt、約8,000nt~約16,000nt、約9,000nt~約10,000nt、約9,000nt~約11,000nt、約9,000nt~約12,000nt、約9,000nt~約13,000nt、約9,000nt~約14,000nt、約9,000nt~約15,000nt、約9,000nt~約16,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、または約15,000nt~約16,000ntであり、総標的タンパク質コード配列が、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約5,000nt、約6,000nt、約7,000nt、約8,000nt、約9,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、または約15,000ntである;ならびに/または
4つの合成DNA分子によってコードされるRNA分子の合計サイズが、約10,000nt~約18,000nt、約10,000nt~約11,000nt、約10,000nt~約12,000nt、約10,000nt~約13,000nt、約10,000nt~約14,000nt、約10,000nt~約15,000nt、約10,000nt~約16,000nt、約10,000nt~約17,000nt、約10,000nt~約18,000nt、約11,000nt~約12,000nt、約11,000nt~約13,000nt、約11,000nt~約14,000nt、約11,000nt~約15,000nt、約11,000nt~約16,000nt、約11,000nt~約17,000nt、約11,000nt~約18,000nt、約12,000nt~約13,000nt、約12,000nt~約14,000nt、約12,000nt~約15,000nt、約12,000nt~約16,000nt、約12,000nt~約17,000nt、約12,000nt~約18,000nt、約13,000nt~約14,000nt、約13,000nt~約15,000nt、約13,000nt~約16,000nt、約13,000nt~約17,000nt、約13,000nt~約18,000nt、約14,000nt~約15,000nt、約14,000nt~約16,000nt、約14,000nt~約17,000nt、約14,000nt~約18,000nt、約15,000nt~約16,000nt、約15,000nt~約17,000nt、約15,000nt~約18,000nt、約16,000nt~約17,000nt、約16,000nt~約18,000nt、約17,000nt~約18,000nt、約10,000nt、約11,000nt、約12,000nt、約13,000nt、約14,000nt、約15,000nt、約16,000nt、約17,000nt、または約18,000ntである、
実施形態3および4から24までのいずれか1つの組成物。
61.第1の二量体形成ドメインおよび第2の二量体形成ドメイン、第3の二量体形成ドメインおよび第4の二量体形成ドメイン、および/または第5の二量体形成ドメインおよび第6の二量体形成ドメインが、それぞれ、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、実施形態1から24までおよび57から60までのいずれか1つの系。
62.各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、実施形態1から24までおよび57から61までのいずれか1つの系。
63.RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、実施形態1から24までおよび57から62までのいずれか1つの組成物。
64.合成DNAが、逆転写酵素によるRNAウイルスゲノムの転写によって生じたものである、実施形態25から30までおよび44から45までのいずれか1つの組成物、実施形態31から43までのいずれか1つの系、または実施形態47から50のいずれか1つの方法。
(実施例1)
合成RNA二量体形成および組換えドメイン
図1Aは、ベクター設計(左)ならびにRNA相互作用およびスプライシング(右)の概略図を示す。左:5’トランススプライス(trsp)DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。RFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、YFPのN末端部分(n-yfp)、続いて、スプライスドナー配列(SD)、下流イントロンスプライシングエンハンサー(DISE)、および2つのイントロンスプライシングエンハンサー(2×ISE)、結合ドメイン(BD、二量体形成ドメインとも称される)、および安定なステムループボックスBエレメント(ボックスB)、自己切断性ハンマーヘッド型リボザイム(HHrz)、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。n-yfpセグメントには小さなイントロンが挿入されている(n-yfp内の白色のセグメント)。3’trsp DNAベクター:白抜きの矢印は2つの反対方向のプロモーターである。BFPをコードするドメインおよびポリアデニル化エレメントを伴う3’UTRは、相補的結合ドメイン(抗BD、二量体形成ドメインとも称される)、続いて、3つのイントロンスプライシングエンハンサー配列(3×ISE)、分岐点(BP)、ポリピリミジントラクト(PPT)、スプライスアクセプター配列(SA)、YFPコード配列のC末端部分、最後にポリアデニル化エレメントを含有する3’UTRから反対方向に発現される。右:YFPタンパク質をコードするmRNAが生成されるプレmRNA相互作用(5’trsp-RNA+3’trsp-RNA)およびトランス-スプライシングが示されている。
図1Bは、N末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。20kのRFP+細胞を示すフローサイトメトリー。
図1Cは、C末端発現プラスミドのみのトランスフェクションではYFP蛍光がもたらされないことを示す。20kのBFP+細胞を示すフローサイトメトリー。
図1Dは、結合ドメインを有さないN末端断片およびC末端断片の発現では、低レベルのYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Eは、ループ状構成の合理的に設計された二量体形成/結合ドメインを示す。排他的にピリミジンまたは排他的にプリンを含有する低多様性配列のセグメントの間を安定なステム配列が占める。RNAフォールディング予測により、結合ドメインとその相補配列の間の塩基対合に利用可能な、6つの、開いた一続きの配列が示される(1~6の番号が付されている)。
図1Fは、6つの、開いた一続きの配列(1~6の番号が付されている)を示す、「ループ状」二量体形成ドメイン構成の3Dレンダリングを示す。
図1Gは、C末端側半分に結合ドメインを有さない陰性対照を示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Hは、N末端側半分に結合ドメインを有さない陰性対照を示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1Iは、N末端側半分およびC末端側半分の両方におけるマッチする結合ドメインにより、細胞の90%において強力なYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図1J~1Nは、完全に開いた構成をもたらす、一続きの、150個の排他的にピリミジンまたは排他的にプリンを含有する低多様性配列を有する結合ドメインの構成についての図1E~1Iにおけるものと等価のデータを表す。
図1Oは、図1Gに示されている細胞についての代表的な蛍光画像を示す。
図1Pは、図1Lに示されている細胞についての代表的な蛍光画像を示す。
図1Qは、図1D、図1G~1I、および図1L~1Nに示されている条件の比較を示す。YFP誘導係数が算出される:(#R+Y+÷#R+Y-)×100×med.Y-fluor(R+Y+)。N末端上のネイティブなイントロン(マウスパルブアルブミン遺伝子のイントロンI)およびC末端断片上のそのイントロンに対して最適化された結合ドメインの組換え効率の比較について示されている(白色の棒)。これにより、最適化された合成RNA二量体形成および組換えドメインが有益であることが例示される。
(実施例2)
3つの合成断片からのタンパク質の再構成
図2Aは、例示的なベクター設計の概略図を示す。YFPのタンパク質コード配列をN末端断片、中間断片(m-yfp)およびC末端断片に分割する。n断片とm断片の結合部をループ状設計の結合ドメイン(BD1)によって結合し、m断片とc断片の結合部をループ状結合ドメイン(BD2)によって結合する。ピリミジン(Y)配列およびプリン(R)配列を、m断片の自己環状化が回避され、また、N断片とC断片の直接組換えが回避されるように配置する。N末端断片をトランスフェクション対照としての赤色蛍光タンパク質と共発現させ、C末端断片をトランスフェクション対照としての青色蛍光タンパク質と共発現させる。
図2Bは、3つの断片上のマッチする結合ドメイン全てにより、細胞の80%において強力なYFP誘導が示されることを示す。20kのBFP+細胞についての赤色蛍光値および緑色蛍光値を示すフローサイトメトリー。
図2Cは、n断片およびm断片のみの発現ではYFP蛍光が示されないことの代表的な蛍光画像を示す(陰性対照)。
図2Dは、m断片およびc断片のみの発現ではYFP蛍光が示されないことの代表的な蛍光画像を示す(陰性対照)。
図2Eは、3つの断片全ての共トランスフェクションによって強力なYFP蛍光が誘導されることを示す代表的な蛍光画像を示す。
(実施例3)
2つの部分に分けられ再構成された全長YFPのin vivo送達
2つの断片からのYFPコード配列の再構成は、1つがYFPのN末端をコードする半分の断片を含み、1つがC末端をコードする半分の断片を含む、2つの合成RNA配列(図3A)(配列番号1および2)を使用することによって実現される。各断片が、マウス新生仔(P3)への全身(iv)投与後にAAV2/8から発現された。マウス当たり、2つの断片のそれぞれについて合計1.88×1011個のウイルスゲノムを投与した。3週間後に蛍光顕微鏡法を使用して肝臓、心筋、および骨格筋におけるYFPの発現を検出した。
図3Bに示されている通り、若齢マウスの肝臓において全長YFPの発現が検出されたが、注射していない肝臓ではYFP発現は示されなかった。
図3Cに示されている通り、若齢マウスの心筋において全長YFPの発現が検出されたが、注射していない心筋ではYFP発現は示されなかった。
図3Dに示されている通り、肢の骨格筋において全長YFPの発現が検出されたが、注射していない肝臓ではYFP発現は示されなかった。
したがって、本明細書に開示される系を使用して、in vivoにおいて2つまたはそれよりも多くの別々の合成RNA分子から全長タンパク質を発現させることができる。
(実施例4)
3つの部分に分けられ再構成された全長YFPのin vivo送達
3つの断片からのYFPコード配列の再構成は、1つがYFPのN末端断片を含み、1つがYFPの中間断片を含み、1つがC末端断片を含む、3つの合成RNA配列(図4A)(それぞれ配列番号145、146および2)によって実現される。
各断片が、マウス新生仔(P3)の前脛骨筋(e tibialis anterior muscle)への筋肉内注射後にAAV2/8から発現された。断片それぞれについて合計1×1011個のウイルスゲノムを筋肉内投与した。3週間後に蛍光顕微鏡法を使用して骨格筋におけるYFPの発現を検出した。
図4Bに示されている通り、全長YFP蛍光の発現が前脛骨筋において観察された。
したがって、本明細書に開示される系を使用して、in vivoにおいて3つまたはそれよりも多くの別々の合成RNA分子から全長タンパク質を発現させることができる。
(実施例5)
再構成された全長タンパク質のin vivo送達
in vivoにおける3部分sRdR系の実現性を実証するために、YFPの断片を含有する2つまたは3つのいずれかのAAV移入プラスミド(AAVのDNA前駆体プラスミド)の組合せを成体マウスの後肢の前脛骨筋(TA)に経皮的に電気穿孔により導入した。筋肉内電気穿孔の5日後に、2つの部分に分割したYFP系ならびに3つの部分に分割したYFP系の両方の効率的な再構成が観察された(図5A~5F)。
図5A~5Fは、成体マウス前脛骨筋における2つの断片からおよび3つの断片からのYFPの効率的な再構成を表す。図5Aは、合成RNA二量体形成および組換えドメインを備えたYFPコード配列のN末端側半分およびC末端側半分を示す。図5Bは、これらの2つの断片を発現する2つのAAV移入プラスミドを成体マウス前脛骨(TA)筋に経皮的に電気穿孔により導入し、電気穿孔の5日後に強力な蛍光が検出されたことを示す。図5Cは、反対側の注射していないTAでは蛍光は検出可能でなかったことを示す。図5Dは、N末端、中間、およびC末端YFPコード配列が、各断片をその隣接する断片(複数可)に結合する合成RNA二量体形成および組換えドメインを備えていることを示す。図5Eは、これらの3つの断片を発現する3つのAAV移入プラスミドの経皮的な電気穿孔を示す。3つの断片からのYFPの効率的な再構成を示す強力なYFP蛍光が検出される。図5Fは、反対側の注射していないTAにおける蛍光を示す。コンテキストとして蛍光チャネルがグレースケール写真に重ね合わせられている。
2つまたは3つのベクターを使用して、肝臓、心筋(cardiac muscle)および骨格筋(2つのAAVベクター)、ならびに骨格筋(3つのAAVベクター)においてYFPを首尾よく発現させた。
したがって、本明細書に提示される合成RNA二量体形成および組換え系を筋肉において配置することができる。これらの結果に基づいて、YFPコード配列をジストロフィン(または他の遺伝子)コード配列で置換して、所望の対象および/または組織におけるAAVからの治療用全長ジストロフィン(または他の遺伝子)発現を実現することができる。
(実施例6)
DMDを処置するための、再構成された全長ジストロフィンの送達
デュシェンヌ型筋ジストロフィー(DMD)に罹患している患者に対する全長ジストロフィンを使用した効果的な遺伝子療法は依然として困難なままであり、それは、この大きなタンパク質のコード配列が大多数のウイルスベクターの容量を超えるからである。遺伝子置換療法における一般的かつ好ましい遺伝子送達方法はアデノ随伴ウイルス(AAV)である。AAVは、無毒性であり、忍容性が良好であり、また、ゲノムへのランダムな組込みを伴わずに置換遺伝子の長期にわたる発現をもたらす。しかし、ジストロフィン遺伝子は、単一のウイルスによって送達するには大きすぎる。断片に分解する場合、全長ジストロフィンは、最低3つのウイルスを使用することでのみ送達することができる。「マイクロジストロフィン」または「ミニジストロフィン」と称されるより小さなバージョンのジストロフィンが現在ジストロフィン遺伝子置換療法に関して試験されているが、これらの短縮されたバージョンのジストロフィンは、タンパク質のロッドおよびヒンジ区画内の重要なドメインが欠如しているので、完全な機能性を有さないことが予測される。現在まで、この制限を克服するための過去の試みでは、DMDを処置するために必要な効率は得られていない。
ジストロフィンを含めた大きな遺伝子のコード配列を複数の一連の断片から効率的に再構成するために使用することができる新規の技術が本明細書に提示される。この技術を送達ベクターとしてのAAVと組み合わせて使用することで、全長ジストロフィンがDMDのマウスモデル(ならびにブタおよびイヌモデル)において発現される。一実施例では、対象はDMDを有するヒト成人、若年、または乳児である。例えば、本明細書に開示される方法および系を使用して、全長ジストロフィンをコードする合成RNA二量体形成および組換えドメインを2つまたは3つのAAVによって送達することができる(例えば、各AAVにより全長コード配列の半分または3分の1を送達する)。一実施例では、AAVは、筋指向性AAV(例えば、筋肉に優先的に感染するもの)。この手法を使用して、DMDのマウスまたはイヌモデルにおいて、ならびにヒト対象においてジストロフィーの症状を好転させるかまたはその発症を防止することができる。
パート1:効率的に再構成される3分割ジストロフィン発現カセットを構築する。in vitroにおいて全長ジストロフィンコード配列を効率的に再構成すると同時に、個々の発現カセットがそれぞれ従来のAAVベクターのパッケージングの制限の範囲内に入る3つの発現カセットを構築する。治療的に有効なレベルのジストロフィンを実現するために、ジストロフィンのおよそ生理的なレベルまたは適度に超生理的なレベルが実現されるように発現系を最適化することができる。ジストロフィンの最大50倍の過剰発現が許容され、有害作用は伴わない。ジストロフィンコード配列をその長さに沿って複数の異なる点で分割することができる。しかし、再構成の効率は局所的なRNA微小環境の影響を受け、再構成効率の極大化は、いくつかの可能な分割点での効率を比較することによって経験的に行われる。天然のジストロフィンコード配列を最適な発現のためにコドン最適化し、最大の再構成効率に適応するように改変することができる。本明細書に開示される合成RNA二量体形成および組換え手法を使用して3分割前駆体から全長ジストロフィンコード配列を再構成することができることが予想される。異なる構成のスクリーニングにおいて、最も効率的なジストロフィンの再構成(例えば、ほぼ生理的または適度に超生理的なレベル)をもたらす3つの発現カセットのセットを選択する。HEK293T細胞またはヒト骨格筋細胞(HSkMC、初代またはトランス分化させたもの)において実験を実施することができる。内因性定量的RT-PCRプローブと外因性特異的定量的RT-PCRプローブとを使用し、外因性ジストロフィンタンパク質におけるエピトープタグの検出およびウエスタンブロット分析により、異なる構成の分割/再構成されたジストロフィンの再構成効率を決定する。
パート2:再構成されていない断片に対する全長ジストロフィン発現を最大にする。再構成されていないジストロフィンの断片化されたバックグラウンド発現の抑制を、合成RNA二量体形成および組換えドメインを改変することによって実現することができる。RNA組換えが無効であることによって引き起こされる再構成されていない断片の発現により、ジストロフィン断片のバックグラウンド発現がもたらされ得る。さらに、この断片化されたバックグラウンド発現抑制を、合成RNA二量体形成および組換えドメインを改変することによって実現することができる。本明細書に開示される手法を用いて、ジストロフィンの各断片を別々に転写する。RNAレベルで再構成が起こる。したがって、個々の断片がそれぞれ、再構成されることなく潜在的に翻訳され得る。ウエスタンブロットにおいて、全長ジストロフィンはおよそ430kDaで泳動氏、これらの断片はその約2/3(約290kDa)および1/3(約140kDa)のサイズで泳動する。再構成されていない断片の発現が回避され、ジストロフィンの全長発現が選好されるように合成RNA二量体形成および組換えドメインを最適化することができる。これは、例えば、デグロン配列を戦略的に配置すること、組み換えられていない断片のRNA核外移行を妨害すること、およびデコイ翻訳開始点を導入することによって実現することができる。実験をHEK293TおよびHSkMCに対して行う。ジストロフィンコード配列を、ウエスタンブロット分析を使用してジストロフィンの十分に再構成されていない断片を同定および定量化することを可能にするエピトープタグでブックエンドすることができる。これらのジストロフィン断片の細胞分布をヒト骨格筋細胞における免疫組織化学的検査を使用して評価する。さらに、定量的RT PCR組換え結合部を使用して、RNAレベルで効率的な再構成がどのくらい起こるかを決定することを含め、従来の分子生物学技法を使用して断片抑制の定量的評価を行う。断片化されたジストロフィン発現が低レベルで観察されることが予想される。合成RNA二量体形成および組換えドメインを改変することにより、これらの断片を抑制することができる。
パート3.in vitroおよびin vivoにおける発現のための全長ジストロフィンモジュールの高力価AAVストックを創出する。ジストロフィンを発現するAAVを高純度および3×1013GC/mlよりも多いウイルスゲノム計数で作製する。3つの筋指向性AAV血清型を作製する:AAV2/8、AAV2/9、およびAAV2/rh10。3部分に分割された蛍光タンパク質、エピトープタグでブックエンドされた、3部分に分割された全長ジストロフィン(上のパート2を参照されたい)、および、タグ付けされていない、3部分に分割された全長ジストロフィンを作製し、その結果、27種の高力価AAV調製物が生じる。治療用AAV粒子の全身送達には高濃度の大きなウイルス調製物が必要である。3つの別々のウイルスからのジストロフィンの再構成された発現を実現するために、ウイルスの反復投与を実施することができる。HEK293T細胞におけるAAV産生。イオジキサノールまたはCsCl精製。全てのバッチをin vitroにおいてHEK293Tおよびヒト骨格筋細胞で試験する。パート1および2における概説の通り、再構成効率および望ましくない断片発現を評価する。
パート4.in vivoにおけるFLD-AAVモジュールの発現/再構成レベルならびにin vivoにおける全長ジストロフィンを発現するAAVモジュールの組織分布を測定する。これらを、代理指標として3部分に分割された蛍光タンパク質に関して評価する。in vivo送達に関しては、新生マウスおよび若齢マウスにおける直接筋肉内送達(心筋および骨格筋)と全身性静脈内送達を比較する。上記の実施例において示されている通り、FLD-AAVの直接筋肉注射により全長ジストロフィンの効率的な発現がもたらされ得る。FLD-AAVの全身送達を免疫組織化学的検査およびウエスタンブロット分析を使用して調査する。新生マウスおよび若齢マウスにおける直接筋肉内送達および全身性静脈内送達を含めた異なる投与経路を比較する。この分析は以下に焦点を当てる:(1)骨格筋(主要な前肢、後肢、肩、腹部および顔の筋肉)、および速筋と遅筋とでの示差的感染力(differential infectivity)を、前脛骨筋とヒラメ筋を比較することによって評価する、(2)心筋(cardiac muscle)における発現、ならびに(3)肝臓における発現。この動物のコホートを高力価AAV注射に関する可能性のある有害作用についてモニタリングする。
AAVの直接筋肉注射はFLD-AAVモジュールを送達するための手法であるが(図5A~5Fにおける結果が上首尾である可能性があることを踏まえて)、それにもかかわらず、臨床的展望から、ウイルスの全身性i.v.送達を使用して全長ジストロフィン発現を実現することが望ましい。in vitroにおけるFLD-AAV試験を使用して、AAVコピー数と再構成されるジストロフィンレベルがどのように相関するかを決定する。組織分布および再構成の効率をin vivoで評価し、また、最適な組織分布を実現するために異なる送達パラダイム(例えば、血清型、ウイルス力価、適用の経路、繰り返し適用の数)を調査する。組織カバレッジおよび発現レベルを評価する。筋線維の一部しかジストロフィンを発現しない場合であっても(例えば、非ストレス条件下で心筋細胞の約50%のみでジストロフィンが欠損している正常な心機能)、有益な転帰を実現することができる。生理的なレベルのジストロフィンおよび超生理的なレベルのジストロフィンのどちらにも治療的価値がある。定量的評価をパート1および2に概説の通り実施する。in vivoにおける筋肉内ウイルス適用および全身性ウイルス適用を新生仔マウスまたは若齢マウスに対して無菌条件下で実施する。
パート5.FLD-AAVを用いてDMDマウスモデル(mdx)を処置し、疾患の発症/進行を評価する。新生仔mdxマウスにおけるFLD-AAV送達により、ミオパチーおよび心筋症の発症および進行が防止され得る。再構成された全長ジストロフィンのウイルスによる送達の最適化(パート1~4)の後、FLD-AAVによる処置をDMDのマウスモデルに施行する。これらのマウスは、それらが交配される遺伝的背景に応じて、ヒトDMDよりもあまり目立たないミオパチーを示す。より重症の表現型を示す遺伝的背景を有するマウス(D2.B10-Dmdmdx)では、後肢衰弱、筋重量減少、筋線維の減少、ならびに脂肪および線維症の増加が示される。これらのパラメータを野生型対照マウス、処置されたmdxマウス、および処置されていないmdxマウスの間で比較することができる。所望の転帰は疾患の発症/進行の好転または防止である。
ジストロフィン遺伝子に変異を有する2種のマウス系統、C57BL/10ScSn-Dmdmdx/J、およびD2.B10-Dmdmdx/Jを使用する。FLD-AAVを、パート4の下で記載されている確立されたパラメータに従って送達する。動物に、出生後第1週に、mdxマウスにおける筋壊死の発症前の時間ウインドウ内に注射を行う。野生型マウス、処置されたmdxマウスおよびビヒクル/擬処置されたmdxマウスを、骨格および心臓のミオパチーに関する行動および解剖学的徴候について評価する。運動学的および筋電図記録試験装置を使用して、平均台、握力、水平はしご、トレッドミルスピード負荷、地上での自発運動の運動学的評価、および水泳の運動学的評価(周辺温度および冷水負荷)などの種々の運動課題に関するこれらのマウスの成績を評価する。化学的負荷後にmdxマウスにおいてFLD-AAV治療により心筋症が示されることを防止できるかどうかを決定する。
これらの実験の所望の転帰は疾患の発症/進行の好転または防止である。
(実施例7)
再構成された全長MYO7Aの送達によりアッシャー症候群を処置する
MYO7Aコード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。MYO7Aの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、MYO7Aの両半分が組み換えられて全長MYO7A転写物が形成され、次いでそれがタンパク質に翻訳される。
(実施例8)
転写/発現論理ゲート
標的遺伝子を2つの非機能性の半分に割り、それを2つの異なるプロモーターから、または2つの異なる送達ビヒクルを使用して発現させることにより、交差発現パターンをもたらすことができる。
例えば、本明細書に提示される第1の合成核酸分子のプロモーター1により、例えば、細胞型A、B、およびCにおけるコード配列のN末端側半分の発現を駆動することができ、一方、本明細書に提示される第2の合成核酸分子のプロモーター2により、細胞A、D、E、およびFのサブセットにおけるC末端側半分の発現を駆動する。そのような実施例では、標的タンパク質をコードするエフェクター遺伝子は重複する領域(本実施例では細胞集団A)においてのみ発現される。
両半分を条件付きで、例えば、リコンビナーゼの存在下で発現されるようにすることにより、同様の交差性を使用することができる。別のレベルでは、両半分を、異なるトロピズムを有する2つのウイルスを用いて送達することによって交差性を実現することができる。
(実施例9)
相補性
本明細書に開示される方法および系を使用して、別々のプラスミドに、両方のプラスミドが存在する場合にのみ活性になる2つの非機能性の半分をコードさせることにより、任意の遺伝子(および対応する標的タンパク質)を相補性の部分にすることができる(LacZのアルファ相補性の原理と同様)。
(実施例10)
トリガーRNA
本明細書に開示される系および方法を、標的タンパク質のコード配列の2つまたはそれよりも多くの部分の再構成が特定の「トリガー」RNA分子の存在に依存するように構成することができる。図7Bに示されている通り、本実施例では、各合成核酸分子の二量体形成ドメインは互いに逆相補物ではないが、その代わりに、2つの合成核酸分子に架橋してひとつにする橋としての機能を果たす「トリガーRNA」である第3のRNA分子の隣接する領域と特異的にハイブリダイズする。この例では、系により、レポーター/エフェクタータンパク質の「細胞型特異的誘発」を可能にする特定のRNA分子の存在を「報告」することができる。
(実施例11)
3’-UTRへの安定化エレメントの包含
本実施例では、RNAを安定化する3’-UTR内の配列の存在下での分割されたコード配列の組換えを評価するために使用する方法を記載する。ウッドチャック肝炎転写後調節エレメント3(WPRE3)を例示的な安定化配列として使用した。WPRE3の代わりに他のRNA配列安定化物質を使用することができることが当業者には理解されよう。
本明細書に開示される合成RNA二量体形成および組換え手法を使用して再構成される二方向分割YFPについてのYFP蛍光中央値をフローサイトメトリーによって測定した。C末端YFPコード断片の後にはポリアデニル化シグナルのみが続くか(WPRE3なし)、または短縮されたバージョンのウッドチャック肝炎転写後調節エレメント、WPRE3が続き、その後、ポリアデニル化シグナルが続く(WPRE3で標識する)。N末端YFPコード断片を双方向プロモーターからトランスフェクション対照としての赤色蛍光タンパク質と共発現させる。C末端断片を双方向プロモーターからトランスフェクション対照としての青色蛍光タンパク質と共発現させる。赤色蛍光対照値と青色蛍光対照値が等しい細胞を条件間で比較する。
図8に示されている通り、3’-UTRに安定化エレメントを含めることにより、組み換えられた全長YFPの発現効率が約50~60%上昇した。この増強は、WPRE配列により、WPRE配列が含有されるRNA分子の核外移行が刺激され、このRNA分子の核外移行は、スプライソソーム媒介性RNA結合が起こり得る前に図6Aの分子150が核外に運ばれ、したがって分子150が非機能的になることによってRNA結合反応(したがって、遺伝子発現)に負の影響を及ぼし得るにもかかわらず、観察される。
したがって、本明細書に開示される合成分子(例えば、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のいずれか)を、RNA配列安定化物質をさらに含むように改変することができる。
(実施例12)
結合ドメインの長さの再構成効率に対する影響
結合ドメインの長さを以下の通り評価した。YFPを2つの非蛍光の半分に分割した(配列番号1および2、結合ドメインの長さが異なる)。培養したHEK 293T細胞における異なる長さの結合ドメイン(50~500ヌクレオチドにわたる)についての再構成効率を評価した。N末端YFPを双方向CMVプロモーターからトランスフェクション対照としての赤色蛍光タンパク質(RFP)と共に発現させる。C末端YFPを双方向CMVプロモーターからトランスフェクション対照としての青色蛍光タンパク質(BFP)と共に発現させる。異なる結合ドメインの長さについて、YFP蛍光強度中央値を比較した。匹敵するRFPおよびBFPトランスフェクションレベルを有する細胞を条件間で比較する。
図11に示されている通り、全ての分子でいくらかのレベルの全長YFPの発現が実現され、再構成効率の程度は様々であった。結合ドメインの長さが150bpおよびそれよりも短い(例えば、50~150bp)場合に最大の性能が観察されたが、最大500bpの結合ドメインの長さでもなお組み換えられ、全長YFPの発現が可能であった。
(実施例13)
スプライシングエンハンサー配列の影響
本実施例では、本明細書に開示される合成イントロンに1つまたは複数のイントロンスプライシングエンハンサー配列(例えば、図6Aの118、120、156)を含めることの影響を評価するために使用する方法を記載する。
YFPを2つの非蛍光の半分に分割した(図12A)。培養したHEK 293T細胞における異なるイントロン構成についての再構成効率を評価した。N末端YFPを双方向CMVプロモーターからトランスフェクション対照としての赤色蛍光タンパク質(RFP)と共に発現させた。C末端YFPを双方向CMVプロモーターからトランスフェクション対照としての青色蛍光タンパク質(BFP)と共に発現させた。異なるイントロン構成について、YFP蛍光強度中央値を比較する。匹敵するRFPおよびBFPトランスフェクションレベルを有する細胞を条件間で比較する。
図12Aに示されている通り、5’分子(配列番号1)は、YFPのN末端部分のコード領域(n-yfp)、続いて、スプライスドナー配列(SD)、下流イントロンスプライシングエンハンサー(DISE)、および2つのイントロンスプライシングエンハンサー(2×ISE)、結合ドメイン(BD)、自己切断性ハンマーヘッド型リボザイム(HHrz)、最後にポリアデニル化シグナル(pA)を含む。3’分子(配列番号2)は、相補的結合ドメイン(抗BD)、続いて、3つのイントロンスプライシングエンハンサー配列(3×ISE)、分岐点(BP)、ポリピリミジントラクト(PPT)、スプライスアクセプター配列(SA)、YFPコード配列のC末端部分、最後にポリアデニル化シグナル(pA)を含む。
図12Bに示されている通り、5’分子および3’分子の両方にスプライスエンハンサーを含めることにより、全長YFPの再構成効率が上昇する。スプライスエンハンサーを除去することにより、2つのコード配列の再構成効率が約50~90%低下する。最初の縦棒では、YFPが参照構成(配列番号1および2)を用いて再構成されており、2番目の縦棒は、5’断片のISEエレメントの欠失を伴う場合の再構成効率を示し、3番目の縦棒は、5’断片のISEおよびDISEの欠失後の再構成効率を示す。4番目の縦棒は、5’断片のHHrzの欠失後の再構成効率を示す。5番目の縦棒は、参照構成を使用した再構成効率を示す。6番目の縦棒は、3’断片のISEエレメントの欠失後の再構成効率を示す。7番目は5’断片および3’断片の両方のISEならびに5’断片のDISEの欠失後の再構成効率を示す。
(実施例14)
デュアル投影追跡
本実施例では、2つの断片(配列番号147および148)からの全長flpリコンビナーゼ(Flpo)の再構成によるデュアル投影追跡を実施するための方法を記載する。図13Aに示されている通り、Flpリコンビナーゼ遺伝子を2つの非機能性の半分に分割した。Flpo遺伝子のN末端側半分をその3’末端において合成イントロン配列、続いて二量体形成ドメイン配列(RNA末端結合モジュール、REJ)と結合した。Flpo遺伝子のC末端側半分をその5’末端において合成イントロンおよび二量体形成ドメイン(REJ-モジュール)と結合した。細胞に両方の構築物が感染し、各構築物からプレmRNAが発現されると、プレmRNAが二量体形成ドメイン(図13Aにおいて濃い並行した棒によって示されている)で結合し、得られた複合体がスプライスされて全長FlpoリコンビナーゼmRNA転写物が生じる。したがって、2つの断片の再構成によって機能的なリコンビナーゼタンパク質が生じた。図13Bは、flpo依存性赤色蛍光タンパク質(tdTomato)(Rosa-CAG-frt-STOP-frt-tdTomato)を有するflp活性レポーターマウスの概略図を示す。2つの合成核酸(DNA)構築物を別々のアデノ随伴ウイルス(逆行輸送される血清型AAV2/retro)にパッケージングした。第1の構築物を運ぶウイルスであるAAV2/retro-n-flpoをマウスの左一次運動野に注射し、第2の構築物を運ぶウイルスであるAAV2/retro-c-flpoをマウスの右一次運動野に注射した。
図13C~13Dに示されている通り、軸索が正中線を交差している一次運動野細胞が赤色蛍光タンパク質で標識される(図13Cおよび13Dにおいて白色に見える)。コンテキストとしてHoechst染色(核)が示されている。
(実施例15)
in vivoにおける長いタンパク質の発現
本実施例では、細胞培養物中およびマウス一次運動野におけるin vivoでの特大カーゴの効率的な発現を実現するために使用する方法を記載する。
2つのウイルスのアデノ随伴ウイルス(AAV)カーゴ容量をいっぱいにする(すなわち、単一のAAVのパッケージング容量を超える)、疾患を引き起こす大きな遺伝子をシミュレートするために、分割したYFPコード配列を大きな中断なしのオープンリーディングフレームの内部に包埋した。N末端(すなわち、5’側)では、2A自己切断性ペプチドをコードする配列が後に続く長いスタッファー配列(すなわち、中断なしのオープンリーディングフレーム)にYFPコード配列の第1の部分が隣接する。C末端(すなわち、3’側)では、YFPコード配列の第2の部分の後に2A自己切断性ペプチドコード配列が続き、次いで、長いスタッファー配列(すなわち、および中断なしのオープンリーディングフレーム)が続く(図14A)。プレmRNA分子をコードする第1の合成DNA分子および第2の合成DNA分子が、プロモーター配列を除いて、配列番号22および23に示されている。得られる発現されたRNA分子はそれぞれ配列番号22の1位にある転写開始部位および配列番号23の1位にある転写開始部位とポリA尾部の間の約4000ntである。得られる転写されたプレmRNA分子(5’断片;配列番号22から転写される)は、スタッファーオープンリーディングフレームを含有し、その後には自己切断性2Aペプチドコード配列が続き、その後、YFPのN末端部分をコードする配列が続き、その後、合成イントロンおよび二量体形成ドメイン(キッシングループアーキテクチャを有する)、ならびにポリA尾部が続く。C末端プレmRNA分子(3’断片;配列番号23から転写される)は、相補的なキッシングループ二量体形成ドメイン、合成イントロン配列、その後のC末端YFPコード配列、その後の自己切断性2Aペプチドコード配列、その後のスタッファーオープンリーディングフレーム、その後のポリA尾部で構成される。
プレmRNA分子が産生された後、二量体形成ドメインが結合し、スプライシングによりプレmRNAが結合して全長mRNAが生じる。翻訳の間に、YFPに隣接する2A切断配列によりN末端スタッファー配列およびC末端スタッファー配列の切断ならびに機能的YFPタンパク質の産生がもたらされる。
RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’加水分解)定量的リアルタイムPCRアッセイを使用する。第1のアッセイは、3’エクソンYFP配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンYFP配列と3’エクソンYFP配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。
HEK 293T細胞における特大YFP構築物の再構成効率の定量的リアルタイムPCR分析を実施した。全長特大YFPを参照として使用する。全長特大YFP比を1に設定する(図14B)。再構成された比を、全長に対する分率として表す(標識された分割-REJ(分割RNA末端結合))。再構成効率は以下の通り算出される:結合部/3’プライム。図14Bに示されている通り、分割-REJ系でRNAの約60%が結合した。
全長特大YFP発現および分割-REJ発現からの再構成されたYFPタンパク質の発現を、一過性にトランスフェクトされたHEK 293T細胞のフローサイトメトリーによって評価した。図14Cに示されている通り、分割REJ系により、大きなカーゴであっても約45%の結合効率が実現された。
大きなYFPタンパク質の再構成に関するin vivo分析を以下の通り実施した。3×109vg/注射/断片を含有するアデノ随伴ウイルス2/8を60nl、マウスの一次運動野に注射した。注射の10日後に組織を回収した。図14Dに示されている通り、バルク組織においてYFP蛍光が容易に検出可能である(左上、中央上のパネル、マウス脳の肉眼で見える上面図、YFP蛍光に加えてコンテキストとして自家蛍光が示されている)。運動野の層5内のウイルス注射部位およびその周囲において強力なYFPシグナルが検出される(右側のパネル、皮質層に1~6の番号が付されている、おおよその注射の深さが灰色の棒で示されている、スケールバー=100マイクロメートル)。したがって、本明細書に開示される系を使用して、大きなタンパク質をin vivoで発現させることができる。
(実施例16)
第VIII因子の発現
本実施例では、全長ヒト凝固第VIII因子(FVIII)の効率的な再構成を実現するために使用する方法を記載する。
図15Aに示されている実験に使用した5’核酸分子および3’核酸分子の概略図(プレRNA分子をコードするDNAがそれぞれ配列番号24および25に記載されている)。各半分が約3.8kbのFVIIIコード配列を含む。得られる、FVIIIコード配列のRNA5’配列を含有するN末端側半分(例えば、図6Aの110に概略的に示されている)はその後に効率的な合成イントロンおよび二量体形成ドメイン(キッシングループアーキテクチャ)、ならびにポリA尾部が続く。FVIIIコード配列の3’配列を含有するC末端側半分(例えば、図6Aの150)はその前に相補的なキッシングループ二量体形成ドメイン、および効率的な合成イントロン配列がある。RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’-加水分解)定量的リアルタイムPCRアッセイを使用する。第1のアッセイは、3’エクソンFVIII配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンFVIII配列と3’エクソンFVIII配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。
HEK 293T細胞における発現の2日後の再構成効率のPCRによる定量化を実施した。全長FVIIIを参照として使用する。全長FVIII比を1に設定する。再構成されたFVIIIアッセイ比を全長に対する分率として表す(分割-REJで標識)。図15Bに示されている通り、約40~60%の再構成効率が実現された(つまり、2つのRNAのうちの約40~60%が分割-REJ系において結合された)。
in vitroにおけるFVIIIの発現を実証するためにウエスタンブロッティングを使用した。FVIIIのN末端にHAタグでタグ付けした。構築物を2日間にわたってHEK 293T細胞において発現させる。図15Cに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長FVIIIが首尾よく発現された。
これらの知見に基づいて、例えば、血友病Aを処置するために、in vivoにおける全長FVIIIタンパク質の発現を実現することができる。例えば、FVIIIコード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。FVIIIの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、FVIIIの両半分が組み換えられ全長FVIII転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端FVIIIコード配列を含む、配列番号24に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端FVIIIコード配列を含む配列番号25をin vivo発現に利用することができる。
(実施例17)
Abca4の発現
本実施例では、全長ヒトATP結合カセットサブファミリーAメンバー4(Abca4)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’分子および3’分子の概略図が図16A示されている(プレRNA分子をコードするDNAはそれぞれ配列番号20および21に記載されている)。5’側半分は約3.6kbのAbca4コード配列を含み、3’側半分は約3.2kbのAbca4コード領域とそれに加えてC末端3×FLAGタグを含む。5’側配列は、コード配列のN末端側半分、その後に効率的な合成イントロン配列および第1の二量体形成ドメイン(キッシングループ)を含有する。コード配列のC末端側半分を含有する3’側配列の前には相補的な(キッシングループ)二量体形成ドメインおよび効率的な合成イントロン配列がある。結合部にわたるサンガーシーケンシングトレースが示されている。
図16Bに示されている通り、結合部のPCR増幅により、2つのコード配列の忠実な結合が実証される。RNAレベルでの再構成効率を決定するために、2つのプローブに基づく(5’-加水分解)定量的リアルタイムPCRアッセイを使用する(図16C)。第1のアッセイは、3’エクソンAbca4配列に完全に含有される配列にわたる(3’プローブで標識)。第2のアッセイは、5’エクソンAbca4配列と3’エクソンAbca4配列の結合部にわたる(結合部プローブで標識)。再構成効率は(結合部プローブ計数)/(3’プローブ計数)の比として算出される。HEK 293T細胞における発現の2日後の再構成効率のPCRによる定量が図16Dに示されている。全長Abca4を参照として使用する。平均全長Abca4比を1に設定する。再構成されたAbca4アッセイ比を全長に対する分率として表す(分割-REJで標識)。図16Dに示されている通り、約35%の再構成効率が実現された(つまり、2つのRNAのうちの約30~40%が分割-REJ系において結合された)。
in vitroにおけるAbca4の発現を実証するためにウエスタンブロッティングを使用した。Abca4のC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図16Eに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Abca4が首尾よく発現された。
ウエスタンブロットの定量が図16Fに示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。各試料におけるBFP濃度をドットブロットによって決定し、条件間での正規化に使用した。図16Fに示されている通り、再構成されたAbca4が直接全長発現と比較しておよそ40%のレベルで発現される。したがって、ウエスタンブロットによって決定されるタンパク質レベルによりqPCRによって決定されるRNA再構成効率がよく追跡される。
これらの知見に基づいて、例えば、スタルガルト病を処置するために、in vivoにおける全長ABCA4タンパク質の発現を実現することができる。例えば、ABCA4コード配列の第1の半分を合成RNA二量体形成および組換えドメインに付加し、第1のベクター/プラスミドから発現させる。ABCA4の第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、ABCA4の両半分が組み換えられ全長ABCA4転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端Abca4コード配列を含む、配列番号20に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列(図10R~10U)、およびC末端Abca4コード配列を含む配列番号21(図10V~10Z)をin vivo発現に利用することができる。
(実施例18)
Otofの発現
本実施例では、全長マウスオトフェルリン(Otof)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号155および156に示されている。5’側半分は約3.5kbのOtofコード配列を含み、3’側半分は約2.5kbのOtofコード領域とそれに加えてC末端3×FLAGタグを含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。ヒトOTOFコード配列(例えば、GenBank受託番号NM_001287489.2またはNM_194248.3)で配列番号155および156のマウスコード配列を置換することができることが当業者には理解されよう。
in vitroにおけるOtofの発現を実証するためにウエスタンブロッティングを使用した。ウエスタンブロットによる検出のためにOtofをC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図18Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Otofが首尾よく発現された。
ウエスタンブロットの定量が図18B~Cに示されている。生の定量が左側の棒プロット(図18B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図18C)に全長対照に対する正規化された分率として示されている。図18Cに示されている通り、再構成されたOtofが直接全長発現と比較しておよそ30%のレベルで発現される。
これらの知見に基づいて、例えば、常染色体劣性聴覚消失9を処置するために、in vivoにおける全長OTOFタンパク質の発現を実現することができる。例えば、OTOFコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。OTOFの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、OTOFコード転写物の両半分が組み換えられ全長OTOF転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、聴力損失を処置するために、例えば、N末端Otofコード配列を含む、配列番号155に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端Otofコード配列を含む配列番号156をin vivo発現に利用することができる。
(実施例19)
Myo7aの発現
本実施例では、全長ヒトミオシンVIIA(Myo7a)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号157および158に示されている。5’側半分は約3.6kbのMyo7aコード配列を含み、3’側半分は約3.1kbのMyo7aコード領域とそれに加えてC末端3×FLAGタグを含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるMyo7aの発現を実証するためにウエスタンブロッティングを使用した。ウエスタンブロットによる検出のためにMyo7aのC末端に3×FLAG-タグでタグ付けする。構築物を2日間にわたってHEK 293T細胞において発現させる。図19Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Myo7aが首尾よく発現された。
ウエスタンブロットの定量が図19B~19Cに示されている。生の定量が左側の棒プロット(図19B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図19C)に全長対照に対する正規化された分率として示されている。図19Cに示されている通り、再構成されたMyo7aが直接全長発現と比較しておよそ60%のレベルで発現される。
これらの知見に基づいて、例えば、アッシャー症候群、1B型を処置するために、in vivoにおける全長MYO7Aタンパク質の発現を実現することができる。例えば、MYO7Aコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。MYO7Aの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、両半分のMYO7Aコード転写物が組み換えられ全長MYO7A転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端Myo7aコード配列を含む、配列番号157に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端Myo7aコード配列を含む配列番号158をin vivo発現に利用することができる。
(実施例20)
dCas9-VPRの発現
本実施例では、VPR転写活性化因子ドメインに融合した全長の酵素的に不活性型のCas9(dCas9-VPR)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号159および160に示されている。5’側半分は約3.3kbのDCas9-VPRコード配列を含み、3’側半分は約2.5kbのDCas9-VPRコード領域を含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるDCas9-VPRの発現を実証するためにウエスタンブロッティングを使用した。構築物を2日間にわたってHEK 293T細胞において発現させる。図20Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長DCas9-VPRが首尾よく発現された。
ウエスタンブロットの定量が図20B~20Cに示されている。生の定量が左側の棒プロット(図20B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図20C)に全長対照に対する正規化された分率として示されている。図20Cに示されている通り、再構成されたDCas9-VPRが直接全長発現と比較しておよそ35%のレベルで発現される。HEK 293T細胞においてUASを標的とするガイドRNAと共に発現させると(図20D)、全長dCas9-VPRおよび二方向分割再構成dCas9-VPRのどちらによってもUAS-YFPプラスミドからの黄色蛍光タンパク質の発現が誘導され、それにより、再構成されたdCas9-VPRの機能性が実証される。
これらの知見に基づいて、例えば、遺伝子を活性化するまたは過剰発現させるために、in vivoにおける全長DCAS9-VPRタンパク質の発現を実現することができる。例えば、DCAS9-VPRコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。DCAS9-VPRの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、DCAS9-VPRコード転写物の両半分が組み換えられ全長DCAS9-VPR転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端DCas9-VPRコード配列を含む、配列番号159に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端DCas9-VPRコード配列を含む配列番号160をin vivo発現に利用することができる。
(実施例21)
プライムエディターの発現
本実施例では、全長ヒト化Cas9プライムエディター(プライムエディター)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号161および162に示されている。5’側半分は約3.3kbのプライムエディターコード配列を含み、3’側半分は約3.0kbのプライムエディターコード領域を含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるプライムエディターの発現を実証するためにウエスタンブロッティングを使用した。構築物を2日間にわたってHEK 293T細胞において発現させる。図21Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長プライムエディターが首尾よく発現された。
ウエスタンブロットの定量が図21B~21Cに示されている。生の定量が左側の棒プロット(図21B)に全長対照に対する分率として示されている。条件間での示差的トランスフェクション効率について正規化するために、全長プラスミドおよびC末端プラスミドをトランスフェクション対照としての青色蛍光タンパク質と共発現させる。細胞を回収する前に各試料におけるBFP濃度を共焦点蛍光顕微鏡法によって決定し、条件間での正規化に使用した。正規化された定量が右側の棒プロット(図21C)に全長対照に対する正規化された分率として示されている。図21Cに示されている通り、再構成されたプライムエディターが直接全長発現と比較しておよそ60%のレベルで発現される。図21Dは、全長プライムエディターおよび二方向分割プライムエディターを使用して標的化されたGからTへの塩基転換変異を導入することができ、それにより、二方向分割プライムエディター構築物の機能性が実証されることを示す。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長プライムエディタータンパク質の発現を実現することができる。例えば、プライムエディターコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。プライムエディターの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、プライムエディターコード転写物の両半分が組み換えられ全長プライムエディター転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端プライムエディターコード配列を含む、配列番号161に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端プライムエディターコード配列を含む配列番号162をin vivo発現に利用することができる。
(実施例22)
AncBE4の発現
本実施例では、全長ヒト化Cas9シトシン塩基エディター(AncBE4)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号163および164に示されている。5’側半分は約2.4kbのAncBE4コード配列を含み、3’側半分は約3.2kbのAncBE4コード領域を含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるAncBE4の発現を実証するために、ウエスタンブロッティングを使用した。構築物を2日間にわたってHEK 293T細胞において発現させる。図22Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長AncBE4が首尾よく発現された。
ウエスタンブロットの定量が図22Bに示されている。生の定量が左側の棒プロット(図22B)に全長対照に対する分率として示されている。図22Bに示されている通り、再構成されたAncBE4が直接全長発現と比較しておよそ40~50%のレベルで発現される。図22Cは、全長および二方向分割AncBE4を使用して標的化されたCからTへの転位変異を導入することができ、それにより、二方向分割AncBE4構築物の機能性が実証されることを示す。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長ANCBE4タンパク質の発現を実現することができる。例えば、ANCBE4コード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。ANCBE4の第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、ANCBE4コード転写物の両半分が組み換えられ全長ANCBE4転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端AncBE4コード配列を含む、配列番号163に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端AncBE4コード配列を含む配列番号164をin vivo発現に利用することができる。
(実施例23)
Abe8eの発現
本実施例では、全長ヒト化Cas9アデノシン塩基エディター(Abe8e)の効率的な再構成を実現するために使用する方法を記載する。
使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号165および166に示されている。5’側半分は約2.4kbのAbe8eコード配列を含み、3’側半分は約3.2kbのAbe8eコード領域を含む。C末端側半分を含有する3’側配列(例えば、図6Aの150)の前には相補的結合ドメインおよび効率的な合成イントロン配列がある。
in vitroにおけるAbe8eの発現を実証するために、ウエスタンブロッティングを使用した。構築物を2日間にわたってHEK 293T細胞において発現させる。図23Aに示されている通り、本明細書に開示される分割-REJ系により、in vitroにおいて全長Abe8eが首尾よく発現された。
ウエスタンブロットの定量が図23Bに示されている。生の定量が左側の棒プロット(図23B)に全長対照に対する分率として示されている。図23Bに示されている通り、再構成されたAbe8eが直接全長発現と比較しておよそ70%のレベルで発現される。図23Cは、全長および二方向分割Abe8eを使用して標的化されたCからTへの転位変異を導入することができ、それにより、二方向分割Abe8e構築物の機能性が実証されることを示す。
これらの知見に基づいて、例えば、ゲノム点変異を処置するために、in vivoにおける全長ABE8Eタンパク質の発現を実現することができる。例えば、ABE8Eコード配列の第1の半分を合成RNA二量体形成および組換えドメイン(イントロンおよび結合ドメインである)に付加し、第1のベクター/プラスミドから発現させる。ABE8Eの第2の半分を相補的なRNA二量体形成および組換えドメインに付加し、第2のベクター/プラスミドから発現させる。同じ細胞において一緒に発現させると、2つのRNA分子が標的細胞において発現され、ABE8Eココード転写物の両半分が組み換えられ全長ABE8E転写物が形成され、次いでそれがタンパク質に翻訳される。例えば、N末端Abe8eコード配列を含む、配列番号165に対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する配列、およびC末端Abe8eコード配列を含む配列番号166をin vivo発現に利用することができる。
(実施例24)
RNA断片の長さが増すと二方向分割遺伝子の再構成が低減する
5’断片をコードするRNA分子および3’断片をコードするRNA分子の長さの影響を評価した。
黄色蛍光タンパク質(yfp)コード配列を2つの断片に分割した。RNAコード分子を伸長させるために、スタッファーオープンリーディングフレームをそれぞれ5’断片の5’末端および3’断片の3’末端に組み込んだ。5’yfpコード配列を、伸長させたスタッファーオープンリーディングフレームに自己切断性2A配列を介して融合した。yfpの3’yfpコード配列を伸長させたスタッファーオープンリーディングフレームに自己切断性2A配列を介して連結した。yfpの5’断片とyfpの3’断片の分割点にRNA末端結合モジュール(合成イントロンとそれに加えて結合ドメイン)を組み込んだ。自己切断性2A配列により、翻訳後にYFPタンパク質をそれぞれのスタッファーオープンリーディングフレームから分離することが可能になる。異なる長さのスタッファーオープンリーディングフレームを組み入れることにより、4種の5’断片コード構築物および4種の3’断片コード構築物をアセンブルした。これらの構築物から転写されたRNA(タンパク質コード配列とそれに加えて合成イントロンおよび結合ドメイン)の長さは、5’断片については1000nt、2000nt、3000nt、および4000ntであり、3’断片については1000nt、2000nt、3000nt、および4000ntであった。
YFP再構成の効率を全部で16種の5’断片と3’断片の対の間で比較した。この比較では、最も短い構築物(すなわち、5’-1000ntと3’-1000nt)を対にした場合にYFPが最も効率的に再構成された。より長いスタッファー配列を有する断片を対にした場合には再構成効率の低下が観察された。最も短い対(5’-1000ntと3’-1000nt)に対するパーセントとして、以下のYFP再構成効率が認められた:
5’-1000ntと3’-1000nt:100%
5’-1000ntと3’-2000nt:約40%
5’-1000ntと3’-3000nt:約20%
5’-1000ntと3’-4000nt:約16%
5’-2000ntと3’-1000nt:約55%
5’-2000ntと3’-2000nt:約30%
5’-2000ntと3’-3000nt:約20%
5’-2000ntと3’-4000nt:約15%
5’-3000ntと3’-1000nt:約60%
5’-3000ntと3’-2000nt:約40%
5’-3000ntと3’-3000nt:約25%
5’-3000ntと3’-4000nt:約20%
5’-4000ntと3’-1000nt:約40%
5’-4000ntと3’-2000nt:約35%
5’-4000ntと3’-3000nt:約20%
5’-4000ntと3’-4000nt:約15%。
これらのデータにより、分割された遺伝子の5’コード配列および3’コード配列をコードする断片の長さが増すにつれて分割された遺伝子の再構成の効率が低下することが例示される。
(実施例25)
下流イントロンスプライシングエンハンサーおよびイントロンスプライシングエンハンサー配列を用いたRNA末端結合反応の増強。
本実施例では、特定のスプライシングエンハンサー配列を組み入れることによって2つのRNA分子の効率的な結合を実現するために使用する方法を記載する。
イントロンスプライシングエンハンサー配列を選択することの特定の効果を、分割された黄色蛍光タンパク質(YFP)を三峰性キッシングループRNA二量体形成ドメインおよびイントロンセグメントの種々のライブラリーで構成されるRNA末端結合モジュールを使用して再構成するスクリーニングプラットフォームを使用して調査した。使用した5’DNA分子および3’DNA分子の配列がそれぞれ配列番号171および172に示されている(以下の表2の配列のうちの少なくとも1つ、例えば、これらの配列の1つ、2つ、3つ、4つまたは5つなど、配列内の一連のNはイントロンライブラリー配置の部位を示す)。
in vitroにおける再構成されたyfpの発現を実証するために、フローサイトメトリーを使用して、5’DNA分子および3’DNA分子をトランスフェクトしたHEK293T細胞におけるyfp蛍光強度を決定した。図24Aに示されている通り、本明細書に開示される分割-REJ系のイントロン部分を個々のセグメントに細分して、RNA結合反応を容易にする効率的なイントロンスプライシングエンハンサー配列についてスクリーニングした。構築物の5’イントロン部分の3つの位置および3’イントロン部分の3つの位置に使用した配列が配列番号173~204に示され(表2)、図24Cに列挙されている。
フローサイトメトリーの定量が図24Bに示されている。5’スプライス部位選択促進スプライシング因子TIA-1(T細胞により制限される細胞内抗原-1)の動員を刺激するためにイントロン配列を組み入れることにより、RNA末端結合を増加させることができる。一部の実施例では、WGGGモチーフを含有する配列によりRNA末端結合が増強される。
これらの知見に基づいて、in vivoにおける分割されたタンパク質全長の発現を、RNA末端結合モジュールの特定のイントロンスプライシングエンハンサー配列をイントロン部分に組み入れることによって増強することができる。例えば、配列番号173~180、182~196、または199~203のいずれか1つに対して少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%の配列同一性を有する1つまたは複数の配列(例えば、1つ、2つ、または3つの配列)をRNA末端結合反応産物のin vivo発現に利用することができる(例えば、本明細書に提示される任意の実施形態のISEとして使用することができる)。
本明細書に開示される原理を適用することができる多くの可能性のある実施形態を考慮して、例示されている実施形態は単に本発明の例であり、本発明の範囲を限定するものと解釈されるべきではないことが認識されるべきである。そうではなく、本発明の範囲は、以下の特許請求の範囲によって定義される。したがって、これらの特許請求の範囲の範囲および主旨に入る全てが本発明者らの発明であることを主張する。
特定の実施形態では、例えば以下の項目が提供される。
(項目1)
標的タンパク質を発現させるための組成物であって、
(a)第1のRNA分子であって、5’から3’に:(i)前記標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に:(i)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)前記標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む組成物。
(項目2)
前記第1の二量体形成ドメインと前記第2の二量体形成ドメインが、直接結合、間接結合、またはこれらの組合せによって結合している、項目1に記載の組成物。
(項目3)
直接結合または間接結合が、塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、項目2に記載の組成物。
(項目4)
直接結合が、キッシングループ間または低多様性領域間の塩基対合相互作用を含む、項目2または3に記載の組成物。
(項目5)
直接結合が、アプタマー領域間の非標準的な塩基対合相互作用、非標準的な塩基対合相互作用、非塩基対合相互作用、またはこれらの組合せを含む、項目2または3に記載の組成物。
(項目6)
間接結合が、核酸架橋を通じた塩基対合相互作用を含む、項目2または3に記載の組成物。
(項目7)
間接結合が、アプタマーとアプタマーの標的との間、または2つのアプタマー間の非塩基対合相互作用を含む、項目2に記載の組成物。
(項目8)
前記第1の二量体形成ドメインまたは前記第2の二量体形成ドメインが、潜在スプライスアクセプターを含まない、項目1から7までのいずれか一項に記載の組成物。
(項目9)
前記二量体形成ドメインが、アプタマー配列二量体形成ドメインと直接結合しているかまたは間接的に結合している、項目1から8までのいずれか一項に記載の組成物。
(項目10)
前記二量体形成ドメインが、キッシングループ相互作用ドメインである、項目1から9までのいずれか一項に記載の組成物。
(項目11)
前記標的タンパク質が、疾患に関連するタンパク質、または治療用タンパク質である、項目1から10までのいずれか一項に記載の組成物。
(項目12)
前記疾患が、単一遺伝子疾患である、項目11に記載の組成物。
(項目13)
前記治療用タンパク質が、毒素である、項目12に記載の組成物。
(項目14)
前記疾患および前記標的タンパク質が、表1に列挙されているものである、項目11から13までのいずれか一項に記載の組成物。
(項目15)
前記第1のRNA分子が、前記スプライスドナーに対して3’側かつ前記第1の二量体形成ドメインに対して5’側の下流イントロンスプライスエンハンサー(DISE)、前記スプライスドナーに対して3’側かつ前記第1の二量体形成ドメインに対して5’側のイントロンスプライスエンハンサー(ISE)のうちの一方または両方をさらに含む;ならびに/または
前記第2のRNA分子が、前記第2の二量体形成ドメインに対して3’側かつ前記分岐点配列に対して5’側のISE、および前記スプライスドナーに対して3’側かつ前記二量体形成ドメインに対して5’側のDISEのうちの一方または両方をさらに含む;
またはこれらの任意の組合せである、項目1から14までのいずれか一項に記載の組成物。
(項目16)
前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により3’に位置するポリアデニル化尾部が切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
前記第2のRNA分子が、前記分岐点配列に対して5’側の任意の場所に位置を占めた自己切断性RNA配列またはRNA切断酵素標的配列をさらに含み、したがって、当該配列により5’に位置するRNAキャップが切断されて、組み換えられていないRNA分子からのタンパク質断片の発現が低減または抑制される;
前記第2のRNA分子が、前記スプライスアクセプターに対して3’側にあるオープンリーディングフレームに対してシフトされる開始コドンを前記分岐点配列に対して5’側の任意の場所にさらに含んで、組み換えられていないRNA分子からの標的タンパク質断片の翻訳が低減または抑制される;
前記第1のRNA分子が、前記スプライスドナーに対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受ける;
前記第2のRNA分子が、前記コード配列に対して3’側の任意の場所にマイクロRNA標的部位をさらに含み、したがって、結合していないRNA断片が核の外側に出るとマイクロRNA依存性分解を受ける;
前記第1のRNA分子が、デグロンタンパク質分解タグをコードする配列を、前記スプライスドナーに対して3’側の任意の場所に前記スプライスドナー部位の5’側にある前記標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
前記第2のRNA分子が、開始コドンおよびインフレームのデグロンタンパク質分解タグを、前記分岐点配列に対して5’側の任意の場所に前記スプライスアクセプター部位の3’側の前記標的タンパク質のオープンリーディングフレームとインフレームになるようにさらに含み、したがって、結合していないタンパク質断片が分解に関してタグ付けされる;
またはこれらの任意の組合せである、項目1から15までのいずれか一項に記載の組成物。
(項目17)
標的タンパク質を発現させるための組成物であって、(a)項目1から16までのいずれか一項に記載の第1のRNA分子をコードする第1の合成DNA分子であって、(i)前記第1のRNA分子をコードする配列に作動可能に連結した第1のプロモーターを含む、第1の合成DNA分子;ならびに(b)項目1から16までのいずれか一項に記載の第2のRNA分子をコードする第2の合成DNA分子であって、(i)前記第2のRNA分子をコードする配列に作動可能に連結した第2のプロモーターを含む、第2の合成DNA分子を含む、組成物。
(項目18)
各プロモーターが、独立に選択される、項目17に記載の組成物。
(項目19)
前記第1のプロモーターと第2のプロモーターが同じプロモーターであるか、または、前記第1のプロモーターと第2のプロモーターが異なるプロモーターである、項目18または19に記載の組成物。
(項目20)
前記第1のプロモーターと前記第2のプロモーターのそれぞれが、独立に、構成的プロモーター;組織特異的プロモーター;および前記標的タンパク質に対して内因性のプロモーターから選択される、項目17から19までのいずれか一項に記載の組成物。
(項目21)
項目17から20までのいずれか一項に記載の組成物を含む、標的タンパク質を発現させるための系。
(項目22)
細胞に導入されると、前記RNA分子を適当な順序で産生させ、組み換え、それにより、前記標的タンパク質の全長コード配列をもたらす、項目21に記載の系。
(項目23)
第1の合成RNA分子および第2の合成RNA分子のそれぞれが、別々のウイルスベクターから転写される、項目21または22に記載の系。
(項目24)
前記ウイルスベクターが、AAVである、項目21から23までのいずれか一項に記載の系。
(項目25)
合成DNA分子のそれぞれが、約2500nt~約5000nt、2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,500nt~約4,750nt、約2,500nt~約5,000nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約2,750nt~約4,750nt、約2,750nt~約5,000nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,000nt~約4,750nt、約3,000nt~約5,000nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,250nt~約4,750nt、約3,250nt~約5,000nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,500nt~約4,750nt、約3,500nt~約5,000nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約3,750nt~約4,750nt、約3,750nt~約5,000nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,000nt~約4,750nt、約4,000nt~約5,000nt、約4,250nt~約4,500nt、約4,250nt~約4,750nt、約4,250nt~約5,000nt、約4,500nt~約4,750nt、約4,500nt~約5,000nt、約4,750nt~約5,000nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、約4,500nt、約4,750nt、および約5,000ntから独立に選択されるサイズを有する、項目21から24までのいずれか一項に記載の系。
(項目26)
前記系の合成DNA分子によってコードされる前記標的タンパク質のN末端部分または前記標的タンパク質のC末端部分の前記コード配列のそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、項目21から25までのいずれか一項に記載の系。
(項目27)
前記系の前記合成DNA分子によってコードされる前記RNA分子のうちの任意の一方または両方のそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、項目21から26までのいずれか一項に記載の系。
(項目28)
項目17から20までのいずれか一項に記載の組成物を含み、
前記合成DNA分子が、約5000nt~約10,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,000nt~約9,500nt、約5,000nt~約10,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約5,500nt~約9,500nt、約5,500nt~約10,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,000nt~約9,500nt、約6,000nt~約10,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約6,500nt~約9,500nt、約6,500nt~約10,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,000nt~約9,500nt、約7,000nt~約10,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約7,500nt~約9,500nt、約7,500nt~約10,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,000nt~約9,500nt、約8,000nt~約10,000nt、約8,500nt~約9,000nt、約8,500nt~約9,500nt、約8,500nt~約10,000nt、約9,000nt~約9,500nt、約9,000nt~約10,000nt、約9,500nt~約10,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、約9,000nt、約9,500nt、および約10,000ntから選択される総サイズを有し、
総標的タンパク質コード配列が、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、または約7,500nt~約8,000ntから選択され、前記総標的タンパク質コード配列が、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、および約8,000ntであり、かつ/または、
2つの前記合成DNA分子によってコードされる前記RNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、および約9,000ntから選択される、項目21から27までのいずれか一項に記載の系。
(項目29)
前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、または約100%である、項目21から28までのいずれか一項に記載の系。
(項目30)
各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも90%、または約100%である、項目21から29までのいずれか一項に記載の系。
(項目31)
RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、項目21から30までのいずれか一項に記載の系。
(項目32)
項目21から31までのいずれか一項に記載の系を含む組成物。
(項目33)
それぞれジストロフィン、第8因子、ABCA4、またはMYO7Aの少なくとも一部分をコードする第1のRNA分子、第2のRNA分子、第3のRNA分子および必要に応じて第4のRNA分子を含む、項目32に記載の組成物。
(項目34)
項目21から31までのいずれか一項に記載の系、または項目44および45のいずれか一項に記載の組成物を含むキットであって、第1の合成核酸分子、第2の合成核酸分子、第3の合成核酸分子および第4の合成核酸分子のいずれかが別々の容器に入っていてよく、必要に応じて薬学的に許容される担体などのバッファーをさらに含む、キット。
(項目35)
細胞において標的タンパク質を発現させる方法であって、項目21から31までのいずれか一項に記載の系、または項目32もしくは33に記載の組成物を細胞に導入するステップと、前記第1のRNA分子および前記第2のRNA分子を前記細胞において発現させるステップとを含み、前記標的タンパク質が前記細胞において産生される、方法。
(項目36)
前記細胞が、対象内に存在し、導入するステップが、前記系を治療有効量で前記対象に投与することを含む、項目35に記載の方法。
(項目37)
前記対象における前記標的タンパク質をコードする遺伝子の変異によって引き起こされる遺伝子疾患を処置し、前記対象における機能的標的タンパク質の発現をもたらす、項目36に記載の方法。
(項目38)
前記遺伝子疾患がデュシェンヌ型筋ジストロフィーであり、前記標的タンパク質がジストロフィンである;
前記遺伝子疾患が血友病Aであり、前記標的タンパク質がF8である;
前記遺伝子疾患がスタルガルト病であり、前記標的タンパク質がABCA4である;または
前記遺伝子疾患がアッシャー症候群であり、前記標的タンパク質がMYO7Aである、項目37に記載の方法。
(項目39)
前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、145、146、147、148、155、156、157、158、159、160、161、162、163、164、165、および166のうちのいずれか1つに提示される合成イントロンに対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の配列同一性を含む、項目21から31までのいずれか一項に記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法。
(項目40)
前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、配列番号20のnt3703~3975、配列番号21のnt1~228、配列番号22のnt3703~3975、配列番号23のnt1~225、配列番号24のnt3560~3828、および配列番号25のnt1~225から選択される合成イントロンを含む、項目21から31までおよび39のいずれか一項に記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法、または項目35から38までのいずれか一項に記載の方法。
(項目41)
前記第1のRNA分子および前記第2のRNA分子のうちの一方または両方が、タンパク質コード配列の一部をさらに含む、項目21から31、39、および40のいずれかに記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法、または項目35から38までのいずれか一項に記載の方法。
(項目42)
前記タンパク質コード配列の前記一部が、前記タンパク質コード配列のN末端側半分、N末端部分、C末端側半分、またはC末端部分を含む、項目21から31までおよび39から41までのいずれかに記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法、または項目35から38までのいずれか一項に記載の方法。
(項目43)
(a)第1のRNA分子であって、5’から3’に、(i)前記標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、または両方;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)少なくとも1つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)前記標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、項目21から31までおよび39から42までのいずれか一項に記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法。
(項目44)
(a)第1のRNA分子であって、5’から3’に、(i)前記標的タンパク質のN末端部分のコード配列;(ii)スプライスドナー;(ii-2)DISE、ISE、およびISE;および(iii)第1の二量体形成ドメインを含む、第1のRNA分子;ならびに(b)第2のRNA分子であって、5’から3’に、(i)前記第1の二量体形成ドメインに結合する第2の二量体形成ドメイン;(i-2)3つのISE配列;(ii)分岐点配列;(iii)ポリピリミジントラクト;(iv)スプライスアクセプター;および(v)前記標的タンパク質のC末端部分のコード配列を含む、第2のRNA分子を含む、項目21から31までおよび39から43までのいずれか一項に記載の系、項目1から16まで、32および33のいずれか一項に記載の組成物、または項目35から38までのいずれか一項に記載の方法。
(項目45)
前記第1のRNA分子および前記第2のRNA分子のうちの1つまたは2つのいずれかのそれぞれが、約2500~4500nt、約2,500nt~約2,750nt、約2,500nt~約3,000nt、約2,500nt~約3,250nt、約2,500nt~約3,500nt、約2,500nt~約3,750nt、約2,500nt~約4,000nt、約2,500nt~約4,250nt、約2,500nt~約4,500nt、約2,750nt~約3,000nt、約2,750nt~約3,250nt、約2,750nt~約3,500nt、約2,750nt~約3,750nt、約2,750nt~約4,000nt、約2,750nt~約4,250nt、約2,750nt~約4,500nt、約3,000nt~約3,250nt、約3,000nt~約3,500nt、約3,000nt~約3,750nt、約3,000nt~約4,000nt、約3,000nt~約4,250nt、約3,000nt~約4,500nt、約3,250nt~約3,500nt、約3,250nt~約3,750nt、約3,250nt~約4,000nt、約3,250nt~約4,250nt、約3,250nt~約4,500nt、約3,500nt~約3,750nt、約3,500nt~約4,000nt、約3,500nt~約4,250nt、約3,500nt~約4,500nt、約3,750nt~約4,000nt、約3,750nt~約4,250nt、約3,750nt~約4,500nt、約4,000nt~約4,250nt、約4,000nt~約4,500nt、約4,250nt~約4,500nt、約2,500nt、約2,750nt、約3,000nt、約3,250nt、約3,500nt、約3,750nt、約4,000nt、約4,250nt、および約4,500ntから独立に選択されるサイズを有する、項目1から16までのいずれか一項に記載の組成物。
(項目46)
前記総標的タンパク質コード配列のサイズが、約2000nt~約8000nt、約2,000nt~約3,000nt、約2,000nt~約3,500nt、約2,000nt~約4,000nt、約2,000nt~約4,500nt、約2,000nt~約5,000nt、約2,000nt~約5,500nt、約2,000nt~約6,000nt、約2,000nt~約6,500nt、約2,000nt~約7,000nt、約2,000nt~約7,500nt、約2,000nt~約8,000nt、約3,000nt~約3,500nt、約3,000nt~約4,000nt、約3,000nt~約4,500nt、約3,000nt~約5,000nt、約3,000nt~約5,500nt、約3,000nt~約6,000nt、約3,000nt~約6,500nt、約3,000nt~約7,000nt、約3,000nt~約7,500nt、約3,000nt~約8,000nt、約3,500nt~約4,000nt、約3,500nt~約4,500nt、約3,500nt~約5,000nt、約3,500nt~約5,500nt、約3,500nt~約6,000nt、約3,500nt~約6,500nt、約3,500nt~約7,000nt、約3,500nt~約7,500nt、約3,500nt~約8,000nt、約4,000nt~約4,500nt、約4,000nt~約5,000nt、約4,000nt~約5,500nt、約4,000nt~約6,000nt、約4,000nt~約6,500nt、約4,000nt~約7,000nt、約4,000nt~約7,500nt、約4,000nt~約8,000nt、約4,500nt~約5,000nt、約4,500nt~約5,500nt、約4,500nt~約6,000nt、約4,500nt~約6,500nt、約4,500nt~約7,000nt、約4,500nt~約7,500nt、約4,500nt~約8,000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,500nt~約8,000nt、約2,000nt、約3,000nt、約3,500nt、約4,000nt、約4,500nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、または約8,000ntであり、かつ/または、
2つの前記RNA分子の合計サイズが、約5,000nt~約9000nt、約5,000nt~約5,500nt、約5,000nt~約6,000nt、約5,000nt~約6,500nt、約5,000nt~約7,000nt、約5,000nt~約7,500nt、約5,000nt~約8,000nt、約5,000nt~約8,500nt、約5,000nt~約9,000nt、約5,500nt~約6,000nt、約5,500nt~約6,500nt、約5,500nt~約7,000nt、約5,500nt~約7,500nt、約5,500nt~約8,000nt、約5,500nt~約8,500nt、約5,500nt~約9,000nt、約6,000nt~約6,500nt、約6,000nt~約7,000nt、約6,000nt~約7,500nt、約6,000nt~約8,000nt、約6,000nt~約8,500nt、約6,000nt~約9,000nt、約6,500nt~約7,000nt、約6,500nt~約7,500nt、約6,500nt~約8,000nt、約6,500nt~約8,500nt、約6,500nt~約9,000nt、約7,000nt~約7,500nt、約7,000nt~約8,000nt、約7,000nt~約8,500nt、約7,000nt~約9,000nt、約7,500nt~約8,000nt、約7,500nt~約8,500nt、約7,500nt~約9,000nt、約8,000nt~約8,500nt、約8,000nt~約9,000nt、約8,500nt~約9,000nt、約5,000nt、約5,500nt、約6,000nt、約6,500nt、約7,000nt、約7,500nt、約8,000nt、約8,500nt、または約9,000ntである、項目1から16までのいずれか一項に記載の組成物。
(項目47)
前記第1の二量体形成ドメインおよび前記第2の二量体形成ドメインのそれぞれが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、または少なくとも約95%である、項目1から16までのいずれか一項に記載の組成物。
(項目48)
各二量体形成ドメインが、1000nt以下、例えば、少なくとも50nt、少なくとも100nt、少なくとも150nt、少なくとも200nt、少なくとも300nt、少なくとも400nt、少なくとも500nt、50~1000nt、50~500nt、50~150nt、50nt、100nt、150nt、200nt、250nt、300nt、400nt、または500ntであり;前記系の組換え効率が、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも75%、少なくとも80%、または少なくとも90%である、項目1から16までのいずれか一項に記載の組成物。
(項目49)
RNA組換え効率が、約10%~約100%、約10%~約20%、約10%~約30%、約10%~約35%、約10%~約40%、約10%~約45%、約10%~約50%、約10%~約55%、約10%~約60%、約10%~約70%、約10%~約80%、約10%~約90%、約20%~約30%、約20%~約35%、約20%~約40%、約20%~約45%、約20%~約50%、約20%~約55%、約20%~約60%、約20%~約70%、約20%~約80%、約20%~約90%、約30%~約35%、約30%~約40%、約30%~約45%、約30%~約50%、約30%~約55%、約30%~約60%、約30%~約70%、約30%~約80%、約30%~約90%、約35%~約40%、約35%~約45%、約35%~約50%、約35%~約55%、約35%~約60%、約35%~約70%、約35%~約80%、約35%~約90%、約40%~約45%、約40%~約50%、約40%~約55%、約40%~約60%、約40%~約70%、約40%~約80%、約40%~約90%、約45%~約50%、約45%~約55%、約45%~約60%、約45%~約70%、約45%~約80%、約45%~約90%、約50%~約55%、約50%~約60%、約50%~約70%、約50%~約80%、約50%~約90%、約55%~約60%、約55%~約70%、約55%~約80%、約55%~約90%、約60%~約70%、約60%~約80%、約60%~約90%、約70%~約80%、約70%~約90%、約80%~約90%、約10%、約20%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約70%、約80%、約90%、約95%、または約100%である、項目1から16までのいずれか一項に記載の組成物。
(項目50)
(a)前記第1のRNA分子および前記第2のRNA分子のそれぞれが、約2500nt~4500ntであり;
(b)総標的タンパク質コード配列のサイズが、約2000nt~約8000ntであり;かつ/または、
(c)2つの前記RNA分子の合計サイズが、約5,000nt~約9000ntであり;
前記RNA組換え効率が、約10%~約100%である、項目1から16までのいずれか一項に記載の組成物。