本発明が関係する分野の当業者は、本明細書に記載されている本発明の改変およびそれ以外の実施態様として、上記の説明及び関連する図面に示されている教示の利点を持つものを多数思いつくであろう。したがって本発明が開示されている具体的な実施態様に限定されることはなく、改変やそれ以外の実施態様が添付の実施態様の範囲に含まれることを理解すべきである。特殊な用語を本明細書で使用するが、それらは一般的かつ説明的な意味で用いられているのであり、制限する目的ではない。
I.概要
RNA誘導型ヌクレアーゼ(RGN)により、ゲノム内の単一の部位を標的として操作することが可能になるため、RGNは治療と研究の用途における遺伝子ターゲティングの文脈で有用である。哺乳動物を含む多彩な生物において、RNA誘導型ヌクレアーゼは、例えば非相同末端結合と相同組み換えを刺激することによるゲノム操作のために使用されてきた。本明細書に記載されている組成物と方法は、ポリヌクレオチドに一本鎖切断または二本鎖切断を生じさせること、またはポリヌクレオチドを改変すること、またはポリヌクレオチド内の特定の部位を検出すること、または特定の遺伝子の発現を変化させることに役立つ。
本明細書に開示されているRNA誘導型ヌクレアーゼは、標的配列を改変することによって遺伝子の発現を変化させることができる。特別な実施態様では、RNA誘導型ヌクレアーゼは、クラスター化されて規則的な間隔で配置された短い回文反復(CRISPR)RNA誘導型ヌクレアーゼシステムの一部としてのガイドRNA(gRNA)によって標的配列に向けられる。ガイドRNAはRNA誘導型ヌクレアーゼと複合体を形成してこのRNA誘導型ヌクレアーゼを標的配列と結合させ、いくつかの実施態様では、標的配列の位置に一本鎖切断または二本鎖切断を導入する。標的配列が切断された後、この切断の修復プロセスの間に標的配列のDNA配列が改変されるようにすることができる。したがって本明細書では、RNA誘導型ヌクレアーゼを用いて宿主細胞のDNAの中の標的配列を改変する方法が提供される。例えばRNA誘導型ヌクレアーゼを用いて真核細胞または原核細胞のゲノム遺伝子座の位置にある標的配列を改変することができる。
II.RNA誘導型ヌクレアーゼ
本明細書にはRNA誘導型ヌクレアーゼが提示されている。RNA誘導型ヌクレアーゼ(RGN)という用語は、配列特異的なやり方で特定の標的ヌクレオチド配列に結合するポリペプチドを意味し、このポリペプチドとの複合体を形成したガイドRNA分子によって標的ヌクレオチド配列に向けられて、この標的配列とハイブリダイズする。RNA誘導型ヌクレアーゼは、標的配列に結合したときにこの標的配列を切断できるが、RNA誘導型ヌクレアーゼという用語には、標的配列に結合できるが標的配列の切断はできないヌクレアーゼ-デッドRNA誘導型ヌクレアーゼも包含される。RNA誘導型ヌクレアーゼによって標的配列を切断する結果として、一本鎖を切断すること、または二本鎖を切断することができる。二本鎖核酸分子の単一の鎖を切断することのできるRNA誘導型ヌクレアーゼを本明細書ではニッカーゼと呼ぶ。
本明細書に開示されているRNA誘導型ヌクレアーゼには、APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1、APG1688.1というRNA誘導型ヌクレアーゼ(そのアミノ酸配列は、それぞれ配列番号1、11、19、27、36、45、54で表わされる)と、その活性な断片またはバリアントでRNA誘導型配列に特異的なやり方で標的ヌクレオチド配列に結合する能力を保持しているものが含まれる。これら実施態様のいくつかでは、APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1、APG1688.1というRGNの活性な断片またはバリアントは、一本鎖標的配列または二本鎖標的配列を切断することができる。いくつかの実施態様では、APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1、APG1688.1というRGNの活性なバリアントは、配列番号1、11、19、27、36、45、54のいずれかで表わされるアミノ酸配列と配列が少なくとも40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するアミノ酸配列を含んでいる。いくつかの実施態様では、APG05083.1、APG07433.1、APG07513.1、APG08290.1、APG05459.1、APG04583.1、APG1688.1というRGNの活性な断片は、配列番号1、11、19、27、36、45、54のいずれかで表わされるアミノ酸配列の少なくとも50個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、800個、850個、900個、950個、1000個、1050個、またはそれよりも多い個数の連続したアミノ酸残基を含んでいる。本明細書に提示されているRNA誘導型ヌクレアーゼは、少なくとも1つのヌクレアーゼドメイン(例えばDNアーゼドメイン、RNアーゼドメイン)と、ガイドRNAと相互作用する少なくとも1つのRNA認識および/またはRNA結合ドメインを含むことができる。本明細書に提示されているRNA誘導型ヌクレアーゼの中に見いだすことができるさらに別のドメインの非限定的な例に含まれるのは、DNA結合ドメイン、ヘリカーゼドメイン、タンパク質-タンパク質相互作用ドメイン、二量体化ドメインである。特別な実施態様では、本明細書に提示されているRNA誘導型ヌクレアーゼは、DNA結合ドメイン、ヘリカーゼドメイン、タンパク質-タンパク質相互作用ドメイン、二量体化ドメインのうちの1つ以上の少なくとも70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%を含むことができる。
標的ヌクレオチド配列には、本明細書に提示されているRNA誘導型ヌクレアーゼが結合し、このRNA誘導型ヌクレアーゼに関係するガイドRNAがハイブリダイズする。その後、RNA誘導型ヌクレアーゼがヌクレアーゼ活性を有する場合には、標的配列をこのRNA誘導型ヌクレアーゼによって切断することができる。「切断する」または「切断」という用語は、標的配列の骨格内の少なくとも1つのホスホジエステル結合が加水分解し、その結果として標的核酸内で一本鎖または二本鎖を切断できることを意味する。本開示のRGNは、エンドヌクレアーゼとして機能してポリヌクレオチド内のヌクレオチドを切断すること、またはエキソヌクレアーゼとなってポリヌクレオチドの末端(5'末端および/または3'末端)から連続的にヌクレオチドを除去することができる。別の実施態様では、開示されているRGNはポリヌクレオチドの任意の位置にある標的配列のヌクレオチドを切断できるため、エンドヌクレアーゼとエキソヌクレアーゼの両方として機能することができる。本開示のRGNによって標的ポリヌクレオチドが切断される結果として粘着末端または平滑末端になる可能性がある。
本明細書に開示されているRNA誘導型ヌクレアーゼとして、細菌または古細菌の種に由来する野生型配列が可能である。あるいはRNA誘導型ヌクレアーゼとして、野生型ポリペプチドのバリアントまたは断片が可能である。野生型RGNを改変して例えばヌクレアーゼ活性またはPAM特異性を変化させることができる。いくつかの実施態様では、RNA誘導型ヌクレアーゼは天然のものではない。
いくつかの実施態様では、RNA誘導型ヌクレアーゼはニッカーゼとして機能し、標的ヌクレオチド配列の単一の鎖だけを切断する。このようなRNA誘導型ヌクレアーゼは機能する単一のヌクレアーゼドメインを有する。これら実施態様のいくつかでは、追加のヌクレアーゼドメインが変異してヌクレアーゼ活性が低下または消失している。
別の実施態様では、RNA誘導型ヌクレアーゼはヌクレアーゼ活性が完全に消失しているか、低下したヌクレアーゼ活性を示すため、本明細書ではヌクレアーゼ-デッド(不活化)と呼ぶ。アミノ酸配列に変異を導入するための本分野で知られている任意の方法(PCRを媒介とした突然変異誘発、部位指定突然変異誘発など)を利用してニッカーゼ、またはヌクレアーゼ-デッドRGNを生成させることができる。例えばアメリカ合衆国特許出願公開第2014/0068797号とアメリカ合衆国特許第9,790,490号を参照されたい(そのそれぞれの全体が、参照によって本明細書に組み込まれている)。
ヌクレアーゼ活性を欠くRNA誘導型ヌクレアーゼを用い、融合したポリペプチド、ポリヌクレオチド、小分子ペイロードのいずれかを特定のゲノム位置に送達することができる。これら実施態様のいくつかでは、RGNポリペプチドまたはガイドRNAを検出可能な標識に融合させ、特定の配列を検出できるようにする。非限定的な一例として、ヌクレアーゼ-デッドRGNを検出可能な標識(例えば蛍光タンパク質)に融合させ、疾患に関係する特定の配列を標的とすることで、疾患関連配列の検出が可能になる。
あるいはヌクレアーゼ-デッドRGNを特定のゲノム位置に向かわせて望む配列の発現を変化させることができる。いくつかの実施態様では、ヌクレアーゼ-デッドRGN誘導型ヌクレアーゼが標的配列に結合すると、標的となるゲノム領域内でRNAポリメラーゼまたは転写因子が結合するのに干渉することにより、標的配列の発現、または標的配列による転写制御下にある遺伝子の発現が抑制される。別の実施態様では、RGN(例えばヌクレアーゼ-デッドRGN)、またはRGNとの複合体になったガイドRNAは、発現モジュレータをさらに含んでいて、この発現モジュレータは、標的配列に結合すると、標的配列の発現、または標的配列による転写制御下にある遺伝子の発現を抑制するか活性化する。これら実施態様のいくつかでは、発現モジュレータは、標的配列の発現、またはエピジェネティックな機構を通じて調節された遺伝子の発現を変化させる。
別の実施態様では、ヌクレアーゼ-デッドRGN、またはニッカーゼ活性だけを有するRGNを特定のゲノム位置に向かわせ、塩基編集ポリペプチド(例えばデアミナーゼポリペプチド、またはその活性なバリアントまたは断片でヌクレオチド塩基を脱アミノ化するもの)に融合させることを通じて標的ポリヌクレオチドの配列を改変することができるため、その結果として1個のヌクレオチドが別のヌクレオチドに変換される。塩基編集ポリペプチドは、RGNのN末端またはC末端に融合させることができる。それに加え、塩基編集ポリペプチドは、ペプチドリンカーを介してRGNに融合させることができる。このような組成物と方法で有用なデアミナーゼポリペプチドの非限定的な一例に含まれるのは、Gaudelli他(2017年)Nature 第551巻:464〜471ページ、アメリカ合衆国特許出願公開第2017/0121693号と第2018/0073012号、国際出願公開第WO/2018/027078号(そのそれぞれの全体が参照によって本明細書に組み込まれている)に記載されているシチジンデアミナーゼ塩基エディタまたはアデノシンデアミナーゼ塩基エディタである。
ポリペプチドまたはドメインに融合されるRNA誘導型ヌクレアーゼは、リンカーによって隔てること、または接合することができる。「リンカー」という用語は、本明細書では、2つの分子または部分(例えばヌクレアーゼの結合ドメインと切断ドメイン)を連結する化学基または分子を意味する。いくつかの実施態様では、リンカーは、RNA誘導型ヌクレアーゼのgRNA結合ドメインと塩基編集ポリペプチド(デアミナーゼなど)を接合する。いくつかの実施態様では、リンカーは、ヌクレアーゼ-デッドRGNとデアミナーゼを連結する。典型的には、リンカーは、2つの基、または分子、またはそれ以外の部分の間に、または隣接して位置しており、共有結合を通じてそれぞれに接続されているため、その2つを接続している。いくつかの実施態様では、リンカーは、1個のアミノ酸、または複数個のアミノ酸(例えばペプチドまたはタンパク質)である。いくつかの実施態様では、リンカーは、有機分子、基、ポリマー、化学的部分のいずれかである。いくつかの実施態様では、リンカーは、長さが5〜100個のアミノ酸、例えば長さが5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、30〜35個、35〜40個、40〜45個、45〜50個、50〜60個、60〜70個、70〜80個、80〜90個、90〜100個、100〜150個、150〜200個のいずれかであるアミノ酸である。より長いリンカー、またはより短いリンカーも考えられる。
本開示のRNA誘導型ヌクレアーゼは、細胞の核へのRGNの輸送を増強するため少なくとも1つの核局在化シグナル(NLS)を含むことができる。核局在化シグナルは本分野で知られており、一般に一連の塩基性アミノ酸を含んでいる(例えばLange他、J. Biol. Chem.(2007年)第282巻:5101〜5105ページを参照されたい)。特別な実施態様では、RGNは、2つ、3つ、4つ、5つ、6つ、またはそれよりも多い数の核局在化シグナルを含んでいる。核局在化シグナルとして異種NLSが可能である。本開示のRGNにとって有用な核局在化シグナルの非限定的な例は、SV40大T抗原、ヌクレオパスミン、c-Mycの核局在化シグナルである(例えばRay他(2015年)Bioconjug Chem 第26巻(6):1004〜1007ページを参照されたい)。特別な実施態様では、RGNは、配列番号67として示されているNLS配列を含んでいる。RGNは、N末端に、またはC末端に、またはN末端とC末端の両方に1つ以上のNLS配列を含むことができる。例えばRGNは、N末端領域に2つのNLS配列と、C末端領域に4つのNLS配列を含むことができる。
RGNを標的とするのに、ポリペプチドを細胞内の特定の位置に局在させる本分野で知られた他の局在シグナルも用いることができ、その非限定的な例に含まれるのは、プラスチド(色素体)局在化配列、ミトコンドリア局在化配列、プラスチドとミトコンドリアの両方を標的とする二重標的シグナル配列である(例えばNassouryとMorse(2005年)Biochim Biophys Acta第1743巻:5〜19ページ;KunzeとBerger(2015年)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;HerrmannとNeupert(2003年)IUBMB Life第55巻:219〜225ページ;Soll(2002年)Curr Opin Plant Biol第5巻:529〜535ページ;CarrieとSmall(2013年)Biochim Biophys Acta第1833巻:253〜259ページ;Carrie他(2009年)FEBS J第276巻:1187〜1195ページ;Silva-Filho(2003年)Curr Opin Plant Biol第6巻:589〜595ページ;PeetersとSmall(2001年)Biochim Biophys Acta第1541巻:54〜63ページ;Murcha他(2014年)J Exp Bot第65巻:6301〜6335ページ;Mackenzie(2005年)Trends Cell Biol第15巻:548〜554ページ;Glaser他(1998年)Plant Mol Biol第38巻:311〜338ページを参照されたい)。
いくつかの実施態様では、本開示のRNA誘導型ヌクレアーゼは、細胞へのRGNの取り込みを容易にする少なくとも1つの細胞侵入ドメインを含んでいる。細胞侵入ドメインは本分野で知られており、一般に、一連の正に帯電したアミノ酸残基(すなわちポリカチオン性細胞侵入ドメイン)、または交互にされた極性アミノ酸残基と非極性アミノ酸残基(すなわち両親媒性細胞侵入ドメイン)、または疎水性アミノ酸残基(すなわち疎水性細胞侵入ドメイン)を含んでいる(例えばMilletti F.(2012年)Drug Discov Today 第17巻:850〜860ページを参照されたい)。細胞侵入ドメインの非限定的な一例は、ヒト免疫不全ウイルス1からのトランス活性化転写アクチベータ(TAT)である。
核局在化シグナル、および/またはプラスチド局在化配列、および/またはミトコンドリア局在化配列、および/または二重標的シグナル配列、および/または細胞侵入ドメインは、RNA誘導型ヌクレアーゼのアミノ末端(N末端)、またはカルボキシル末端(C末端)、または内部位置に位置させることができる。
本開示のRGNは、エフェクタドメイン(切断ドメイン、デアミナーゼドメイン、発現モジュレータドメインなど)に直接的に融合させるか、リンカーペプチドを介して間接的に融合させることができる。このようなドメインは、RNA誘導型ヌクレアーゼのN末端、またはC末端、または内部位置に位置させることができる。これら実施態様のいくつかでは、融合タンパク質のRGN要素は、ヌクレアーゼ-デッドRGNである。
いくつかの実施態様では、RGN融合タンパク質は切断ドメインを含んでいる。切断ドメインは、ポリヌクレオチド(すなわちRNA、DNA、RNA/DNAハイブリッドのいずれか)を切断することのできる任意のドメインであり、その非限定的な例に含まれるのは、制限エンドヌクレアーゼとホーミングエンドヌクレアーゼ(IIS型エンドヌクレアーゼなど(例えばFokI))である(例えばBelfort他(1997年)Nucleic Acids Res. 第25巻:3379〜3388ページ;Linn他(編)『Nucleases』、Cold Spring Harbor Laboratory Press、1993年を参照されたい)。
別の実施態様では、RGN融合タンパク質は、ヌクレオチド塩基を脱アミノ化して1個のヌクレオチド塩基を別のヌクレオチド塩基に変換するデアミナーゼドメインを含んでおり、その非限定的な例に含まれるのは、シチジンデアミナーゼ塩基エディタまたはアデノシンデアミナーゼ塩基エディタである(例えばGaudelli他(2017年)Nature第551巻:464〜471ページ、アメリカ合衆国特許出願公開第2017/0121693号、第2018/0073012号、アメリカ合衆国特許第9,840,699号、国際出願公開第WO/2018/027078号を参照されたい)。
いくつかの実施態様では、RGN融合タンパク質のエフェクタドメインとして発現モジュレータドメインが可能である。発現モジュレータドメインは、転写を上方調節または下方調節する機能を持つドメインである。発現モジュレータドメインとして、エピジェネティックな修飾ドメイン、転写抑制ドメイン、転写活性化ドメインのいずれかが可能である。
これら実施態様のいくつかでは、RGN融合タンパク質の発現モジュレータは、DNAまたはヒストンタンパク質の共有結合を修飾してDNA配列を変化させることなくヒストン構造および/または染色体構造を変化させ、遺伝子発現を変化(上方調節または下方調節)させるエピジェネティックな修飾ドメインを含んでいる。エピジェネティックな修飾の非限定的な例に含まれるのは、DNA内のリシン残基のアセチル化またはメチル化、アルギニンのメチル化、セリンとトレオニンのリン酸化、リシンのユビキチン化、ヒストンタンパク質のSUMO化、シトシン残基のメチル化とヒドロキシメチル化である。エピジェネティックな修飾ドメインの非限定的な例に含まれるのは、ヒストンアセチルトランスフェラーゼドメイン、ヒストンデアセチラーゼドメイン、ヒストンメチルトランスフェラーゼドメイン、ヒストンデメチラーゼドメイン、DNAメチルトランスフェラーゼドメイン、DNAデメチラーゼドメインである。
別の実施態様では、融合タンパク質の発現モジュレータは転写抑制ドメインを含んでいる。転写抑制ドメインは、転写制御エレメントおよび/または転写調節タンパク質(RNAポリメラーゼ、転写因子など)と相互作用して、少なくとも1つの遺伝子の転写を減少または停止させる。転写抑制ドメインは本分野で知られており、その非限定的な例に含まれるのは、Sp1様リプレッサ、IκB、クリュッペル関連ボックス(KRAB)ドメインである。
さらに別の実施態様では、融合タンパク質の発現モジュレータは、転写活性化ドメインを含んでいる。転写活性化ドメインは、転写制御エレメントおよび/または転写調節タンパク質(RNAポリメラーゼ、転写因子など)と相互作用して、少なくとも1つの遺伝子の転写を増加または活性化させる。転写活性化ドメインは本分野で知られており、その非限定的な例に含まれるのは、単純ヘルペスウイルスVP16活性化ドメイン、NFAT活性化ドメインである。
本開示のRGNポリペプチドは、検出可能な標識または精製タグを含むことができる。検出可能な標識または精製タグは、RNA誘導型ヌクレアーゼのN末端、またはC末端、または内部位置に、直接位置させること、またはリンカーペプチドを介して間接的に位置させることができる。これら実施態様のいくつかでは、融合タンパク質のRGN要素は、ヌクレアーゼ-デッドRGNである。別の実施態様では、融合タンパク質のRGN要素は、ニッカーゼ活性を有するRGNである。
検出可能な標識は、可視化すること、または別のやり方で観測することができる。検出可能な標識は、融合タンパク質(例えば蛍光タンパク質)としてRGNに融合させること、またはRGNポリペプチドとの複合体にされていて視覚的に、または他の手段によって検出可能な小分子にすることができる。本開示のRGNに融合タンパク質として融合させることのできる検出可能な標識には、検出可能な任意のタンパク質ドメインが含まれ、その非限定的な例に含まれるのは、蛍光タンパク質、特異的抗体を用いて検出できるタンパク質ドメインである。蛍光タンパク質の非限定的な例に含まれるのは、緑色蛍光タンパク質(例えばGFP、EGFP、ZsGreen1)と黄色蛍光タンパク質(例えばYFP、EYFP、ZsYellow1)である。検出可能な小分子標識の非限定的な例に含まれるのは、放射性標識である3H、35Sなどである。
RGNポリペプチドは精製タグも含むことができる。これは、混合物(例えば生物サンプル、培地)からタンパク質または融合タンパク質を単離するのに使用できる任意の分子である。精製タグの非限定的な例に含まれるのは、myc、マルトース結合タンパク質(MBP)、グルタチオン-S-トランスフェラーゼ(GST)である。
II.ガイドRNA
本開示により、ガイドRNAと、それをコードするポリヌクレオチドが提供される。「ガイドRNA」という用語は、標的ヌクレオチド配列と十分な相補性を有するためにその標的配列とハイブリダイズして関係するRNA誘導型ヌクレアーゼを標的ヌクレオチド配列に配列特異的に結合させるヌクレオチド配列を意味する。したがってRGNの各ガイドRNAは、RGNに結合してこのRGNをガイドし、特定の標的ヌクレオチド配列に結合させることのできる1つ以上のRNA分子であり(一般に、1つあるいは2つ)、RGNがニッカーゼ活性またはヌクレアーゼ活性を持つ場合には、標的ヌクレオチド配列も切断する。一般に、ガイドRNAは、CRISPR RNA(crRNA)とトランス活性化CRISPR RNA(tracrRNA)を含んでいる。crRNAとtracrRNAの両方を含む天然のガイドRNAは、一般に、2つの別々のRNA分子を含んでいて、crRNAの反復配列とtracrRNAのアンチ反復配列を通じて互いにハイブリダイズする。
CRISPRアレイの中の天然の直列反復配列は、一般に長さが28〜37塩基対の範囲だが、この長さは約23 bp〜約55 bpの間で変化する可能性がある。CRISPRアレイの中のスペーサ配列は、一般に長さが32〜38塩基対の範囲だが、この長さは約21bp〜約72 bpの間で変化する可能性がある。各CRISPRアレイは一般に50単位未満のCRISPR反復スペーサ配列を含んでいる。CRISPRは、一次CRISPR転写産物と呼ばれる長い転写産物の一部として転写され、一次CRISPR転写産物はCRISPRアレイの多くを含んでいる。一次CRISPR転写産物はCasタンパク質によって切断されてcrRNAを生成させるが、いくつかの場合にはプレcrRNAを生成させる。プレcrRNAは追加のCasタンパク質によってさらに処理されて成熟crRNAになる。成熟crRNAは、スペーサ配列とCRISPR反復配列を含んでいる。プレcrRNAが処理されて成熟(または処理された)crRNAになるいくつかの実施態様では、成熟に、約1個〜約6個以上の5'ヌクレオチドの除去、または3'ヌクレオチドの除去、または5'ヌクレオチドと3'ヌクレオチドの除去が含まれる。目的の特定の標的ヌクレオチド配列のゲノム編集またはターゲティングの目的では、プレcrRNA分子が成熟する間に除去されるヌクレオチドは、ガイドRNAの生成または設計に必要とされない。
CRISPR RNA(crRNA)は、スペーサ配列とCRISPR反復配列を含んでいる。「スペーサ配列」は、目的の標的ヌクレオチド配列に直接ハイブリダイズするヌクレオチド配列である。スペーサ配列を操作して、目的の標的ヌクレオチド配列と完全に、または部分的に相補的であるようにする。さまざまな実施態様では、スペーサ配列は、約8個〜約30個、またはそれよりも多い個数のヌクレオチドを含むことができる。例えばスペーサ配列は、長さが約8個、約9個、約10個、約11個、約12個、約13個、約14個、約15個、約16個、約17個、約18個、約19個、約20個、約21個、約22個、約23個、約24個、約25個、約26個、約27個、約28個、約29個、約30個、またはそれよりも多い個数のヌクレオチドである。いくつかの実施態様では、スペーサ配列は、長さが約10個〜約26個のヌクレオチド、または長さが約12個〜約30個のヌクレオチドである。特別な実施態様では、スペーサ配列は長さが約30個のヌクレオチドである。いくつかの実施態様では、スペーサ配列とそれに対応する標的配列の間の相補性の程度は、適切なアラインメントプログラムを用いて最適なアラインメントにしたとき、約50%以上、約60%以上、約70%以上、約75%以上、約80%以上、約81%以上、約82%以上、約83%以上、約84%以上、約85%以上、約86%以上、約87%以上、約88%以上、約89%以上、約90%以上、約91%以上、約92%以上、約93%以上、約94%以上、約95%以上、約96%以上、約97%以上、約98%以上、約99%以上、またはそれよりも大きい。特別な実施態様では、スペーサ配列は自由な二次構造を取り、それは、本分野で知られている適切な任意のポリヌクレオチド折り畳みアルゴリズムを用いて予測することができる。アルゴリズムの非限定的な例に含まれるのは、mFold(例えばZukerとStiegler(1981年)Nucleic Acids Res. 第9巻:133〜148ページを参照されたい)と、RNAfold(例えばGruber他(2008年)Cell第106巻(1):23〜24ページを参照されたい)である。
RGNタンパク質は、gRNA内のスペーサ配列とgRNAの標的配列の間のミスマッチに対する感度がさまざまである可能性があり、この感度が切断の効率に影響を与える。実施例5で議論するように、APG05459.1 RGNは、スペーサ配列と、PAM部位の5'の少なくとも15個のヌクレオチドにわたる標的配列の間のミスマッチに対して異常な感度を持つ。したがってAPG05459.1は、スペーサ配列と標的配列の間のミスマッチに対する感度がより低い他のRGNよりも特定の配列をより細かく(すなわち特異的に)標的とする能力を有する。
CRISPR RNA反復配列は、tracrRNAにハイブリダイズするのに十分な相補性を持つ領域を含むヌクレオチド配列を含んでいる。さまざまな実施態様では、CRISPR RNA反復配列は、約8個〜約30個、またはそれよりも多い個数のヌクレオチドを含むことができる。例えばCRISPR反復配列は、長さが約8個、約9個、約10個、約11個、約12個、約13個、約14個、約15個、約16個、約17個、約18個、約19個、約20個、約21個、約22個、約23個、約24個、約25個、約26個、約27個、約28個、約29個、約30個、またはそれよりも多い個数のヌクレオチドである。いくつかの実施態様では、CRISPR反復配列は、長さが約21個のヌクレオチドである。いくつかの実施態様では、CRISPR反復配列と、それに対応するtracrRNA配列の間の相補性の程度は、適切なアラインメントプログラムを用いて最適なアラインメントにしたとき、約50%以上、約60%以上、約70%以上、約75%以上、約80%以上、約81%以上、約82%以上、約83%以上、約84%以上、約85%以上、約86%以上、約87%以上、約88%以上、約89%以上、約90%以上、約91%以上、約92%以上、約93%以上、約94%以上、約95%以上、約96%以上、約97%以上、約98%以上、約99%以上、またはそれよりも大きい。特別な実施態様では、CRISPR反復配列は、配列番号2、12、20、28、37、46、55いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含んでおり、それがガイドRNAの中に含まれているときには、本明細書に提示されている関連するRNA誘導型ヌクレアーゼを目的の標的配列に配列特異的に結合させることができる。いくつかの実施態様では、野生型配列の活性なCRISPR反復配列バリアントは、配列番号2、12、20、28、37、46、55いずれかとして表わされるヌクレオチド配列と配列が少なくとも40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するヌクレオチド配列を含んでいる。いくつかの実施態様では、野生型配列の活性なCRISPR反復配列断片は、配列番号2、12、20、28、37、46、55いずれかとして表わされるヌクレオチド配列の連続した少なくとも5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個いずれかのヌクレオチドを含んでいる。
いくつかの実施態様では、crRNAは天然には存在しない。これら実施態様のいくつかでは、特異的CRISPR反復配列は、操作されたスペーサ配列に自然に連結されることはなく、このCRISPR反復配列はスペーサ配列にとって異種であると見なされる。いくつかの実施態様では、スペーサ配列は、天然に存在しない操作された配列である。
トランス活性化CRISPR RNA分子、すなわちtracrRNA分子は、crRNAのCRISPR反復配列にハイブリダイズするのに十分な相補性を持つ領域(本明細書ではアンチ反復領域と呼ぶ)を含むヌクレオチド配列を含んでいる。いくつかの実施態様では、tracrRNA分子はさらに、二次構造(例えばステム-ループ)を持つ領域を含むか、対応するcrRNAにハイブリダイズしたときに二次構造を形成する。特別な実施態様では、tracrRNAのうちでCRISPR反復配列と完全に、または部分的に相補的な領域はこの分子の5'末端にあり、tractRNAの3'末端は二次構造を含んでいる。二次構造のこの領域は一般にいくつかのヘアピン構造を含んでいる(その中には、アンチ反復配列の隣に見いだされる連結ヘアピンが含まれる)。連結ヘアピンは、ヘアピンステムの塩基の中に保存されたヌクレオチド配列を有することがしばしばあり、tracrRNA内の多くの連結ヘアピンの中にモチーフUNANNG、UNANNU、UNANNA(それぞれ配列番号68、557、558)が見いだされる。tracrRNAの3'末端には、複数の末端ヘアピンが存在することがしばしばある。その構造と数はさまざまである可能性があるが、CGリッチでRhoとは独立な転写終了ヘアピンと、その後に続く3'末端に位置するUのストリングを含んでいることがしばしばある。例えばBriner他(2014年)Molecular Cell 第56巻:333〜339ページ、BrinerとBarrangou(2016年)Cold Spring Harb Protoc; doi: 10.1101/pdb.top090902と、アメリカ合衆国特許出願公開第2017/0275648号を参照されたい(そのそれぞれの全体が参照によって本明細書に組み込まれている)。
さまざまな実施態様では、tracrRNAのうちでCRISPR反復配列と完全に、または部分的に相補的なアンチ反復領域は、約8個〜約30個、またはそれよりも多い個数のヌクレオチドを含んでいる。例えばtracrRNAアンチ反復領域とCRISPR反復配列の間で塩基対を形成する領域として、長さが約8個、約9個、約10個、約11個、約12個、約13個、約14個、約15個、約16個、約17個、約18個、約19個、約20個、約21個、約22個、約23個、約24個、約25個、約26個、約27個、約28個、約29個、約30個、またはそれよりも多い個数のヌクレオチドが可能である。特別な実施態様では、tracrRNAのうちでCRISPR反復配列と完全に、または部分的に相補的なアンチ反復領域は、長さが約20個のヌクレオチドである。いくつかの実施態様では、CRISPR反復配列とそれに対応するtracrRNAアンチ反復配列の間の相補性の程度は、約50%以上、約60%以上、約70%以上、約75%以上、約80%以上、約81%以上、約82%以上、約83%以上、約84%以上、約85%以上、約86%以上、約87%以上、約88%以上、約89%以上、約90%以上、約91%以上、約92%以上、約93%以上、約94%以上、約95%以上、約96%以上、約97%以上、約98%以上、約99%以上、またはそれよりも大きい。
さまざまな実施態様では、tracrRNA全体は、約60個のヌクレオチド〜約140個超のヌクレオチドを含むことができる。例えばtracrRNAとして、長さが約60個、約65個、約70個、約75個、約80個、約85個、約90個、約95個、約100個、約105個、約110個、約115個、約120個、約125個、約130個、約135個、約140個、またはそれよりも多い個数のヌクレオチドが可能である。特別な実施態様では、tracrRNAは、長さが約80個〜約90個のヌクレオチドであり、その中には長さが約80個、約81個、約82個、約83個、約84個、約85個、約86個、約87個、約88個、約89個、約90個のヌクレオチドが含まれる。いくつかの実施態様では、tracrRNAは、長さが約85個のヌクレオチドである。
特別な実施態様では、tracrRNAは、配列番号3、13、21、29、38、47、56いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含んでおり、それがガイドRNAの中に含まれているときには、本明細書に提示されている関連するRNA誘導型ヌクレアーゼを目的の標的配列に配列特異的に結合させることができる。いくつかの実施態様では、野生型配列の活性なtracrRNA配列バリアントは、配列番号3、13、21、29、38、47、56いずれかとして表わされるヌクレオチド配列と配列が少なくとも40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するヌクレオチド配列を含んでいる。いくつかの実施態様では、野生型配列の活性なtracrRNA配列断片は、配列番号3、13、21、29、38、47、56いずれかとして表わされるヌクレオチド配列の連続した少なくとも5個、10個、15個、20個、25個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、またはそれよりも多い個数のヌクレオチドを含んでいる。
2つのポリヌクレオチド配列は、その2つの配列が厳しい条件下で互いにハイブリダイズするとき、実質的に相補的であると見なすことができる。同様に、RGNは、そのRGNに結合したガイドRNAが厳しい条件下で特定の標的配列に結合する場合に、配列特異的なやり方でその標的配列に結合すると見なされる。「厳しい条件」または「厳しいハイブリダイゼーション条件」とは、2つのポリヌクレオチド配列が、他の配列よりも大きな程度(例えばバックグラウンドの少なくとも2倍)の検出可能性で互いにハイブリダイズする条件を意味する。厳しい条件は配列に依存しており、環境が異なれば異なるであろう。典型的には、厳しい条件は、塩の濃度が、pH 7.0〜8.3で約1.5 M未満のNaイオン、典型的には約0.01〜1.0 MのNaイオン(または他の塩)、かつ温度が短い配列(例えば10〜50個のヌクレオチド)では少なくとも約30℃、長い配列(例えば50個超のヌクレオチド)では少なくとも約60℃である条件である。厳しい条件は、脱安定剤(ホルムアミドなど)の添加によって実現することもできる。厳しさの低い代表的な条件には、30〜35%のホルムアミドと、1 MのNaClと、1%SDS(ドデシル硫酸ナトリウム)の緩衝溶液を用いた37℃でのハイブリダイゼーションと、50〜55℃の1×〜2×SSC(20×SSC=3.0 MのNaCl/0.3 Mのクエン酸三ナトリウム)の中での洗浄が含まれる。中程度の厳しさの代表的な条件には、37℃の40〜45%のホルムアミドと、1.0 MのNaClと、1%SDSの中でのハイブリダイゼーションと、55〜60℃の0.5×〜1×SSCの中での洗浄が含まれる。厳しさの程度が高い代表的な条件には、37℃の50%のホルムアミドと、1 MのNaClと、1%SDSの中でのハイブリダイゼーションと、60〜65℃の0.1×SSCの中での洗浄が含まれる。場合によっては、洗浄用緩衝液は、約0.1%〜約1%のSDSを含むことができる。ハイブリダイゼーションの時間は一般に約24時間未満であり、通常は約4〜約12時間である。洗浄時間は、少なくとも平衡に到達するのに十分な長さの時間になろう。
Tmは、相補的な標的配列の50%が、(規定されたイオン強度とpHのもとで)完全に一致した配列にハイブリダイゼーションする温度である。DNA-DNAハイブリッドに関しては、Tmは、MeinkothとWahl(1984年)Anal. Biochem. 第138巻:267〜284ページの式から大まかに知ることができ、Tm=81.5℃+16.6 (log M)+0.41(%GC)-0.61(%form)-500/Lとなる(ただしMは1価カチオンのモル数であり、%GCは、DNAの中のグアノシンヌクレオチドとシトシンヌクレオチドの割合であり、%formは、ハイブリダイゼーション溶液に含まれるホルムアミドの割合であり、Lは、塩基対の中のハイブリッドの長さである)。一般に、厳しい条件は、規定されたイオン強度とpHにおける具体的な配列とその相補的配列の融点(Tm)よりも約5℃低くなるように選択される。しかし極めて厳しい条件は、融点(Tm)よりも1℃、または2℃、または3℃、または4℃低い温度でのハイブリダイゼーションおよび/または洗浄を利用することができ;中程度に厳しい条件は、融点(Tm)よりも6℃、または7℃、または8℃、または9℃、または10℃低い温度でのハイブリダイゼーションおよび/または洗浄を利用することができ;厳しさが低い条件は、融点(Tm)よりも11℃、または12℃、または13℃、または14℃、または15℃、または20℃低い温度でのハイブリダイゼーションおよび/または洗浄を利用することができる。当業者は、ハイブリダイゼーションおよび/または洗浄溶液の厳しさの変動が、上記の式、組成物のハイブリダイゼーションと洗浄、望むTmを利用して本質的に記述されることを理解しているであろう。核酸のハイブリダイゼーションに関する包括的なガイドは、Tijssen(1993年)『Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes』、第I部、第2章(Elsevier社、ニューヨーク);Ausubel他編(1995年)『Current Protocols in Molecular Biology』、第2章(Greene Publishing and Wiley-Interscience社、ニューヨーク)に見いだされる。Sambrook他(1989年)『Molecular Cloning: A Laboratory Manual』(第2版)、Cold Spring Harbor Laboratory Press、プレインヴュー、ニューヨーク州を参照されたい。
ガイドRNAとして、単一ガイドRNA、または二重ガイドRNAシステムが可能である。単一ガイドRNAは、単一のRNA分子上にcrRNAとtracrRNAを含んでいるのに対し、二重ガイドRNAシステムは、2つの異なるRNA分子上に、crRNAとtracrRNAを、crRNAのCRISPR反復配列の少なくとも一部とtracrRNAの少なくとも一部(crRNAのCRISPR反復配列と完全に、または部分的に相補的なものが可能である)を通じて互いにハイブリダイズした状態で含んでいる。ガイドRNAが単一ガイドRNAである実施態様のいくつかでは、crRNAとtracrRNAはリンカーヌクレオチド配列によって隔てられている。一般に、リンカーヌクレオチド配列は、リンカーヌクレオチド配列のヌクレオチドの中に二次構造が形成されることを避けるため、またはリンカーヌクレオチド配列のヌクレオチドを含む二次構造が形成されることを避けるため、相補的な塩基を含んでいない配列である。いくつかの実施態様では、crRNAとtracrRNAの間のリンカーヌクレオチド配列は、長さが少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも11個、少なくとも12個、またはそれよりも多い個数のヌクレオチドである。特別な実施態様では、単一ガイドRNAのリンカーヌクレオチド配列は、長さが少なくとも4個のヌクレオチドである。いくつかの実施態様では、リンカーヌクレオチド配列は、配列番号63、64、65のいずれかとして表わされるヌクレオチド配列である。別の実施態様では、リンカーヌクレオチド配列は、長さが少なくとも6個のヌクレオチドである。いくつかの実施態様では、リンカーヌクレオチド配列は、配列番号65として表わされるヌクレオチド配列である。
単一ガイドRNA、または二重ガイドRNAは、化学的に合成すること、またはインビトロでの転写を通じて合成することができる。RGNとガイドRNAの間の配列特異的結合を明らかにするためのアッセイは本分野で知られており、その非限定的な例に含まれるのは、発現しているRGNとガイドRNAの間の結合アッセイである。ガイドRNAは、検出可能な標識(例えばビオチン)をタグとして付けてプル-ダウン検出アッセイで使用することができ、このアッセイでは、ガイドRNA:RGN複合体が(例えばストレプトアビジンビーズを用いて)検出可能な標識を通じて捕獲される。ガイドRNAとは無関係の配列または構造を持つ対照ガイドRNAを、RNAへのRGNの非特異的結合の陰性対照として用いることができる。いくつかの実施態様では、ガイドRNAは配列番号10、18、26、35、44、53、62のいずれかであり、その中のスペーサ配列は任意の配列が可能であり、ポリN配列として示される。
実施例8に記載されているように、本発明のいくつかのRGNは、いくつかのガイドRNAを共有することができる。APG05083.1、APG07433.1、APG07513.1、APG08290.1は、それぞれ、配列番号2、12、20、28いずれかのヌクレオチド配列を含むcrRNAを含むガイドRNAと、配列番号3、13、21、29いずれかのヌクレオチド配列をそれぞれ含む対応するtracrRNAを用いて機能することができる。さらに、APG04583.1とAPG01688.1は、それぞれ、配列番号46または55のヌクレオチド配列を含むcrRNAを含むガイドRNAと、配列番号47または56のヌクレオチド配列をそれぞれ含む対応するtracrRNAを用いて機能することができる。
いくつかの実施態様では、ガイドRNAは、標的細胞、またはオルガネラ(細胞小器官)、または胚の中にRNA分子として導入することができる。ガイドRNAは、インビトロで転写すること、または化学的に合成することができる。別の実施態様では、ガイドRNAをコードするヌクレオチド配列は、標的細胞、またはオルガネラ、または胚の中に導入される。これら実施態様のいくつかでは、ガイドRNAをコードするヌクレオチド配列は、プロモータ(例えばRNAポリメラーゼIIIプロモータ)に機能可能に連結されている。プロモータとして、天然のプロモータ、またはガイドRNAをコードするヌクレオチド配列にとって異種であるものが可能である。
さまざまな実施態様では、ガイドRNAは、本明細書に記載されているように、標的細胞、またはオルガネラ、または胚の中にリボ核タンパク質複合体として導入することができ、ガイドRNAは、RNA誘導型ヌクレアーゼポリペプチドに結合する。
ガイドRNAは、目的の特定の標的ヌクレオチド配列にハイブリダイズすることを通じ、関連するRNA誘導型ヌクレアーゼをその標的ヌクレオチド配列に向かわせる。標的ヌクレオチド配列は、DNA、またはRNA、またはその両者の組み合わせを含むことができ、一本鎖または二本鎖が可能である。標的ヌクレオチド配列として、ゲノムDNA(すなわち染色体DNA)、プラスミドDNA、RNA分子(例えばメッセンジャーRNA、リボソームRNA、トランスファーRNA、マイクロRNA、小さな干渉性RNA)のいずれかが可能である。標的ヌクレオチド配列には、RNA誘導型ヌクレアーゼがインビトロで、または細胞内で結合することができる。RGNが標的とする染色体配列として、核、プラスチド、ミトコンドリアの染色体配列が可能である。いくつかの実施態様では、標的ヌクレオチド配列は、標的ゲノムの中に1つだけである。
標的ヌクレオチド配列は、プロトスペーサモチーフ(PAM)に隣接している。プロトスペーサモチーフは一般に標的ヌクレオチド配列からヌクレオチド約1個〜約10個以内の位置にあり、その中には、標的ヌクレオチド配列からヌクレオチド約1個、または約2個、または約3個、または約4個、または約5個、または約6個、または約7個、または約8個、または約9個、または約10個が含まれる。PAMとして標的配列の5'または3'が可能である。いくつかの実施態様では、PAMは、本開示のRGNのための標的配列の3'である。一般に、PAMは約3〜4個のヌクレオチドからなるコンセンサス配列だが、特別な実施態様では、長さが2個、3個、4個、5個、6個、7個、8個、9個、またはそれよりも多い個数のヌクレオチドであることが可能である。さまざまな実施態様では、本開示のRGNによって認識されるPAM配列は、配列番号6、32、41、50、59のいずれかとして表わされるコンセンサス配列を含んでいる。非限定的なPAM配列は、配列番号7、69、70、71、72として表わされるヌクレオチド配列である。
特別な実施態様では、配列番号1、11、19、27、36、45、54のいずれかを持つRNA誘導型ヌクレアーゼ、またはその活性なバリアントまたは断片は、それぞれ、配列番号6、32、41、50、59、7のいずれかとして表わされるPAM配列に隣接した標的ヌクレオチド配列に結合する。これら実施態様のいくつかでは、RGNは、それぞれ配列番号2、12、20、28、37、46、55のいずれかとして表わされるCRISPR反復配列、またはその活性なバリアントまたは断片を含むとともに、それぞれ配列番号3、13、21、29、38、47、56のいずれかとして表わされるtracrRNA配列、またはその活性なバリアントまたは断片を含むガイド配列に結合する。RGNシステムは、本明細書の実施例1と表1にさらに詳しく記載されている。
所与のヌクレアーゼ酵素のためのPAM配列特異性が酵素の濃度の影響を受けることは周知である(例えばKarvelis他(2015年)Genome Biol第16巻:253ページを参照されたい)。この濃度は、RGNを発現させるのに用いるプロモータを変えることによって、または細胞、オルガネラ、胚のいずれかに送達されるリボ核タンパク質複合体の量を変えることによって変更することができる。
RGNは、対応するPAM配列を認識すると、特定の切断部位にある標的ヌクレオチド配列を切断することができる。本明細書では、切断部位は、標的ヌクレオチド配列内の2つの特定のヌクレオチドで構成されており、その間でヌクレオチド配列がRGNによって切断される。切断部位は、PAMから5'方向または3'方向に向かって1番目と2番目のヌクレオチド、または2番目と3番目のヌクレオチド、または3番目と4番目のヌクレオチド、または4番目と5番目のヌクレオチド、または5番目と6番目のヌクレオチド、または7番目と8番目のヌクレオチド、または8番目と9番目のヌクレオチドを含むことができる。いくつかの実施態様では、切断部位は、PAMから5'方向または3'方向に向かって10個、または11個、または12個、または13個、または14個、または15個、または16個、または17個、または18個、または19個、または20個のヌクレオチドを超えた位置に存在することが可能である。いくつかの実施態様では、切断部位は、PAMからヌクレオチド4個分離れている。別の実施態様では、切断部位はPAMから少なくとも15個のヌクレオチド離れている。RGNは標的ヌクレオチド配列を切断して粘着末端にすることができるため、いくつかの実施態様では、切断部位は、ポリヌクレオチドのプラス(+)鎖上のPAMからヌクレオチド2個の距離と、ポリヌクレオチドのマイナス(-)鎖上のPAMからヌクレオチド2個の距離に基づいて規定される。
III.RNA誘導型ヌクレアーゼ、および/またはCRISPR RNA、および/またはtracrRNAをコードするヌクレオチド
本開示により、本開示のCRISPR RNA、および/またはtracrRNA、および/またはsgRNAを含むポリヌクレオチドと、本開示のRNA誘導型ヌクレアーゼ、および/またはCRISPR RNA、および/またはtracrRNA、および/またはsgRNAをコードするヌクレオチド配列を含むポリヌクレオチドが提供される。本開示のポリヌクレオチドは、配列番号2、12、20、28、37、46、55いずれかのヌクレオチド配列を含むCRISPR反復配列、またはその活性なバリアントまたは断片を含むかコードするポリヌクレオチドを含んでいて、このCRISPR反復配列、またはその活性なバリアントまたは断片は、ガイドRNAの中に含まれているとき、関連するRNA誘導型ヌクレアーゼを目的の標的配列に配列特異的に結合させることができる。配列番号3、13、21、29、38、47、56いずれかのヌクレオチド配列を含むtracrRNA、またはその活性なバリアントまたは断片を含むかコードするポリヌクレオチドも開示されており、このtracrRNA、またはその活性なバリアントまたは断片は、ガイドRNAの中に含まれているとき、関連するRNA誘導型ヌクレアーゼを目的の標的配列に配列特異的に結合させることができる。配列番号1、11、19、27、36、45、54のいずれかとして表わされるアミノ酸配列を含むRNA誘導型ヌクレアーゼと、その活性な断片またはバリアントをコードするポリヌクレオチドも提供され、このRNA誘導型ヌクレアーゼと、その活性な断片またはバリアントは、標的ヌクレアーゼ配列にRNA誘導型配列特異的なやり方で結合する能力を保持している。
使用されている「ポリヌクレオチド」という用語は、本開示ではDNAを含むポリヌクレオチドに限定されない。当業者は、ポリヌクレオチドに、リボヌクレオチド(RNA)と、リボヌクレオチドとデオキシリボヌクレオチドの組み合わせを含めることが可能であることを認識しているであろう。このようなデオキシリボヌクレオチドとリボヌクレオチドに、天然の分子と合成類似体の両方が含まれる。その中には、ペプチド核酸(PNA)、PNA-DNAキメラ、架橋型核酸(LNA)、ホスホチオレート架橋配列が含まれる。本明細書に開示されているポリヌクレオチドにはあらゆる形態の配列も包含され、その非限定的な例に含まれるのは、一本鎖の形態、二本鎖の形態、DNA-RNAハイブリッド、三本鎖構造、ステム-ループ構造などである。
RGNをコードする核酸分子として、目的の生物の体内における発現を最適化するコドンが可能である。「コドンが最適化された」コード配列は、特定の宿主細胞の好ましいコドンの使用頻度または転写条件を模倣するように設計されたコドン使用頻度を持つ配列をコードするポリヌクレオチドである。核酸レベルで、翻訳されるアミノ酸配列が変化しないように1つ以上のコドンが変化している結果として、その特定の宿主細胞または生物における発現が増加する。核酸分子の全体または一部についてコドンを最適化することができる。広い範囲の生物について好ましい情報を提供するコドン表とそれ以外の参考文献を本分野で入手することができる(植物が好むコドンの利用に関しては、例えばCampbellとGowri(1990年)Plant Physiol. 第92巻:1〜11ページを参照されたい)。本分野では、植物が好む遺伝子を合成するための方法を利用することができる。例えばアメリカ合衆国特許第5,380,831号、第5,436,391号、Murray他(1989年)Nucleic Acids Res. 第17巻:477〜498ページを参照されたい(参照によって本明細書に組み込まれている)。
本明細書に提示されているRGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードするポリヌクレオチドを発現カセットに入れて提供し、インビトロで発現させること、または目的の細胞、オルガネラ、胚、生物いずれかの中で発現させることができる。カセットは、本明細書に提示されているRGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードするポリヌクレオチドに機能可能に連結された5'調節配列と3'調節配列を含むことで、このポリヌクレオチドの発現が可能になろう。カセットはさらに、生物に入れて同時形質転換するための少なくとも1つの追加の遺伝子または遺伝子エレメントを含むことができる。追加の遺伝子またはエレメントが含まれている場合には、これらの要素は機能可能に連結されている。「機能可能に連結された」という表現は、2つ以上のエレメントの間の機能的な連結を意味する。例えばプロモータと目的のコード領域(例えばRGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードする領域)の間の機能可能な連結は、目的のこのコード領域の発現を可能にする機能的な連結である。機能可能に連結されたエレメントは、連続していても不連続でもよい。「機能可能に連結された」が、2つのタンパク質コード領域の接合に言及するのに用いられているときには、それらコード領域が同じリーディングフレームの中にあることを意味する。あるいは追加の遺伝子またはエレメントは、複数の発現カセット上に提供することができる。例えば本開示のRGNをコードするヌクレオチド配列は1つの発現カセット上にあるのに対し、crRNA、trancrRNA、完全なガイドRNAのいずれかをコードするヌクレオチド配列は別の発現カセット上にあることが可能である。このような発現カセットは、調節領域の転写調節下にあるポリヌクレオチドを挿入するための複数の制限部位および/または組み換え部位とともに提供される。発現カセットは、選択マーカー遺伝子を追加して含むことができる。
発現カセットは、転写の5'→3'方向に向かって、目的の生物の中で機能する本発明の転写(と、いくつかの場合には翻訳)開始領域(すなわちプロモータ)と、RGNをコードするポリヌクレオチドと、crRNAをコードするポリヌクレオチドと、tracrRNAをコードするポリヌクレオチドと、sgRNAをコードするポリヌクレオチドと、転写(と、いくつかの場合には翻訳)終止領域(すなわち終止領域)を含むことになろう。本発明のプロモータは、宿主細胞の中でコード配列の発現を指示または命令することができる。これらの調節領域(例えばプロモータ、転写調節領域、翻訳終止領域)は、宿主細胞に内在するもの、または宿主にとって異種のもの、または内在性のものと異種のものの混合が可能である。配列に関して本明細書で用いられている「異種の」は、外来種に由来する配列であるか、同じ種に由来する場合には、人為的な介入によって組成および/またはゲノム遺伝子座の中の天然の形態から実質的に改変されている配列である。本明細書では、キメラ遺伝子は、コード配列として、このコード配列にとって異種の転写開始領域に機能可能に連結されたコード配列を含んでいる。
便利な終止領域(オクトピンシンターゼ終止領域とノパリンシンターゼ終止領域)をアグロバクテリウム・ツメファシエンスのTiプラスミドから入手することができる。Guerineau他(1991年)Mol. Gen. Genet. 第262巻:141〜144ページ;Proudfoot (1991年)Cell第64巻:671〜674ページ;Sanfacon他(1991年)Genes Dev. 第5巻:141〜149ページ;Mogen他(1990年)Plant Cell第2巻:1261〜1272ページ;Munroe他(1990年)Gene第91巻:151〜158ページ;Ballas他(1989年)Nucleic Acids Res. 第17巻:7891〜7903ページ;Joshi他(1987年)Nucleic Acids Res. 第15巻:9627〜9639ページも参照されたい。
追加の調節シグナルの非限定的な例に含まれるのは、転写開始部位、オペレータ、アクチベータ、エンハンサ、これら以外の調節エレメント、リボソーム結合部位、開始コドン、終止シグナルなどである。例えばアメリカ合衆国特許第5,039,523号と第4,853,331号;EPO 0480762A2;Sambrook他(1992年)『Molecular Cloning: A Laboratory Manual』、Maniatis他編(Cold Spring Harbor Laboratory Press、コールド・スプリング・ハーバー、ニューヨーク州)(今後は「Sambrook 11」と呼ぶ);Davis他編(1980年)『Advanced Bacterial Genetics』(Cold Spring Harbor Laboratory Press)、コールド・スプリング・ハーバー、ニューヨーク州と、これらの中で引用されている参考文献を参照されたい。
発現カセットを用意する際には、さまざまなDNA断片を操作し、適切な向きと、必要に応じて適切なリーディングフレームにされたDNA配列が提供されるようにする。この目的に向け、アダプタまたはリンカーを用いてDNA断片を接合することや、他の操作として、便利な制限部位の提供、余分なDNAの除去、制限部位の除去などのための操作を含めることができる。この目的で、インビトロの突然変異誘発、プライマーの修復、制限、アニーリング、再置換(例えば転位(トランジション)と転換(トランスバージョン))を含めることができる。
本発明を実施するのに多数のプロモータを使用することができる。プロモータは、望む結果に基づいて選択することができる。目的の生物の中で発現させるため、核酸を、構成的プロモータ、誘導性プロモータ、増殖段階特異的プロモータ、細胞タイプ特異的プロモータ、組織選択的プロモータ、組織特異的プロモータ、またはこれら以外のプロモータと組み合わせることができる。例えばWO 99/43838と、アメリカ合衆国特許第8,575,425号;第7,790,846号;第8,147,856号;第8,586832号;第7,772,369号;第7,534,939号;第6,072,050号;第5,659,026号;第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号;第6,177,611号に記載されているプロモータを参照されたい(これらは参照によって本明細書に組み込まれている)。
植物の中で発現させるため、構成的プロモータには、CaMV 35Sプロモータ(Odell他(1985年)Nature第313巻:810〜812ページ);イネのアクチン(McElroy他(1990年)Plant Cell第2巻:163〜171ページ);ユビキチン(Christensen他(1989年)Plant Mol. Biol. 第12巻:619〜632ページと、Christensen他(1992年)Plant Mol. Biol. 第18巻:675〜689ページ);pEMU(Last他(1991年)Theor. Appl. Genet. 第81巻:581〜588ページ);MAS (Velten他(1984年)EMBO J. 第3巻:2723〜2730ページ)も含まれる。
誘導性プロモータの例は、低酸素ストレスまたは低温ストレスによって誘導可能なAdh 1プロモータ、熱ストレスによって誘導可能なHsp70プロモータ、光によって誘導可能なPPDKプロモータとペプカルボキシラーゼプロモータである。化学的に誘導可能なプロモータ、例えば薬害軽減剤によって誘導されるIn2-2プロモータ(アメリカ合衆国特許第5,364,780号)、オーキシンによって誘導され、タペート組織特異的だがカルスの中でも活性なAxig1プロモータ(PCT US01/22169)、ステロロイド反応性プロモータ(例えばSchena他(1991年)Proc. Natl. Acad. Sci. USA第88巻:10421〜10425ページと、McNellis他(1998年)Plant J. 第14巻(2):247〜257ページを参照されたい)、テトラサイクリンによる誘導と抑制が可能なプロモータ(例えばGatz他(1991年)Mol. Gen. Genet. 第227巻:229〜237ページ、アメリカ合衆国特許第5,814,618号、第5,789,156号を参照されたい;これらは参照によって本明細書に組み込まれている)も有用である。
組織特異的または組織選択的なプロモータは、特定の組織内で発現コンストラクトを発現させることを目的として用いることができる。いくつかの実施態様では、組織特異的または組織選択的なプロモータは、植物組織の中で活性である。植物の中で発生制御下にあるプロモータの例に含まれるのは、所定の組織(葉、根、果実、種子、花など)の中で選択的に転写を開始するプロモータである。「組織特異的」プロモータは、所定の組織の中だけで転写を開始するプロモータである。組織特異的発現は、遺伝子の構成的発現とは異なり、遺伝子調節の相互作用のレベルがいくつかあることの結果である。そのため、相同な植物種、または近縁の植物種からのプロモータを選択的に用いて特定の組織内で導入遺伝子の効果的かつ信頼性の高い発現を実現することができる。いくつかの実施態様では、発現は、組織選択的プロモータを含む。「組織選択的」プロモータは、選択的に転写を開始するが、必ずしも全面的に所定の組織の中で、または所定の組織の中だけで転写を開始するのではないプロモータである。
いくつかの実施態様では、RGN、および/またはcrRNA、および/またはtracrRNAをコードする核酸分子は、細胞タイプ特異的プロモータを含んでいる。「細胞タイプ特異的」プロモータは、1つ以上の器官内のいくつかのタイプの細胞の中での発現を主に命令するプロモータである。植物の中で機能する細胞タイプ特異的プロモータが主に活性であることのできる植物細胞のいくつかの例に含まれるのは、例えばBETL細胞、根と葉の中の維管束細胞、茎細胞、幹細胞である。核酸分子は、細胞タイプ選択的プロモータも含むことができる。「細胞タイプ選択的」プロモータは、たいていは1つ以上の器官内のいくつかのタイプの細胞の中で発現を命令するが、必ずしも全面的に所定の組織の中で、または所定の組織の中だけで発現を命令するのではないプロモータである。植物の中で機能する細胞タイプ選択的プロモータが選択的に活性であることのできる植物細胞のいくつかの例に含まれるのは、例えばBELT細胞、根と葉の中の維管束細胞、茎細胞、幹細胞である。
RGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードする核酸分子は、例えばインビトロでのmRNA合成のためのプロモータ配列ファージRNAポリメラーゼによって認識されるプロモータ配列に機能可能に連結させることができる。このような実施態様では、インビトロで転写されるRNAを精製し、本明細書に記載されている方法で使用することができる。例えばプロモータ配列として、T7プロモータ配列、T3プロモータ配列、SP6プロモータ配列、またはT7プロモータ配列、T3プロモータ配列、SP6プロモータ配列のバリエーションが可能である。このような実施態様では、発現したタンパク質および/またはRNAを精製し、本明細書に記載されているゲノム改変の方法で使用することができる。
いくつかの実施態様では、RGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードするポリヌクレオチドは、ポリアデニル化シグナル(例えば植物の中で機能するSV40ポリAシグナルとそれ以外のシグナル)および/または少なくとも1つの転写終止配列に連結することもできる。それに加え、本明細書の別の箇所に記載されているように、RGNをコードする配列も、タンパク質を特定の細胞内位置に移動させることのできる少なくとも1つの核局在化シグナル、および/または少なくとも1つの細胞侵入ドメイン、および/または少なくとも1つのシグナルペプチドをコードする配列に連結することができる。
RGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードするポリヌクレオチドは、1つのベクター、または複数のベクターの中に存在することができる。「ベクター」は、核酸を宿主細胞の中に移す、または送達する、または導入するためのポリヌクレオチド組成物を意味する。適切なベクターに含まれるのは、プラスミドベクター、ファージミド、コスミド、人工/ミニ染色体、トランスポゾン、ウイルスベクター(例えばレンチウイルスベクター、アデノ随伴ウイルスベクター、バキュロウイルスベクター)である。ベクターは、追加発現制御配列(例えばエンハンサ配列、コザック配列、ポリアデニル化配列、転写終止配列)、選択マーカー配列(例えば抗生剤耐性遺伝子)、複製起点などを含むことができる。追加情報は、『Current Protocols in Molecular Biology』Ausubel他、John Wiley & Sons社、ニューヨーク、2003年、または『Molecular Cloning: A Laboratory Manual』、SambrookとRussell、Cold Spring Harbor Press、コールド・スプリング・ハーバー、ニューヨーク州、第3版、2001年に見いだすことができる。
ベクターは、形質転換された細胞を選択するための選択マーカー遺伝子も含むことができる。選択マーカー遺伝子は、形質転換された細胞または組織を選択するために使用される。マーカー遺伝子に含まれるのは、抗生剤耐性をコードする遺伝子(ネオマイシンホスホトランスフェラーゼII(NEO)とハイグロマイシンホスホトランスフェラーゼ(HPT)をコードする遺伝子など)のほか、殺虫化合物(グルホシネートアンモニウム、ブロモキシニル、イミダゾリノン、2,4-ジクロロフェノキシ酢酸塩(2,4-D)など)に対する耐性を与える遺伝子である。
いくつかの実施態様では、RGNポリペプチドをコードする配列を含む発現カセットまたはベクターは、crRNAおよび/またはtracrRNAをコードする配列、またはガイドRNAを生成させるために組み合わされるcrRNAとtracrRNAをさらに含むことができる。crRNAおよび/またはtracrRNAをコードする配列は、目的の生物または宿主細胞の中でcrRNAおよび/またはtracrRNAを発現させるため、少なくとも1つの転写制御配列に機能可能に連結させることができる。例えばcrRNAおよび/またはtracrRNAをコードするポリヌクレオチドは、RNAポリメラーゼIII(Pol III)によって認識されるプロモータ配列に機能可能に連結させることができる。適切なPol IIIプロモータの非限定的な例に含まれるのは、哺乳動物のU6プロモータ、U3プロモータ、H1プロモータ、7SL RNAプロモータと、イネのU6プロモータ、U3プロモータである。
示されているように、RGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードする発現コンストラクトを用いて目的の生物を形質転換することができる。形質転換の方法は、ヌクレオチドコンストラクトを目的の生物の中に導入することを含んでいる。「導入する」とは、ヌクレオチドコンストラクトを宿主細胞の中に導入し、そのコンストラクトが宿主細胞の内部にアクセスすることを意味する。本発明の方法は、ヌクレオチドコンストラクトを宿主生物の中に導入する特別な方法を必要とせず、ヌクレオチドコンストラクトが宿主生物の少なくとも1個の細胞の内部にアクセスできるだけでよい。宿主細胞として真核細胞または原核細胞が可能である。特別な実施態様では、真核細胞は、植物細胞、哺乳動物の細胞、昆虫細胞のいずれかである。ヌクレオチドコンストラクトを植物やそれ以外の宿主細胞に導入する方法は本分野で知られており、その非限定的な例に含まれるのは、安定に形質転換する方法、一過性に形質転換する方法、ウイルスを媒介とする方法である。
これらの方法により、形質転換された生物(例えば植物であり、その中には植物体全体のほか、植物の器官(例えば葉、幹、根など)、種子、植物細胞、むかご、これらの胚と子孫が含まれる)が得られる。植物細胞は、分化していること、または未分化であることが可能である(例えばカルス、懸濁培養細胞、プロトプラスト、葉細胞、根細胞、師管細胞、花粉)。
「トランスジェニック生物」または「形質転換された生物」または「安定に形質転換された」生物または細胞または組織は、本発明のRGN、および/またはcrRNA、および/またはtracrRNA、および/またはsgRNAをコードするポリヌクレオチドが組み込まれているか一体化している生物を意味する。他の外来性または内在性の核酸配列またはDNA断片も宿主細胞の中に組み込めることが知られている。アグロバクテリウムとバイオリスティックを媒介とした形質転換は、植物細胞を形質転換するのに相変わらず利用されている2つの主要なアプローチである。しかし宿主細胞の形質転換は、感染、トランスフェクション、微量注入、電気穿孔、マイクロプロジェクション、バイオリスティックまたは粒子衝突、シリカ/炭素繊維、超音波を媒介とした方法、PEGを媒介とした方法、リン酸カルシウム共沈降、ポリカチオンDMSO技術、DEAEデキストラン手続き、ウイルスを媒介とした方法、リポソームを媒介とした方法などによって実現することができる。ウイルスを媒介としてRGN、および/またはcrRNA、および/またはtracrRNAをコードするポリヌクレオチドを導入する方法に含まれるのは、レトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルスを媒介とした導入と発現のほか、カリモウイルス、ジェミニウイルス、RNA植物ウイルスの利用である。
形質転換のプロトコルのほか、ポリペプチド配列またはポリヌクレオチド配列を植物の中に導入するプロトコルは、形質転換の標的となる宿主細胞のタイプ(例えば単子葉植物の細胞または双子葉植物の細胞)によって異なる可能性がある。形質転換の方法は本分野で知られており、その中に含まれるのは、アメリカ合衆国特許第8,575,425号;第7,692,068号;第8,802,934号;第7,541,517号に記載されている方法である(それぞれが参照によって本明細書に組み込まれている)。Rakoczy-Trojanowska、M.(2002年)Cell Mol Biol Lett. 第7巻:849〜858ページ;Jones他(2005年)Plant Methods第1巻:5ページ;Rivera他(2012年)Physics of Life Reviews第9巻:308〜345ページ;Bartlett他(2008年)Plant Methods第4巻:1〜12ページ;Bates、G.W.(1999年)Methods in Molecular Biology 第111巻:359〜366ページ;BinnsとThomashow(1988年)Annual Reviews in Microbiology第42巻:575〜606ページ;Christou、P.(1992年)The Plant Journal第2巻:275〜281ページ;Christou、P.(1995年)Euphytica第85巻:13〜27ページ;Tzfira他(2004年)TRENDS in Genetics第20巻:375〜383ページ;Yao他(2006年)Journal of Experimental Botany第57巻:3737〜3746ページ;ZupanとZambryski(1995年)Plant Physiology第107巻:1041〜1047ページも参照されたい。
形質転換により、細胞の中に核酸を安定に、または一過性に組み込むことができる。「安定な形質転換」は、宿主細胞の中に導入されたヌクレオチドコンストラクトが、その宿主細胞のゲノムに組み込まれ、その子孫によって遺伝させることができることを意味する。「一過性の形質転換」は、ポリヌクレオチドが宿主細胞の中に導入されるがその宿主細胞のゲノムに組み込まれないことを意味する。
葉緑体を形質転換する方法が本分野で知られている。例えばSvab他(1990年)Proc. Nail. Acad. Sci. USA 第87巻:8526〜8530ページ;SvabとMaliga(1993年)Proc. Natl. Acad. Sci. USA 第90巻:913〜917ページ;SvabとMaliga (1993年)EMBO J. 第12巻:601〜606ページを参照されたい。この方法は、選択マーカーを含有するDNAを粒子銃で送達し、相同組み換えを通じてそのDNAをプラスチドのゲノムに向かわせることに依存している。それに加え、プラスチドの形質転換は、核がコードするプラスチド誘導型RNAポリメラーゼの組織選択的発現によってプラスチドが運ぶサイレントな導入遺伝子を交差活性化することによって実現することができる。このようなシステムは、McBride他(1994年)Proc. Natl. Acad. Sci. USA 第91巻:7301〜7305ページに報告されている。
形質転換された細胞を従来のやり方に従ってトランスジェニック生物(植物など)の中に入れて増殖させることができる。例えばMcCormick他(1986年)Plant Cell Reports 第5巻:81〜84ページを参照されたい。次いでこの植物を増殖させ、同じ形質転換された株、または異なる株を用いて受粉させ、得られたハイブリッドの中から望む表現型の特徴が構成的に発現しているものを同定する。2世代以上増殖させて望む表現型の特徴の発現が安定に維持されて遺伝することを確認した後、種子を回収して望む表現型の特徴が実現したことを確認する。このようにして、本発明により、本発明のヌクレオチドコンストラクト(例えば本発明の発現カセット)がゲノムの中に安定に組み込まれた形質転換種子(「トランスジェニック種子」とも呼ぶ)が提供される。
あるいは形質転換された細胞を生物の中に導入することができる。これらの細胞は生物に由来するものが可能であったと考えられ、その場合には、細胞は生体外アプローチで形質転換される。
本明細書に提示されている配列は、任意の植物種(その非限定的な例に、単子葉植物と双子葉植物が含まれる)の形質転換に用いることができる。目的の植物の非限定的な例に含まれるのは、トウモロコシ、モロコシ、コムギ、ヒマワリ、トマト、アブラナ科植物、コショウ、ジャガイモ、木綿、イネ、ダイズ、テンサイ、サトウキビ、タバコ、オオムギ、ナタネ、アブラナ属の種、アルファルファ、ライムギ、雑穀、ベニバナ、ピーナツ、サツマイモ、キャッサバ、コーヒー、ココナツ、パイナップル、柑橘類、ココア、茶、バナナ、アボカド、イチジク、グアバ、マンゴ、オリーブ、パパイヤ、カシューナッツ、マカダミアナッツ、アーモンド、エンバク、野菜、装飾植物、針葉樹である。
野菜の非限定的な例に含まれるのは、トマト、レタス、グリーンピース、ライマメ、エンドウマメと、キュウリ属のメンバーであるキュウリ、カンタループ、マスクメロンである。装飾植物の非限定的な例に含まれるのは、アザレア、アジサイ、ハイビスカス、バラ、チューリップ、ラッパズイセン、ペチュニア、カーネーション、ポインセチア、菊である。本発明の植物は、栽培作物(例えばトウモロコシ、モロコシ、コムギ、ヒマワリ、トマト、アブラナ科植物、コショウ、ジャガイモ、木綿、イネ、ダイズ、テンサイ、サトウキビ、タバコ、オオムギ、ナタネなど)であることが好ましい。
本明細書では、植物という用語に含まれるのは、植物細胞、植物プロトプラスト、植物を再生させることのできる植物細胞組織培養物、植物カルス、植物の集団、植物内の完全な植物細胞、植物の一部(胚、花粉、胚珠、種子、葉、花、枝、果実、仁、穂、穂軸、殻、茎、根、根冠、葯など)である。穀粒は、農作物栽培者が増殖または生殖以外の目的で生産した成熟した種子を意味する。再生した植物の子孫、バリアント、変異体も本発明の範囲に含まれるが、導入されたポリヌクレオチドを含んでいることが条件である。さらに、本明細書に開示されている配列を保持している加工された植物製品または副生成物(例えば大豆粕)も提供される。
RGN、および/またはcrRNA、および/またはtracrRNAをコードするポリヌクレオチドは、任意の原核生物種を形質転換するのにも使用できる。原核生物種の非限定的な例に含まれるのは、古細菌と細菌(例えばバシラス属の種、クレブシエラ属の種、ストレプトマイセス属の種、リゾビウム属の種、大腸菌属の種、シュードモナス属の種、サルモネラ属の種、赤痢菌属の種、ビブリオ属の種、エルシニア属の種、マイコプラズマ属の種、アグロバクテリウム、ラクトバシラス属の種)である。
RGN、および/またはcrRNA、および/またはtracrRNAをコードするポリヌクレオチドは、任意の真核生物種を形質転換するのにも使用できる。真核生物種の非限定的な例に含まれるのは、動物(例えば哺乳動物、昆虫、魚類、鳥類、爬虫類)、菌類、アメーバ、藻類、酵母である。
ウイルスと非ウイルスに基づく従来からの遺伝子導入法を利用して核酸を哺乳動物の細胞または標的組織に導入することができる。このような方法を利用してCRISPRシステムの構成要素をコードする核酸を培養中の細胞または宿主生物に投与することができる。非ウイルスベクター送達系に含まれるのは、DNAプラスミド、RNA(例えば本明細書に記載されているベクターの転写産物)、裸の核酸、送達ビヒクル(リポソームなど)との複合体にされた核酸である。ウイルスベクター送達系に含まれるのはDNAウイルスとRNAウイルスであり、これらのウイルスは細胞に送達された後にエピソーマルゲノムまたは組み込まれたゲノムを有する。遺伝子療法の総説に関しては、Anderson、Science 第256巻:808〜813ページ(1992年);NabelとFeigner、TIBTECH第11巻:211〜217ページ(1993年);MitaniとCaskey、TIBTECH第11巻:162〜166ページ(1993年);Dillon、TIBTECH第11巻:167〜175ページ(1993年);Miller、Nature第357巻:455〜460ページ(1992年);Van Brunt、Biotechnology第6巻(10): 1149〜1154ページ(1988年);Vigne、Restorative Neurology and Neuroscience第8巻:35〜36ページ(1995年);KremerとPerricaudet、British Medical Bulletin第51巻(1):31〜44ページ(1995年);『Current Topics in Microbiology and Immunology』、DoerflerとBohm(編)の中のHaddada他(1995年);Yu他、Gene Therapy第1巻:13〜26ページ(1994年)を参照されたい。
核酸の非ウイルス送達法には、リポフェクション、ヌクレオフェクション、微量注入、バイオリスティック、ウイロソーム、リポソーム、イムノリポソーム、ポリカチオンまたは脂質:核酸複合体、裸のDNA、人工ビリオン、DNAの薬剤増強式取り込みが含まれる。リポフェクションは例えばアメリカ合衆国特許第5,049,386号、第4,946,787号、第4,897,355号に記載されており、リポフェクション試薬が市販されている(例えばTransfectam(商標)とLipofectin(商標))。ポリヌクレオチドの効率的な受容体認識リポフェクションに適したカチオン性脂質と中性脂質には、FelgnerによるWO 91/17424;WO 91/16024の脂質が含まれる。送達は、細胞(例えばインビトロ投与または生体外投与)または標的組織(例えば生体内投与)に対してなすことができる。脂質:核酸複合体の調製は、標的とされるリポソーム(イムノ脂質複合体など)の調製を含め、当業者に周知である(例えばCrystal、Science第270巻:404〜410ページ(1995年);Blaese他、Cancer Gene Ther. 第2巻:291〜297ページ(1995年);Behr他、Bioconjugate Chem. 第5巻:382〜389ページ(1994年);Remy他、Bioconjugate Chem. 第5巻:647〜654ページ(1994)年);Gao他、Gene Therapy第2巻:710〜722ページ(1995年);Ahmad他、Cancer Res. 第52巻:4817〜4820ページ(1992年);アメリカ合衆国特許第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号、第4,946,787号を参照されたい)。
核酸の送達にRNAウイルスまたはDNAウイルスに基づくシステムを用いるというのは、ウイルスを体内の特定の細胞に向かわせてウイルスのペイロードを核に輸送するための高度に進化した方法を利用することである。ウイルスベクターは、患者に直接投与することができる(生体内)。あるいはウイルスベクターをインビトロで細胞を処置するのに用い、場合によっては改変された細胞を患者に投与することができる(生体外)。ウイルスに基づく従来のシステムは、遺伝子を輸送するためのレトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルスベクター、単純ヘルペスウイルスベクターを含んでいた。宿主のゲノムへの組み込みは、レトロウイルス、レンチウイルス、アデノ随伴ウイルスによる遺伝子輸送法を用いることによって可能になり、その結果として挿入された導入遺伝子が長期にわたって発現することがしばしばある。それに加え、大きな遺伝子導入効率が、異なる多くのタイプの細胞と標的組織で観察されてきた。
レトロウイルスの指向性は、外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を増殖させることによって変えることができる。レンチウイルスベクターは、非分裂細胞に遺伝子導入または感染することのできるレトロウイルスベクターであり、典型的には高いウイルス力価を生み出す。したがってレトロウイルス遺伝子輸送システムの選択は、標的組織に依存すると考えられる。レトロウイルスベクターは、シス作用性の長い末端反復からなり、6〜10 kbまでの外来配列をパッケージする能力を持つ。ベクターの複製とパッケージングには最小のシス作用性LTRで十分であり、このベクターを用いて治療遺伝子を標的細胞の中に組み込み、導入遺伝子を恒久的に発現させる。広く使用されているレトロウイルスベクターに含まれるのは、マウス白血病ウイルス(MuLV)、ギボン白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)に基づくベクターと、これらの組み合わせである(例えばBuchscher他、J. Viral. 第66巻:2731〜2739ページ(1992年);Johann他、J. Viral. 第66巻:1635〜1640ページ(1992年);Sommnerfelt他、J. Viral. 第176巻:58〜59ページ(1990年);Wilson他、J. Viral. 第63巻:2374〜2378ページ(1989年);Miller他、J. Viral. 第65巻:2220〜2224ページ(1991年);PCT/US94/05700を参照されたい)。
一過性発現が好ましい用途では、アデノウイルスに基づくシステムを用いることができる。アデノウイルスに基づくベクターは、多くのタイプの細胞で非常に高い遺伝子導入効率が可能であり、細胞分裂を必要としない。このようなベクターを用いて高力価と高い発現レベルが得られている。このベクターは、比較的簡単なシステムの中で大量に作製することができる。例えば核酸とペプチドをインビトロで作製するため、生体内と生体外の遺伝子療法のため、アデノ随伴ウイルス(「AAV」)ベクターを用いて細胞に標的核酸を導入することもできる(例えばWest他、Virology 第160巻:38〜47ページ(1987年);アメリカ合衆国特許第4,797,368号;WO 93/24641;Katin、Human Gene Therapy第5巻:793〜801ページ(1994年);Muzyczka、J. Clin. Invest. 第94巻:1351ページ(1994年)を参照されたい)。組み換えAAVベクターの構築は多数の刊行物に記載されており、そうした刊行物に含まれるのは、アメリカ合衆国特許第5,173,414号;Tratschin他、Mol. Cell. Biol. 第5巻:3251〜3260ページ(1985年);Tratschin他、Mol. Cell. Biol. 第4巻:2072〜2081ページ(1984年);HermonatとMuzyczka、PNAS 第81巻:6466〜6470ページ(1984年);Samulski他、J. Viral. 第63巻:3822〜3828ページ(1989年)である。典型的にはパッケージング細胞を用いて、宿主細胞に感染することのできるウイルス粒子を形成する。このような細胞に含まれるのは、293細胞(アデノウイルスをパッケージする)と、ΨJ2細胞またはPA317細胞(レトロウイルスをパッケージする)である。
遺伝子療法で用いられるウイルスベクターは、通常は、核酸ベクターをウイルス粒子の中にパッケージする細胞系を生成させることによって作製する。ベクターは、典型には、パッケージングとその後の宿主への組み込みに必要な最小ウイルス配列を含有していて、他のウイルス配列は、発現することになるポリヌクレオチドのための発現カセットによって置き換えられる。失われるウイルス機能は、典型的には、パッケージング細胞系によってトランスで供給される。例えば遺伝子療法で用いられるAAVベクターは、典型的には、パッケージングと宿主ゲノムへの組み込みに必要なAAVゲノムからのITR配列だけを有する。ウイルスDNAは、他のAAV遺伝子(すなわちrepとcap)をコードするがITR配列を欠くヘルパープラスミドを含有している細胞系の中にパッケージされる。
細胞系には、ヘルパーとしてアデノウイルスを感染させることもできる。ヘルパーウイルスプロモータは、AAVベクターの複製と、ヘルパープラスミドからのAAV遺伝子の発現を促進する。ヘルパープラスミドは、ITR配列が欠けていることが原因で大量にはパッケージされない。アデノウイルスを用いた汚染は、例えばAAVよりもアデノウイルスのほうがより感受性である熱処理によって減らすことができる。核酸を細胞に送達する追加の方法が当業者に知られている。例えばアメリカ合衆国特許出願公開第2003/0087817号を参照されたい(参照によって本明細書に組み込まれている)。
いくつかの実施態様では、本明細書に記載されている1つ以上のベクターを宿主細胞に一過性または非一過性にトランスフェクトする。いくつかの実施態様では、対象で自然に起こるのと同様にして細胞にトランスフェクトする。いくつかの実施態様では、トランスフェクトされた細胞を対象から採取する。いくつかの実施態様では、細胞は、対象から採取された細胞(細胞系など)に由来する。組織培養のための多彩な細胞系が本分野で知られている。細胞系の非限定的な例に含まれるのは、C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1サル腎臓上皮、BALB/3T3マウス胚線維芽細胞、3T3 Swiss、3T3-Ll、132-d5ヒト胎児線維芽細胞;10.1マウス線維芽細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-lA/ PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞系、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YARと、これらのトランスジェニックな変種である。当業者に知られている多彩な供給源からの細胞系を利用することができる(例えばAmerican Type Culture Collection(ATCC)(マナサス、ヴァージニア州)を参照されたい)。
いくつかの実施態様では、本明細書に記載されている1つ以上のベクターをトランスフェクトされた細胞を用い、1つ以上のベクター由来配列を含む新たな細胞系を確立する。いくつかの実施態様では、本明細書に記載されているCRISPR系の構成要素を(1つ以上のベクターの一過性トランスフェクション、またはRNAのトランスフェクションによって)一過性にトランスフェクトされてCRISPR複合体の活性を通じて改変された細胞を用い、改変を含有するが他の外来性配列は完全に欠けた新たな細胞系を確立する。いくつかの実施態様では、本明細書に記載されている1つ以上のベクターを一過性に、または非一過性にトランスフェクトされた細胞、またはそのような細胞に由来する細胞系を用いて1つ以上の試験化合物を評価する。
いくつかの実施態様では、本明細書に記載されている1つ以上のベクターを用いて非ヒトトランスジェニック動物またはトランスジェニック植物を作製する。いくつかの実施態様では、トランスジェニック動物は哺乳動物(マウス、ラット、ウサギなど)である。
IV.ポリペプチドとポリヌクレオチドのバリアントと断片
本開示により、天然(すなわち野生型)のRNA誘導型ヌクレアーゼ(そのアミノ酸配列は、配列番号1、11、19、27、36、45、54のいずれかとして表わされる)の活性なバリアントと断片のほか、天然のCRISPR反復(例えば配列番号2、12、20、28、37、46、55のいずれかとして表わされる配列)の活性なバリアントと断片と、天然のtracrRNA(例えば配列番号3、13、21、29、38、47、56のいずれかとして表わされる配列)の活性なバリアントと断片と、これらをコードするポリヌクレオチドが提供される。
バリアントまたは断片の活性は、目的のポリヌクレオチドまたはポリペプチドと比べて変化していてもよいが、バリアントと断片は、目的のポリヌクレオチドまたはポリペプチドの機能性を保持していなければならない。例えばバリアントまたは断片は、目的のポリヌクレオチドまたはポリペプチドと比較すると、活性が増大している可能性、または活性が低下している可能性、または活性のスペクトルが異なっている可能性、または活性がそれ以外に何らかの変化をしている可能性がある。
天然のRGNポリペプチドの断片とバリアント(本明細書に開示されているものなど)は、配列特異的なRNA誘導型DNA結合活性を保持することになろう。特別な実施態様では、天然のRGNポリペプチドの断片とバリアント(本明細書に開示されているものなど)は、ヌクレアーゼ活性を保持することになろう(一本鎖または二本鎖)。
天然のCRISPR反復の断片とバリアント(本明細書に開示されているものなど)は、(tracrRNAを含む)ガイドRNAの一部であるとき、配列特異的なやり方でRNA誘導型ヌクレアーゼに結合して(ガイドRNAとの複合体になり)標的ヌクレオチド配列を標的とするようガイドする能力を保持することになろう。
天然のtracrRNAの断片とバリアント(本明細書に開示されているものなど)は、(CRISPR RNAを含む)ガイドRNAの一部であるとき、配列特異的なやり方でRNA誘導型ヌクレアーゼに結合して(ガイドRNAとの複合体になり)標的ヌクレオチド配列を標的とするようガイドする能力を保持することになろう。
「断片」という用語は、本発明のポリヌクレオチド配列またはポリペプチド配列の一部を意味する。「断片」または「生物活性な部分」には、生物活性を保持する(すなわち、ガイドRNAの中に含まれているとき、RGNに配列特異的に結合してこのRGNを標的ヌクレオチド配列に向かわせる)のに十分な数の連続したヌクレオチドを含むポリヌクレオチドが含まれる。「断片」または「生物活性な部分」には、生物活性を保持する(すなわち、ガイドRNAの中に含まれているとき、RGNに配列特異的に結合してこのRGNを標的ヌクレオチド配列に向かわせる)のに十分な数の連続したアミノ酸残基を含むポリペプチドが含まれる。RGNタンパク質の断片には、代わりの下流開始部位を使用することが理由で完全長配列よりも短いものが含まれる。RGNタンパク質の生物活性な部分として、例えば配列番号1、11、19、27、36、45、54いずれかの連続した10個、25個、50個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、800個、850個、900個、950個、1000個、1050個、またはそれよりも多い個数のアミノ酸残基を含むポリペプチドが可能である。このような生物活性な部分は、組み換え技術によって調製した後、配列特異的なRNA誘導型DNA結合活性を評価することができる。CRISPR反復配列の生物活性な断片は、配列番号2、12、20、28、37、46、55いずれかの連続した少なくとも8個のアミノ酸を含むことができる。CRISPR反復配列の生物活性な部分として、例えば配列番号2、12、20、28、37、46、55いずれかの連続した8個、または9個、または10個、または11個、または12個、または13個、または14個、または15個、または16個、または17個、または18個、または19個、または20個のヌクレオチドを含むポリヌクレオチドが可能である。tracrRNAの生物活性な部分として、例えば配列番号3、13、21、29、38、47、56いずれかの連続した8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、またはそれよりも多い個数のヌクレオチドを含むポリヌクレオチドが可能である。
一般に「バリアント」は、実質的に似ている配列を意味する。ポリヌクレオチドに関しては、バリアントは、天然のポリヌクレオチド内の1つ以上の内部部位に1個以上のヌクレオチドの欠失および/または付加を含む、および/または天然のポリヌクレオチド内の1つ以上の内部部位に1個以上のヌクレオチドの置換を含む。本明細書で用いられている「天然の」または「野生型」ポリヌクレオチドまたはポリペプチドは、天然のヌクレオチド配列またはアミノ酸配列をそれぞれ含んでいる。ポリヌクレオチドに関しては、保存されたバリアントに、遺伝暗号の縮重が理由で目的の遺伝子の天然のアミノ酸配列をコードしている配列が含まれる。このような天然のアレルバリアントは、分子生物学の周知の技術(例えば下に概略を記載するポリメラーゼ連鎖反応(PCR)やハイブリダイゼーション技術)を利用して同定することができる。バリアントポリヌクレオチドには、合成に由来するが、目的のポリペプチドまたはポリヌクレオチドをやはりコードしているポリヌクレオチド(例えば部位指定突然変異誘発によって生成したポリヌクレオチド)も含まれる。一般に、本明細書に開示されている特別なポリヌクレオチドのバリアントは、本明細書の別の箇所に記載されている配列アラインメントプログラムとパラメータによって調べると、その特別なポリヌクレオチドと配列が少なくとも約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するであろう。
本明細書に開示されている特別なポリヌクレオチド(すなわち参照ポリヌクレオチド)のバリアントは、バリアントポリヌクレオチドによってコードされるポリペプチドと、参照ポリヌクレオチドによってコードされるポリペプチドの間の配列一致率の比較によって評価することもできる。任意の2つのポリペプチドの間の配列一致率は、本明細書の別の箇所に記載されている配列アラインメントプログラムとパラメータを用いて計算することができる。本明細書に開示されている任意のポリヌクレオチドのペアを、これらポリヌクレオチドがコードする2つのポリペプチドに共通する配列一致率の比較によって評価する場合、コードされる2つのポリペプチドの間の配列一致率は、少なくとも約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上である。
特別な実施態様では、本開示のポリヌクレオチドは、配列番号1、11、19、27、36、45、54いずれかのアミノ酸配列と少なくとも約40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するアミノ酸配列を含むRNA誘導型ヌクレアーゼポリペプチドをコードしている。
本発明のRGNポリペプチドの生物活性なバリアントは、約1〜15個のアミノ酸残基、または約1〜10個のアミノ酸残基、または約6〜10個のアミノ酸残基、または5個、または4個、または3個、または2個、または1個という少数のアミノ酸残基が異なっている可能性がある。特別な実施態様では、ポリペプチドは、N末端またはC末端のトランケーションを含むことができ、そこにはポリペプチドのN末端またはC末端から少なくとも10個、15個、20個、25個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、85個、90個、95個、100個、150個、200個、250個、300個、350個、400個、450個、500個、550個、600個、650個、700個、750個、800個、850個、900個、950個、1000個、1050個、またはそれよりも多い個数の欠失が含まれる可能性がある。
いくつかの実施態様では、本開示のポリヌクレオチドは、配列番号2、12、20、28、37、46、55のいずれかとして表わされるヌクレオチド配列と少なくとも40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するヌクレオチド配列を含むCRISPR反復を含むかコードしている。
本開示のポリヌクレオチドは、配列番号3、13、21、29、38、47、56のいずれかとして表わされるヌクレオチド配列と少なくとも40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれ以上一致するヌクレオチド配列を含むtracrRNAを含むかコードすることができる。
本発明のCRISPR反復またはtracrRNAの生物活性なバリアントは、約1〜15個のアミノ酸残基、または約1〜10個のアミノ酸残基、または約6〜10個のアミノ酸残基、または5個、または4個、または3個、または2個、または1個という少数のアミノ酸残基が異なっている可能性がある。特別な実施態様では、ポリヌクレオチドは5'または3'のトランケーションを含むことができ、そこにはこのポリヌクレオチドの5'末端または3'末端から少なくとも10個、15個、20個、25個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、またはそれよりも多い個数の欠失を含まれる可能性がある。
本明細書に提示されているRGNポリペプチド、CRISPR反復、tracrRNAを改変してバリアントタンパク質とバリアントポリヌクレオチドを作製できることがわかる。変化を設計し、部位指定突然変異誘発技術を適用して導入することができる。あるいは本明細書に開示されている配列と構造および/または機能が関連した天然の、だがまだ知られていないかまだ同定されていないポリヌクレオチドおよび/またはポリペプチドで、本発明の範囲に入るものを同定することもできる。RGNタンパク質の機能を変化させない保存されたアミノ酸置換を、保存されていない領域に対して実施することができる。あるいはRGNの活性を向上させる改変をなすことができる。
バリアントポリヌクレオチドとバリアントタンパク質には、突然変異と組み換えを起こさせる手続き(DNAシャッフリングなど)から得られる配列とタンパク質も包含される。このような手続きを利用して本明細書に開示されている1つ以上の異なるRGNタンパク質(例えば配列番号1、11、19、27、36、45、54)を操作し、望む特性を有する新たなRGNタンパク質を作り出す。このようにして、関連した配列を持つポリヌクレオチドの集団、すなわち実質的に一致した配列を持ち、インビトロまたは生体内で相同組み換えが可能な配列領域を含むポリヌクレオチドの集団から、組み換えポリヌクレオチドのライブラリを生成させる。例えばこのアプローチを用いると、本明細書に提示されているRGN配列と既知の他のRGN遺伝子の間で目的のドメインをコードする配列モチーフをシャッフルし、目的の特性が改善された(例えば酵素の場合にはKmが増大した)タンパク質をコードする新たな遺伝子を得ることができる。このようなDNAシャッフリングのための戦略は本分野で知られている。例えばStemmer(1994年)Proc. Natl. Acad. Sci. USA 第91巻:10747〜10751ページ;Stemmer(1994年)Nature 第370巻:389〜391ページ;Crameri他(1997年)Nature Biotech. 第15巻:436〜438ページ;Moore他(1997年)J. Mol. Biol. 第272巻:336〜347ページ;Zhang他(1997年)Proc. Natl. Acad. Sci. USA 第94巻:4504〜4509ページ;Crameri他(1998年)Nature 第391巻:288〜291ページ;アメリカ合衆国特許第5,605,793号、第5,837,458号を参照されたい。「シャッフルされた」核酸は、シャッフル手続き(例えば本明細書に記載されている任意のシャッフル手続き)によって生成した核酸である。シャッフルされた核酸は、2つ以上の核酸(または文字列)を例えば人工的な、そして場合によっては回帰的なやり方で(物理的または仮想的に)組み換えることによって生成する。一般に、シャッフリングプロセスでは1つ以上のスクリーニング工程を利用して目的の核酸を同定する。このスクリーニング工程は、任意の組み換え工程の前または後に実施することができる。シャッフリングのいくつかの(だがすべてではない)実施態様では、選択の前に組み換えを多数回実施してスクリーニングすべきプールの多様性を大きくすることが望ましい。組み換えと選択のプロセス全体を場合によっては回帰的に繰り返す。文脈に応じ、シャッフリングは、組み換えと選択のプロセス全体を意味するか、プロセス全体の組み換え部分だけを意味することができる。
本明細書では、2つのポリヌクレオチド配列またはポリペプチド配列の文脈における「配列一致」または「一致」は、指定された比較ウインドウで対応が最大になるようにアラインメントしたとき、その2つの配列の中で同じである残基を意味する。配列一致の割合がタンパク質に関して用いられているときには、同じではない残基位置は、保存されたアミノ酸置換の違いであることがしばしばあり、その位置ではアミノ酸残基が似た化学的特性(例えば電荷や疎水性)の別のアミノ酸残基で置換されているため、分子の機能的特性は変化しないと認識されている。配列が保存的置換に関して異なっているときには、その置換が保存的性質を持つことを修正するため、配列一致の割合を上方に調節することができる。そのような保存的置換が異なる配列は、「配列類似性」または「類似性」を持つと言われる。この調節を行なう手段は当業者に周知である。典型的には、この手段は、保存的置換を完全なミスマッチではなく部分的なミスマッチとして点数化することで、配列一致の割合を大きくすることを含んでいる。したがって例えば同じであるアミノ酸には1点を与え、保存されていない置換には0点を与えた場合、保存された置換には0と1の間の点数が与えられる。保存された置換の点数は、例えばプログラムPC/GENE(Intelligenetics社、マウンテン・ヴュー、カリフォルニア州)の中に実現されているようにして計算される。
本明細書では、「配列一致の割合」は、比較ウインドウ上で最適なアラインメントにされた2つの配列を比較することによって求まる値を意味する。その場合、ポリヌクレオチド配列のうちで比較ウインドウの中にある部分は、2つの配列の最適なアラインメントのための(付加または欠失を含まない)参照配列と比較して付加または欠失(すなわちギャップ)を含んでいる可能性がある。割合は、両方の配列で同じ核酸塩基またはアミノ酸残基である位置の数を明らかにすることによって一致した位置の数を取得し、この一致した位置の数を、比較ウインドウ内の位置の総数で割り、100を掛けることによって計算され、配列一致の割合が得られる。
特に断わらない限り、本明細書に提示されている配列一致/類似性の値は、GAP Version 10を用いて得られる値(以下のパラメータを用いる:ヌクレオチド配列に関しては、GAP Weightを50、Length Weightを3にし、nwsgapdna.cmpスコアリングマトリックスを用いて得られる%一致と%類似性;アミノ酸配列に関しては、GAP Weightを8、Length Weightを2にし、BLOSUM62スコアリングマトリックスを用いて得られる%一致と%類似性)、またはこれと同等な任意のプログラムを用いて得られる値を意味する。「同等なプログラム」とは、問題の任意の2つの配列について、GAP Version 10によって生成させた対応するアラインメントと比較したとき、ヌクレオチドまたはアミノ酸残基の一致が同じで、配列一致の割合が同じアラインメントを生じさせる任意の配列比較プログラムを意味する。
2つの配列が「最適なアラインメントである」のは、類似性スコアを求めることを目的として、所定のアミノ酸置換マトリックス(例えばBLOSUM62)、ギャップ存在ペナルティ、ギャップ延長ペナルティを用い、そのペアの配列に関して可能な最高スコアに到達するようにアラインメントされたときである。アミノ酸置換マトリックスと、それを利用して2つの配列の間の類似性を定量化することは、本分野で周知であり、例えば『Atlas of Protein Sequence and Structure』、第5巻、補3(M. O. Dayhoff編)、Natl. Biomed. Res. Found.、ワシントンD.C.の中のDayhoff他(1978年)「タンパク質における進化的変化のモデル」、345〜352ページと、Henikoff他(1992年)Proc. Natl. Acad. Sci. USA 第89巻:10915〜10919ページに記載されている。BLOSUM62マトリックスは、配列アラインメントプロトコルにおいてデフォルトのスコアリング置換マトリックスとしてしばしば用いられる。ギャップ存在ペナルティは、アラインメントされた配列の1つに単一のアミノ酸ギャップを導入するために課され、ギャップ延長ペナルティは、すでに設けられているギャップの中に空のアミノ酸位置をそれぞれ追加して導入するために課される。アラインメントは、各配列の中で、そのアラインメントが始まるアミノ酸位置と終わるアミノ酸位置によって規定され、場合によっては一方または両方の配列に1つまたは複数のギャップを挿入して、可能な最高スコアが得られるようにする。最適なアラインメントと点数化は手作業で実現することができるが、このプロセスは、コンピュータで実現されるアラインメントアルゴリズム(例えばAltschul 他(1997年)Nucleic Acids Res. 第25巻:3389〜3402ページに記載されているギャップ付きBLAST 2.0があり、National Center for Biotechnology Information Website(www.ncbi.nlm.nih.gov)で公開されているため入手できる)を用いると容易になる。最適なアラインメントは、多数のアラインメントを含め、例えばPSI-BLAST(Altschul 他(1997年)Nucleic Acids Res. 第25巻:3389〜3402ページに記載されており、www.ncbi.nlm.nih.govから入手することができる)を用いて用意することができる。
参照配列と最適なアラインメントの状態にされたアミノ酸配列に関しては、1個のアミノ酸残基は、アラインメントの中でこの残基とペアになる参照配列中の位置に「対応する」。「位置」は、参照配列の中でN末端との相対的な位置に基づいて逐次的に同定される各アミノ酸の番号によって表わされる。最適なアラインメントを求めるときに考慮すべき欠失、挿入、トランケーション、融合などがあるため、一般に、N末端から単純に数えることによって求めたときの試験配列中のアミノ酸残基の番号は、参照配列の中の対応する位置の番号と必ずしも同じにならない。例えばアラインメントされた試験配列の中に欠失が1つ存在している場合には、参照配列の中でその欠失部位の位置に対応するアミノ酸は存在しない。アラインメントされた試験配列の中に挿入が1つ存在している場合には、その挿入は、参照配列の中のどのアミノ酸位置にも対応しない。トランケーションまたは融合がある場合には、参照配列またはアラインメントされた配列の中に、対応する配列中のどのアミノ酸にも対応しない一連のアミノ酸が存在する可能性がある。
V.抗体
本発明のRGNポリペプチド、またはこのRGNポリペプチドを含むリボ核タンパク質(配列番号1、11、19、27、36、45、54として表わされているアミノ酸配列を持つもの、またはその活性なバリアントまたは断片が含まれる)に対する抗体も包含される。抗体を作製する方法は本分野で周知である(例えばHarlowとLane(1988年)『Antibodies: A Laboratory Manual』、Cold Spring Harbor Laboratory、コールド・スプリング・ハーバー、ニューヨーク州;アメリカ合衆国特許第4,196,265号を参照されたい)。これらの抗体は、RGNポリペプチドまたはリボ核タンパク質を検出・単離するためのキットで用いることができる。したがって本開示により、本明細書に記載されているポリペプチドまたはリボ核タンパク質(例えば配列番号1、11、19、27、36、45、54いずれかの配列を持つポリペプチドが含まれる)に特異的に結合する抗体を含むキットが提供される。
VI.目的の標的配列に結合させるためのシステムおよびリボ核タンパク質複合体と、それを作製する方法
本開示により、目的の標的配列に結合させるためのシステムが提供される。このシステムは、少なくとも1つのガイドRNA、またはそれをコードするヌクレオチド配列と、少なくとも1つのRNA誘導型ヌクレアーゼ、またはそれをコードするヌクレオチド配列を含んでいる。ガイドRNAは目的の標的配列にハイブリダイズし、RGNポリペプチドと複合体も形成することにより、RGNポリペプチドを標的配列に結合させる。これら実施態様のいくつかでは、RGNは、配列番号1、11、19、27、36、45、54いずれかのアミノ酸配列、またはその活性なバリアントまたは断片を含んでいる。さまざまな実施態様では、ガイドRNAは、配列番号2、12、20、28、37、46、55いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含むCRISPR反復配列を含んでいる。特別な実施態様では、ガイドRNAは、配列番号3、13、21、29、38、47、56いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含むtracrRNAを含んでいる。このシステムのガイドRNAとして、単一ガイドRNAまたは二重ガイドRNAが可能である。特別な実施態様では、システムは、ガイドRNAにとって異種のRNA誘導型ヌクレアーゼを含んでおり、RGNとガイドRNAが自然に複合体を形成することはない。
目的の標的配列に結合させるための本明細書に提示されているシステムとして、リボ核タンパク質複合体が可能であり、この複合体は、少なくとも1つのタンパク質に結合した少なくとも1個のRNA分子である。本明細書に提示されている核タンパク質複合体は、RNA構成要素としての少なくとも1つのガイドRNAと、タンパク質構成要素としてのRNA誘導型ヌクレアーゼを含んでいる。このような核タンパク質複合体は、RGNポリペプチドを自然に発現するとともに目的の標的配列に対して特異的な特定のガイドRNAを発現するように操作されている細胞または生物から精製することができる。あるいは核タンパク質複合体は、RGNポリペプチドとガイドRNAをコードするポリヌクレオチドを用いて形質転換されて、そのRGNポリペプチドとガイドRNAの発現を可能にする条件下で培養された細胞または生物から精製することができる。このようにして、RGNポリペプチドまたはRGNリボ核タンパク質複合体を作製する方法が提供される。このような方法は、RGNポリペプチドをコードするヌクレオチド配列を含む細胞を、RGNポリペプチド(と、いくつかの実施態様ではガイドRNA)が発現する条件下で培養することを含んでいる。その後、RGNポリペプチドまたはRGNリボ核タンパク質複合体を培養された細胞のライセートから精製することができる。
RGNポリペプチドまたはリボ核タンパク質複合体を生物サンプルのライセートから精製する方法は本分野で知られている(例えばサイズ排除クロマトグラフィおよび/またはアフィニティクロマトグラフィ、2D-PAGE、HPLC、逆相クロマトグラフィ、免疫沈降)。特別な方法では、RGNポリペプチドは組み換え産生されたものであり、精製を助けるための精製タグを含んでいる。精製タグの非限定的な例に含まれるのは、グルタチオン-S-トランスフェラーゼ(GST)、キチン結合タンパク質(CBP)、マルトース結合タンパク質、チオレドキシン(TRX)、ポリ(NANP)、タンデムアフィニティ精製(TAP)タグ、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6×His、10×His、ビオチンカルボキシル担体タンパク質(BCCP)、カルモジュリンである。一般に、タグ付きのRGNポリペプチドまたはRGNリボ核タンパク質複合体は、固定化された金属アフィニティクロマトグラフィを利用して精製される。本分野で知られている他の同様の方法(他の形態のクロマトグラフィや、例えば免疫沈降が含まれる)を、単独で、または組み合わせて使用できることがわかるであろう。
「単離された」または「精製された」ポリペプチド、またはその生物活性な部分は、天然の環境で見いだされたポリペプチドに通常は付随する構成成分、またはそのポリペプチドと相互作用する構成成分を実質的または本質的に含んでいない。したがって単離または精製されたポリペプチドは、組み換え技術によって作製されるときには他の細胞材料、または細胞培地を実質的に含んでおらず、化学合成されるときには化学的前駆体または他の化合物を実質的に含んでいない。細胞材料を実質的に含んでいないタンパク質には、汚染タンパク質が(乾燥重量で)約30%未満、または20%未満、10%未満、または5%未満、または1%未満のタンパク質調製物が含まれる。本発明のタンパク質、またはその生物活性のある部分は組み換えによって作製され、最適には、培地は、化学的前駆体を、または目的のタンパク質なしの化合物質を約30%未満、または20%未満、10%未満、または5%未満、または1%未満含んでいる。
目的の標的配列に結合させるための、および/または目的の標的配列を切断するための本明細書に提示されている特別な方法は、インビトロで組み立てられたRGNリボ核タンパク質複合体の使用を含んでいる。RGNリボ核タンパク質複合体のインビトロでの組み立ては、本分野で知られている任意の方法を用いて実施することができ、その方法では、RGNポリペプチドがガイドRNAに結合できる条件下でRGNポリペプチドをガイドRNAと接触させる。本明細書で用いられている「接触」、「接触している」、「接触した」は、望む反応の構成要素を一緒にまとめ、望むその反応を実施するのに適した条件下に置くことを意味する。RGNポリペプチドは、インビトロでの翻訳、または化学合成を通じて生成したものを、生物サンプル、細胞ライセート、培地のいずれかから精製することができる。ガイドRNAは、インビトロでの転写、または化学合成を通じて生成したものを、生物サンプル、細胞ライセート、培地のいずれかから精製することができる。RGNポリペプチドとガイドRNAを溶液(例えば緩衝化生理食塩溶液)中で接触させてRGNリボ核タンパク質複合体をインビトロで組み立てることができる。
VII.標的配列に結合させる方法、標的配列を切断する方法、標的配列を改変する方法
本開示により、目的の標的ヌクレオチドに結合させる方法、および/または目的の標的ヌクレオチドを切断する方法、および/または目的の標的ヌクレオチド改変する方法が提供される。これらの方法は、少なくとも1つのガイドRNAまたはそれをコードするポリヌクレオチドと、少なくとも1つのRGNポリペプチドまたはそれをコードするポリヌクレオチドを含むシステムを、標的配列に、またはこの標的配列を含む細胞、オルガネラ、胚のいずれかに送達することを含んでいる。これらの実施態様のいくつかでは、RGNは、配列番号1、11、19、27、36、45、54いずれかのアミノ酸配列、またはその活性なバリアントまたは断片を含んでいる。さまざまな実施態様では、ガイドRNAは、配列番号2、12、20、28、37、46、55いずれかのヌクレオチド配列を含むCRISPR反復配列、またはその活性なバリアントまたは断片を含んでいる。特別な実施態様では、ガイドRNAは、配列番号3、13、21、29、38、47、56いずれかのヌクレオチド配列を含むtracrRNA、またはその活性なバリアントまたは断片を含んでいる。システムのガイドRNAとして、単一ガイドRNAまたは二重ガイドRNAが可能である。システムのRGNは、ヌクレアーゼ-デッドRGNであること、またはニッカーゼ活性を持つこと、または融合ポリペプチドであることが可能である。いくつかの実施態様では、融合ポリペプチドは、塩基編集ポリペプチド(例えばシチジンデアミナーゼ、またはアデノシンデアミナーゼ)を含んでいる。特別な実施態様では、RGNおよび/またはガイドRNAは、このRGNおよび/またはガイドRNA(またはこのRGNとガイドRNAの少なくとも一方をコードするポリヌクレオチド)が導入される細胞、またはオルガネラ、または胚にとって異種である。
方法が、ガイドRNAおよび/またはRGNポリペプチドをコードするポリヌクレオチドの送達を含む実施態様では、細胞または胚をその後、ガイドRNAおよび/またはRGNポリペプチドが発現する条件下で培養することができる。さまざまな実施態様では、方法は、標的配列をRGNリボ核タンパク質複合体と接触させることを含んでいる。RGNリボ核タンパク質複合体は、ヌクレアーゼ-デッドであるかニッカーゼ活性を持つRGNを含むことができる。いくつかの実施態様では、リボ核タンパク質複合体のRGNは、塩基編集ポリペプチドを含む融合ポリペプチドである。いくつかの実施態様では、方法は、標的配列を含む細胞、またはオルガネラ、または胚にRGNリボ核タンパク質複合体を導入することを含んでいる。RGNリボ核タンパク質複合体として、生物サンプルから精製されたもの、または組み換え産生させた後に精製されたもの、または本明細書に記載されているようにしてインビトロで組み立てられたものが可能である。インビトロで組み立てられたRGNリボ核タンパク質複合体を標的配列、細胞、オルガネラ、胚のいずれかと接触させる実施態様では、方法はさらに、この複合体をインビトロで組み立てた後に、標的配列、細胞、オルガネラ、胚のいずれかと接触させることを含むことができる。
精製されるかインビトロで組み立てられたRGNリボ核タンパク質複合体は、本分野で知られている任意の方法(その非限定的な例に電気穿孔が含まれる)を用いて細胞、オルガネラ、胚のいずれかに導入することができる。あるいはRGNポリペプチド、および/またはガイドRNAをコードするか含んでいるポリヌクレオチドは、本分野で知られている任意の方法(例えば電気穿孔)を用いて導入することができる。
ガイドRNAは、標的配列に、または標的配列を含む細胞、オルガネラ、胚のいずれかに送達されるか、標的配列と、または標的配列を含む細胞、オルガネラ、胚のいずれかと接触すると、RGNを配列特異的なやり方で標的配列に結合させる。RGNがヌクレアーゼ活性を持つ実施態様では、RGNポリペプチドは、目的の標的配列に結合するとこの標的配列を切断する。標的配列はその後、内在性修復機構(例えば提供されるドナーポリヌクレオチドを用いた非相同末端結合修復または相同組み換え修復)を通じて改変される。
標的配列に対するRGNポリペプチドの結合を測定する方法は本分野で知られており、クロマチン免疫沈降アッセイ、ゲル移動度シフトアッセイ、DNAプル-ダウンアッセイ、レポータアッセイ、マイクロプレート捕獲・検出アッセイが含まれる。同様に、標的配列の切断または改変を測定する方法は本分野で知られており、その中にインビトロまたは生体内での切断アッセイが含まれる。この切断アッセイでは、分解産物の検出を容易にするための標的配列に対する適切な標識(例えば放射性同位体、蛍光物質)あり、またはなしで、PCRシークエンシングまたはゲル電気泳動を利用して切断を確認する。あるいは切断トリガー式指数関数的増幅反応(NTEXPAR)アッセイを利用することができる(例えばZhang他(2016年)Chem. Sci. 第7巻:4951〜4957ページを参照されたい)。生体内切断は、Surveyorアッセイを利用して評価することができる(Guschin他(2010年)Methods Mol Biol第649巻:247〜256ページ)。
いくつかの実施態様では、方法は、2つ以上のガイドRNAとの複合体にされたRGNの使用を含んでいる。その2つ以上のガイドRNAは、単一の遺伝子の異なる領域、または多数の遺伝子を標的とすることができる。
ドナーポリヌクレオチドが提供されない実施態様では、RGNポリペプチドによって導入される二本鎖切断を非相同末端結合(NHEJ)修復プロセスによって修復することができる。NHEJはエラーしやすい性質があるため、二本鎖切断の修復によって標的配列が改変される可能性がある。本明細書で核酸分子に関して用いられている「改変」は、核酸分子のヌクレオチド配列の変化を意味し、1個以上のヌクレオチドの欠失、挿入、置換、またはこれらの組み合わせが可能である。標的配列の改変により、変化したタンパク質産物が発現する可能性、またはコード配列が不活性化する可能性がある。
ドナーポリヌクレオチドが存在する実施態様では、導入された二本鎖切断が修復されている間に、ドナーポリペプチドの中のドナー配列を標的ヌクレオチド配列に組み込むこと、または標的ヌクレオチド配列と交換することができるため、その結果として外来ドナー配列が導入される。したがってドナーポリヌクレオチドは、目的の標的配列に導入されることが望ましいドナー配列を含んでいる。いくつかの実施態様では、ドナー配列は元の標的ヌクレオチド配列を変化させるため、新たに組み込まれたドナー配列はRGNを認識せず、RGNによって切断されない。ドナー配列の組み込みは、ドナーポリヌクレオチドの中に、標的ヌクレオチド配列に隣接した配列と実質的に配列が一致するフランキング配列を含めることによって増強することができ、相同組み換え修復プロセスが可能になる。RGNポリペプチドが二本鎖切断で粘着末端を導入する実施態様では、ドナーポリヌクレオチドは、適合したオーバーハングが隣接しているドナー配列を含むことができて、二本鎖切断が修復されている間に非相同組み換え修復プロセスにより、オーバーハングを含む切断された標的ヌクレオチド配列にドナー配列を直接連結することが可能になる。
方法が、ニッカーゼである(すなわち二本鎖ポリヌクレオチドの単一の鎖だけを切断することのできる)RGNの使用を含む実施態様では、方法は、同じ標的配列または重複している標的配列を標的とする2つのRGNニッカーゼを導入し、ポリヌクレオチドの異なる鎖を切断することを含むことができる。例えば二本鎖ポリヌクレオチドのプラス(+)鎖だけを切断するRGNニッカーゼとともに、二本鎖ポリヌクレオチドのマイナス(-)鎖だけを切断する第2のRGNニッカーゼを導入することができる。
さまざまな実施態様では、標的ヌクレオチド配列に結合させてその標的配列を検出する方法が提供され、この方法は、細胞、またはオルガネラ、または胚の中に少なくとも1つのガイドRNAまたはそれをコードするポリヌクレオチドと、少なくとも1つのRGNポリペプチドまたはそれをコードするポリヌクレオチドを導入し、そのガイドRNAおよび/またはRGNポリペプチド(コード配列を導入する場合;このRGNポリペプチドはヌクレアーゼ-デッドRGNであり、検出可能な標識をさらに含んでいる)を発現させることを含み、この方法はさらに、検出可能な標識を検出することを含んでいる。検出可能な標識は、融合タンパク質(例えば蛍光タンパク質)としてRGNに融合させることができる。あるいは検出可能な標識として、RGNポリペプチドとの複合体にされるか、RGNポリペプチドの中に組み込まれていて、視覚的に、または単手段によって検出できる小分子が可能である。
本明細書では、目的の標的配列の発現、または標的配列の調節下にある目的の遺伝子の発現を変化させる方法も提供される。この方法は、細胞、またはオルガネラ、または胚の中に少なくとも1つのガイドRNAまたはそれをコードするポリヌクレオチドと、少なくとも1つのRGNポリペプチドまたはそれをコードするポリヌクレオチドを導入し、このガイドRNAおよび/またはRGNポリペプチド(コード配列を導入する場合;このRGNポリペプチドはヌクレアーゼ-デッドRGNである)を発現させることを含んでいる。これら実施態様のいくつかでは、ヌクレアーゼ-デッドRGNは、本明細書に記載されているような発現モジュレータドメイン(すなわちエピジェネティックな修飾ドメイン、または転写活性化ドメイン、または転写抑制ドメイン)を含む融合タンパク質である。
本開示により、目的の標的配列に結合させる方法、および/または目的の標的配列を改変する方法も提供される。これらの方法は、少なくとも1つのガイドRNAまたはそれをコードするポリヌクレオチドを含むとともに、本発明のRGNと塩基編集ポリペプチド(例えばシチジンデアミナーゼまたはアデノシンデアミナーゼ)を含有する融合ポリペプチドまたはこの融合ポリペプチドをコードするポリペプチドを含むシステムを標的配列に、または標的配列を含む細胞、オルガネラ、胚のいずれかに送達することを含んでいる。
当業者は、本開示の任意の方法を利用して単一の標的配列または複数の標的配列を標的にすることができることがわかるであろう。例えばこの方法は、単一のRGNポリペプチドを多数の異なるガイドRNAと組み合わせて使用することを含んでいて、単一の遺伝子および/または複数の遺伝子の中の多数の異なる配列を標的にすることができる。本発明には、多数の異なるガイドRNAを多数の異なるRGNポリペプチドと組み合わせて導入する方法も包含される。これらのガイドRNAと、これらのガイドRNA/RGNポリペプチドシステムは、単一の遺伝子および/または複数の遺伝子の中の多数の異なる配列を標的にすることができる。
1つの側面では、本発明により、上記の方法と組成物に開示されている任意の1つ以上のエレメントを含むキットが提供される。いくつかの実施態様では、キットは、ベクター系と、キットを使用するための指示を含んでいる。いくつかの実施態様では、ベクター系は、(a)tracrメイト配列に機能可能に連結された第1の調節エレメントと、tracrメイト配列の上流にガイド配列を挿入するための1つ以上の挿入部位(ガイド配列は、発現すると、CRISPR複合体を真核細胞の中の標的配列に配列特異的に結合させる;CRISPR複合体は、(1)標的配列にハイブリダイズするガイド配列、および(2)tracr 配列にハイブリダイズするtracrメイト配列との複合体になったCRISPR酵素を含んでいる);および/または(b)核局在配列を含むCRISPR酵素をコードする酵素コード配列に機能可能に連結された第2の調節エレメントを含んでいる。エレメントは、個別に、または組み合わせて提供することができ、適切な任意の容器(バイアル、瓶、試験管など)に入れて提供することができる。
いくつかの実施態様では、キットは、1つ以上の言語による指示を含んでいる。いくつかの実施態様では、キットは、本明細書に記載されている1つ以上のエレメントを利用する方法で使用するための1つ以上の試薬を含んでいる。試薬は、適切な任意の容器に入れて提供することができる。例えばキットは、1つ以上の反応用バッファまたは保管用バッファを提供することができる。試薬は、特定のアッセイで使用できる形態で提供すること、または使用前に1つ以上の他の構成要素を添加する必要がある形態(例えば濃縮液または凍結乾燥形態)で提供することができる。バッファとして任意のバッファが可能であり、その非限定的な例に含まれるのは、炭酸ナトリウムバッファ、炭酸水素ナトリウムバッファ、ホウ酸塩バッファ、トリスバッファ、MOPSバッファ、HEPESバッファと、これらの組み合わせである。いくつかの実施態様では、バッファはアルカリ性である。いくつかの実施態様では、バッファはpHが約7〜約10である。
いくつかの実施態様では、キットは、ガイド配列と調節エレメントを機能可能に連結するため、ベクターの中に挿入するためのガイド配列に対応する1つ以上のオリゴヌクレオチドを含んでいる。いくつかの実施態様では、キットは、相同組み換え鋳型ポリヌクレオチドを含んでいる。1つの側面では、本発明により、CRISPRシステムの1つ以上のエレメントを用いるための方法が提供される。本発明のCRISPR複合体は、標的ポリヌクレオチドを改変するための有効な手段を提供する。本発明のCRISPR複合体は多彩な有用性を持っていて、その中には、多くのタイプの細胞の中の標的ポリヌクレオチドの改変(例えば欠失、挿入、転位、不活化、活性化)が含まれる。そのため本発明のCRISPR複合体は、例えば遺伝子療法、薬のスクリーニング、疾患の診断、予後予測において広範な用途を持つ。代表的な1つのCRISPR複合体は、標的ポリヌクレオチド内の標的配列にハイブリダイズしたガイド配列との複合体になったCRISPR酵素を含んでいる。
VIII.標的ポリヌクレオチド
1つの側面では、本発明により、真核細胞の中の標的ポリヌクレオチドを改変する方法が提供される。この方法は、生体内、生体外、インビトロのいずれでも可能である。いくつかの実施態様では、この方法は、ヒト、または非ヒト動物、または植物(微細藻類を含む)からの1個の細胞、または細胞の集団をサンプリングし、その細胞を改変することを含んでいる。培養は、任意の段階で生体外にて実施することができる。細胞は、非ヒト動物、または植物(微細藻類を含む)に再導入することさえできる。
植物栽培者は、望ましい品質(収量、品質、一様性、丈夫さ、病原体に対する抵抗性など)を探すため、天然の変動性を利用して最も有用な遺伝子を組み合わせる。これらの望ましい品質には、成長、日照時間の好み、温度条件、開花開始日または生殖/発生、脂肪酸含量、昆虫抵抗性、疾患抵抗性、線虫抵抗性、真菌抵抗性、除草剤抵抗性、さまざまな環境因子(旱魃、熱、湿度、寒さ、風、不利な土壌状態(高塩分を含む))に対する寛容性も含まれる。有用なこれら遺伝子の供給源には、在来種または外来種、家宝種、野生植物の親戚、誘導変異(例えば突然変異誘発剤で植物材料を処理する)が含まれる。植物栽培者は、本発明を利用することで、変異を誘導するための新たなツールを提供される。したがって当業者は、ゲノムを分析して有用な遺伝子を探し、望む特徴または形質を持つ品種の中で本発明を利用して有用な遺伝子の増加を以前の突然変異誘発剤よりも正確に誘導し、したがって植物栽培プログラムの加速と改良を実現することができる。
RGNシステムの標的ポリヌクレオチドとして、真核細胞にとって内在性または外来性の任意のポリヌクレオチドが可能である。例えば標的ポリヌクレオチドとして、真核細胞の核の中に存在するポリヌクレオチドが可能である。標的ポリヌクレオチドとして、遺伝子産物(例えばタンパク質)をコードする配列、または非コード配列(例えば調節ポリヌクレオチドまたはジャンクDNA)が可能である。理論に囚われることは望まないが、標的配列は、PAM(プロトスペーサ隣接モチーフ)、すなわちCRISPR複合体によって認識される短い配列と関連しているべきであると考えられる。PAMの正確な配列と長さに関する条件は用いるCRISPR酵素によって異なるが、PAMは、典型的には、プロトスペーサ(すなわち標的配列)に隣接する2〜5つの塩基対の配列である。
CRISPR複合体の標的ポリヌクレオチドは、疾患に関連する遺伝子とポリヌクレオチドのほか、生化学的シグナル伝達経路に関連する遺伝子とポリヌクレオチドを含むことができる。標的ポリヌクレオチドの例に含まれるのは、生化学的シグナル伝達経路に関連する配列、例えば生化学的シグナル伝達経路に関連する遺伝子またはポリヌクレオチドである。標的ポリヌクレオチドの例に含まれるのは、疾患に関連する遺伝子またはポリヌクレオチドである。「疾患に関連した」遺伝子またはポリヌクレオチドは、疾患でない対照の組織または細胞と比べたとき、疾患に冒された組織に由来する細胞の中では異常なレベル、または異常な形態になった転写産物または翻訳産物を生じさせる任意の遺伝子またはポリヌクレオチドを意味する。それは、異常な高レベルで発現する遺伝子である可能性、または異常な低レベルで発現する遺伝子である可能性があり、変化した発現は、疾患の発生および/または進行と相関している。疾患に関連した遺伝子は、疾患の起源(例えば原因変異)に直接の責任がある変異または遺伝的変異を有する遺伝子、または疾患の起源に責任がある遺伝子と連鎖平衡にある変異または遺伝的変異を有する遺伝子も意味する。転写または翻訳された産物は、既知であるか未知である可能性があり、さらに、正常なレベルまたは異常なレベルである可能性がある。疾患に関連する遺伝子とポリヌクレオチドの例は、McKusick-Nathans Institute of Genetic Medicine、Johns Hopkins University(バルチモア、メリーランド州)と、National Center for Biotechnology Information、National Library of Medicine(ベセスダ、メリーランド州)から、World Wide Web上で入手することができる。
CRISPRシステムは、目的のゲノム配列を標的とすることが比較的容易であるため特に有用だが、RGNが原因変異に対処するためにできることに関する問題が相変わらず残されている。1つのアプローチは、RGN(RGNの不活性なバリアントまたはニッカーゼバリアントが好ましい)と、塩基編集酵素(例えばシチジンデアミナーゼまたはアデノシンデアミナーゼ塩基エディタ)、または塩基編集酵素の活性ドメインの間の融合タンパク質を作製するというものである(アメリカ合衆国特許第9,840,699号;参照によって本明細書に組み込まれている)。いくつかの実施態様では、この方法は、DNA分子を(a)本発明のRGNと塩基編集ポリペプチド(デアミナーゼなど)を含む融合タンパク質と接触させるとともに;(b)(a)の融合タンパク質をDNA鎖の標的ヌクレオチド配列に向かわせるgRNAと接触させることを含んでいて;DNA分子は、融合タンパク質およびgRNAと十分な量で、ヌクレオチド塩基の脱アミノ化に適した条件下にて接触する。いくつかの実施態様では、標的DNA配列は、疾患または障害と関係する配列を含んでいて、その中のヌクレオチド塩基の脱アミノ化により、疾患または障害と関係のない配列になる。いくつかの実施態様では、標的DNA配列は作物植物のアレルの中に存在しており、その中の目的の形質が特別なアレルになっていることで、農業的な価値がより小さな植物になっている。ヌクレオチド塩基の脱アミノ化により、形質を改善し、植物の農業的な価値を増大させるアレルになる。
いくつかの実施態様では、DNA配列は、疾患または障害に関係するT→C点変異またはA→G点変異を含んでおり、変異したC塩基またはG塩基の脱アミノ化により、疾患または障害に関係しない配列になる。いくつかの実施態様では、脱アミノ化により、配列内にあって疾患または障害に関係する変異が修正される。
いくつかの実施態様では、疾患または障害に関係する配列はタンパク質をコードしており、脱アミノ化によって疾患または障害に関係する配列に終止コドンが導入され、その結果としてコードされるタンパク質が打ち切られる。いくつかの実施態様では、接触操作は、疾患または障害を持つ可能性が大きい対象、または疾患または障害を持つ対象、または疾患または障害を持つと診断された対象の生体内で実施される。いくつかの実施態様では、疾患または障害は、ゲノムの中の点変異または単一塩基変異と関係した疾患である。いくつかの実施態様では、疾患は、遺伝子疾患、がん、代謝疾患、リソソーム蓄積症のいずれかである。
ある種の遺伝疾患を引き起こす遺伝子座、特に本発明のRGNまたはRGN-塩基エディタ融合タンパク質が容易に標的とすることのできる遺伝子座のさらに別の例は、実施例9と、それに対応する表12に見いだすことができる。
ハーラー症候群
本発明のRGN-塩基エディタ融合タンパク質に頼るアプローチを用いて修正できると考えられる遺伝子疾患の一例は、ハーラー症候群である。ハーラー症候群(MPS-1としても知られる)は、α-L-イズロニダーゼ(IDUA)が欠損していることの結果であり、分子レベルでリソソームの中に硫酸デルマタンと硫酸へパランが蓄積することを特徴とするリソソーム蓄積症になる。この疾患は一般に、α-L-イズロニダーゼをコードするIDUA遺伝子の中の変異によって起こる遺伝性の遺伝子障害である。共通するIDUA変異はW402XとQ70Xであり、両方ともナンセンス変異であるため翻訳が途中で停止する。このような変異は、精密ゲノム編集(PGE)アプローチによってうまく対処される。なぜなら例えば塩基編集アプローチによって1個のヌクレオチドを元に戻すと野生型コード配列が復元され、遺伝子座の内在性調節機構によってタンパク質の発現が制御されるからである。それに加え、ヘテロ接合体は無症状であることが知られているため、これら変異の1つを標的とするPGE療法は、この疾患を持つ患者の多くにとって、修正する必要があるのは変異したアレルのうちの1つだけであるという理由で有用であると考えられる(Bunge他(1994年)Hum. Mol. Genet. 第3巻(6):861〜866ページ;参照によって本明細書に組み込まれている)。
ハーラー症候群の現在の治療法は、酵素置換療法と骨髄移植を含んでいる(Vellodi他(1997年)Arch. Dis. Child. 第76巻(2):92〜99ページ;Peters他(1998年)Blood第91巻(7):2601〜2608ページ;参照によって本明細書に組み込まれている)。酵素置換療法は、ハーラー症候群の患者の生存と生活の質に対して劇的な効果があったが、このアプローチは、費用と時間がかかる毎週の輸液を必要とする。追加のアプローチに含まれるのは、発現ベクターに載せたIDUA遺伝子の送達、または高発現している遺伝子座(血清アルブミンの遺伝子座など)へのこの遺伝子の挿入である(アメリカ合衆国特許第9.956,247号;参照によって本明細書に組み込まれている)。しかしこれらのアプローチでは、元のIDUA遺伝子座が復元されて正確なコード配列になることはない。ゲノム編集戦略には多数の利点があると考えられ、その中で最も注目すべきは、遺伝子の発現調節が健康な個人に存在する自然の機構によって制御されると考えられることである。それに加え、塩基編集を利用すると、二本鎖DNAを切断する必要がない。二本鎖DNAが切断されると、大規模な染色体再配列、細胞死や、腫瘍抑制機構の破壊によるがん発生につながる可能性がある。この疾患の原因変異を修正する方法を可能にする記述は実施例10に提示されている。記載されている方法は、本発明のRGN-塩基エディタ融合タンパク質を用いる一般的な戦略の一例であり、この融合タンパク質をヒトゲノムの中にあって疾患を引き起こすいくつかの変異に向かわせてその変異を修正する。表12に記載されているような疾患を標的とする同様のアプローチも追究できることがわかるであろう。さらに、他の種(特に一般的なペットや家畜)で疾患を引き起こす変異を標的とする同様のアプローチも本発明のRGNを用いて展開できることがわかるであろう。一般的なペットと家畜に含まれるのは、イヌ、ネコ、ウマ、ブタ、ウシ、ヒツジ、ニワトリ、ロバ、ヘビ、フェレット、魚類(サケを含む)、エビである。
フリードライヒ運動失調症
本発明のRGNは、原因変異がより複雑なヒトの治療法においても有用である可能性があろう。例えばフリードライヒ運動失調症やハンチントン病などのいくつかの疾患は、遺伝子の特定の領域にある3ヌクレオチドモチーフの反復回数が顕著に増加している結果であり、発現するタンパク質が機能する能力、または発現する能力に影響を与える。フリードライヒ運動失調症(FRDA)は常染色体劣性疾患であり、脊椎内の神経組織が徐々に変性していく。ミトコンドリア内のフラタキシン(FXN)タンパク質のレベルが低下することにより、細胞レベルで酸化的損傷と鉄欠損が起こる。FXNの発現低下は、体細胞と生殖系のFXN遺伝子のイントロン1の中にあるGAAトリプレット伸長と結び付けられてきた。FRDA患者では、GAAの反復回数は、70超であることがしばしばあり、ときに1000トリプレットを超えてさえいる(最も一般的なのは600〜900)のに対し、この病気でない個人は約40未満の反復回数である(Pandolfo他(2012年)Handbook of Clinical Neurology第103巻:275〜294ページ;Campuzano他(1996年)Science第271巻:1423〜1427ページ;Pandolfo(2002年)Adv. Exp. Med. Biol. 第516巻:99〜118ページ;これらはすべて、参照によって本明細書に組み込まれている)。
フリードライヒ運動失調症(FRDA)を引き起こす3ヌクレオチド反復配列の増殖は、FRDA不安定性領域と呼ばれるFXN遺伝子内の特定の遺伝子座の中で起こる。RNA誘導型ヌクレアーゼ(RGN)を用いてFRDA患者の細胞内の不安定性領域を切除することができる。このアプローチは、1)ヒトゲノムの中のアレルを標的とするようにプログラムすることのできるRGN・ガイドRNA配列と;2)このRGN・ガイド配列を送達する方法を必要とする。ゲノムの編集に用いられる多くのヌクレアーゼ(一般に用いられている化膿レンサ球菌からのCas9ヌクレアーゼ(SpCas9))は、アデノ随伴ウイルス(AAV)ベクターの中にパッケージするには大きすぎる。特にSpCas9遺伝子とガイドRNAの長さに加え、機能的な発現カセットに必要とされる他の遺伝エレメントの長さを考慮すると、そのことがわかる。そのためSpCas9を利用するアプローチはより困難になる。
本発明のコンパクトなRNA誘導型ヌクレアーゼ(特にAPG07433.1とAPG08290.1)は、FRDA不安定性領域の切除に極めてよく適している。それぞれのRGNは、FRDA不安定性領域の近傍にPAMを必要とする。それに加え、これらRGNのそれぞれは、ガイドRNAとともにAAVベクターの中にパッケージすることができる。2つのガイドRNAをパッケージするには第2のベクターが必要となる可能性が大きいが、それでもこのアプローチは、より大きなヌクレアーゼ(例えばSpCas9であり、タンパク質配列を2つのベクターに分割せねばならない可能性がある)で必要とされると考えられるベクターよりも有利である。この疾患の原因変異を修正する方法を可能にする記述は実施例11に提示されている。記載されている方法には、本発明のRGNを用いてゲノム不安定性の領域を除去する戦略が包含される。このような戦略は、同様の遺伝的基礎を持つ他の疾患と障害(ハンチントン病など)に適用することができる。本発明のRGNを用いる同様の戦略は、農業的に、または経済的に重要な非ヒト動物の疾患と障害にも適用することができる。そのような非ヒト動物に含まれるのは、イヌ、ネコ、ウマ、ブタ、ウシ、ヒツジ、ニワトリ、ロバ、ヘビ、フェレット、魚類(サケを含む)、エビである。
ヘモグロビン異常症
本発明のRGNは、有利な効果をもたらす可能性がある破壊的変異を導入することもできると考えられる。ヘモグロビン、特にβグロビン鎖(HBB遺伝子)をコードする遺伝子の中の遺伝子欠陥が、ヘモグロビン異常症として知られる多数の疾患(鎌形赤血球貧血、サラセミアが含まれる)に責任がある可能性がある。
成人では、ヘモグロビンは、2つのアルファ(α)様グロビン鎖と、2つのベータ(β)様グロビン鎖と、4つのヘム基を含むヘテロ四量体である。成人では、このα2β2四量体は、ヘモグロビンA(HbA)または成人ヘモグロビンと呼ばれている。典型的には、アルファグロビン鎖とベータグロビン鎖は約1:1の比で合成され、この比が、ヘモグロビンと赤血球細胞(RBC)の安定性にとって極めて重要であるように見える。発達中の胎児では、ヘモグロビンAよりも酸素への結合親和性が大きい異なる形態のヘモグロビン(胎児ヘモグロビン(HbF))が産生されるため、酸素を母体の血流を通じて胎児のシステムに送達することができる。胎児のヘモグロビンは2つのαグロビン鎖も含有しているが、成人のβグロビン鎖の代わりに2つの胎児ガンマ(γ)グロビン鎖を有する(すなわち胎児ヘモグロビンはα2γ2である)。ガンマグロビンの産生からベータグロビンの産生への切り換えの調節は極めて複雑であり、主に、ガンマグロビン転写の下方調節と、それと同時に起こるベータグロビン転写の上方調節を含んでいる。妊娠約30週の時点では、胎児の体内におけるガンマグロビンの合成は低下し始めるのに対し、ベータグロビンの産生は増加する。新生児のヘモグロビンは、年齢が約10ヶ月になるまではほぼすべてがα2β2だが、いくらかのHbFが成人期まで残る(全ヘモグロビンの約1〜3%)。上に説明したように、ヘモグロビン異常症を持つ患者の大半は、ガンマグロビンをコードする遺伝子が存在したままだが、上に説明したような分娩の頃に起こる正常遺伝子の抑制が原因で発現は比較的少ない。
鎌状赤血球症は、βグロビン遺伝子(HBB)内のV6E変異によって起こり(DNAレベルでGAGからGTGへ)、得られるヘモグロビンは「ヘモグロビンS」または「HbS」と呼ばれる。低酸素条件では、HbS分子が凝集して繊維状の沈殿物を形成する。これら凝集体がRBCの異常または「鎌状化」を引き起こし、その結果として細胞の可撓性が失われる。この鎌状RBCはもはや毛細血管床に入り込むことができないため、鎌形赤血球患者では血管閉塞危機になる可能性がある。それに加え、鎌状RBCは正常なRBCよりも脆弱で溶血しやすく、最終的に患者は貧血になる。
鎌状赤血球症患者の治療と管理は、抗生剤治療、疼痛管理、急性期の輸血を含む一生にわたる課題である。1つのアプローチは、ヒドロキシウレアを使用するというものである。ヒドロキシウレアは、ガンマグロビンの産生を増加させることによって効果の一部を及ぼす。慢性ヒドロキシウレア療法の長期にわたる副作用はまだ知られていないが、治療によって望まない副作用が生じることで、患者ごとに効果が異なる可能性がある。鎌状赤血球治療の効果は増大しているにもかかわらず、患者の平均寿命はまだ50代の半ばから後半にすぎず、この疾患に関係する病的状態が患者の生活の質に深刻な影響を及ぼす。
サラセミア(アルファサラセミアとベータサラセミア)もヘモグロビンに関係する疾患であり、典型的にはグロビン鎖の発現低下が関係する。これは、遺伝子の調節領域における変異を通じて発生するか、グロビンコード配列の中の変異によって機能するグロビンタンパク質の発現またはレベルが低下することから発生する。サラセミアの治療は、通常は、輸血と鉄キレート化療法を含んでいる。適切なドナーを特定できた場合には、重症患者の治療に骨髄移植も利用されているが、この方法はリスクが大きい可能性がある。
SCDとベータサラセミアの両方を治療するために提案されてきた1つのアプローチは、ガンマグロビンの発現を増加させ、異常な成人ヘモグロビンAをHbFで機能的に置き換えるというものである。上述のように、ヒドロキシウレアを用いたSCD患者の治療は成功すると考えられるが、その理由の一部は、ヒドロキシウレアがガンマグロビンの発現増加に効果があることにある(DeSimone(1982年)Proc Nat'l Acad Sci USA第79巻(14):4428〜4431ページ;Ley他(1982年)N. Engl. J. Medicine、第307巻:1469〜1475ページ;Ley他(1983年)Blood第62巻:370〜380ページ;Constantoulakis他(1988年)Blood第72巻(6):1961〜1967ページ;これらのすべてが参照によって本明細書に組み込まれている)。HbFの発現増加は、遺伝子の産物がガンマグロビンの発現調節において役割を果たす遺伝子の同定を含んでいる。そのような1つの遺伝子はBCL11Aである。BCL11Aは、成人の赤血球前駆細胞で発現しているジンクフィンガータンパク質をコードしていて、その発現が下方調節されるとガンマグロビンの発現が増加する(Sankaran他(2008年)Science 第322巻:1839ページ;参照によって本明細書に組み込まれている)。BCL11A遺伝子を標的とする抑制性RNAの使用が提案されている(例えばアメリカ合衆国特許出願公開第2011/0182867号;参照によって本明細書に組み込まれている)が、この技術には潜在的な欠点がいくつかある。そのような欠点に含まれるのは、完全なノックダウンを実現できない可能性があること、このようなRNAの送達に問題がある可能性のあること、このRNAが継続的に存在せねばならないため、生涯にわたって多数回の治療が必要とされることである。
本発明のRGNを用いてBCL11Aエンハンサ領域を標的とし、BCL11Aの発現を破壊することにより、ガンマグロビンの発現を増加させる。この標的破壊は、非相同末端結合(NHEJ)によって実現することができる。NHEJによって本発明のRGNはBCL11Aエンハンサ領域内の特定の配列を標的として二本鎖を切断し、細胞の機構がその切断を修復し、典型的にはそれと同時に有害な変異を導入する。別の疾患標的について記載したことと同様、本発明のRGNは相対的にサイズが小さく、生体内送達を目的としてRGNとそれに対応するガイドRNAのための発現カセットを単一のAAVベクターの中にパッケージできることが理由で、他の既知のRGNと比べて利点を有する。この方法を可能にする記述は実施例12に提示されている。本発明のRGNを用いる同様の戦略も、ヒトと、農業的または経済的に重要な非ヒト動物の両方の同様の疾患と障害に適用することができる。
IX.ポリヌクレオチド遺伝子改変を含む細胞
本明細書では、本明細書に記載されているRGN、および/またはcrRNA、および/またはtracrRNAを媒介とする方法を用いて改変された目的の標的配列を含む細胞と生物が提供される。これら実施態様のいくつかでは、RGNは、配列番号1、11、19、27、36、45、54いずれかのアミノ酸配列、またはその活性なバリアントまたは断片を含んでいる。さまざまな実施態様では、ガイドRNAは、配列番号2、12、20、28、37、46、55いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含むCRISPR反復配列を含んでいる。特別な実施態様では、ガイドRNAは、配列番号3、13、21、29、38、47、56いずれかのヌクレオチド配列、またはその活性なバリアントまたは断片を含むtracrRNAを含んでいる。このシステムのガイドRNAとして、単一ガイドRNAまたは二重ガイドRNAが可能である。
改変された細胞として、真核細胞(例えば哺乳動物の細胞、植物細胞、昆虫細胞)または原核細胞が可能である。本明細書に記載されているRGN、および/またはcrRNA、および/またはtracrRNAを用いる方法によって改変された少なくとも1つのヌクレオチド配列を含むオルガネラと胚も提供される。遺伝子が改変された細胞、または生物、またはオルガネラ、または胚は、改変されたヌクレオチド配列に関してヘテロ接合性またはホモ接合性であることが可能である。
細胞、生物、オルガネラ、胚のいずれかの染色体が改変される結果として、変化したタンパク質産物または組み込まれた配列の発現の変化(上方調節または下方調節)、または不活化、または発現が起こる可能性がある。染色体の改変によって遺伝子の不活化、または非機能性タンパク質産物の発現が起こる場合には、遺伝子が改変された細胞、または生物、またはオルガネラ、または胚は「ノックアウト」と呼ばれる。ノックアウト表現型の結果として、欠失変異(すなわち少なくとも1個のヌクレオチドの欠失)、または挿入変異(すなわち少なくとも1個のヌクレオチドの挿入)、またはナンセンス変異(すなわち少なくとも1個のヌクレオチドが置換されて終止コドンが導入される)になる可能性がある。
あるいは細胞、生物、オルガネラ、胚のいずれかの染色体が改変される結果として、「ノックイン」が生成する可能性がある。これは、タンパク質をコードするヌクレオチド配列が染色体に組み込まれることの結果である。これら実施態様のいくつかでは、コード配列が染色体に組み込まれることで野生型タンパク質をコードする染色体配列は不活化するが、外部から導入されたタンパク質は発現する。
別の実施態様では、染色体が改変される結果として、バリアントタンパク質産物が生成する。発現するバリアントタンパク質は、少なくとも1個のアミノ酸の置換、および/または少なくとも1個のアミノ酸の付加または欠失を有する可能性がある。変化した染色体配列によってコードされるバリアントタンパク質産物は、野生型タンパク質と比べて改変された特徴または活性(その非限定的な例に、変化した酵素活性または基質特異性が含まれる)を示す可能性がある。
さらに別の実施態様では、染色体が改変される結果として、タンパク質の発現パターンが変化する可能性がある。非限定的な一例として、タンパク質産物の発現を制御する調節領域内の染色体が変化する結果として、そのタンパク質産物の過剰発現または下方調節、または変化した組織発現パターン、または変化した時間的発現パターンが生じる可能性がある。
冠詞「1つの」は、本明細書では、文法的対象となる1つまたは2つ以上(すなわち、少なくとも1つ)の物体を意味するのに用いられる。例として「1つのポリペプチド」は、1つ以上のポリペプチドを意味する。
本明細書で言及されているあらゆる刊行物と特許出願は、本開示が関係する分野の当業者のレベルを示している。どの刊行物と特許出願も、個々の刊行物または特許出願が具体的かつ個別に参照によって組み込まれていることが示されているかのようにして、参照によって本明細書に組み込まれている。
明確な理解を目的として説明と例によって本発明をいくらか詳細に記載してきたが、添付の実施態様の範囲内でいくつかの変更と改変を実施できることは明らかであろう。
非限定的な実施態様には、以下のものが含まれる。
1.RNA誘導型ヌクレアーゼ(RGN)ポリペプチドをコードするポリヌクレオチドを含む核酸分子であって、前記ポリヌクレオチドが、配列番号1、11、19、27、36、45、54のいずれかと配列が少なくとも95%一致するアミノ酸配列を含むRGNポリペプチドをコードするヌクレオチド配列を含み、
前記RGNポリペプチドが、標的DNA配列にハイブリダイズすることのできるガイドRNA(gRNA)に結合しているとき、RNA誘導型配列に特異的なやり方で前記標的DNA配列に結合し、
RGNポリペプチドをコードする前記ポリヌクレオチドが、前記ポリヌクレオチドにとって異種のプロモータに機能可能に連結されている、核酸分子。
2.前記RGNポリペプチドが前記標的DNA配列に結合したときにこの標的DNA配列を切断することができる、実施態様1に記載の核酸分子。
3.前記RGNポリペプチドによる切断によって二本鎖の切断が生じる、実施態様2に記載の核酸分子。
4.前記RGNポリペプチドによる切断によって一本鎖の切断が生じる、実施態様2に記載の核酸分子。
5.前記RGNポリペプチドが塩基編集ポリヌクレオチドに機能可能に融合されている、実施態様1〜4のいずれか1項に記載の核酸分子。
6.前記RGNポリペプチドが1つ以上の核局在化シグナルを含む、実施態様1〜5のいずれか1項に記載の核酸分子。
7.前記RGNポリペプチドが、真核細胞の中での発現に関してコドン最適化されている、実施態様1〜6のいずれか1項に記載の核酸分子。
8.前記標的DNA配列がプロトスペーサ隣接モチーフ(PAM)に隣接した位置にある、実施態様1〜7のいずれか1項に記載の核酸分子。
9.実施態様1〜8のいずれか1項の核酸分子を含むベクター。
10.前記標的DNA配列にハイブリダイズすることのできる前記gRNAをコードする少なくとも1つのヌクレオチド配列をさらに含む、実施態様9に記載のベクター。
11.前記gRNAが単一ガイドRNAである、実施態様10に記載のベクター。
12.前記gRNAが二重ガイドRNAである、実施態様10に記載のベクター。
13.前記ガイドRNAが、配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つCRISPR 反復配列を含むCRISPR RNAを含む、実施態様10〜12のいずれか1項に記載のベクター。
14.前記ガイドRNAが、配列番号3、13、21、29、38、47、56のいずれかと少なくとも95%一致する配列を持つtracrRNAを含む、実施態様10〜13のいずれか1項に記載のベクター。
15.実施態様1〜8のいずれか1項の核酸分子を含むか、実施態様9〜14のいずれか1項に記載のベクターを含む細胞。
16.RGNポリペプチドを作製する方法であって、前記RGNポリペプチドが発現する条件下で実施態様15に記載の細胞を培養することを含む方法。
17.RGNポリペプチドを作製する方法であって、配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含むRNA誘導型ヌクレアーゼ(RGN)ポリペプチドをコードするヌクレオチド配列を含む異種核酸分子を細胞に導入して;
前記RGNポリペプチドが、標的DNA配列にハイブリダイズすることのできるガイドRNA(gRNA)に結合しているとき、そのRGNポリペプチドをRNA誘導型配列に特異的なやり方で前記標的DNA配列に結合させ;
前記RGNポリペプチドが発現する条件下で前記細胞を培養することを含む方法。
18.前記RGNポリペプチドを精製することをさらに含む、実施態様16または17に記載の方法。
19.前記細胞が、前記RGNポリペプチドに結合する1つ以上のガイドRNAをさらに発現し、RGNリボ核タンパク質複合体を形成する、実施態様16または17に記載の方法。
20.前記RGNリボ核タンパク質複合体を精製することをさらに含む、実施態様19に記載の方法。
21.CRISPR RNA(crRNA)をコードするポリヌクレオチドを含む核酸分子であって、前記crRNAが、スペーサ配列とCRISPR反復配列を含み、前記CRISPR反復配列は、配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含み;
a)前記crRNAと;
b)前記crRNAの前記CRISPR反復配列にハイブリダイズするトランス活性化CRISPR RNA(tracrRNA)
を含むガイドRNAが、
RNA誘導型ヌクレアーゼ(RGN)ポリペプチドに結合しているとき、前記crRNAのスペーサ配列を介して配列特異的なやり方で標的DNA配列にハイブリダイズすることができるものであり、
crRNAをコードする前記ポリヌクレオチドが、前記ポリヌクレオチドにとって異種であるプロモータに機能可能に連結されていている、核酸分子。
22.実施態様21に記載の核酸分子を含むベクター。
23.前記tracrRNAをコードするポリヌクレオチドをさらに含む、実施態様22に記載のベクター。
24.前記tracrRNAが、配列番号3、13、21、29、38、47、56のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含む、実施態様23に記載のベクター。
25.前記crRNAをコードする前記ポリヌクレオチドと、前記tracrRNAをコードする前記ポリヌクレオチドが、同じプロモータに機能可能に連結されていて、単一ガイドRNAとしてコードされている、実施態様23または24に記載のベクター。
26.前記crRNAをコードする前記ポリヌクレオチドと、前記tracrRNAをコードする前記ポリヌクレオチドが、別々のプロモータに機能可能に連結されている、実施態様23または24に記載のベクター。
27.前記RGNポリペプチドをコードするポリヌクレオチドをさらに含んでいて、前記RGNポリペプチドが、配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含む、実施態様22〜26のいずれか1項に記載のベクター。
28.配列番号3、13、21、29、38、47、56のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むトランス活性化CRISPR RNA(tracrRNA)をコードするポリヌクレオチドを含む核酸分子であって;
a)前記tracrRNAと;
b)このtracrRNAがハイブリダイズするCRISPR反復配列と、スペーサ配列を含むcrRNA
を含むガイドRNAが、
RNA誘導型ヌクレアーゼ(RGN)ポリペプチドに結合しているとき、前記crRNAのスペーサ配列を介して配列特異的なやり方で標的DNA配列にハイブリダイズすることができるものであり、
tracrRNAをコードする前記ポリヌクレオチドが、前記ポリヌクレオチドにとって異種であるプロモータに機能可能に連結されている、核酸分子。
29.実施態様28に記載の核酸分子を含むベクター。
30.前記crRNAをコードするポリヌクレオチドをさらに含む、実施態様29に記載のベクター。
31.前記crDNAの前記CRISPR反復配列が、配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含む、実施態様30に記載のベクター。
32.前記crDNAをコードする前記ポリヌクレオチドと、前記tracrRNAをコードする前記ポリヌクレオチドが、同じプロモータに機能可能に連結されていて、単一ガイドRNAとしてコードされている、実施態様30または31に記載のベクター。
33.前記crDNAをコードする前記ポリヌクレオチドと、前記tracrRNAをコードする前記ポリヌクレオチドが、別々のプロモータに機能可能に連結されている、実施態様30または31に記載のベクター。
34.前記RGNポリペプチドをコードするポリヌクレオチドをさらに含んでいて、前記RGNポリペプチドが、配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含む、実施態様29〜33のいずれか1項に記載のベクター。
35.標的DNA配列に結合させるため、
a)この標的DNA配列にハイブリダイズすることのできる1つ以上のガイドRNA、またはこの1つ以上のガイドRNA(gRNA)をコードする1つ以上のヌクレオチド配列と;
b)配列番号1、11、19、27、36、45、54のいずれかと配列が少なくとも95%一致するアミノ酸配列を含むRNA誘導型ヌクレアーゼ(RGN)ポリペプチド、またはこのRGNポリペプチドをコードするヌクレオチド配列を含んでいて;
前記1つ以上のガイドRNAをコードするヌクレオチド配列と前記RGNポリペプチドをコードするヌクレオチド配列のそれぞれが、それぞれのヌクレオチド配列にとって異種のプロモータに機能可能に連結されているシステムであって;
前記1つ以上のガイドRNAが前記標的DNA配列にハイブリダイズすることと、
前記1つ以上のガイドRNAが前記RGNポリペプチドと複合体を形成することにより、このRGNポリペプチドを前記標的DNA配列に結合させる、システム。
36.前記gRNAが単一ガイドRNA(sgRNA)である、実施態様35に記載のシステム。
37.前記gRNAが二重ガイドRNAである、実施態様35に記載のシステム。
38.前記gRNAが、配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含む、実施態様35〜37のいずれか1項に記載のシステム。
39.前記gRNAが、配列番号3、13、21、29、38、47、56のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むtracrRNAを含む、実施態様35〜38のいずれか1項に記載のシステム。
40.前記標的DNA配列がプロトスペーサ隣接モチーフ(PAM)に隣接した位置にある、実施態様35〜39のいずれか1項に記載のシステム。
41.前記標的DNA配列が細胞の中にある、実施態様35〜40のいずれか1項に記載のシステム。
42.前記細胞が真核細胞である、実施態様41に記載のシステム。
43.前記真核細胞が植物細胞である、実施態様42に記載のシステム。
44.前記真核細胞が哺乳動物の細胞である、実施態様42に記載のシステム。
45.前記真核細胞が昆虫細胞である、実施態様42に記載のシステム。
46.前記細胞が原核細胞である、実施態様41に記載のシステム。
47.転写されるとき、前記1つ以上のガイドRNAが前記標的DNA配列にハイブリダイズして前記RGNポリペプチドと複合体を形成し、前記標的DNA配列の切断を引き起こす、実施態様35〜46のいずれか1項に記載のシステム。
48.前記切断によって二本鎖の切断が生じる、実施態様47に記載のシステム。
49.前記RGNポリペプチドによる切断によって一本鎖の切断が生じる、実施態様47に記載のシステム。
50.前記RGNポリペプチドが塩基編集ポリペプチドに機能可能に連結されている、実施態様35〜49のいずれか1項に記載のシステム。
51.前記RGNポリペプチドが1つ以上の核局在化シグナルを含む、実施態様35〜50のいずれか1項に記載のシステム。
52.前記RGNポリペプチドが、真核細胞の中での発現に関してコドン最適化されている、実施態様35〜51のいずれか1項に記載のシステム。
53.前記1つ以上のガイドRNAをコードするヌクレオチド配列と、RGNポリペプチドをコードする前記ヌクレオチド配列が、1つのベクター上に位置する、実施態様35〜52のいずれか1項に記載のシステム。
54.1つ以上のドナーポリヌクレオチド、またはこの1つ以上のドナーポリヌクレオチドをコードする1つ以上のヌクレオチド配列をさらに含む、実施態様35〜53のいずれか1項に記載のシステム。
55.標的DNA配列に結合させる方法であって、実施態様35〜54のいずれか1項に記載のシステムを、前記標的DNA配列に送達するか、この標的DNA配列を含む細胞に送達することを含む方法。
56.前記RGNポリペプチドまたは前記ガイドRNAが検出可能な標識をさらに含むことにより、前記標的DNA配列の検出を可能にする、実施態様55に記載の方法。
57.前記ガイドRNAまたは前記RGNポリペプチドが発現モジュレータをさらに含むことにより、前記標的DNA配列の発現、または前記標的DNA配列による転写制御下にある遺伝子の発現を変化させる、実施態様55に記載の方法。
58.標的DNA配列を切断または改変する方法であって、実施態様35〜54のいずれか1項に記載のシステムを、前記標的DNA配列に送達するか、前記標的DNA配列を含む細胞に送達することを含む方法。
59.前記改変された標的DNA配列が、異種DNAを前記標的DNA配列に挿入することを含む、実施態様58に記載の方法。
60.前記改変された標的DNA配列が、前記標的DNA配列から少なくとも1個のヌクレオチドを欠失させることを含む、実施態様58に記載の方法。
61.前記改変された標的DNA配列が、前記標的DNA配列の中に少なくとも1個のヌクレオチドの変異を含む、実施態様58に記載の方法。
62.標的DNA配列に結合させる方法であって、
a)i)前記標的DNA配列にハイブリダイズすることのできる1つ以上のガイドRNAと;
ii)配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含むRGNポリペプチド
をインビトロで組み合わせることにより、RNA誘導型ヌクレアーゼ(RGN)リボヌクレオチド複合体を、このRGNリボヌクレオチド複合体の形成に適した条件下で組み立てた後;
b)前記標的DNA配列、または前記標的DNA配列を含む細胞を、インビトロで組み立てた前記RGNリボヌクレオチド複合体と接触させることを含んでいて;
前記1つ以上のガイドRNAが前記標的DNA配列にハイブリダイズすることにより、前記RGNポリペプチドが前記標的DNA配列に結合する、方法。
63.前記RGNポリペプチドまたは前記ガイドRNAが検出可能な標識をさらに含むことにより、前記標的DNA配列の検出を可能にする、実施態様62に記載の方法。
64.前記ガイドRNAまたは前記RGNポリペプチドが発現モジュレータをさらに含むことにより、前記標的DNA配列の発現の変化を可能にする、実施態様62に記載の方法。
65.標的DNA配列を切断および/または改変する方法であって、DNA分子を、
a)配列番号1、11、19、27、36、45、54のいずれかと配列が少なくとも95%一致するアミノ酸配列を含むRNA誘導型ヌクレアーゼ(RGN)ポリペプチドと;
b)(a)のRGNを前記標的DNA配列に向かわせることのできる1つ以上のガイドRNAに接触させることを含んでいて、
前記1つ以上のガイドRNAが前記標的DNA配列にハイブリダイズすることにより、前記RGNポリペプチドがこの標的DNA配列に結合し、この標的DNA配列の切断および/または改変が起こる、方法。
66.前記改変された標的DNA配列が、前記標的DNA配列への異種DNAの挿入を含む、実施態様65に記載の方法。
67.前記改変された標的DNA配列が、前記標的DNA配列からの少なくとも1個のヌクレオチドの欠失を含む、実施態様65に記載の方法。
68.前記改変された標的DNA配列が、前記標的DNA配列の中の少なくとも1個のヌクレオチドの変異を含む、実施態様65に記載の方法。
69.前記gRNAが単一ガイドRNA(sgRNA)である、実施態様62〜68のいずれか1項に記載の方法。
70.前記gRNAが二重ガイドRNAである、実施態様62〜68のいずれか1項に記載の方法。
71.前記gRNAが、配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含む、実施態様62〜70のいずれか1項に記載の方法。
72.前記gRNAが、配列番号3、13、21、29、38、47、56のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むtracrRNAを含む、実施態様62〜71のいずれか1項に記載の方法。
73.前記標的DNA配列がプロトスペーサ隣接モチーフ(PAM)に隣接した位置にある、実施態様62〜72のいずれか1項に記載の方法。
74.前記標的DNA配列が細胞の中にある、実施態様55〜73のいずれか1項に記載の方法。
75.前記細胞が真核細胞である、実施態様74に記載の方法。
76.前記真核細胞が植物細胞である、実施態様75に記載の方法。
77.前記真核細胞が哺乳動物の細胞である、実施態様75に記載の方法。
78.前記真核細胞が昆虫細胞である、実施態様75に記載の方法。
79.前記細胞が原核細胞である、実施態様74に記載の方法。
80.前記細胞の培養を、前記RGNポリペプチドが発現して前記標的DNA配列を切断することにより改変されたDNA配列を生成させる条件下で実施し;前記改変されたDNA配列を含む細胞を選択することをさらに含む、実施態様74〜79のいずれか1項に記載の方法。
81.実施態様80に記載の方法に従って改変された標的DNA配列を含む細胞。
82.真核細胞である、実施態様81に記載の細胞。
83.前記真核細胞が植物細胞である、実施態様82に記載の細胞。
84.実施態様83に記載の細胞を含む植物。
85.実施態様83に記載の細胞を含む種子。
86.前記真核細胞が哺乳動物の細胞である、実施態様82に記載の細胞。
87.前記真核細胞が昆虫細胞である、実施態様82に記載の細胞。
88.原核細胞である、実施態様81に記載の細胞。
89.遺伝性疾患の原因変異を修正した遺伝子改変細胞を作製する方法であって、細胞の中に、
a)配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含むRNA誘導型(RGN)ポリペプチド、またはこのRGNポリペプチドをコードしていて、細胞内でこのRGNポリペプチドの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドと;
b)配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含むガイドRNA(gRNA)、またはこのgRNAをコードしていて、細胞内でこのgRNAの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドを導入することにより、
前記RGNと前記gRNAを前記原因変異のゲノム位置に向かわせてこのゲノム位置の配列を改変し、前記原因変異を除去することを含む方法。
90.前記RGNを、塩基編集活性を有するポリペプチドに融合させる、実施態様89に記載の方法。
91.塩基編集活性を有する前記ポリペプチドが、シチジンデアミナーゼまたはアデノシンデアミナーゼである、実施態様90に記載の方法。
92.前記細胞が動物細胞である、実施態様89に記載の方法。
93.前記細胞が哺乳動物の細胞である、実施態様89に記載の方法。
94.前記細胞が、イヌ、ネコ、マウス、ラット、ウサギ、ウマ、ウシ、ブタ、ヒトのいずれかに由来する、実施態様92に記載の方法。
95.前記遺伝性疾患が、表12に掲載されている疾患である、実施態様92に記載の方法。
96.前記遺伝性疾患がハーラー症候群である、実施態様92に記載の方法。
97.前記gRNAが、配列番号453、454、455のいずれかを標的とするスペーサ配列をさらに含む、実施態様96に記載の方法。
98.疾患を引き起こすゲノム不安定性領域に欠失がある遺伝子改変細胞を作製する方法であって、この細胞の中に、
a)配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含むRNA誘導型(RGN)ポリペプチド、またはこのRGNポリペプチドをコードしていて、細胞内でこのRGNポリペプチドの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドと;
b)配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含むとともに、ゲノム不安定性領域の5'フランキング領域を標的とするスペーサ配列をさらに含むガイドRNA(gRNA)、またはこのgRNAをコードしていて、細胞内でこのgRNAの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドと;
c)配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含むとともに、ゲノム不安定性領域の3'フランキング領域を標的とするスペーサ配列をさらに含む第2のガイドRNA(gRNA)、またはこのgRNAをコードしていて、細胞内でこのgRNAの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドを導入することにより、
前記RGNと前記2つのgRNAを前記ゲノム不安定性領域に向かわせ、このゲノム不安定性領域の少なくとも一部を除去することを含む方法。
99.前記細胞が動物細胞である、実施態様98に記載の方法。
100.前記細胞が哺乳動物の細胞である、実施態様98に記載の方法。
101.前記細胞が、イヌ、ネコ、マウス、ラット、ウサギ、ウマ、ウシ、ブタ、ヒトのいずれかに由来する、実施態様100に記載の方法。
102.前記遺伝性疾患が、フリードライヒ運動失調症またはハンチントン病である、実施態様99に記載の方法。
103.前記第1のgRNAが、配列番号468、469、470のいずれかを標的とするスペーサ配列をさらに含む、実施態様102に記載の方法。
104.前記第2のgRNAが、配列番号471を標的とするスペーサ配列をさらに含む、実施態様103に記載の方法。
105.BCL11AのmRNAとタンパク質の発現が低下した遺伝子改変哺乳動物造血前駆細胞を作製する方法であって、単離されたヒト造血前駆細胞の中に、
a)配列番号1、11、19、27、36、45、54のいずれかと少なくとも95%一致する配列を持つアミノ酸配列を含むRNA誘導型(RGN)ポリペプチド、またはこのRGNポリペプチドをコードしていて、細胞内でこのRGNポリペプチドの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドと;
b)配列番号2、12、20、28、37、46、55のいずれかと少なくとも95%一致する配列を持つヌクレオチド配列を含むCRISPR反復配列を含むガイドRNA(gRNA)、またはこのgRNAをコードしていて、細胞内でこのgRNAの発現を可能にするプロモータに機能可能に連結されているポリヌクレオチドを導入することにより、
前記RGNと前記gRNAを前記細胞内で発現させてBCL11Aエンハンサ領域の位置での切断を実現する結果として、前記ヒト造血前駆細胞の遺伝子が改変され、BCL11AのmRNAおよび/またはタンパク質の発現が低下することを含む方法。
106.前記gRNAが、配列番号473、474、475、476、477、478のいずれかを標的とするスペーサ配列をさらに含む、実施態様105に記載の方法。
107.標的DNA配列に結合させるため、
a)この標的DNA配列にハイブリダイズすることのできる1つ以上のガイドRNA、またはこの1つ以上のガイドRNA(gRNA)をコードする1つ以上のヌクレオチド配列と;
b)配列番号1、11、19、27、36、45、54のいずれかと配列が少なくとも95%一致するアミノ酸配列を含むRNA誘導型ヌクレアーゼ(RGN)ポリペプチドを含んでいて;
前記1つ以上のガイドRNAをコードするヌクレオチド配列と前記RGNポリペプチドをコードするヌクレオチド配列のそれぞれが、それぞれのヌクレオチド配列にとって異種のプロモータに機能可能に連結されているシステムであって;
前記1つ以上のガイドRNAが前記標的DNA配列にハイブリダイズすることと、
前記1つ以上のガイドRNAが前記RGNポリペプチドと複合体を形成することにより、このRGNポリペプチドを前記標的DNA配列に結合させる、システム
108.前記RGNポリペプチドが、ヌクレアーゼ-デッドであるか、ニッカーゼとして機能する、実施態様107に記載のシステム。
109.前記RGNポリペプチドが塩基編集ポリペプチドに機能可能に融合している、実施態様107または108に記載のシステム。
110.前記塩基編集ポリペプチドがデアミナーゼである、実施態様109に記載のシステム。
111.前記デアミナーゼが、シチジンデアミナーゼまたはアデノシンデアミナーゼである、実施態様110に記載のシステム。
以下の実施例は説明のために提供されているのであり、制限するためではない。
実験
実施例1:RNA誘導型ヌクレアーゼの同定
異なる7つのCRISPR関連RNA誘導型ヌクレアーゼ(RGN)が同定されたため、それらを下記の表1に記載してある。表1には、各RGNの名称、そのアミノ酸配列、出所、処理されたcrRNA配列とtracrRNA配列が示されている。表1にはさらに、一般的な単一ガイドRNA(sgRNA)配列が示されていて、その中のポリNは、sgRNAの核酸標的配列を決めるスペーサ配列の位置を示す。RNGシステムAPGシステムであるAPG05083.1、APG07433.1、APG07513.1、APG08290.1及びAPG08290.1は、tracrRNAのヘアピンステムの塩基中に保存された配列UNANNG(配列番号68)を持っていた。AP05459.1システムに関しては、同じ位置内の配列はUNANNU(配列番号557)である。APG04583.1システムとAPG01688.1システムに関しては、その配列はUNANNA(配列番号558)である。
実施例2:ガイドRNAの同定とsgRNAの構築
調べるRNA誘導型ヌクレアーゼシステムを元々発現する細菌の培養物を対数中期(OD600が約0.600)まで増殖させ、ペレット化し、瞬間凍結させた。mirVANA miRNA単離キット(Life Technologies社、カールスバッド、カリフォルニア州)を用いてRNAをペレットから単離し、単離されたRNAからNEBNext Small RNA Library Prepキット(NEB社、ビヴァリー、マサチューセッツ州)を用いてシークエンシングライブラリを調製した。このライブラリ調製物を6%ポリアクリルアミドゲル上で18〜65 nt RNA種と90〜200 nt RNA種に対応する2つのサイズに分画し、crRNAとtracrRNAをそれぞれ検出した。深いシークエンシング(小さいほうの分画に関しては40 bpペアードエンド、大きいほうの分画に関しては80 bpペアードエンド)をサービス提供者(MoGene社、セントルイス、ミズーリ州)がNext Seq 500(High Outputキット)上で実施した。Cutadaptを用いてリードを品質でトリミングし、Bowtie2を用いて参照ゲノムにマッピングした。カスタムRNAseqパイプラインをphytonで書いてcrRNA転写産物とtracrRNA転写産物を検出した。天然反復スペーサアレイの配列カバレッジによって処理されたcrRNAの境界を決定した。許容可能なBLASTnパラメータを用いてtracrRNAのアンチ反復部分を同定した。RNAシークエンシングの深度から、アンチ反復を含有する転写産物を同定することにより、処理されたtracrRNAの境界を確認した。RNA折り畳みソフトウエアであるNUPACKによる二次構造予測を利用してRNAのマニュアルキュレーションを実施した。DNA合成によってsgRNAカセットを用意した。sgRNAカセットは一般に以下のように設計した(5'→3'):20〜30 bpのスペーサ配列→crRNAの処理された反復部分→4 bpの非相補的リンカー(AAAG;配列番号63)→処理されたtracrRNA。他の4 bpの非相補的リンカーも使用できる(例えばGAAA(配列番号64)またはACUU(配列番号65))。いくつかの場合には、6 bpのヌクレオチドリンカーを使用できる(例えばCAAAGG(配列番号66))。インビトロアッセイのため、GeneArt(商標)精密gRNA合成キット(ThermoFisher社)を用いたインビトロでのsgRNAカセットの転写によってsgRNAを合成した。それぞれのRGNポリペプチドに関する処理されたcrRNA配列とtracrRNA配列を同定し、表1に示してある。PAMライブラリ1と2のために構成したsgRNAに関しては下記の記述を参照されたい。
実施例3:それぞれのRGNに必要なPAMの決定
Kleinstiver他(2015年)Nature 第523巻:481〜485ページとZetsche他(2015年)Cell第163巻:759〜771ページから本質的に適合させたPAM減少アッセイを利用してそれぞれのRGNに必要なPAMを決定した。簡単に述べると、2つのプラスミドライブラリ(L1とL2)をpUC18骨格(ampR)の中で生成させた。それぞれのライブラリは、8個のランダムなヌクレオチド(すなわちPAM領域)が隣接した明確な30 bpのプロトスペーサ(標的)配列を含有している。それぞれのRGNについてライブラリ1とライブラリ2の標的配列とフランキングPAM領域を表2に示してある。
これらライブラリを別々に、大腸菌BL21(DE3)細胞に電気穿孔した。この大腸菌細胞の中には、本発明のRGN(大腸菌用にコドンが最適化されている)を含有するとともに、L1またはL2の中のプロトスペーサに対応するスペーサ配列を含むコグネイトsgRNAを含有するpRSF-1b発現ベクターが存在している。十分なライブラリプラスミドを形質転換反応物の中で用いて106 超のcfuを得た。pRSF-1b骨格の中のRGNとsgRNAの両方とも、T7プロモータの制御下にあった。この形質転換反応物を1時間かけて回収した後、カルベニシリンとカナマイシンを含有するLB培地の中に入れて希釈し、一晩増殖させた。翌日、この混合物を自己誘導性Overnight Express(商標)Instant TB培地(Millipore Sigma社)の中に入れて希釈し、RGNとsgRNAを発現させ、さらに4時間または20時間にわたって増殖させた後、細胞を沈降させ、Mini-prepキット(Qiagen社、ジャーマンタウン、メリーランド州)を用いてプラスミドDNAを単離した。適切なsgRNAの存在下では、RGNが認識できるPAMを含有するプラスミドが切断されて、集団からそれらプラスミドが除去される。RGNが認識できないPAMを含有するプラスミド、または形質転換のため適切なsgRNAを含有していない細菌の中に入れられるプラスミドは生き延びて複製される。切断されないプラスミドのPAM領域とプロトスペーサ領域をPCRで増幅し、公開されているプロトコル(16sメタゲノムライブラリ調製ガイド15044223B、Illumina社、サンディエゴ、カリフォルニア州)に従うシークエンシングの準備をした。サービス提供者(MoGene社、セントルイス、ミズーリ州)によって深いシークエンシング(80 bp単一エンドリード)がMiSeq(Illumina社)で実施された。典型的には、アンプリコン1つ当たり1〜4M個のリードを取得した。各サンプルでPAM領域を取り出し、カウントし、全リードに規格化した。プラスミドの切断につながるPAMは、対照と比べて(すなわちRGNを含有するが適切なsgRNAを欠く大腸菌をライブラリで形質転換したとき)少ないことによって同定された。新規なRGNのためのPAMの条件を表わすため、問題の領域内の全配列についての減少比(サンプル中の頻度/対照中の頻度)を、-log2変換を用いて富化値に変換した。十分なPAMは、富化値が2.3超(減少比が約0.2未満に対応)であるPAMと定義した。両方のライブラリでこの閾値よりも大きいPAMを回収し、ウェブロゴを生成させるのに使用した。これは、例えばインターネット上でウェブに基づくサービスである「weblogo」として知られるサービスを利用して生成させることができる。PAM配列を同定し、富化された上位のPAMの中に一定のパターンがあるときに報告した。それぞれのRGNについて(富化値(EF)が2.3よりも大きい)PAMを表2に提示する。いくつかのRGNについては、(EFが3.3超である)PAMの非限定的な例も同定された。APG005083.1については、代表的なPAMはNNNNCCR (配列番号70)である。APG007513.1については、代表的なPAMはNNRNCC (配列番号71)である。APG001688.1については、代表的なPAMはNNRANC (配列番号72)である。
実施例4:切断の決定
RNP(リボ核タンパク質)を用いたインビトロでの切断反応から切断部位を明らかにした。His6タグまたはHis10タグに融合されたRGNを含有する発現プラスミドを構成し、大腸菌のBL21(DE3)菌株を形質転換した。自己誘導培地またはIPTG誘導を利用して発現させた。溶解と清澄化の後、タンパク質を固定化金属アフィニティクロマトグラフィによって精製した。
(ヌクレアーゼと、sgRNAまたはcrRNAとtracrRNAの二本鎖を含む)リボ核タンパク質複合体を、緩衝化溶液の中でヌクレアーゼとRNAを室温にて20分間インキュベートすることによって形成した。この複合体を、消化バッファとPCR増幅された標的(「配列1」と呼ぶ)を収容した試験管に移した。配列1は、3'末端の位置に、各RGNのための対応するPAM配列が直接連結したヌクレオチド配列(配列番号73)を含んでいた。リボ核タンパク質複合体としての各RGNを各標的ポリヌクレオチドとともに25℃(APG04583.1)または37℃(他のすべて)で30分間または60分間(APG05459.1とAPG01688.1だけ)インキュベートした。消化反応物を熱で不活化した後、アガロースゲル上を走らせた。切断産物のバンドをゲルから切除し、Sangerシークエンシングを利用してシークエンシングした。切断部位は、シークエンシング結果をPCR産物の予想される配列とアラインメントさせることによって同定した。結果を表3に示す。表3に示されているように、RGN APG007433.1は、標的配列が異なる平滑な切断部も生成させることができる。
配列2(配列番号559、3'末端の位置でRGN APG0733.1のためのPAM配列に機能可能に融合している)の切断部位を、ヌクレアーゼAPG07433.1のための以下のアプローチによって明らかにした。消化後、ゲル精製したDNA産物をDNA末端修復キット(Thermo Scientific K0771)で処理し、直線化した平滑ベクターに連結し、得られた環状DNAで大腸菌コンピテント細胞を形質転換した。5'オーバーハングを持つ粘着切断部があれば、両方の切断産物からのクローン中の重複した配列が検出されると考えられる。3'オーバーハングは、配列の欠落をもたらし、平滑な切断部は、重複なくすべての元の配列が検出されると考えられる。この実験により、配列1に関する上記の方法からの知見も確認され、大半のクローンは5'が重複した切断に由来することが検出された。そのため見つかった平滑な切断部は、この方法を利用したアーチファクトであるとは考えられない。
実施例5:ミスマッチ感受性アッセイ
評価するヌクレアーゼのための適切なPAMモチーフの5'側に隣接した標的配列(配列番号73)を持つプラスミドを設計して取得した。ミスマッチが1つあって示されている位置が変化した配列を持つ配列も作製した(表4)。精製されたヌクレアーゼ(APG08290.1またはAPG05459.1)とガイドRNAのRNP複合体を形成し、設計したプラスミドからのPCR増幅した直線状DNAとともにインキュベートした。決められた時間インキュベートしてヌクレアーゼを不活化した後、サンプルをアガロースゲル電気泳動によって分析し、残っている直線状PCA産物の分画を明らかにした。各位置におけるミスマッチについて、切断された完全なバンドの割合を表5に示す。
RGN APG07433.1に関して同様のミスマッチ感受性実験を実施した。この実験は上に説明した実験と同様だが、代わりの塩基をDNA標的ではなくてRNAガイドに導入した点が異なっていた。ミスマッチがあったsgRNA合成のDNA配列を表6に示してある。ミスマッチ感受性アッセイの結果は表7に示してある。
RGN APG07433.1とRGN APG08290.1は、いくつかの例外はあるが、PAMの5'から1〜10番目の位置にあるミスマッチに対して有意な感受性を示す(表5と表7)。RGN APG05459.1もこの領域内のミスマッチに対して感受性であるが、PAM部位から離れたミスマッチによってdsDNAを切断する能力も大きく損なわれている(表5)。切断が起こるかどうかに顕著な影響を与える部位の総数は、スペーサ配列内の少なくとも15個の位置である。これは、他のゲノム編集ツール(化膿レンサ球菌からのよく研究されているCas9ヌクレアーゼは、10〜13塩基対に対して一般に感受性である)に匹敵する(Hsu他、Nat Biotechnol(2013年)第31巻(9):827〜832ページ)。それに加え、RGN APG05459.1を媒介とした切断がない極めて重要な部位は、PAM配列から非常に遠く、注目すべきことに13〜20 bpの範囲である。そこでは他の多くのヌクレアーゼはミスマッチに対する感受性感受性をほとんど示さず、あったとしてもわずかである。この特性は、目的の生物の他の部位と配列類似性が近い遺伝子座を標的とする際に極めて有用である可能性がある。
実施例6:哺乳動物の細胞における遺伝子編集活性の実証
RGN発現カセットを作製し、哺乳動物で発現させるためのベクターの中に導入した。各RGNは、ヒトにおける発現のためにコドンが最適化されており(配列番号127〜133)、5'末端の位置でSV40核局在配列(配列番号134)と3×FLAGタグ(配列番号135)に機能可能に連結され、3'末端の位置で核プラスミンNLS配列(配列番号136)に機能可能に連結されていた。それぞれの発現カセットは、サイトメガロウイルス(CMV)プロモータ(配列番号137)の制御下にあった。本分野では、CMV転写エンハンサ(配列番号138)もCMVプロモータを含むコンストラクトの中に導入できることが知られている。それぞれがヒトRNAポリメラーゼIII U6プロモータ(配列番号139)の制御下にある単一のgRNAをコードするガイドRNA発現コンストラクトを作製し、pTwist High Copy Ampベクターの中に導入した。各ガイドの標的配列の配列は表9に示されている。
上記のコンストラクトを哺乳動物の細胞の中に導入した。トランスフェクションの1日前、1×105個のHEK293T細胞/ウエル(Sigma社)を24ウエルの皿の中でダルベッコ改変イーグル培地(DMEM)+10%(vol/vol)ウシ胎仔血清(Gibco社)と1%ペニシリン-ストレプロマイシン(Gibco社)の中に播種した。翌日、細胞が50〜60%の集密度になったとき、ウエル1つにつき1.5μlのリポフェクタミン3000(Thermo Scientific社)を製造者の指示に従って用い、500 ngのRGN発現プラスミドと500 ngの単一gRNA発現プラスミドを同時にトランスフェクトした。48時間増殖させた後、全ゲノムDNAを、ゲノムDNA単離キット(Machery-Nagel社)を製造者の指示に従って用いて回収した。
次いで全ゲノムDNAを分析し、各ゲノム標的について各RGNの編集率を求めた。最初にPCR増幅に用いるためのオリゴヌクレオチドを生成させ、次いで増幅されたゲノム標的部位を分析した。使用したオリゴヌクレオチドの配列を表8.1〜表8.5に掲載してある。
すべてのPCR反応を、各プライマーを0.5μM含む20μlの反応物の中で、10μlの2×Master Mix Phusion High-Fidelity DNAポリメラーゼ(Thermo Scientific社)を用いて実施した。PCR#1プライマーを用いて各標的遺伝子を包含する大きなゲノム領域を最初に増幅した。そのとき利用したプログラムは、98℃、1分間;[98℃、10秒間;62℃、15秒間;72℃、5分間]を30サイクル;72℃、5分間;12℃、永遠にであった。次いで各ガイドに特異的なプライマー(PCR#2プライマー)を用いてこのPCR反応物1マイクロリットルをさらに増幅した。そのとき利用したプログラムは、98℃、1分間;[98℃、10秒間;67℃、15秒間;72℃、30秒間]を35サイクル;72℃、5分間;12℃、永遠にであった。PCR#2のためのプライマーは、Illumina シークエンシングのためのNextera Read 1 Transposase Adapterオーバーハング配列とNextera Read 2 Transposase Adapterオーバーハング配列を含んでいる。
精製されたゲノムDNAに対して上記のようにPCR#1とPCR2#を実施した。第2のPCR増幅の後、PCRクリーンアップキット(Zymo社)を製造者の指示に従って用いてDNAをクリーンにし、水の中で溶離させた。200〜500 mgの精製されたPCR2#産物を20μlの反応物の中で2μlの10×NEBバッファ2および水と組み合わせ、アニールしてヘテロ二本鎖DNAを形成した。そのとき利用したプログラムは、95℃、5分間;95から85℃へ2℃/秒の速度で冷却;85から25℃へ0.1℃/秒の速度で冷却;12℃、永遠にであった。アニーリングの後、5μlのDNAを無酵素対照として取り出し、1μlのT7エンドヌクレアーゼI(NEB社)を添加し、この反応物を37℃で1時間インキュベートした。インキュベーションの後、5×FlashGelローディング染料(Lonza社)を添加し、5μlの各反応物と対照を、ゲル電気泳動を利用して2.2%アガロースFlashGel(Lonza社)によって分析した。ゲルを可視化した後、非相同末端結合(NHEJ)の割合を、式:%NHEJイベント=100×[1−(1−切断された割合)1/2]を用いて求めた(ただし(切断された割合)は、(消化された産物の密度)/(消化された産物+消化されなかった親バンドの密度)と定義される)。
いくつかのサンプルについて、SURVEYOR(登録商標)を用いて哺乳動物の細胞における発現後の結果を分析した。トランスフェクション後の72時間にわたって細胞を37℃でインキュベートした後、ゲノムDNAを抽出した。ゲノムDNAは、QuickExtract DNA 抽出溶液(Epicentre社)を製造者のプロトコルに従って用いて抽出した。RGN標的部位に隣接するゲノム領域をPCR増幅し、産物を、QiaQuickスピンカラム(Qiagen社)を製造者のプロトコルに従って用いて精製した。精製された合計200〜500 ngのPCR産物を1μlの10×Taq DNAポリメラーゼPCRバッファ(Enzymatics社)および超純水と混合して最終体積を10μlにし、再アニーリングプロセスを適用することでヘテロ二本鎖の形成が可能になるようにした:95℃で10分間、-2℃/秒の勾配で95℃から85℃へ;-0.25℃/秒の勾配で85℃から25℃へ;25℃に1分間保持。
再アニーリングの後、産物を、SURVEYOR(登録商標)ヌクレアーゼとSURVEYOR(登録商標)エンハンサS(Integrated DNA Technologies社)を製造者が推奨するプロトコルに従って用いて処理し、4〜20%Novex TBEポリアクリルアミドゲル(Life Technologies社)上で分析した。ゲルをYBR Gold DNA染色(Life Technologies社)で10分間染色し、Gel Docゲルイメージングシステム(Bio-rad社)を用いて画像を取得した。定量は、相対的バンド強度に基づいて実施した。indel率は、式:100×(1−(1−(b+c)/(a+b+c))1/2)によって求めた(ただしaは消化されなかったPCR産物の積分強度であり、bとcは各切断産物の積分強度である)。
それに加え、Illuminaオーバーハング配列を含有するPCR#2からの産物を用い、Illumina 16S メタゲノムシークエンシングライブラリプロトコルに従ってライブラリを調製した。深いシークエンシングをサービス提供者(MOGene社)がIllumina Mi-Seqプラットフォーム上で実施した。典型的にはアンプリコン1つにつき250 bpペアードエンドリードを200,000個(2×100,000リード)生成させる。これらのリードは、CRISPResso(Pinello他、2016年 Nature Biotech、第34巻:695〜697ページ)を用いて分析し、編集率を計算した。出力のアラインメントをマニュアルキュレーションで実施し、挿入部位と欠失部位を確認するとともに、組み換え部位のマイクロ相同性部位を同定した。編集率を表9に示す。すべての実験をヒト細胞で実施した。「標的配列」は、遺伝子標的内で標的とされる配列である。それぞれの標的配列について、ガイドRNAは、相補的なRNA標的配列と、使用するRGNに依存する適切なsgRNAを含んでいた。実験の選択された内訳をガイドRNAごとに表10.1〜表10.9に示す。
各ガイドについて、特異的な挿入と欠失を表10.1〜表10.7に示す。これらの表では、標的配列は太字の大文字によって特定される。8量体PAM領域には二重下線が引かれており、認識される主要なヌクレオチドは太字にされている。挿入は小文字によって特定される。欠失は点線(---)で示されている。INDEL位置は、標的配列のPAM近位端から計算され、縁部は位置0である。位置は、縁部の標的側にある場合にはプラス(+)であり、縁部のPAM側にある場合にはマイナス(-)である。
実施例7:植物細胞における遺伝子編集活性の実証
本発明によるRGNのRNA誘導型ヌクレアーゼの活性を、Li他(2013年)Nat. Biotech. 第31巻:688〜691ページから改変したプロトコルを用いて植物細胞で実証する。簡単に述べると、N末端SV40核局在化シグナルを含有する各RGN(配列番号169〜182)の植物コドン最適化バージョンを一過性形質転換ベクターに入れて、強力な構成的35Sプロモータの後ろにクローニングする。植物PDS遺伝子の中にあって適切なPAM配列に隣接した1つ以上の部位を標的とするsgRNAを第2の一過性形質転換ベクターに入れて、植物U6プロモータの後ろにクローニングする。PEGを媒介とした形質転換を利用してこれら発現ベクターをニコティアナ・ベンサミアナの葉肉プロトプラストの中に導入する。形質転換されたプロトプラストを暗所で36時間までインキュベートする。DNeasy植物ミニキット(Qiagen社)を用いてゲノムDNAをプロトプラストから単離する。RGN標的部位に隣接するゲノム領域をPCRで増幅し、産物を、QiaQuickスピンカラム(Qiagen社)を製造者のプロトコルに従って用いて精製する。精製された合計200〜500 ngのPCR産物を1μlの10×Taq DNAポリメラーゼPCRバッファ(Enzymatics社)および超純水と混合して最終体積を10μlにし、再アニーリングプロセスを適用することでヘテロ二本鎖の形成が可能になるようにした:95℃で10分間、-2℃/秒の勾配で95℃から85℃へ;-0.25℃/秒の勾配で85℃から25℃へ;25℃に1分間保持。再アニーリングの後、産物を、SURVEYOR(登録商標)ヌクレアーゼとSURVEYOR(登録商標)エンハンサS(Integrated DNA Technologies社)を製造者の推奨されるプロトコルに従って用いて処理し、4〜20%Novex TBEポリアクリルアミドゲル(Life Technologies社)上で分析した。ゲルをYBR Gold DNA染色(Life Technologies社)で10分間染色し、Gel Docゲルイメージングシステム(Bio-rad社)を用いて画像を取得した。定量は、相対的バンド強度に基づいて実施した。indel率は、式:100×(1−(1−(b+c)/(a+b+c))1/2)によって求めた(ただしaは消化されなかったPCR産物の積分強度であり、bとcは各切断産物の積分強度である)。
あるいは標的となるゲノム配列に由来するPCR産物に対して実施例6に記載されているのと同様のPCRを実施することが可能であり、その結果としてPCR産物はIlluminaオーバーハング配列を含有し、ライブラリの調製と深いシークエンシングを実施することが可能になる。この方法により、表9に示されているように、編集率を求めることが可能になる。
実施例8:ガイドの交差適合性
RGNの間のガイドRNAの交差適合性を調べるため、2プラスミド干渉実験を実施した(Esvelt他(2013年)、Nat. Methods 第10巻(11):1116〜1121ページ)。第1のプラスミドは、カナマイシン耐性骨格上に規定されたPAMを含有するいくつかの標的を持つRGNを含有していた。これらプラスミドで大腸菌BL21を形質転換し、形質転換された菌株を化学的にコンピテントにした。次いで、アンピリシン耐性骨格上にガイドRNAを含有する第2のプラスミドを導入した。両方の抗生剤を含有する培地に細胞を播種した。RGNが第2のプラスミド上のガイドを利用できる場合には、カナマイシン耐性プラスミドは切断されて直線状になり、その結果としてコロニーはほとんど形成されないか、まったく形成されない。RGNが第2のプラスミド上のガイドを利用できない場合には、カナマイシン耐性プラスミドは切断されず、その結果としてコロニーが高レベルで形成される。化膿レンサ球菌 Cas9(SpyCas9)と黄色ブドウ球菌Cas9(SauCas9)のためのガイドRNAも含まれており、これらのガイドRNAを用いて交差適合性を調べた。
減少確率を計算するため、各ガイドでの形質転換に関するコロニーの数を、陽性対照を用いた形質転換効率と比較する。この比較に基づくと、RGNがガイドを使用できる場合にはどのコロニーも生存できないため、減少確率は0であるはずである。RGNがガイドを使用できない場合にはすべてのプラスミドが完全な状態で残るため、減少確率は1であるはずである。結果を下記の表11に示す。「sg」は、記載されているRGNのためのガイドRNAを示す。
表11からわかるように、直交するシステムのグループが4つ存在する。RGNは、自らのグループ内の他のシステムからのガイドを認識できるが、他のグループからのガイドを利用することはできない。第1のグループには、APG05083.1、APG07433.1、APG07513.1、APG08290.1が含まれる。第2のグループには、SpyCas9とAPG05459.1が含まれる。第3のグループには、APG04583.1 とAPG01688.1が含まれる。第4のグループにはSauCas9が含まれる。
実施例9:疾患標的の同定
臨床バリアントのデータベースをNCBI ClinVarデータベースから取得した。これは、world wide webのNCBI ClinVarのウェブサイトを通じて入手することができる。病原性一塩基多型(SNP)をこのリストから同定した。ゲノム遺伝子座情報を利用して、各SNPと重複する領域と各SNPの周囲の領域にあるCRISPR標的を同定した。原因変異を標的とする本発明のRGNと組み合わせた塩基編集を利用して修正することのできるSNPの選択は、表12に掲載されている。表12には、各疾患の1つの通称だけを掲載してある。「RS#」は、NCBIウェブサイトのSNPデータベースにおけるRSアクセッション番号に対応する。アレルIDは原因アレルのアクセッション番号に対応し、染色体アクセッション番号は、NCBIウェブサイトを通じて見ることのできるアクセッション参考情報も提供している。表12には、各疾患について、掲載されているRGNに合ったゲノム標的配列の情報も提示されている。標的配列の情報は、本発明の対応するRGNにとって必要なsgRNAを作製するためのプロトスペーサ配列も提供する。
実施例10:ハーラー症候群に責任がある変異を標的とする
以下に、ハーラー症候群(MPS-1とも呼ばれる)のための可能性のある治療法として、この疾患を持つ患者の大きな集団内でハーラー症候群に責任のある変異を修正するRNA誘導型塩基編集システムを用いた治療法を記述する。このアプローチは、広い範囲のタイプの組織に送達するためRNA誘導型で単一のAAVベクターにパッケージすることのできる塩基編集融合タンパク質を利用している。使用する正確な調節エレメントと塩基編集ドメインに応じ、疾患のある遺伝子座を標的とする塩基編集融合タンパク質と単一ガイドRNAの両方をコードする単一のベクターを作製することも可能であろう。
実施例10.1:理想的なPAMを持つRGNの同定
遺伝子疾患MPS-1はリソソーム蓄積症であり、分子レベルでリソソームの中に硫酸ダルマタンと硫酸へパランが蓄積することを特徴とする。この疾患は、一般に、α-L-イズロニダーゼをコードするIDUA遺伝子(NCBI参照配列NG_008103.1)の中の変異によって起こる遺伝性の遺伝子疾患である。この疾患は、α-L-イズロニダーゼが欠損していることの結果である。北欧系の個人の研究で見いだされた最も一般的なIDUA変異はW402XとQ70Xである。両方ともナンセンス変異であり、その結果として翻訳が途中で終了する(Bunge他(1994年)、Hum. Mol. Genet、第3巻(6):861〜866ページ;参照によって本明細書に組み込まれている)。1個のヌクレオチドを元に戻すと野生型コード配列が回復し、その結果として遺伝子座の内在性調節機構によりタンパク質発現が制御されると考えられる。
ヒトIdua遺伝子のW402X変異が、MPS-1Hのケースの大きな割合を占めている。塩基エディタは、ガイドRNAのプロトスペーサ成分の結合部位よりも狭い配列ウインドウを標的とすることができるため、標的遺伝子座から特定の距離にあるPAM配列の存在がこの戦略の成功にとって不可欠である。標的変異は、塩基編集タンパク質との相互作用中は露出した非標的鎖(NTS)上に存在していなければならないという制約と、RGNドメインのフットプリントは、PAM近くの領域へのアクセスを阻止するという制約があるため、アクセス可能な遺伝子座はPAMから10〜30 bpの位置であると考えられる。このウインドウ内にある近傍の別のアデノシン塩基の編集と突然変異誘発を回避するため、さまざまなリンカーをスクリーニングする。理想的なウインドウは、PAMから12〜16 bpである。
遺伝子座の位置と上記の理想的な塩基編集ウインドウの中でAPG07433.1とAPG08290.1に適合するPAM配列はただちにわかる。これらヌクレアーゼは、それぞれ、NNNNCC (配列番号6)とNNRNCC(配列番号32)というPAM配列を持ち、サイズがコンパクトであるため、単一のAAVベクターを通じて送達できる可能性がある。この送達アプローチは、他のやり方と比べて多くの利点を与える(広い範囲の組織(肝臓、筋肉、CNS)へのアクセス、よく確立された安全性プロファイルと製造技術など)。
化膿レンサ球菌からのCas9(SpyCas9)はNGG(配列番号448)というPAM配列を必要とし、このPAM配列はW402X遺伝子座の近くに存在しているが、SpyCas9のサイズが理由で、塩基編集ドメインの融合タンパク質をコードする遺伝子とSpyCas9ヌクレアーゼを単一のAAVベクターにパッケージすることはできないため、このアプローチの上記の利点が失われる。ガイドRNAをコードする配列をこのベクターに含めることは、遺伝子調節エレメントのサイズを小さくするための、またはAAVベクターのパッケージングの限界を大きくするための顕著な技術的改良がたとえ存在するとしても、実現可能性がさらに小さいと考えられる。二重送達戦略を利用できるが(例えばRyu他(2018年)、Nat. Biotechnol.、第36巻(6):536〜539ページ;参照によって本明細書に組み込まれている)、作製が極めて複雑で大きなコストがかかることになろう。それに加え、二重ウイルスベクター送達は、遺伝子修正の効率を顕著に低下させる。なぜなら所与の細胞内で成功する編集は、両方のベクターを感染させることと、細胞の中で融合タンパク質を組み立てることを必要とするからである。
一般に用いられている黄色ブドウ球菌からのCas9オルソログ(SauCas9)は、SpyCas9と比べてサイズがかなり小さいが、必要なPAMはより複雑である(NGRRT(配列番号449))。しかしこの配列は、原因遺伝子座の塩基編集に役立つと予想される範囲内にはない。
実施例10.2:RGN融合コンストラクトとsgRNA配列
1)DNA切断活性を不活化する変異(「デッド」または「ニッカーゼ」)があるRGNドメインと;2)塩基編集に役立つアデノシンデアミナーゼを有する融合タンパク質をコードするDNA配列を、標準的な分性生物学の技術を利用して作製する。下記の表に記載されているすべてのコンストラクトが、塩基編集活性ドメイン(この例では、RGN APG08290.1のN末端に機能可能に融合したADAT(配列番号450))を有する融合タンパク質を含んでいる。本分野では、RGNのC末端に塩基編集酵素を有する融合タンパク質も作製できることが知られている。それに加え、融合タンパク質のRGNと塩基エディタは、典型的には、リンカーアミノ配列によって隔てられている。本分野では、標準的なリンカーの長さは15〜30個の範囲のアミノ酸であることが知られている。さらに本分野では、いくつかの融合タンパク質は、RGNと塩基編集酵素(例えばシチジンデアミナーゼ)の間に、塩基編集効率を向上させることのできる少なくとも1つのウラシルグリコシラーゼ阻害剤(UGI)ドメインも含むことができることが知られている(アメリカ合衆国特許第10,167,457号;参照によって本明細書に組み込まれている)。したがって融合タンパク質は、APG08290.1と、塩基改変酵素と、少なくとも1つのUGIを含むことができる。
RGNがアクセスできる編集部位はPAM配列によって決まる。RGNを塩基編集ドメインと組み合わせるとき、編集の標的となる残基は、非標的鎖(NTS)の上に存在していなければならない。なぜならRGNが遺伝子座に会合している間は、NTSは一本鎖だからである。多数のヌクレアーゼと対応するガイドRNAを評価することで、この特定の遺伝子座のための最適な遺伝子編集ツールを選択することが可能になる。ヒトIdua遺伝子の中で上記のコンストラクトが標的にできる可能性のあるいくつかのPAM配列は、W402X変異に責任がある変異ヌクレオチドの近傍にある。1)疾患遺伝子座の位置で非コードDNA鎖と相補的な「スペーサ」と、2)ガイドRNAをRGNと会合させるのに必要なRNA配列を含有するガイドRNA転写産物をコードする配列も作製する。有用なガイドRNA配列(sgRNA)を下記の表14に示す。これらのガイドRNA配列が上記の塩基エディタを目的の遺伝子座に向かわせる効率を評価することができる。
実施例10.3:ハーラー疾患の患者に由来する細胞における活性を調べるアッセイ
遺伝子型戦略を確認し、上記のコンストラクトを評価するため、ハーラー疾患の患者に由来する線維芽細胞を使用する。実施例5に記載されているベクターと同様にして、融合タンパク質コード配列の上流の適切なプロモータと、これらをヒト細胞で発現させるためのsgRNAコード配列を含有するベクターを設計する。ヒト細胞の中で高レベルに発現することが知られているか、線維芽細胞の中で特異的によく発現することのできるプロモータとそれ以外のDNAエレメント(例えばエンハンサ、またはターミネータ)も用いることができる。標準的な技術(例えば実施例6に記載されているのと同様のトランスフェクション)を利用してベクターを線維芽細胞にトランスフェクトする。あるいは電気穿孔を利用することができる。細胞を1〜3日間培養する。標準的な技術を利用してゲノムDNA(gDNA)を単離する。編集効率は、精製されたgDNAに関するqPCR遺伝子型決定アッセイおよび/または次世代シークエンシングによって求める。これについては下にさらに詳しく記載する。
Taqman(商標)qPCR分析では、野生型アレルに対して特異的なプローブと、変異アレルに対して特異的なプローブを用いる。これらプローブは蛍光体を担持しており、これら蛍光体はqPCR装置を用いてスペクトル励起特性および/または放出特性によって分離される。PCR用のプライマーとプローブを含有する遺伝子型決定キットは、市販のものを入手する(すなわちThermo SNP ID rs121965019のためのFisher Taqman(商標)SNP遺伝子型決定アッセイID C__27862753_10)か、設計することができる。設計したプライマーとプローブのセットの一例を表15に示す。
編集実験の後、標準的な方法と上記のプライマーおよびプローブを用いてgDNAをqPCRで分析する。予想される結果を表16に示す。このインビトロ系は、コンストラクトを適切に評価して、さらに研究するため編集効率が大きいコンストラクトを選択するのに利用することができる。この系は、W402X変異を持つ細胞および持たない細胞と比較して評価され、好ましくはこの変異に関してヘテロ接合であるいくつかの細胞と比較して評価されることになる。Ct値は、染料(Sybrグリーンなど)を用い、参照遺伝子、またはその遺伝子座の全増幅と比較されることになる。
組織は次世代シークエンシングによって分析することもできる。下に示したようなプライマー結合部位(表17)、または当業者が同定可能な他の適切なプライマー結合部位を使用することができる。PCR増幅の後、Illumina 16Sメタゲノムシークエンシングライブラリのプロトコルに従い、Illumina Nextera XTオーバーハング配列を含有する産物からライブラリを調製する。深いシークエンシングをIllumina Mi-Seqプラットフォーム上で実施する。典型的には、アンプリコン1つ当たり200,000個の250 bpペアードエンドリード(2×100,000個のリード)を生成させる。CRISPResso(Pinello他、2016年)を利用してこれらのリードを分析し、編集率を計算する。出力アラインメントのマニュアルキュレーションを実施して挿入部位と欠失部位を確認するとともに、組み換え部位のマイクロ相同性部位を同定する。
トランスフェクトされた細胞と対照細胞の細胞ライセートのウエスタンブロッティングを抗IDUA抗体を用いて実施することによって完全長タンパク質の発現を確認し、基質である4-メチルウンベリフェリルa-L-イズロニドを用いた細胞ライセートに関する酵素活性アッセイによって酵素が触媒活性であることを確認する(Hopwood他、Clin.Chim. ACta(1979年)、第92巻(2):257〜265ページ;参照によって本明細書に組み込まれている)。これらの実験を実施し、元のIduaW402X/W402X細胞系(トランスフェクションなし)、塩基編集コンストラクトとランダムなガイド配列をトランスフェクトされたIduaW402X/W402X細胞系、野生型IDUAを発現する細胞系と比較する。
実施例10.4:マウスモデルにおける疾患治療の検証
この治療アプローチの効果を検証するため、類似アミノ酸にナンセンス変異を有するマウスモデルを使用する。このマウス系統は、Idua遺伝子(遺伝子ID:15932)の中に、ハーラー症候群の患者における変異と相同な変異に対応するW392X変異を有する(Bunge他(1994年)、Hum. Mol. Genet. 第3巻(6):861〜866ページ;参照によって本明細書に組み込まれている)。この遺伝子座は、ヒトにおけるのとは明確に異なるヌクレオチド配列を含んでいて、前の実施例に記載した塩基エディタを用いた修正に必要なPAM配列を欠いているため、異なる融合タンパク質を設計してヌクレオチドを修正する必要がある。この動物での疾患改善により、遺伝子送達ベクターがアクセスできる組織内にある変異を修正するこの治療アプローチの有効性を確認することができる。
この変異に関してホモ接合性であるマウスは、ハーラー症候群の患者と似た表現型の特徴を多数示す。上記の塩基編集RGN融合タンパク質(表13)とRNAガイド配列を、マウスでタンパク質の発現とRNAの転写を可能にする発現ベクターに組み込む。研究の設計を下記の表18に示す。この研究は、塩基編集融合タンパク質とRNAガイド配列を含む高用量の発現ベクターで治療した群と、塩基編集融合タンパク質またはRNAガイド配列を含まない発現ベクターで治療したモデルマウスである対照と、空にした同じベクターで治療した野生型マウスである第2の対照を含んでいる。
評価するエンドポイントに含まれるのは、体重、尿GAG排泄、血清IDUA酵素活性、目的の組織内のIDUA活性、組織の病態、SNPの修正を確認するための目的の組織の遺伝子型、挙動評価と神経学的評価である。いくつかのエンドポイントは消失であるため、研究が終了する前に追加の群を追加して例えば組織の病態と組織IDUA活性を評価することができる。エンドポイントの別の例は、ハーラー症候群動物モデルを確立した公開されている論文に見いだすことができる(Shull他(1994年)、Proc. Natl. Acad. Sci. U.S.A.、第91巻(26):12937〜12941ページ;Wang他(2010年)、Mol. Genet. Metab.、第99巻(1):62〜71ページ;Hartung他(2004年)、Mol. Ther.、第9巻(6):866〜875ページ;Liu他(2005年)、Mol. Ther.、第11巻(1):35〜47ページ;Clarketa他(1997年)、Hum. Mol. Genet. 第6巻(4):503〜511ページ;これらのすべてが参照によって本明細書に組み込まれている)。
可能な1つの送達ベクターは、アデノ随伴ウイルス(AAV)を利用している。ベクターを作製するときに含めるのは、塩基エディタ-dRGN融合タンパク質をコードする配列(例えば配列番号452)と、その前にあるCMVエンハンサ(配列番号138)とプロモータ(配列番号137)の組み合わせ、または他の適切なエンハンサとプロモータの組み合わせと、場合によってはコザック配列と、3'末端の位置で機能可能に連結されたターミネータ配列とポリアデニル化配列(例えばLevitt, N.;Briggs, D.;Gil, A.;Proudfoot, N. J.「効率的な合成ポリ(A)部位の定義」Genes Dev. 1989年、第3巻(7)、1019〜1025ページに記載されている最小配列)である。このベクターはさらに、5'末端の位置でヒトU6プロモータ(配列番号139)または小さな非コードRNAの作製に適した別のプロモータに機能可能に連結された単一ガイドRNAをコードする発現カセットを含むとともに、AAVカプシドにパッケージするために必要な本分野で周知の逆転末端反復(ITR)配列をさらに含んでいる。ベクターの作製とウイルスのパッケージングは、標準的な方法(例えばアメリカ合衆国特許第9,587,250号に記載されている方法;参照によって本明細書に組み込まれている)によって実施する。
別の可能なウイルスベクターには、さまざまなパッケージング能力と条件を持つアデノシンベクターとレンチウイルスベクター(一般に用いられていて、似たエレメントを含有すると考えられる)が含まれる。非ウイルス送達法も利用することができ、その例は、脂質ナノ粒子によってカプセル化されたmRNAとsgRNAである(Cullis, P. R.とAllen, T. M.(2013年)、Adv. Drug Deliv. Rev. 第65巻(1):36〜48ページ;Finn他(2018年)、Cell Rep. 第22巻(9):2227〜2235ページ;両方とも参照によって本明細書に組み込まれている)、またはプラスミドDNAのハイドロダイナミック注入(Suda TとLiu D、(2007年)Mol. Ther. 第15巻(12):2063〜2069ページ;参照によって本明細書に組み込まれている)、または金ナノ粒子と会合させたsgRNAのリボ核タンパク質複合体(Lee, K.;Conboy, M.;Park, H. M.;Jiang, F.;Kim, H. J.;Dewitt, M. A.;Mackley, V. A.;Chang, K.;Rao, A.;Skinner, C.;他、「Cas9リボ核タンパク質とドナーDNA の生体内ナノ粒子送達が相同組み換えDNA修復を誘導する」Nat. Biomed. Eng. 2017年、第1巻(11)、889〜890ページ)である。
実施例10.5:ヒト化遺伝子座を有するマウスモデルにおける疾患の修正
ヒトの治療に使用できると考えられるのと同じ塩基エディタコンストラクトの効果を評価するには、W392の近傍のヌクレオチドを変化させてヒトのW402の周辺の配列に一致させたマウスモデルが必要とされる。これは、多彩な技術によって実現することができ、その中には、RGNとHDR鋳型を使用してマウスの胚の中にある遺伝子座を切断して置き換えることが含まれる。
アミノ酸保存の程度が大きいため、表19に示されているように、マウス遺伝子座の中の大半のヌクレオチドを、サイレント変異を有するヒト配列のヌクレオチドに変えることができる。得られた操作されたマウスゲノムでコード配列が変化する塩基変化だけが、導入された終止コドンの後に生じる。
このマウス系統の操作が終わると、同様の実験を実施例10.4に記載されているようにして実施する。
実施例11:フリードライヒ運動失調症に責任がある変異を標的とする
フリードライヒ運動失調症(FRDA)を引き起こす3ヌクレオチド反復配列の増殖は、FXN遺伝子内の所定の遺伝子座(FRDA不安定性領域と呼ばれる)に起こる。RNA誘導型ヌクレアーゼ(RGN)を用いてFRDA患者の細胞内の不安定性領域を切除することができる。このアプローチは、1)ヒトゲノム内のアレルを標的とするようにプログラムすることのできるRGN・ガイドRNA配列と;2)このRGN・ガイドRNA配列を送達する方法を必要とする。ゲノム編集に使用される多くのヌクレアーゼ(一般に用いられている化膿レンサ球菌からのCas9ヌクレアーゼ(SpCas9)など)は、アデノ随伴ウイルス(AAV)ベクターの中にパッケージするには大きすぎる。特にSpCas9遺伝子とガイドRNAの長さに加え、機能的な発現カセットに必要とされる他の遺伝エレメントの長さを考慮すると、そのことがわかる。そのためSpCas9を用いるアプローチの可能性は小さい。
本発明のコンパクトなRNA誘導型ヌクレアーゼ(特にAPG07433.1とAPG08290.1)は、FRDA不安定性領域の切除に極めてよく適している。それぞれのRGNは、FRDA不安定性領域の近傍にPAMを必要とする。それに加え、これらRGNのそれぞれは、ガイドRNAとともにAAVベクターの中にパッケージすることができる。2つのガイドRNAをパッケージするには第2のベクターが必要となる可能性が大きいが、それでもこのアプローチは、より大きなヌクレアーゼ(例えばSpCas9であり、タンパク質配列を2つのベクターに分割せねばならない可能性がある)で必要とされると考えられるベクターよりも有利である。
表20は、APG07433.1またはAPG08290.1をFRDA不安定性領域の5'フランクと3'フランクに向かわせるのに適したゲノム標的配列の位置を示している。RGNは、この遺伝子座の位置に来ると、FA不安定性領域を切除すると考えられる。この領域の切除は、この遺伝子座のIlluminaシークエンシングによって確認することができる。
実施例12:鎌形赤血球疾患に責任がある変異を標的とする
BCL11エンハンサ領域内の標的配列(配列番号472)は胎児ヘモグロビン(HbF)を増加させる機構を提供することができるため、鎌形赤血球疾患の症状が治癒または緩和する。例えばゲノムワイドの関連研究により、HbFのレベル上昇と関係するBCL11Aで一群の遺伝子バリエーションが同定されている。これらのバリエーションは、段階特異的で系列限定エンハンサ領域として機能するBCL11A の非コード領域内に見いだされるSNPの集合である。さらなる探索から、赤血球細胞でBCL11Aを発現させるのにこのBCL11Aエンハンサが必要とされることが明らかになった(Bauer他(2013年)Science 第343巻:253〜257ページ;参照によって本明細書に組み込まれている)。このエンハンサ領域はBCL11A遺伝子のイントロン2の中に見いだされ、イントロン2の中では、(調節能力と関係するクロマチンの状態を示していることがしばしばある)3つのDNアーゼI高感受性領域が同定された。これら3つの領域は、BCL11Aの転写開始位置からの距離(単位はキロ塩基)に従って「+62」、「+58」、「+55」として同定された。これらエンハンサ領域は、長さが大まかにヌクレオチド350個(+55);550個(+58);350個(+62)である(Bauer他、2013年)。
実施例12.1:好ましいRGNシステムを同定する
ここでは、BCL11AがHBB遺伝子座(成人のヘモグロビンの中でβ-グロビンを作るのに責任がある遺伝子)内の結合部位に結合するのを阻止するRGNシステムを用いたβ-ヘモグロビン症の治療の可能性を記述する。このアプローチは、哺乳動物の細胞においてより効率的なNHEJを利用する。それに加え、このアプローチは、生体内送達のため単一のAAVベクターの中にパッケージできる十分に小さなサイズのヌクレアーゼを利用する。
ヒトBCL11エンハンサ領域内のGATA1エンハンサモチーフ(配列番号472)は、RNA誘導型ヌクレアーゼ(RGN)を用いて破壊するのに理想的な標的であり、その破壊によって成人のヒト赤血球の中でBCL11Aの発現が低下すると同時にHbFが再発現する(Wu他(2019年)Nat Med 第387巻:2554ページ)。このGATA1部位の周囲の遺伝子座においてAPG07433.1およびAPG08290.1と適合性のあるいくつかのPAM配列は容易にわかる。これらヌクレアーゼは5’-NNNNCC-3’(配列番号6)というPAM配列を持ち、サイズがコンパクトであるため、適切なガイドRNAとともに単一のAAVベクターまたはアデノウイルスベクターの中に入れて送達できる可能性がある。この送達アプローチは、他のアプローチと比べて多数の利点(例えば造血幹細胞へのアクセス、よく確立された安全性プロファイルと製造技術)を与える。
化膿レンサ球菌からの一般に用いられているCas9ヌクレアーゼ(SpyCas9)は、5’-NGG-3’(配列番号448)というPAM配列を必要とし、そのいくつかはGATA1モチーフの近くに存在する。しかしSpyCas9のサイズが原因で単一のAAVベクターまたはアデノウイルスベクターにパッケージすることはできないため、このアプローチの上記の利点が消える。二重送達戦略を採用できるが、作製が極めて複雑で大きなコストがかかると考えられる。それに加え、二重ウイルスベクター送達は、遺伝子修正の効率を顕著に低下させる。なぜなら所与の細胞内で編集が成功するには両方のベクターを感染させる必要があるからである。
実施例6に記載されているのと同様にして、ヒトコドンが最適化されたAPG07433.1(配列番号128)またはAPG08290.1(配列番号130)をコードする発現カセットを作製する。RGN APG07433.1とAPG08290.1のためのガイドRNAを発現する発現カセットも作製する。これらのガイドRNAは、1)BCL11Aエンハンサ遺伝子座(標的配列)内の非コードDNA鎖またはコードDNA鎖と相補的なプロトスペーサ配列と、2)ガイドRNAをRGN(APG07433.1のための配列番号18と、APG08290.1のための配列番号35)と会合させるのに必要なRNA配列を含んでいる。APG07433.1またはAPG08290.1が標的とする可能性があるいくつかのPAM配列がBCL11A GATA1エンハンサモチーフを取り囲んでいるため、可能性のあるいくつかのガイドRNAコンストラクトを作製し、BCL11A GATA1エンハンサ配列のロバストな切断とNHEJを媒介とした中断を生じさせる最良のプロトスペーサ配列を決定する。RGNをこの遺伝子座に向かわせるため、下記の表(表21)の中の標的ゲノム配列を評価する。
APG07433.1またはAPG08290.1がBCL11Aエンハンサ領域を中断する挿入または欠失を生じさせる効率を評価するため、ヒト細胞系(ヒト胚性腎細胞(HEK細胞)など)を使用する。RGN発現カセット(例えば実施例6に記載されているもの)を含むDNAベクターを作製する。表21のガイドRNA配列をコードする配列を含む発現カセットを含む別のベクターも作製する。このような発現カセットはさらに、実施例6に記載されているようなヒトRNAポリメラーゼIII U6プロモータ(配列番号139)を含むことができる。あるいはRGNの発現カセットとガイドRNAの発現カセットの両方を含む単一のベクターを使用することができる。標準的な技術(例えば実施例6に記載されている技術)を利用してベクターをHEK細胞に導入し、細胞を1〜3日間にわたって培養する。この培養期間の後、ゲノムDNAを単離し、実施例6に記載されているように、T7エンドヌクレアーゼIによる消化および/または直接的なシークエンシングを利用して挿入または欠失の頻度を求める。
標的BCL11Aを包含するDNA領域を、Illumina Nextera XTオーバーハング配列を含有するプライマーを用いてPCRによって増幅する。これらのPCRアンプリコンでT7エンドヌクレアーゼIによる消化を利用してNHEJの形成を調べるか、Illumina 16Sメタゲノムシークエンシングライブラリのプロトコルに従うライブラリの調製、または同様の次世代シークエンシング(NGS)ライブラリの調製を実施する。深いシークエンシングの後、生成したリードをCRISPRessoによって分析し、編集率を計算する。出力アラインメントのマニュアルキュレーションを実施して挿入部位と欠失部位を確認する。この分析により、好ましいRGNと、対応する好ましいガイドRNA(sgRNA)が同定される。この分析により、APG07433.1とAPG08290.1の両方が同様に好ましい結果になる可能性がある。それに加え、この分析により、2つ以上の好ましいガイドRNAが存在すると判断される可能性、または表21のすべての標的ゲノム配列が同様に好ましいと判断される可能性がある。
実施例12.2:胎児ヘモグロビンの発現を調べるアッセイ
この実施例では、APG07433.1またはAPG08290.1によってBCL11Aエンハンサ領域を中断する挿入または欠失が生成した場合の胎児ヘモグロビンの発現を調べる。健康なヒトのドナーCD34+造血幹細胞(HSC)を使用する。実施例11.1に記載されているのと同様の方法を利用してこれらHSCを培養し、好ましいRGNをコードする領域を含む発現カセットと好ましいsgRNAをコードする領域を含む発現カセットを含むベクターを導入する。電気穿孔の後、確立されたプロトコル(例えばGiarratana他(2004年)Nat Biotechnology 第23巻:69〜74ページ;参照によって本明細書に組み込まれている)を利用してこれらの細胞をインビトロで赤血球に分化させる。次いでHbFの発現を、抗ヒトHbF抗体を用いたウエスタンブロッティングを利用して測定するか、高性能液体クロマトグラフィ(HPLC)を通じて定量する。BCL11Aエンハンサ遺伝子座の中断が成功すると、ガイドなしでRGNだけを電気穿孔したHSCと比べてHbFの産生が増加することが予想される。
実施例12.3:鎌形赤血球形成の減少を調べるアッセイ
この実施例では、APG07433.1またはAPG08290.1によってBCL11Aエンハンサ領域を中断する挿入または欠失が生成した場合の鎌形赤血球形成の減少を調べる。鎌形赤血球症を患っている患者からのドナーCD34+造血幹細胞(HSC)を用いる。実施例11.1に記載されているのと同様の方法を利用してこれらHSCを培養し、好ましいRGNをコードする領域を含む発現カセットと好ましいsgRNAをコードする領域を含む発現カセットを含むベクターを導入する。電気穿孔の後、確立されたプロトコル(例えばGiarratana他(2004年)Nat Biotechnology 第23巻:69〜74ページ)を利用してこれらの細胞をインビトロで赤血球に分化させる。次いでHbFの発現を、抗ヒトHbF抗体を用いたウエスタンブロッティングを利用して測定するか、高性能液体クロマトグラフィ(HPLC)を通じて定量する。BCL11Aエンハンサ遺伝子座の中断に成功すると、ガイドなしでRGNだけを電気穿孔したHSCと比べてHbFの産生が増加することが予想される。
分化したこれら赤血球にメタ重亜硫酸塩を添加することによって鎌形赤血球の形成が誘導される。顕微鏡を用いて鎌形赤血球と正常な赤血球の数をカウントする。鎌形赤血球の数は、APG07433.1またはAPG08290.1とsgRNAで処理した細胞では、処理しない細胞、またはRGNだけで処理した細胞と比べて少ないことが予想される。
実施例12.4:マウスモデルにおける疾患治療の検証
APG07433.1またはAPG08290.1を用いたBCL11A遺伝子座の中断の効果を評価するため、鎌形赤血球貧血の適切なヒト化マウスモデルを用いる。好ましいRGNをコードする発現カセットと好ましいsgRNAをコードする発現カセットをAAVベクターまたはアデノウイルスベクターの中にパッケージする。特にアデノウイルス型Ad5/35が、HSCを標的とするのに有効である。鎌形赤血球アレルを持つヒト化HBB遺伝子座を含有する適切なマウスモデル(例えばB6;FVB-Tg(LCR-HBA2,LCR-HBB*E26K)53Hhb/JまたはB6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ)を選択する。これらのマウスは、顆粒球コロニー刺激因子だけで治療するか、プレリキサホルとの組み合わせで治療し、HBCを循環の中に移動させる。次に、RGNとガイドプラスミドを担持するAAVまたはアデノウイルスを静脈内注射し、マウスを一週間回復させる。これらのマウスから得られた血液を、メタ重亜硫酸塩を用いるインビトロ鎌形赤血球アッセイで調べ、マウスを長期にわたって追跡して死亡率と造血機能をモニタする。RGNとガイドRNAを担持するAAVまたはアデノウイルスを用いた治療は、両方の発現カセットが欠けたウイルス、またはRGN発現カセットだけを担持するウイルスで治療したマウスと比べて鎌形赤血球を減少させ、死亡率を低下させ、造血機能を改善する。