【発明の詳細な説明】
配列決定を行なわないでサンプル中のDNA配列を同定、分類または定量する 方法及び装置
この出願は同日出願の米国特許出願第08/547,214号(1995年10月24日付け)の
continuation-in-partであり、その内容の全部をここに引用する。
本発明はNational Institute of Standards and Technologyによる承認番号第
70NANB5H1036号として、米国政府の補助のもとに行なわれた。米国政府は本発明
に関する権利の一部を所有する。
1.発明の分野
本発明の分野はDNA配列の定量、同定または判定、および分類である。より
特定すると、配列決定を何ら実施しない、好ましくはサンプル中全DNA配列ま
たは遺伝子の定量的分類、発現の比較、または同定である。
2.背景
過去10年間に、生物学およびゲノム研究によって生命の分子を基礎とする我々
の知見が革命的に変化してきたことにともなって、遺伝子の時間的および空間的
発現が全生命の経過、すなわち健康および疾病における経過を決定付けることが
ますます明らかとなってきた。科学は、たった一つの遺伝子の欠失がどのように
してサラセミアなどの伝統的に遺伝性として認識されてきた障害の原因となるか
の理解から、がんなどの大多数のより複雑な疾患の発症因子における、環境因子
による多重的な遺伝子の欠失の相互作用の重要性の認識へと進歩した。がんの場
合、現状の科学的証拠はいくつかの軸となる遺伝子の変更された発現および多重
的欠失がキィとなる原因としての役割をもつことを証明している。その他の複雑
な疾病も同様の発症因子を有する。こうして、遺伝子発現と健康または疾病状態
の間に確立される相関関係がもっと完全で信頼性のあるものになれば、よりうま
く疾病が認識され、診断され、治療される。
この重要な相関関係は組織サンプル中のDNA発現の定量測定および分類によ
って確立されるので、このための迅速で経済的な方法は意義が大きい。ゲノムD
NA(“gDNA”)配列は細胞のゲノムを構成する天然に生起するDNA配列
である。どんな場合でも、遺伝子、またはgDNAの状態、発現は総細胞メッセ
ンジャーRNA(“mRNA”)の組成によって決定され、これはgDNAの調
節的転写によって合成される。相補的DNA(“cDNA”)配列はmRNAか
ら逆転写によって合成される。総細胞mRNAからのcDNAは、おおよそでは
あるが、一定の時間の細胞中のgDNAの発現をも決定する。結局、全DNA配
列、特にcDNAまたはgDNAの迅速で経済的な検出が望まれる。特にこれら
の検出が迅速で正確で定量的であれば望ましい。
従来は、遺伝子の特定のDNA分析技術はDNAサンプル中の総細胞mRNA
を表示する実質的な全DNAの決定または分類を目的とはしないで、ある程度ま
での配列決定を要求していた。一般的に、cDNA、またgDNAが存在する場
合、分析技術は一回について1つまたは2つの既知のまたは未知の遺伝子配列を
決定および分析することを目的としてきた。これらの技術ではハイブリダイゼー
ションによってただ1つの特定のDNA配列または遺伝子を特異的に認識するた
めに合成したプローブが使用されてきた。(例えば、Watsonら、1992,Recombina nt DNA
,chap 7,W.H.Freeman,New York参照。)さらに、サンプル中の全配列を
認識するという問題へのこれらの方法の適用は煩雑で非経済的となる。
未知の遺伝子を発見して配列決定するための現行の1方法は、アレイ化(array
ed)cDNAライブラリーから出発する。特定の組織または試料からmRNAを
単離し、適当なベクター中にクローン化し、次に1つのcDNA配列のクローン
を産生した各ベクターの子孫を分離して同定することができるような方法でこれ
をプレートに入れる。その後、このような1プレートの複製物を、多くの場合目
的の遺伝子を表示するcDNAとハイブリダイズするように選択された標識DN
Aオリゴマーで、プローブする。これによって、目的のcDNAを産生するコロ
ニーを発見して単離し、cDNAを回収して配列決定する。その後、この単離し
た挿入物にSangerのジデオキシ鎖終結法(Sangerら、1977,“DNA sequcnsing w
ith chain terminating inhibitors”,Proc.Natl.Acad.Sci.USA 74(12):5463-5
467)を適用することによって、配列決定を実施する。
コロニー選択のために使用する未知の遺伝子のためのDNAオリゴマープロー
ブは、好ましくは目的の遺伝子に対するcDNAとのみハイブリダイズするよう
に合成する。この特異性を達成するための1方法として、目的の遺伝子のタンパ
ク質産物から出発するものがある。このタンパク質の活性領域から5-10量体のペ
ペチド断片の部分的配列を決定することができれば、このペプチドをコードする
、対応する15-20量体の縮重オリゴヌクレオチド類を合成することができる。こ
の縮重オリゴヌクレオチドの集合体は典型的には、対応する遺伝子のみを同定す
るのに十分である。同様に、単一の遺伝子プローブを作製するために、15-30の
長さのヌクレオチドサブ配列を導くどんな情報でも使用することができる。
組織サンプルから調製されたcDNAまたはgDNA中の既知の配列を探索す
るための別の現行の方法においても、すでにわかっている遺伝子配列の独特のサ
ブ配列に相補的な単一遺伝子または単一配列プローブが使用される。例えば、発
現されたがん遺伝子の配列標識の1サブ配列に由来するプローブを使用して組織
由来のcDNAをプローブすることによって、サンプル中の特定のがん遺伝子の
発現を決定することができる。同様に、TBバチルスまたはHIVなどの、希少なま
たは培養するのが困難な病原体の存在について、この病原体の1遺伝子に特異的
なハイブリダイゼーションプローブでgDNAをプローブすることによって、こ
れらを決定することができる。外見上正常な個体における変異対立遺伝子のヘテ
ロ接合の存在、または胎児におけるそのホモ接合の存在について、その変異対立
遺伝子のみに相補的な対立遺伝子特異的プローブを使用してプローブすることに
よって、これを決定することができる(例えば、Guoら、1994,Nucleic Acid Rc
search,22:5456-65参照)。
与えられた組織サンプル中に発現された全遺伝子を決定するのに適用する場合
、前述の例が典型的なものである。単一遺伝子プローブを使用する現行の方法は
すべて、数千から数万の別々のプローブを必要とする。一つのヒト細胞は典型的
には同時におよそ15,000から15,000の遺伝子を発現し、最も複雑な組織、例えば
脳はヒトゲノムの半分までを発現することができると推定される(Liangら、1992
,“Differential Display of Eukaryotic Messenger RNA by Meansof the Polym
erase Chain Reaction,Science,257:967-971)。このように多数のプローブを
必要とするこれらの適用は明らかにあまりにも煩雑であって、経済的ではなく、
実用的でもない。
ハイブリダイゼーションによる配列決定(“SBH”)として知られる、別の
クラスの現行の方法は、これとは対照的に、遺伝子に特異的ではないプローブの
組合せを使用する(Drmanacら、1993,Science 260:1649-52; U.S.Patent No.5
,202,231,Apr 13,1993,to Drmanac et al.)。未知の遺伝子を決定するための
SBHの代表的な実行例では、一定の長さ、例えばすべて6量体からなるDNA
の全オリゴマーで一つの単一cDNAクローンをプローブする必要がある。この
ような選択の余地なく合成された一定の長さの全オリゴマーの1セットを組合せ
プローブライブラリーと称する。1つの組合せライブラリーに関する全部のハイ
ブリダイゼーションの結果、例えば4096の6量体ブローブ全部の結果の知見から
、アルゴリズム操作によって、cDNAに関する部分的DNA配列を再構築する
ことができる。少なくとも、反復されるサブ配列は完全に決定することができな
いので、完全配列を決定することはできない。既知の遺伝子の分類に適用される
SBHをオリゴマー配列シグナチャー(signature)(“OSS”)と呼ぶ(Lenno
nら、1991,Trends In Genetics 7(10):314-317)。この手法によって、全組合せ
ライブラリー、または特徴的なサブライブラリーに対するプローブのヒットのパ
ターンを基礎として、単一クローンが分類される。これには組織サンプルライブ
ラリーがクローン内に配列され、それぞれのクローンがライブラリーからのただ
1つの純粋な配列を含むことが必要である。これを混合物に応用することはでき
ない。
これらの代表的な現行の方法はすべてそれぞれが1組織サンプルからの1配列
を発現するクローンの1アレイ中の1配列を発見することを目的としている。こ
れらは、特定の総細胞cDNAまたはgDNAサンプルなどの配列の混合物中の
全DNA配列の迅速、経済的、定量的で正確な特性決定を目的としてはいない。
このような課題へのこれらの適用はできない。配列決定による1クローンのDN
A、まして数千の配列を持つサンプル全部の決定は、経済的で有用な診断のため
には迅速でも安価でもない。現行のプローブを基礎とする遺伝子決定または分類
の手法は、遺伝子が既知か未知かにかかわらず、観測されるべき可能なそれぞれ
の遺伝子に特異的な、数千のプローブ、あるいは組合せライブラリー中の少なく
とも数千またはさらに数万のプローブが必要とされる。さらに、これらの方法は
すべて、それぞれがサンプルの単一遺伝子を発現するクローン中にサンプルがア
レイ化される必要がある。
これまで記載した代表的な現行の遺伝子決定および分類技術とは対照的に、デ
ィフェレンシャルディスプレイ(differential display)として知られたまた別の
現行の技術は、プールしたcDNAライブラリーに見られるものなどの発現され
た遺伝子の混合物を識別鑑定(fingerprint)することを目的とする。しかし、こ
の識別鑑定は単に2つのサンプルが同一か異なるかを確定することを求めるもの
である。特定の決定された遺伝子の発現を定量的に、または定性的にすら決定す
る試みは行なわれていない(Liangら、1995,Current Opinions in Immunology 7
:274-280; Liangら、1992,Science 257:967-71; Welshら、1992,Nucleic Acid R
es.20:4965-70;McClellandら、1993,Exs 67:103-15;Lisitsyn,1993,Science 2 59
:946-50)。ディフェレンシャルディスプレイはポリメラーゼ連鎖反応(“P
CR”)を使用して各種の長さのDNAサブ配列を増幅させ、これらを任意に選
択したプライマーのハイブリダイゼーション部位の間に置くことによって確定す
る。理想的には、観察される長さのパターンはライブラリーが調製された原組織
に特徴的である。典型的には、ディフェレンシャルディスプレイで使用される1
プライマーはオリゴ(dT)であり、もう1つはライブラリー中の1cDNAのポ
リ-da尾部の200-300塩基対内とハイブリダイズするようにした設計1以上の任意
のオリゴヌクレオチドである。これによって、電気泳動分離から、200-300塩基
対までの長さの増幅された断片はサンプルに特徴的で識別しうるバンドを生成す
るはずである。組織の遺伝子発現の変化は1以上のバンドの変化として観察する
ことができる。
特徴的なバンド形成のパターンは展開されるが、これらのパターンを特定の遺
伝子の発現とリンクする試みは行なわれていない。第2の任意のプライマーでは
特定の遺伝子に到達することができない。第1に、PCR工程は理想的には特異
的でない。典型的に使用される低緊縮性のアニーリングステップによって1から
2,3塩基対(“bp”)のミスマッチ(“bubbles”)が許容され、またTaqポリメ
ラーゼによって新しい鎖を開始するだけの十分な寛容性がある。第2に、1つの
単一のサブ配列の位置またはその非存在では全発現遺伝子を識別するための情報
としては不十分である。第3に、任意のプライマーからポリ-dA尾部への長さ
の情報は、遺伝子の3'非翻訳領域のプロセシングの多様性、ポリアデニル化プロ
セスの多様性、および正確な位置での反復配列へのプライミングの可変性によっ
て、一般的にある配列に対して特徴的なものとは認められない。こうして、バン
ドが形成されても、多くの場合、非特異的なバックグラウンド配列の存在によっ
て、不鮮明なものとなる。既知のPCRの高G+C含有量および短い配列となる
偏りもまた、この方法の特異性をさらに限定する。こうして、この技術は一般的
に同一性または非同一性判定に関する“識別鑑定”サンプルに限定され、同定し
得る遺伝子の異なる発現の定量的決定における使用からは排除される。
遺伝子またはDNA配列の分類または決定のための現行の方法は、組織サンプ
ルから調製されたcDNA混合物の成分の迅速で経済的であるとともに定量的で
特異的な判定を実施する能力を改善する必要がある。上述した背景の総括は、い
くつかの代表的な現行方法の欠陥を明らかにするものである。
3.発明の要約
本発明の1目的は、DNA配列、特に単一配列クローンのアレイまたは組織サ
ンプルから誘導することができるものなどの配列の混合物のいずれかのゲノムま
たは相補的DNA配列を、実際にそのDNAの配列決定をしないで、迅速、経済
的、定量的および正確な判定または分類をする方法を提供することである。これ
によって、ここで明らかにした背景技術の欠陥が解決される。この目的は、分析
するサンプル中のDNA配列からの特色があり検出可能な複数のシグナルを生成
させることによって実現される。好ましくは、サンプル中のそれぞれの特定のD
NA配列をそれが生成する特定のシグナルによって個別に分類し、サンプル中に
存在しうるDNA配列のデータベースを参照して、個別に決定するために、シグ
ナルの全部をまとめて十分な識別性および決定性を有するものである。特定のD
NA配列の指標となるシグナルの強度はそのDNAの存在量に定量的に依存する
。あるいは、シグナルの組合せによって、DNA配列の主要な画分をわずかにお
よそ2から4の別個の配列の複数セットの中に分類することができる。
さらに別の目的は、できる限り少ない数の認識反応、好ましくはわずかに約5-
400反応、最も好ましくはわずかに約20-50反応の結果の測定から多数のシグナル
を生成させることである。複雑な混合物を含有するサンプル中の各DNA配列
が独特のプローブでの別々の反応を要求するものでは、迅速で経済的な判定は達
成されない。好ましくは、各認識反応が識別し得るシグナルの多数のまたは特徴
的なパターンを生成し、これが存在する特定のDNA配列の量に定量的に比例す
るものである。さらに、シグナルが好ましくは最少の観測で検出および測定され
、これらが好ましくは同時に実施することができるものである。
シグナルは好ましくは光学的なもので、蛍光色素標識によって生成され、自動
化光学的検出技術によって検出されるものである。これらの方法を使用して、多
数の個々の標識部分分子を、これらが同一のフィルタースポットまたはゲルバン
ドにあっても、識別することができる。これによって、多重性の反応および同時
に発生するシグナルの検出が可能になる。あるいは、本発明は別の標識システム
、例えば銀染色ゲルに容易に適応させることができる。特に、光学的でも、また
は走査もしくはトンネル顕微鏡などのその他の技術でも、単一の分子を検出する
任意のシステムは定量的特性を著しく改善するので、本発明の使用のために非常
に有利となる。
本発明にしたがって、分析するサンプルの核酸配列内の短いDNAサブ配列(
以後“標的”サブ配列と称する)の存在(以後“ヒット”と称する)または非存
在を検出することによって、シグナルが生成される。サブ配列の存在または非存
在はそのサブ配列についての認識手段、またはプローブの使用によって検出する
。サブ配列はいくつかの種類の認識手段によって認識される。これらとして、限
定するわけではないが、制限エンドヌクレアーゼ(“RE”)類、DNAオリゴマ
ー類およびPNAオリゴマー類が含まれる。REはサブ配列を切断することによ
って、これらに特異的なサブ配列を認識する;DNAおよびPNAオリゴマーは
ハイブリダイゼーション方法によってこれらに特異的なサブ配列を認識する。好
ましい態様はサンプル配列中のヒット対の存在を検出するばかりでなく、隣接す
るヒットの間の塩基対の長さの表示も含む。この長さの表示は、長さに関する分
離および検出手段の実験上の偏りおよび誤差を除去することで、塩基対の真の物
理的長さに補正することができる。ある変更態様では、それぞれが単一配列を1
つ含有するクローンのアレイ(“単一配列クローン”)中のヒットのパターンの
みが検出される。
その後、サンプル中の個々の遺伝子およびそれらの定量的な存在を同定するた
め、本発明の実験分析方法に適合した、コンピュータの配列データベース中に保
存されたDNA配列情報を使用して、生成されたシグナルを分析する。
標的サブ配列は、分析すべきDNA配列を分類または決定するために、それら
の存在または非存在、および存在するときはそれらの相対距離が最大量の情報を
もたらすような、さらにコンピュータを含めた本発明の実験計画法によって、選
択される。これによって、分析すべきDNA配列よりも少ない次数および数のプ
ローブを使用することが可能であり、またさらに、本発明で使用するプローブと
同一の長さの組合せライブラリー中に存在すると考えられるよりもかなり少ない
プローブを使用することが可能である。各実施態様について、標的サブ配列は配
列中に好ましい存在確率、典型的には5%から50%を有する。全実施態様におい
て、分析すべき1DNA配列中の1プローブの存在は他のどのプローブの存在と
も無関係である。
好ましくは、標的サブ配列はサンプルの特徴を決定するDNA配列のデータベ
ースに適合する情報に基づいて選択される。組織サンプル中の全遺伝子を決定す
るための最少数の標的サブ配列を選択することができる(“組織モード”)。あ
るいは、例えばがん遺伝子、腫瘍サブレッサー遺伝子、成長因子、細胞周期遺伝
子、細胞骨格遺伝子、その他の、1つまたは2,3の目的とする遺伝子配列のみ
を定量的に分類または決定するためには、もっと少数の標的サブ配列を選択して
もよい(“クエリー(query)モード”)。
定量発現分析(“QEATM”)と命名した。本発明の好ましい1実施態様は、
cDNA(またはgDNA)混合物との認識反応の結果を測定することによって
、標的サブ配列の存在および隣接する標的サブ配列間の遺伝子に一致する塩基対
の長さの表示を含むシグナルを生成するものである。非常に重要なのは、この方
法では、ライブラリー中の個々のクローンを作製するためにベクター中にcDN
Aを挿入する必要がないことである。これらのライブラリーの作製は、ベクター
中のcDNAを細菌中に形質転換し、その細菌をクローンのコロニーとしてアレ
イ化し、最後に個々の形質転換されたコロニーを増殖させる必要があるので、時
間がかかり、経費もかかり、また工程中に偏りも生じる。
QEATMを実施するための3つの代表的な実験方法をここに記載する:新規な
RE/リガーゼ/増幅操作を利用する好ましい方法;PCRを基礎とする方法;
および不要なDNA断片の除去のための除去手段、好ましくはビオチンを利用す
る方法、である。好ましい方法は混合物またはライブラリー中のDNAから個々
の遺伝子の発現を決定するための正確で再現性があり、ノイズのないサインを生
成し、唯一自動化に応用しうる。なぜならば、これは仲介体の抽出または緩衝液
の交換の必要がないからである。コンピュータを利用した遺伝子検索ステップは
、サンプル中にどの遺伝子が存在するか、および発現の相対的レベルを決定する
ため、DNA配列のデータベースと連動させて測定したヒットおよび長さの情報
を使用する。サンプル中の配列の相対的量を決定するため、シグナルの強度を使
用する。コンピュータを利用する計画法は標的サブ配列の選択を最適化する。
コロニー検索(“CC”)と命名された、本発明の第2の特定の実施態様は、
ライブラリー(cDNAライブラリーが好ましい)中のアレイ化した個々の単一
配列クローンについての全標的サブ配列に対し、標的配列の存在情報だけを集め
るものである。標的サブ配列を、本発明のコンピュータを利用する計画法にした
がって、最大量の情報をもたらし、最少の数となるように、慎重に選択する。組
織中の発現されたcDNA特性決定をするのに、好ましくは10-20サブ配列で十
分である。典型的には短いDNAサブ配列とのハイブリダイゼーションの特異性
および信頼性を増強するために、好ましい方法はPNAである。共通で短い、共
有された標的配列を有する比較的長いDNAオリゴマーの縮重セットもまた、認
識手段として使用される。コンピュータを利用する遺伝子検索ステップは、サン
プル中にどの遺伝子が存在するか、および発現の相対的レベルを決定するため、
DNA配列のデータベースと連動させたヒットのパターンを使用する。
本発明の実施態様は好ましくは正確で再現性があり、ノイズのない測定を生成
させる。QEMTMにおける測定ノイズは典型的には不要なDNA断片の生成また
は増幅によって形成されるので、好ましくはこれらの不要な断片を回避するよう
な特別のステップを採用する。コロニーの検索中の測定ノイズは典型的にはコロ
ニーに対するプローブの不適切なハイブリダイゼーション、または認識手段によ
って形成される。高緊縮性反応条件および増強されたハイブリダイゼーション特
異性を有するDNA疑似体を使用して、このノイズを最少にする。DNA疑似体
はDNAと特異的なWatson-Crick様ハイブリダイゼーションをすることができる
サブユニットで構成されるポリマーである。コロニー検索におけるノイズを最少
にするために、改良されたハイブリダイゼーション検出法もまた有用である。蛍
光色素でのプローブの標識を基礎とする従来の検出方法に代わる新規な方法は、
プローブのハイブリダイゼーション時に凝集する100-200μmの小さな粒子の光散
乱を基礎としている(Stimsonら、1995,“Real-time detection of DNA hybridiz
ation and melting on oligonuclcotide arrays by usingoptical wave guides
”,Proc.Natl.Acad.Sci.USA 92:6379-6383)。この方法において、ハイブリダイ
ゼーションの表面は光パイプまたは光導波管の一つの表面に形成され、これらの
凝集した粒子によって誘導された散乱に起因して光パイプから光が漏れる。この
方法で、ハイブリダイゼーションが暗いバックグラウンド上の漏れた光の明るい
スポットとして表される。この後者の方法では、ハイブリダイゼーションと検出
ステップの間の洗浄ステップが必要でなくなるため、ハイブリダイゼーションの
検出がより迅速になる。さらに光散乱特性が異なる各種のサイズおよび形状の粒
子を使用することによって、1つのコロニーから多数のプローブのハイブリダイ
ゼーションを検出することができる。
さらに、本発明のこの実施態様は、抽出または緩衝液の交換などの自動化でき
ないステップがないので、自動化に応用することができる。本発明のこの実施態
様は、1反応で多数の認識手段を試験することが可能であり、また認識手段を識
別するための多数の標識を利用することによって、シグナルを同時に検出および
測定するための、有効な分析を促進する。好ましくは、QEATMの実施態様につ
いては、この標識を多数の蛍光色素によるものとする。CCの実施態様について
は、検出は好ましくは、各種のサイズおよび形状の粒子での光散乱法によって実
施する。分析しうる蛍光標識の強度およびその数の増加は、蛍光、エネルギー転
移、染料標識プライマーの使用によって達成される。同定する遺伝子が以後の配
列決定または実験用プローブとしての使用のためにゲルから物理的に単離される
場合に好ましいその他の検出方法として、銀染色ゲルおよび放射性標識が含まれ
る。これらの方法は単一レーンで多数のサンプルを実施することができないので
、多量の実施が必要な場合はあまり好ましくない。
本発明は組織またはその他のサンプル中の定量的な遺伝子発現の迅速で経済的
な決定を達成するものなので、重要な医療および研究上の有用性がある。医学に
おいては、ますます多くの疾病がその発症原因および発症について重要な遺伝子
成分を有することが認識されているので、組織サンプルの遺伝子の構造および発
現をアッセイすることができることはますます有用になっている。例えば、ある
種の遺伝子またはその特定の対立遺伝子の存在および発現が(障害を含む)疾病
の前徴または危険因子になっている。こうした疾病のいくつかの例は、ハンチン
トン病および血管拡張性失調症などの神経退行変性疾患に見られる。神経芽細胞
腫などのいくつかのがんは現在特定の遺伝子の欠失に関連付けることができる。
最後に、遺伝子配列は、in vitroでは培養が困難または不可能で、それでもそれ
ら自体の独特の遺伝子を発現する外来の病原体の存在を決定し、分類することも
できる。
疾病の進行は罹患した組織の遺伝子発現の変化を反映する。例えば、特定のが
んプロモーター遺伝子の発現および特定のがんサプレッサー遺伝子の発現の欠失
が正常な組織から増殖症、がん自体および転移がんへのある種の腫瘍の進行に関
係することが現在知られている。アンチセンス技術などを使用するなどによる、
細胞集団の遺伝子発現の正常パターンへの回復は腫瘍の退行に関係させることが
できる。したがって、がん性組織における遺伝子発現の知見をこの疾病の病期の
判断および分類の補助とすることができる。
発現の情報は、また治療を選択し、手引きをするために使用することもできる
。遺伝子発現の情報を使用した正確な疾病の分類および病期または病状判断は、
特定の患者の明確な病状に対してますます明確に組み立てられるようになってい
る初期治療を選択する補助とすることができる。遺伝子発現情報はその後の疾病
の進行または退行を追跡し、こうした情報から初期治療の成功をモニターするか
または方法を変更するための補助となり得る。個体における遺伝子発現の異常な
パターンを正常な方に退行させる結果を招く治療が好ましいが、一方遺伝子発現
またはその進行にほとんど効果がない治療は改変する必要がある。こうしたモニ
タリングは現在がんについて有用で、糖尿病および肥満など、その他のますます
多くの疾病についても有用になると考えられる。最後に、直接遺伝子治療の場合
、発現分析は直接に処置の成功をモニターする。
生物学的研究において、組織またはその他のサンプルの遺伝子発現のための迅
速で経済的なアッセイには多数の適用がある。こうした適用として、限定するわ
けではないが、例えば病理学における、疾病に対する組織特異的遺伝子応答の試
験、発生学における、遺伝子発現の発生上の変化の決定、薬理学における、遺伝
子発現に対する薬剤の直接または間接的影響、が含まれる。これらの適用におい
て、本発明は、例えば、in vitro細胞集団または細胞系、疾病またはその他の経
過のin vivo動物モデル、ヒトサンプル、実際の野性型の産生物から誘導された
と考えられる精製細胞集団、および混合細胞集団を含有する組織サンプルに適用
することができる。細胞または組織源は植物、単細胞動物、多細胞動物、細菌、
ウイルス、真菌、または酵母その他が有利である。動物は、ある種のゲノムまた
は疾病の状態もしくは傾向を持つように加工または飼育されたマウスなどの、研
究に使用する実験用動物が有利である。in vitro細胞集団または細胞系を各種の
外因性因子に暴露して、こうした因子の遺伝子発現に及ぼす影響を決定すること
ができる。さらに、未知のシグナルパターンはやはり未知の遺伝子の指標となる
ので、本発明は新規の遺伝子の発見のための重要な用途がある。医学研究におい
て、さらに別の例を示すと、本発明の方法の使用によって、遺伝子の発現と疾病
の存在および進行を関連させることができ、これによって、新しい診断方法およ
び直接遺伝子の変更をめざす新しい治療手段が提供される。
本発明は、種々の実施態様および態様を含むが、そのいくつかを以下に記載す
る。
最初の実施態様において、本発明はヌクレオチド配列が異なる複数の核酸を含
有するサンプル中の1以上の核酸を同定、分類または定量する方法であって、こ
の方法は、そのサンプルを1以上の認識手段によってプローブする、ただし、各
認識手段は異なる標的ヌクレオチドサブ配列または異なるセットの標的ヌクレオ
チドサブ配列を認識する;該認識手段によりプローブされた該サンプルから1以
上のシグナルを生成させる、ただし、各生成シグナルは該サンプル中の核酸から
生成し、かつ(i)該核酸中の標的サブ配列の存在間の長さ、および(ii)該核
酸中の標的サブ配列の同一性または該セットの標的サブ配列(この中に該核酸中
の標的サブ配列が含まれる)の同一性の表示を含む;および生成した1以上の配
列とマッチする配列またはあらゆるマッチ配列の非存在を決定するためにヌクレ
オチド配列を検索する、ただし、該データベースは該サンプル中に存在しうる核
酸の既知ヌクレオチド配列を多数含み、該データベースからの配列が、(i)生
成したシグナルにより表されるものと同じ標的サブ配列の存在間の長さと、(ii)
生成したシグナルにより表されるものと同じ標的サブ配列、または生成したシグ
ナルにより表される標的サブ配列の同じセットのメンバーである標的サブ配列と
、の両方をもつとき、該データベースからの該配列は生成したシグナルとマッチ
し、それにより、該サンプル中の1以上の核酸を同定、分類または定量する、こ
とを含むものである。
本発明はさらに、第一の実施態様において、各認識手段が1つの標的サブ配列
を認識し、該データベースからの配列が生成したシグナルにより表されるものと
同じ標的サブ配列の存在間の長さを有すると共に生成したシグナルにより表され
るものと同じ標的サブ配列を有する場合、該データベースからの配列は生成した
シグナルとマッチする、という追加の方法、また場合により、各認識手段が1セ
ットの標的サブ配列を認識し、該データベースからの配列が生成したシグナルに
より表されるものと同じ標的サブ配列の存在間の長さを有し、該標的サブ配列が
生成したシグナルにより表される標的サブ配列セットのメンバーである、追加の
方法を提供する。
本発明はさらに、第一の実施態様において、核酸サンプルを複数の部分に分割
し、複数の該部分に対して別個に請求項1に記載の工程を行うことをさらに含ん
でなり、各部分につき異なる1以上の認識手段を用いる、追加の方法を提供する
。
本発明はさらに、第一の実施態様において、サンプル中の特定のヌクレオチド
配列を含む核酸の存在量が、該ヌクレオチド配列とマッチすることが決定された
1以上のシグナルの量的レベルより決定される、追加の方法を提供する。
本発明はさらに、第一の実施態様において、複数の核酸がDNAであり、場合
により該DNAがcDNAであり、場合によりcDNAが植物、単細胞動物、多
細胞動物、細菌、ウイルス、真菌または酵母から調製され、場合によりcDNA
が全細胞RNAまたは全細胞ポリ(A)RNAからのものである、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、前記データベースが前記植物、単
細胞動物、多細胞動物、細菌、ウイルス、真菌または酵母の実質的に全部の既知
発現配列を含む、追加の方法を提供する。
本発明はさらに、第一の実施態様において、認識手段が1以上の制限エンドヌ
クレアーゼであり、その認識部位が標的サブ配列であり、前記プローブする工程
が、サンプルを1以上の制限エンドヌクレアーゼで消化して断片となし、該断片
に二本鎖アダプターDNA分子を連結して連結断片を得ることを含んでなり、た
だし、各アダプターDNA分子が(i)5'末端リン酸基をもたずかつ第1および第
2部分からなる、より短い鎖(第1部分は該短い鎖の5'末端にあって該制限エン
ドヌクレアーゼの1つにより生成された突出部に相補的である)と、(ii)該短い
鎖の第2部分に相補的な3'末端サブ配列を有する、より長い鎖を含み、そして前
記生成工程が、連結断片から該短い鎖を融解し、該連結断片をDNAポリメラー
ゼと接触させ、該DNAポリメラーゼを用いた合成により該連結断片を伸長して
平滑末端化二本鎖DNA断片をつくり、そして該平滑末端化断片を該DNAポリ
メラーゼおよびプライマーオリゴデオキシヌクレオチド(該プライマーオリゴデ
オキシヌクレオチドはより長いアダプター鎖を含む)と接触させることを含む方
法により該平滑末端化断片を増幅することをさらに含み、前記接触を、該プライ
マーオリゴデオキシヌクレオチドに相補的な該平滑末端化断片の鎖からの該プラ
イマーオリゴデオキシヌクレオチドの融解温度より低く、該平滑末端化断片から
のアダプター核酸の該短い鎖の融解温度より高い温度で行う、追加の方法を提供
する。
本発明はさらに、第一の実施態様において、認識手段が1以上の制限エンドヌ
クレアーゼであり、その認識部位が標的サブ配列であり、そしてプローブする工
程がサンプルを1以上の制限エンドヌクレアーゼで消化することをさらに含む、
追加の方法を提供する。
本発明はさらに、第一の実施態様において、1以上のシグナルを生成するサン
プル中の核酸断片を同定し、その後該断片を回収し、場合により、回収した断片
により生成したシグナルがヌクレオチド配列データベース中の配列とマッチせず
、場合により、1以上の制限エンドヌクレアーゼによる消化後に該断片を生成し
うる核酸に結合するハイブリダイゼーションプローブとして該断片の少なくとも
ハイブリダイズ可能部分を用いることをさらに含む、追加の方法を提供する。
本発明はさらに、第一の実施態様において、生成工程が、該消化後に、消化さ
れなかった核酸と該断片の単一末端のみでの消化から生じる核酸断片を両方とも
サンプルから除去することをさらに含み、場合により、消化前にサンプル中の核
酸を一端でビオチン分子またはハプテン分子にそれぞれ結合させ、サンプル中の
核酸を固相支持体に付着させたストレプトアビジンもしくはアビジンと、または
抗ハプテン抗体と、それぞれ接触させることを含む方法により該除去を行う、追
加の方法を提供する。
本発明はさらに、第一の実施態様において、1以上の制限エンドヌクレアーゼ
による消化が両消化末端に一本鎖ヌクレオチド突出部を残す、追加の方法を提供
する。
本発明はさらに、第一の実施態様において、前記プローブする工程が、二本鎖
アダプター核酸(各アダプター核酸は1以上の制限エンドヌクレアーゼの特定の
ものにより生成した該突出部に相補的な末端を有する)を消化サンプル断片とハ
イブリダイズさせ、該アダプター核酸の鎖を消化サンプル断片の鎖の5'末端にリ
ガーゼを用いて連結させて連結核酸断片を形成させることをさらに含む、追加の
方法を提供する。
本発明はさらに、第一の実施態様において、1以上の制限エンドヌクレアーゼ
による消化および連結を同一の反応媒体中で行い、場合により、前記の消化およ
び連結が該反応媒体を第1温度で次に第2温度でインキュベートすることを含み
、その際1以上の制限エンドヌクレアーゼは第2温度よりも第1温度で活性が高
く、該リガーゼは第1温度よりも第2温度で活性が高く、また、第1温度でのイ
ンキュベーションおよび第2温度でのインキュベーションを繰り返し行う、追加
の方法を提供する。
本発明はさらに、第一の実施態様において、前記プローブする工程が、該消化
前に、アルカリホスファターゼと共にインキュベートすることで該サンプル中の
DNAから末端リン酸基を除去することをさらに含み、そして場合により、該ア
ルカリホスファターゼが熱に不安定で、該消化前に熱失活される、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、生成工程が連結核酸断片を増幅す
ることを含み、場合により、前記の増幅が核酸ポリメラーゼとプライマー核酸鎖
を用いて行われ、該プライマー核酸鎖は該ポリメラーゼによる核酸合成を開始さ
せることができ、そして場合により、プライマー核酸鎖が40〜60%のG+C含量
を有する、追加の方法を提供する。
本発明はさらに、第一の実施態様において、各アダプター核酸がより短い鎖と
より長い鎖を有し、より長い鎖は消化サンプル断片に連結され、前記生成工程が
、増幅工程の前に、連結断片からより短い鎖を融解し、該連結断片をDNAポリ
メ
ラーゼと接触させ、DNAポリメラーゼを用いた合成により該連結断片を伸長し
て平滑末端化二本鎖DNA断片を作製することを含み、プライマー核酸鎖がより
長い鎖の配列のハイブリダイズ可能な部分を含み、場合により、プライマー核酸
鎖がより長い鎖の配列を含み、異なる各プライマー核酸鎖が特定の制限エンドヌ
クレアーゼによる消化後に生成される平滑末端化二本鎖DNA断片の増幅のみを
開始させる、追加の方法を提供する。
本発明はさらに、第一の実施態様において、各プライマー核酸鎖が特定の制限
エンドヌクレアーゼに特異的で、さらに、より長い鎖の3'末端にその配列と隣接
して、該制限エンドヌクレアーゼによる消化後に核酸断片末端に残存する制限エ
ンドヌクレアーゼ認識部位の部分を含み、また場合により、特定の制限エンドヌ
クレアーゼに特異的な各プライマーがその3'末端に、制限エンドヌクレアーゼ認
識部位の残存部分の3'側でそれに隣接して1以上のヌクレオチドをさらに含み、
それにより、増幅された連結核酸断片が1以上の該追加的ヌクレオチドに隣接し
て制限エンドヌクレアーゼ認識部位の該残存部分を含むものであり、そして、そ
の結果特定の1以上の該追加的ヌクレオチドを含む該プライマーが異なる1以上
の該追加的ヌクレオチドを含むプライマーから識別可能に検出され得る、追加の
方法を提供する。
本発明はさらに、第一の実施態様において、増幅工程中に、プライマー核酸鎖
が、該プライマー核酸鎖に相補的な鎖からの該プライマー核酸鎖の融解温度より
低いが、平滑末端化断片からのより短いアダプター鎖の融解温度より高い温度で
、連結核酸断片にアニールされる、追加の方法を提供する。
本発明はさらに、第一の実施態様において、認識手段が標的サブ配列と特異的
にハイブリダイズできるヌクレオチド、ヌクレオチド擬似体、またはヌクレオチ
ドとヌクレオチド擬似体の組合せのオリゴマーである、追加の方法を提供し、場
合により、生成工程が核酸ポリメラーゼおよび該オリゴマーを含むプライマーを
用いて増幅することを含み、それにより、ハイブリダイズしたオリゴマー間のサ
ンプル中の核酸断片が増幅される、追加の方法を提供する。
本発明はさらに、第一の実施態様において、前記のシグナルが、追加の標的サ
ブ配列が標的サブ配列の該存在間のサンプル中の該核酸上に存在するか否かの表
示をさらに含み、場合により、追加の標的サブ配列が、サンプル中の核酸と、該
追加の標的サブ配列とハイブリダイズできるヌクレオチド、ヌクレオチド擬似体
、またはヌクレオチドとヌクレオチド擬似体の組合せのオリゴマーと、を接触さ
せることを含む方法により認識される、追加の方法を提供する。
本発明はさらに、第一の実施態様において、生成工程が、追加の標的サブ配列
が標的サブ配列の該存在間のサンプル中の該核酸上に存在する場合、該シグナル
を抑制することを含み、場合により、生成工程がサンプル中の核酸を増幅するこ
とを含み、追加の標的サブ配列が、サンプル中の核酸と、(a)該追加の標的サブ
配列とハイブリダイズしかつ増幅工程を破壊するヌクレオチド、ヌクレオチド擬
似体、またはヌクレオチドとヌクレオチド擬似体の組合せのオリゴマー、または
(b)認識部位として該追加の標的サブ配列を有しかつ該認識部位でサンプル中の
核酸を消化する制限エンドヌクレアーゼと、を接触させることを含む方法により
認識される、追加の方法を提供する。
本発明はさらに、第一の実施態様において、生成工程が長さにより核酸断片を
分離することをさらに含み、場合により、生成工程が分離した核酸断片を検出す
ることをさらに含み、場合により、前記の検出が、該断片を銀で染色するか、該
断片をDNA挿入色素で標識するか、または該断片上の蛍光色素からの発光を検
出することを含む方法により行われる、追加の方法を提供する。
本発明はさらに、第一の実施態様において、標的サブ配列の存在間の長さの表
示が前記分離および検出工程により決定された断片の長さである、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、前記分離が液体クロマトグラフィ
ー、質量分析計または電気泳動を用いて行われ、場合により、電気泳動が変性ま
たは非変性媒体を用いるスラブゲルまたは毛細管形状で行われる、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、前記データベース中の所定の1以
上のヌクレオチド配列が対象となる配列であり、標的サブ配列は、対象の配列が
該データベース中の他のヌクレオチド配列により生成されないシグナルを少なく
とも1つ生成するようなものであり、場合により、対象となるヌクレオチド配列
が該データベース中の大多数の配列である、追加の方法を提供する。
本発明はさらに、第一の実施態様において、該データベースのヌクレオチド配
列中に標的サブ配列が存在する確率が約0.01〜約0.30である、追加の方法を提供
する。
本発明はさらに、第一の実施態様において、標的サブ配列が、該データベース
中のヌクレオチド配列が該データベース中の他のどのヌクレオチド配列によって
も生成されないシグナルを平均して生成するのに平均して十分な数の標的サブ配
列の存在を含むようなものであり、場合により、該データベース中の多数のヌク
レオチド配列中に平均して存在する標的サブ配列のペア数が3以上であり、該デ
ータベース中のヌクレオチド配列から生成されるシグナルの平均数は、生成した
シグナルにより表される長さ間の平均差が1塩基対以上となるようなものである
、追加の方法を提供する。
本発明はさらに、第一の実施態様において、標的サブ配列が、おおむね次の式
:
および
〔式中、N=該データベース中の異なるヌクレオチド配列の数;L=該データベ
ース中の異なるヌクレオチド配列の平均長さ;R=認識手段の数;A=該データ
ベース中の異なるヌクレオチド配列中に平均して存在する標的サブ配列のペア数
;およびB=サンプル中の核酸から生成されたシグナルにより表される長さ間の
平均差〕を解明することで与えられる、存在確率pを有し、そして場合により、
Aが3以上で、Bが1以上である、追加の方法を提供する。
本発明はさらに、第一の実施態様において、標的サブ配列が、ヌクレオチド配
列データベース中の配列に適用されたプローブ工程と生成工程をシミュレートす
ることにより、生成され得るシグナルのパターンおよび各シグナルを生成し得る
配列を決定する工程、ある情報尺度に従って該決定されたパターンの値を確認す
る工程、および該情報尺度を最適化する新しいパターンを生成するために標的サ
ブ配列を選択する工程、を含む更なる工程に従って選択され、場合により、前記
選択工程が1以上の制限エンドヌクレアーゼの認識部位を含む標的サブ配列を選
択し、場合により、前記選択工程が1以上の追加的ヌクレオチドに隣接して1以
上の制限エンドヌクレアーゼの認識部位を含む標的サブ配列を選択する、追加の
方法を提供する。
本発明はさらに、第一の実施態様において、ヌクレオチド配列データベース中
に存在する所定の1以上のヌクレオチド配列が対象となる配列であり、最適化さ
れる情報尺度が該データベース中に存在する他のどのヌクレオチド配列によって
も生成されないシグナルを少なくとも1つ生成する対象配列の数であり、場合に
より、対象となるヌクレオチド配列が該データベース中に存在する大多数のヌク
レオチド配列である、追加の方法を提供する。
本発明はさらに、第一の実施態様において、前記選択工程が約10未満の長さの
標的サブ配列のあらゆる組合せの徹底的な検索により行われるか、または標的サ
ブ配列の選択工程がシミュレートされたアニーリングを含む方法により行われる
、追加の方法を提供する。
本発明はさらに、第一の実施態様において、前記検索工程が、ヌクレオチド配
列データベース中の各配列に適用されたプローブ工程と生成工程をシミュレート
することにより、生成され得るシグナルのパターンおよび各シグナルを生成し得
る配列を決定する工程、および該パターン中で、(i)生成したシグナルにより表
されるものと同じ標的サブ配列の存在間の長さ、および(ii)生成したシグナルに
より表されるものと同じ標的サブ配列、または生成したシグナルにより表される
同じ標的サブ配列セットのメンバーである標的サブ配列、の表示を含むシグナル
を見つけることにより1以上の該生成したシグナルを生成し得る該データベース
中の1以上のヌクレオチド配列を見つけ出す工程、をさらに含む、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、前記決定工程が、ヌクレオチド配
列データベースのヌクレオチド配列中の標的サブ配列または標的サブ配列セット
の存在を検索する工程、該データベースのヌクレオチド配列中の該標的サブ配列
または標的サブ配列セットの存在間の長さを見つける工程、および標的サブ配列
が存在することが見いだされた該データベースの配列から生成され得るシグナル
のパターンを形成する工程、をさらに含む、追加の方法を提供する。
本発明はさらに、第一の実施態様において、制限エンドヌクレアーゼが消化断
片の末端に5'突出部を生成し、各二本鎖アダプター核酸が、第1および第2連続
部分からなるより短い核酸鎖(該第1部分は制限エンドヌクレアーゼの1つによ
り生成された突出部に相補的な5'末端サブ配列である)および該より短い核酸鎖
の該第2部分に相補的な3'末端サブ配列を有するより長い核酸鎖を含むものであ
る、追加の方法を提供する。
本発明はさらに、第一の実施態様において、より短い核酸鎖が約68℃より低い
相補鎖からの融解温度を有し、かつ末端リン酸基をもたず、場合により、より短
い核酸鎖が約12ヌクレオチドの長さである、追加の方法を提供する。
本発明はさらに、第一の実施態様において、より長い核酸鎖が約68℃より高い
相補鎖からの融解温度を有し、該データベース中のどの配列にも相補的でなく、
かつ末端リン酸基をもたず、場合により、連結した核酸断片が制限エンドヌクレ
アーゼのいずれの認識部位も含まず、場合により、より長い核酸鎖が約24ヌクレ
オチドの長さであり、かつ40〜60%のG+C含量を有する、追加の方法を提供す
る。
本発明はさらに、第一の実施態様において、1以上の制限エンドヌクレアーゼ
が連結前に熱失活される、追加の方法を提供する。
本発明はさらに、第一の実施態様において、制限エンドヌクレアーゼが消化断
片の末端に3'突出部を生成し、各二本鎖アダプター核酸が、第1および第2連続
部分からなるより長い核酸鎖(該第1部分は制限エンドヌクレアーゼの1つによ
り生成された突出部に相補的な3'末端サブ配列である)およびより長い核酸鎖の
該第2部分の3'末端に相補的なより短い核酸鎖を含むものである、追加の方法を
提供する。
本発明はさらに、第一の実施態様において、より短い核酸鎖が約68℃より低い
より長い鎖からの融解温度を有し、かつ末端リン酸基をもたず、場合により、よ
り短い核酸鎖が12塩基対の長さである、追加の方法を提供する。
本発明はさらに、第一の実施態様において、より長い核酸鎖が約68℃より高い
相補鎖からの融解温度を有し、該データベース中のどのヌクレオチド配列に対し
ても相補的でなく、かつ末端リン酸基をもたず、そして連結した核酸断片が制限
エンドヌクレアーゼのいずれの認識部位も含まず、場合により、より長い核酸鎖
が24塩基対の長さであり、かつ40〜60%のG+C含量を有する、追加の方法を提
供する。
第二の実施態様において、本発明は、核酸を同定または分類する方法であって
、核酸を複数の認識手段によりプローブする工程、ただし、各認識手段は1セッ
トのシグナルを生成するために標的ヌクレオチドサブ配列または1セットの標的
ヌクレオチドサブ配列を認識し、そして各シグナルは該標的サブ配列または該標
的サブ配列セットのうちの1つが該核酸中に存在するか否かを表示する;および
サンプル中に存在しうる核酸の既知ヌクレオチド配列を多数含有するヌクレオチ
ド配列データベースを、生成したセットのシグナルとマッチする配列について検
索する工程、ただし、該データベースからの配列が、(i)生成したセットのシグ
ナルにより存在すると表示されるものと同じ標的サブ配列を含むか、または存在
すると表示される標的サブ配列セットのメンバーである標的サブ配列を含み、か
つ(ii)生成したセットのシグナルにより存在しないと表示される標的サブ配列、
または存在しないと表示される標的サブ配列セットのメンバーである標的サブ配
列を含まない場合、該データベースからの配列は該セットのシグナルとマッチし
ており、それにより、該核酸を同定または分類する;各工程を含んでなり、場合
により、前記セットのシグナルが二進数であるハッシュコードにより表示される
、上記方法を提供する。
本発明はさらに、第二の実施態様において、前記プローブする工程が該核酸中
の標的サブ配列の存在数または該標的サブ配列セットのメンバー数の量的シグナ
ルをもたらし、場合により、前記データベースからの配列が、量的シグナルにお
けるものと同じ存在数で同じ標的サブ配列を該配列中に含み、かつ存在しないと
表示される標的サブ配列または存在しないと表示される該標的サブ配列セット内
の標的サブ配列を含まない場合、該配列は生成したセットのシグナルとマッチし
ている、追加の方法を提供する。
本発明はさらに、第二の実施態様において、多数の核酸がDNAである、追加
の方法を提供する。
本発明はさらに、第二の実施態様において、認識手段がヌクレオチド、ヌクレ
オチド擬似体、またはヌクレオチドとヌクレオチド擬似体の組合せの検出可能に
標識されたオリゴマーであり、前記プローブする工程が該核酸を該オリゴマーと
ハイブリダイズさせることを含み、場合により、検出可能に標識されたオリゴマ
ーが、該オリゴマー上の蛍光色素標識からの発光を検出することを含む方法、ま
たは該標識オリゴマーを配列して光を光パイプから散乱させ、その散乱を検出す
ることを含む方法により検出され、場合により、認識手段がペプチド−核酸のオ
リゴマーであり、場合により、認識手段がDNAオリゴマー、普遍的ヌクレオチ
ドを含むDNAオリゴマー、または一部縮重したDNAオリゴマーのセットであ
る、追加の方法を提供する。
本発明はさらに、第二の実施態様において、検索工程が、ヌクレオチド配列デ
ータベース中の各配列に適用されたプローブ工程をシミュレートすることにより
、該標的サブ配列または該標的サブ配列セットの存在または非存在のシグナルの
セットのパターン、および該パターンで各セットのシグナルを生成し得る配列を
決定する工程;および生成したセットとマッチするセットを該パターン中で見つ
けることにより、生成したセットのシグナルを生成し得る1以上のヌクレオチド
配列を見つけ出す工程、ただし、該パターンからのシグナルのセットが、(i)生
成したセットのシグナルにより存在すると表示されるものと同じ標的サブ配列ま
たは存在すると表示される標的サブ配列セットのメンバーである標的サブ配列を
存在すると表示し、かつ(ii)生成したセットのシグナルにより存在しないと表示
される標的サブ配列または存在しないと表示される標的サブ配列セットのメンバ
ーである標的サブ配列を存在しないと表示する場合、該パターンからの1セット
のシグナルは生成したセットのシグナルとマッチしている;をさらに含む、追加
の方法を提供する。
本発明はさらに、第二の実施態様において、標的サブ配列が、ヌクレオチド配
列データベース中の各配列に適用されたプローブ工程をシミュレートすることに
より、(i)標的サブ配列のまたは該標的サブ配列セットの存在または非存在を表
示する、生成され得るシグナルのセットのパターン、および(ii)該パターンで各
セットのシグナルを生成し得る配列を決定する工程;ある情報尺度に従って該決
定されたパターンの値を確認する工程;および該情報尺度を最適化する新しいパ
ターンを生成するために標的サブ配列を選択する工程;を含む更なる工程に従っ
て選択される、追加の方法を提供する。
本発明はさらに、第二の実施態様において、情報尺度が該データベース中の1
以上の配列により生成され得る該パターンでのシグナルのセットの数であるか、
または場合により、情報尺度が該データベース中のただ1つの配列により生成さ
れ得る該パターンでのシグナルのセットの数である、追加の方法を提供する。
本発明はさらに、第二の実施態様において、前記選択工程が約10未満の長さの
標的サブ配列のあらゆる組合せの徹底的検索を含む方法により行われるか、また
は場合により、前記選択工程がシミュレートされたアニーリングを含む方法によ
り行われる、追加の方法を提供する。
本発明はさらに、第二の実施態様において、シミュレートすることによる決定
工程が、ヌクレオチド配列データベースの各ヌクレオチド配列中に標的サブ配列
または標的サブ配列セットが存在するか否かを検索する工程;および該データベ
ース中の該配列から生成され得るシグナルのセットのパターンを形成する工程、
をさらに含み、そして場合により、前記検索工程がストリングサーチにより行わ
れ、そして場合により、前記検索工程が各ヌクレオチド配列中の標的サブ配列の
存在数をカウントすることを含む、追加の方法を提供する。
本発明はさらに、第二の実施態様において、ヌクレオチド配列データベースの
ヌクレオチド配列中に標的サブ配列が存在する確率が0.01〜0.6であるか、また
は場合により、標的サブ配列が、ヌクレオチド配列データベースのヌクレオチド
配列中の1つの標的サブ配列の存在が該ヌクレオチド配列中の他のどの標的サブ
配列の存在とも実質的に無関係であるようなものであるか、または場合により、
約50以下の標的サブ配列が選択される、追加の方法を提供する。
第三の実施態様において、本発明は、シグナルを分析するためのプログラマブ
ル装置であって、多数の核酸を含有するサンプルを認識手段でプローブすること
により生成された1以上の実シグナルを入力するための入力デバイス、ただし、
各認識手段は標的ヌクレオチドサブ配列または1セットの標的ヌクレオチドサブ
配列を認識し、該シグナルは、(i)サンプルの核酸中の標的サブ配列の存在間の
長さ、および(ii)該核酸中の標的サブ配列の同一性または該標的サブ配列セット
(この中に該核酸中の標的サブ配列が含まれる)の同一性、の表示を含む;標的
サブ配列または該標的サブ配列セットのメンバーである標的サブ配列の存在およ
び該存在間の長さに関してヌクレオチド配列データベース中の配列を検索するた
めの、前記受容デバイスに作動可能に連結された検索デバイス、ただし、該デー
タベースはサンプル中に存在しうる既知のヌクレオチド配列を多数含有する;1
以上の実シグナルと該データベース中の配列との間のマッチを見いだすための、
前記受容デバイスおよび検索デバイスに作動可能に連結された比較デバイス、た
だし、該データベースからの配列が、(i)1以上の実シグナルにより表示される
ものと同じ標的サブ配列の存在間の長さを有し、かつ(ii)1以上の実シグナルに
より表示されるものと同じ標的サブ配列、または1以上の実シグナルにより表示
される標的サブ配列セットのメンバーである標的サブ配列を有する場合、該1以
上の実シグナルは該データベースからの配列とマッチしている;および該データ
ベース中の配列につき該比較を行わせ、かつ1以上の実シグナルとマッチするデ
ータベース配列を出力するための、前記比較デバイスに作動可能に連結された制
御デバイス;を含んでなる上記のプログラマブル装置を提供する。場合により、
前記検索デバイスは、標的サブ配列中のヌクレオチドと該データベース配列中の
ヌクレオチドとのストリング比較を行うことにより、該標的サブ配列または1セ
ットの標的サブ配列に関して検索する。
本発明はさらに、第三の実施態様において、前記制御デバイスが、該サンプル
を認識手段でプローブすることにより生成され得るシグナルのパターンを決定す
るために、該データベース中の全配列を該検索デバイスに検索させることをさら
に含み、該制御デバイスはさらに1以上の実シグナルと該シグナルのパターンと
のあらゆるマッチを該比較デバイスに見つけさせ、その際該パターンからのシグ
ナルが、(i)1以上の実シグナルにより表示されるものと同じ標的サブ配列の存
在間の長さを表示し、かつ(ii)1以上の実シグナルにより表示されるものと同じ
標的サブ配列、または1以上の実シグナルにより表示される標的サブ配列セット
のメンバーである標的サブ配列を表示する場合、該1以上の実シグナルは該シグ
ナルパターン中のシグナルとマッチしている、ことを提供する。
本発明はさらに、第三の実施態様において、核酸のサンプルが細胞または組織
型のRNAのcDNAを含み、そして該データベースが該細胞または組織型によ
り発現されそうなDNA配列を含む、ことを提供する。
本発明はさらに、第三の実施態様において、多数の核酸を含有するサンプルを
認識手段でプローブすることにより生成された1以上の実シグナルを入力する工
程、ただし、各認識手段は標的ヌクレオチドサブ配列または1セットの標的ヌク
レオチドサブ配列を認識し、該シグナルは、(i)サンプルの核酸中の標的サブ配
列の存在間の長さ、および(ii)該核酸中の標的サブ配列の同一性または該標的サ
ブ配列セット(この中に該核酸中の標的サブ配列が含まれる)の同一性、の表示
を含む;標的サブ配列または該標的サブ配列セットのメンバーである標的サブ配
列の存在および該存在間の長さに関してヌクレオチド配列データベース中の配列
を検索する工程、ただし、該データベースはサンプル中に存在しうる既知のヌク
レオチド配列を多数含有する;該データベース中の配列が、(i)1以上の実シグ
ナルにより表示されるものと同じ標的サブ配列の存在間の長さを有し、かつ(ii)
1以上の実シグナルにより表示されるものと同じ標的サブ配列、または1以上の
実シグナルにより表示される標的サブ配列セットのメンバーである標的サブ配列
を有する場合、該1以上の実シグナルおよび該データベース中の配列をマッチさ
せる工程;および該データベース中の多数の配列につき前記検索工程とマッチさ
せる工程を繰り返し行い、そして1以上の実シグナルとマッチするデータベース
配列を出力する工程;を含む各工程に従ってシグナルを分析するようにプログラ
マブル装置を作動させるために使用できるコンピュータ読み取り可能メモリを提
供する。
第4の実施態様において、本発明は、標的サブ配列を選択するためのプログラ
マブル装置を提供するが、該装置には、初期標的サブ配列または初期標的サブ配
列セットを選択するための初期選択デバイスと;第1の制御デバイスと;(i)ヌク
レオチド配列データベース中の配列を検索することにより、該初期標的サブ配列
の存在または該初期標的サブ配列セットのメンバーである標的サブ配列の存在、
およびこうした存在間の長さを調べるため、ならびに(ii)選択された該初期標的
サブ配列または該初期標的サブ配列セットから生成することのできるシグナルの
初期パターンを決定するための検索デバイスと、ただし、該検索デバイスは、該
初期選択デバイスおよび該第1の制御デバイスに作動可能に連結されており、該
データベースは、既知のヌクレオチド配列を多数含み、該シグナルは、(i)該デ
ータベース中の配列内の該存在間の長さ、および(ii)該データベース中の該配列
内に存在する該初期標的サブ配列の同一性、または該データベース中の該配列内
に存在する同じ初期標的サブ配列セットのメンバーである標的サブ配列の同一性
の表示を含む;決定された該初期パターンの値を情報尺度に従って確認するため
の確認デバイスと、ただし、該確認デバイスは、該検索デバイスおよび該第1の
制御デバイスに作動可能に連結されている;が含まれ、しかも、該第1の制御デ
バイスは、追加標的サブ配列の選択を指示し、シグナルの追加パターンの決定を
検索デバイスに指示し、更に、該情報尺度の該追加値の確認を確認デバイスに指
示し、該追加パターンが該情報尺度の該追加値を最適化するとき、追加標的サブ
配列を受け入れる。
本発明では更に、第4の目的において、該データベース中の配列のうちの予め
決定された1つ以上の配列を対象とするが、この場合、該確認デバイスは、こう
した対象となる配列のうち、該データベース中の他のいかなる配列からも生成さ
れない少なくとも1つのシグナルを予め決定された該パターン中に生成する配列
の数を調べることによって、情報尺度の値を確認する。ただし、場合に応じて、
該配列のうちの対象となる1つ以上の配列には、該データベース中の実質的にす
べての配列が含まれる。
本発明では更に、第4の実施態様において、該第1の制御デバイスは、網羅的検
索法により該情報尺度の値を最適化するが、この場合、該第1の制御デバイスは
、約10未満の長さの追加標的サブ配列を選択し、該情報尺度の該追加値が前の値
を超えたとき、追加標的サブ配列を受け入れる。
本発明では更に、第4の実施態様において、該第1の制御デバイスは、アニーリ
ングのシミュレーションを含む方法により該情報尺度の値を最適化するが、この
場合、該第1の制御デバイスは、追加標的サブ配列を繰返し選択し、該情報尺度
の該追加値が、シミュレートされた温度に依存する確率因子よりも大きく減少し
たとき、追加標的サブ配列を受け入れ、該プログラマブル装置は、該第1の制御
デバイスに作動可能に連結された第2の制御デバイスを更に含み、該第2の制御デ
バイスにより、該第1の制御デバイスが追加標的サブ配列を選択した際の該シミ
ュレートされた温度を低下させ、更に、場合にもよるが、該確率因子は、情報尺
度の減少を該シミュレートされた温度で割った値の負数の指数関数である。
本発明はさらに第4の実施態様において、データベースが、1つ以上の細胞型に
よって発現されると思われる大部分の既知DNAを含むことを提供する。
本発明は更に、第4の実施態様において、次の工程:すなわち、初期標的サブ
配列または初期標的サブ配列セットを選択する工程;ヌクレオチド配列データベ
ース中の配列を検索することにより、該初期標的サブ配列の存在または該初期標
的サブ配列セットのメンバーである標的サブ配列の存在、およびこうした存在間
の長さを調べる工程、ただし、該データベースは、該サンプル中に存在しうる既
知のヌクレオチド配列を多数含む;選択された該初期標的サブ配列または該初期
標的サブ配列セットから生成することのできるシグナルの初期パターンを決定す
る工程、ただし、該シグナルは、(i)該データベース中の配列内の該存在間の長
さ、および(ii)該データベース中の該配列内に存在する該初期標的サブ配列の同
一性または該データベース中の該配列内に存在する初期標的サブ配列セットのメ
ンバーである標的サブ配列の同一性の表示を含む;決定された該初期パターンの
値を情報尺度に従って確認する工程;ならびに、該選択、検索、決定、および確
認の工程を繰り返して、シグナルの追加パターンおよび該情報尺度の追加値を決
め、該追加パターンが該情報尺度の該追加値を最適化するとき、追加標的サブ配
列を受け入れる工程;を含む工程により、プログラマブル装置を作動させて標的
サブ配列を選択するために使用できるコンピュータ読み取り可能メモリを提供す
るか、あるいは、プログラマブル装置を第4の目的の方式で作動させるための他
のコンピュータ読み取り可能メモリを提供する。
第5の実施態様において、本発明は、データを表示するするためのプログラマ
ブル装置を提供するが、該装置には、標的サブ配列または標的サブ配列セットを
選択するための選択デバイスと、ただし、該標的サブ配列または該標的サブ配列
セットを認識するための認識手段を使用して、複数の核酸を含有するサンプルを
プローブすることによりシグナルを生成することができ、該シグナルは、(i)該
サンプルの核酸中の該標的サブ配列の存在間の長さ、および(ii)該核酸中の該標
的サブ配列の同一性または該標的サブ配列セット(この中に該核酸中の標的サブ
配列が含まれる)の同一性の表示を含む;該認識手段を用いて該サンプルをプロ
ーブすることにより生成された1つ以上の実シグナルを入力するための入力デバ
イスと;シグナルを解析するための解析デバイスと、ただし、該解析デバイスは
、該選択デバイスおよび該入力デバイスと作動可能に連結され、該認識手段で処
理する際、ヌクレオチド配列データベース中のどの配列が該実シグナルを生成で
きるかを決定し、該データベースは、該サンプル中に存在しうる既知のヌクレオ
チド配列を多数含む;該選択デバイス、入力デバイス、および解析デバイスに作
動可能に連結された入出力デバイスと、ただし、該入出力デバイスは、ユーザの
要求を入力して選択デバイスを制御することにより標的サブ配列または標的サブ
配列セットを選択し、入力デバイスを制御することにより実シグナルを受け取り
、解析デバイスを制御することにより該データベースの中から該実シグナルを生
成できる配列を見出し、更に、該実シグナルおよび該データベース中の配列のう
ちで該実シグナルを生成できる該配列を含む出力内容を表示する;が含まれる。
本発明では更に、第5の実施態様において、該サンプルは組織試料から調製さ
れたcDNAサンプルであり、該装置は、該組織試料の由来に対する指標および
該組織試料に関する情報を格納するための格納デバイス(ただし、該格納デバイ
スは該入出力デバイスに作動可能に連結されている)を更に具備し、ユーザが入
力を行う際に該指標を表示することができ、場合に応じて、指標および該組織試
料に関する情報には、組織の画像などの組織学的情報が含まれる。
本発明は更に、第5の実施態様において、該認識手段を用いて該サンプルをプ
ローブするため、および該実シグナルを生成するための1つ以上の計測デバイス
と、;該計数デバイスの作動を制御するための制御デバイスと、ただし、制御デ
バイスは、該1つ以上の計数デバイスおよび該入出力デバイスに作動可能に連結
されている;を更に含む拡張型装置を提供する。ただし、該ユーザは、該計数デ
バイスを制御するための制御コマンドの入力および該計数デバイスの状態に関す
る出力を行うことができ、場合に応じて、該選択、入力、解析、および入出力の
デバイスのうちの1つ以上は、互いに物理的に並設されるか、または互い物理的
に離間させ、コマンドおよび情報の交換を行うための通信媒体により連結される
。
本発明は更に、第5の実施態様において、次の工程:すなわち、標的サブ配列
または標的サブ配列セットを選択する工程と、ただし、該標的サブ配列または該
標的サブ配列セットを認識するための認識手段を使用して、複数の核酸を含有す
るサンプルをプローブすることによりシグナルを生成することができ、該シグナ
ルは、(i)該サンプルの核酸中の該標的サブ配列の存在間の長さ、および(ii)該
核酸中の該標的サブ配列の同一性または該標的サブ配列セット(この中に該核酸
中の標的サブ配列が含まれる)の同一性の表示を含む;該認識手段を用いて該サ
ンプルをプローブすることにより生成された1つ以上の実シグナルを入力する工
程と;該1つ以上の実シグナルを解析し、該認識手段で処理する際、ヌクレオチ
ド配列データベース中のどの配列が該実シグナルを生成できるかを決定する工程
と、ただし、該データベースは、該サンプル中に存在しうる既知のヌクレオチド
配列を多数含む;ユーザの要求を入力して該選択工程を制御することにより標的
サブ配列または標的サブ配列セットを選択し、該入力工程を制御することにより
実シグナルを入力し、該解析工程を制御することにより該データベースの中から
該実シグナルを生成できる配列を見出し、更なるユーザの要求に答えて該実シグ
ナルおよび該データベース中の配列のうちで該実シグナルを生成できる該配列を
含む情報を出力する工程と;を含む工程により、プログラマブル装置を作動させ
てデータを表示するために使用できるコンピュータ読み取り可能メモリを提供す
るか、あるいは、プログラマブル装置を第5の目的の方式で作動させるための他
のコンピュータ読み取り可能メモリを提供する。
第6の実施態様において、本発明は、複数の異なるヌクレオチド配列を有する
DNA分子のサンプル中のDNAの同定、分類、または定量を行う方法を提供す
る。該方法には、1つ以上の制限エンドヌクレアーゼを用いて該サンプルを消化
する工程と、ただし、該制限エンドヌクレアーゼは、サブ配列認識部位を認識し
、該認識部位でDNAを消化し、5'突出部を有する断片を生成する;該断片を、
より短いおよびより長いオリゴデオキシヌクレオチドと接触させる工程と、ただ
し、該より短いオリゴデオキシヌクレオチドはそれぞれ、該5'突出部とハイブリ
ダイズでき、かつ末端リン酸基を含まず、該より長いオリゴデオキシヌクレオチ
ドはそれぞれ、該より短いオリゴデオキシヌクレオチドとハイブリダイズできる
;該より長いオリゴデオキシヌクレオチドを該DNA断片上の該5'突出部と連結
させて、連結DNA断片を形成する工程と;DNAポリメラーゼを用いた合成に
より該連結DNA断片を伸長して平滑末端化二本鎖DNA断片を作製する工程と
;該DNA断片をDNAポリメラーゼおよびプライマーオリゴデオキシヌクレオ
チドと接触させることを含む方法により該平滑末端化二本鎖DNA断片を増幅す
る工程と、ただし、該プライマーオリゴデオキシヌクレオチドは、より長いオリ
ゴデオキシヌクレオチドうちの1つの配列を含んでなる配列を有する;増幅され
たDNA断片の長さを決定する工程と;DNA配列データベース(ただし、該デ
ータベースは、該サンプル中に存在しうる既知のDNA配列を多数含む)を検索
する工程と、ただし、所定の長さの1つ以上の該断片とマッチする配列に対して
、該データベースからの配列が、所定の長さを隔てて該1つ以上の制限エンドヌ
クレアーゼの認識部位を含有するとき、該データベースからの配列は所定の長さ
の断片とマッチしたとみなし、これにより、該サンプル中のDNA分子を同定、
分類、または定量する;が含まれる。
本発明は更に、第6の実施態様において、各プライマーオリゴデオキシヌクレ
オチドの配列が、より長いオリゴデオキシヌクレオチドの配列の3'側でそれに隣
接して、消化後にDNA断片末端に残存する該1つ以上の制限エンドヌクレアー
ゼの認識部位の部分を含み、該残存部分は、1つ以上の追加ヌクレオチドの5'側
でそれに隣接して存在する別法を提供するが、この方法では、該データベースか
らの配列が、該1つ以上の追加ヌクレオチドと隣接して該1つ以上の制限エンドヌ
クレアーゼの認識部位であるサブ配列を含むとき、かつ該サブ配列が、所定の長
さを隔てて存在するとき、該データベースからの配列は、所定の長さの断片とマ
ッチしたとみなす。
本発明は更に、第6の実施態様において、該決定工程が、該断片を銀で染色す
ることを含む方法により、増幅されたDNA断片を検出することを更に含む別法
を提供する。
本発明は更に、第6の実施態様において、該オリゴデオキシヌクレオチドプラ
イマーが検出可能に標識され;該決定工程が該検出可能な標識の検出を更に含み
;該データベースからの配列が1つ以上の制限エンドヌクレアーゼの認識部位を
含み、該認識部位が該オリゴデオキシヌクレオチドプライマーの検出可能な標識
により同定され、かつ該認識部位が所定の長さを隔てて存在するとき、該データ
ベースからの配列が所定の長さの断片とマッチしたとみなし;場合に応じて、該
決定工程が、DNA挿入染料を用いて該断片を標識することを含む方法により、
増幅されたDNA断片を検出するか、または該断片上の蛍光色素からの発光を検
出することを更に含む別法を提供する。
本発明は更に、第6の実施態様において、該決定工程の前に、増幅されたDN
A断片を、サブ配列(ただし、該サブ配列は該1つ以上の制限エンドヌクレアーゼ
の該認識部位とは異なる)に相補的で検出可能に標識されたオリゴデオキシヌク
レオチドにハイブリダイズさせる工程を更に含む追加工程を提供するが、この場
合、該決定工程は、該オリゴデオキシヌクレオチドの該検出可能な標識を検出す
ることを更に含み、該データベースからの配列が、該1つ以上の制限エンドヌク
レアーゼの認識部位の間に該サブ配列を更に含むとき、該データベースからの配
列が指定の長さの断片とマッチしたとみなす。
本発明は更に、第6の実施態様において、1つ以上の制限エンドヌクレアーゼが
、Acc56IとHindIII、Acc65IとNgoMI、BamHIとEcoRI、BglIIとHindIII、BglIIとN
goMI、BsiWIとBspHI、BspHIとBstYI、BspHIとNgoMI、BsrGIとEcoRI、EaglとEcoR
I、EagIとHindIII、EagIとNcoI、HindIIIとNgoMI、NgoMIとNheI、NgoMIとSpeIと
BglIIとBapHI、Bsp120IとNcoI、BssHITとNgoMI、EcoRIとHindIII、NgoMIとXbaI
から成る群より選ばれた制限エンドヌクレアーゼの対であるか、または連結工程
が
T4DNAリガーゼを用いて行われる別法を提供する。
本発明は更に、第6の実施態様において、消化、接触、および連結の工程が同
一反応容器中で同時に行われるか、または場合に応じて、消化、接触、連結、伸
長、および増幅の工程が同一反応容器中で行われる別法を提供する。
本発明は更に、第6の実施態様において、長さを決定する工程が電気泳動によ
り行われる別法を提供する。
本発明は更に、第6の実施態様において、該DNAデータベースを検索する工
程が、生成可能な断片のパターン、ならびに該パターン中の各断片について、該
DNAデータベース中の各配列に対して行われる該1つ以上の制限エンドヌクレ
アーゼを用いた消化、接触、連結、伸長、増幅、および決定の工程をシミュレー
ションすることにより断片を生成することが可能な該データベース中の配列、を
決定すること、また、所定の長さの該1つ以上の断片と同じ長さおよび同じ認識
部位を有する1つ以上の断片を該パターン中から探して、所定の長さの該1つ以上
の断片を生成することが可能な配列を決めること、を更に含む別法を提供する。
本発明は更に、第6の実施態様において、消化および連結の工程が実質的に完
全に行われる別法を提供する。
本発明は更に、第6の実施態様において、DNAサンプルがmRNAから調製さ
れたcDNAであり、場合に応じて、DNAが、植物、単細胞動物、多細胞動物
、細菌、ウイルス、真菌、酵母、または哺乳動物由来の組織または細胞タイプか
ら得られたRNAからのものであり、場合に応じて、哺乳動物がヒトであり、場
合に応じて、哺乳動物が、疾患を有するかまたは疾患を有することが疑われるヒ
トであり、場合に応じて、疾患が悪性腫瘍である別法を提供する。
第7の実施態様において、本発明は、複数のヌクレオチド配列を用いてDNA
分子サンプル中のDNAを同定、分類、または定量するための別法を提供するが
、該方法には、1つ以上の制限エンドヌクレアーゼを用いて該サンプルを消化す
る工程と、ただし、該制限エンドヌクレアーゼは、サブ配列認識部位を認識し、
DNAを消化し、3'突出部を有する断片を生成する;該断片を、より短いおよび
より長いオリゴデオキシヌクレオチドと接触させる工程と、ただし、該より長い
オリゴデオキシヌクレオチドは第1および第2の隣接部分を有し、該第1の部分は
、該制限エンドヌクレアーゼの1つにより形成された突出部に相補的な3'末端サ
ブ配列であり、該より短いオリゴデオキシヌクレオチドは、該より長いオリゴデ
オキシヌクレオチド鎖の該第2の部分の3'末端に相補的である;該より長いオリ
ゴデオキシヌクレオチドを該DNA断片と連結させて、連結断片を形成する工程
と;DNAポリメラーゼを用いた合成により該連結DNA断片を伸長して平滑末
端化二本鎖DNA断片を作製する工程と;DNAポリメラーゼおよびプライマー
オリゴデオキシヌクレオチドを使用することにより、該二本鎖DNA断片を増幅
し、増幅されたDNA断片を形成する工程と、ただし、該プライマーオリゴデオ
キシヌクレオチドは、より長いオリゴデオキシヌクレオチドの配列を含んでなる
配列を有する;増幅されたDNA断片の長さを決定する工程と;DNA配列デー
タベース(ただし、該データベースは、該サンプル中に存在しうる既知のDNA
配列を多数含む)を検索する工程と、ただし、所定の長さの1つ以上の該断片とマ
ッチする配列に対して、該データベースからの配列が、所定の長さを隔てて該1
つ以上の制限エンドヌクレアーゼの認識部位を含有するとき、該データベースか
らの配列は所定の長さの断片とマッチしたとみなし、これにより、該サンプル中
のDNA配列を同定、分類、または定量する;が含まれる。
第8の実施態様において、本発明は、外来因子に曝露されたin vitro細胞と、
該外来因子に曝露されないin vitro細胞とを比較し、前者の細胞中で異なる発現
を起こした1つ以上の遺伝子を検出する別法を提供するが、該方法には、該複数
の核酸が、該外来因子に曝露された該in vitro細胞のRNAのcDNAを含む本
発明の第1の実施態様の方法を実施する工程と;該複数の核酸が、該外来因子に
曝露されない該in vitro細胞のRNAのcDNAを含む本発明の第1の実施態様の
方法を実施する工程と;該外来因子に曝露された該in vitro細胞の同定、分類、
または定量されたcDNAを、該外来因子に曝露されない該in vitro細胞の同定
、分類、または定量されたcDNAと比較する工程と;が含まれ、これにより、
異なる発現を起こした遺伝子を同定、分類、または定量する。
第9の実施態様において、本発明は、疾患のある組織と、該疾患のない組織と
を比較し、前者の組織中で異なる発現を起こした1つ以上の遺伝子を検出する別
法を提供するが、該方法には、該複数の核酸が、該疾患のある組織のRNAのc
DNAを含む本発明の第1の実施態様の方法を実施して、1つ以上のcDNA分子
を同定、分類、および/または定量する工程と;該複数の核酸が、該疾患のない
組織のRNAのcDNAを含む本発明の第1の実施態様の方法を実施して、1つ以
上のcDNA分子を同定、分類、および/または定量する工程と;該疾患のある
組織の同定、分類、および/または定量されたcDNA分子を、該疾患のない組
織の同定、分類、および/または定量されたcDNA分子と比較する工程と;が
含まれ、これにより、異なる発現を起こしたcDNA分子を検出する。
本発明はさらに、第九の実施態様において、比較の工程が上記の罹患組織また
は疾患を有さない上記の組織中で再現可能的に発現されるcDNA分子を見出し
、さらに上記の再現可能的発現cDNA分子で上記の罹患組織と疾患を有さない
組織との間の発現の有意差を示さないものを見出すことをさらに包含し、そして
場合によっては、再現可能的に発現されるcDNA分子の上記発見と、上記の罹
患組織および疾患を有さない組織における上記のcDNA分子の発現の上記の有
意差が統計学的測定を適用することを包含する方法により確定され、場合によっ
ては上記の罹患組織または上記の疾患を有さない組織中でのcDNA分子の定量
化発現のレベルの標準偏差がそれぞれ上記の罹患組織または疾患を有さない組織
中での上記のcDNA分子の定量化発現の平均レベル未満である場合には上記統
計学的測定が再現可能的発現を確定することを包含し、そして上記の罹患組織中
での上記のcDNA分子の定量化発現のレベルの標準偏差と上記の疾患を有さな
い組織中での上記のcDNA分子の定量化発現のレベルの標準偏差の合計が上記
の罹患組織中での上記のcDNA分子の定量化発現のレベルから疾患を有さない
組織中での上記のcDNA分子の定量化発現のレベルを減算した差の絶対値より
低い場合はcDNA分子がcDNA分子が発現の有意差を示す付加的方法を提供
する。
本発明はさらに、第九の実施態様において、罹患組織および疾患を有さない組
織が1つ又はそれ以上の哺乳類からのものであり、そして場合によっては疾患が
悪性疾患であって、そして場合によっては疾患が前立腺癌、乳癌、結腸癌、肺癌
、皮膚癌、リンパ腫および白血病からなる群から選択される悪性疾患である付加
的方法を提供する。
本発明はさらに、第九の実施態様において、疾患が悪性疾患であり、疾患を有
さない組織が前悪性特性を有する付加的方法を提供する。
第十の実施態様では、本発明は、上記の複数の核酸がヒト個体からの組織から
調製されるRNAのcDNAを包含する本発明の第一の実施態様の方法を実行し
、上記の組織が上記の疾患を有するかまたは有する疑いがあり、それにより1つ
又はそれ以上の上記のcDNA分子が同定され、分類され、および/または定量
化されて、そして上記の組織中の同定され、分類され、および/または定量化さ
れ
たcDNA分子を、上記の疾患の特定の段階または等級で予期される1つ又はそ
れ以上の同定され、分類されおよび/または定量化されたcDNA分子と比較す
ることからなる、ヒト個体における疾患を病期分類し、等級分けする方法を提供
する。
第十一の実施態様では、本発明は、上記の複数の核酸が上記のヒト患者からの
組織から調製されるRNAのcDNAを包含する本発明の第一の実施態様の方法
を実行し、上記の組織が上記の疾患を有するかまたは有する疑いがあり、それに
より上記の標本中の1つ又はそれ以上のcDNA分子が同定され、分類されおよ
び/または定量されて、そしてそれにより同定され、分類され、および/または
定量された1つ又はそれ以上のcDNA分子が1つ又はそれ以上の療法に対する
不十分なまたは順調な反応と相関するか否かを確認することを包含し、場合によ
っては上記の同定され、分類されおよび/または定量されたcDNA分子が順調
な反応と相関する上記の患者に対する1つ又はそれ以上の反応を選択することを
包含する疾患のための療法に対するヒト患者の反応を予測するための付加的方法
を提供する。
第十二の実施態様では、本発明は、疾患を有する哺乳類における療法の効能を
評価するための付加的方法であって、療法の前に上記の複数の核酸が上記の哺乳
類のRNAのcDNAを包含する本発明の第一の実施態様の方法を実行し、上記
の療法の後に上記の複数の核酸が上記の哺乳類のRNAのcDNAを包含する本
発明の第一の実施態様の方法を実行し、上記の療法前の上記の哺乳類における1
つ又はそれ以上の同定、分類および/または定量されたcDNA分子を療法後の
上記の哺乳類での1つ又はそれ以上の同定、分類および/または定量されたcD
NA分子と比較し、そして療法後の1つ又はそれ以上の同定、分類および/また
は定量されたcDNA分子におけるあらゆる差がそれぞれ疾患の退行または進行
に相関するか否かによって療法に対する反応が有望であるかそうでないかを確定
する方法で、場合によっては哺乳類がヒトである方法を提供する。
第十三の実施態様では、本発明は、1つ又はそれ以上の制限エンドヌクレアー
ゼを入れる1つ又はそれ以上の容器、1つ又はそれ以上の短いオリゴデオキシヌ
クレオチド鎖を入れる1つ又はそれ以上の容器、上記の短鎖とハイブリッド可能
な1つ又はそれ以上の長いオリゴデオキシヌクレオチド鎖を入れる1つ又はそれ
以上の容器を包含するキットであって、長いオリゴデオキシヌクレオチドかまた
は短いオリゴデオキシヌクレオチドのいずれかが各々上記の1つ又はそれ以上の
制限エンドヌクレアーゼの少なくとも1つにより産生されるオーバーハングと相
補的な配列、ならびにDNA標本中の1つ又はそれ以上のDNA分子を同定、分
類または定量するための上記の制限エンドヌクレアーゼ、短鎖および長鎖の使用
のための上記の1つ又はそれ以上の容器に付随して包装される使用説明書を包含
し、上記の使用説明書が(i)上記の標本を上記の制限エンドヌクレアーゼで断
片に消化し、各断片は上記の1つ又はそれ以上の制限エンドヌクレアーゼの制限
部位により各々の末端で終結され、(ii)上記の短鎖および長鎖ならびに消化
断片を接触させて上記の消化断片にアニールされる二本鎖DNAアダプターを生
成し、(iii)上記の長鎖を上記の断片とライゲートし、(iv)各末端で消
化されるような上記の断片を分離し、検出することにより1つ又はそれ以上の信
号を発生し、各信号が断片の長さおよび断片の両端での認識部位の同一性の表示
を包含し、そして(v)上記の1つ又はそれ以上の発生信号に適合する配列また
は適合する配列の非存在を確定するためのヌクレオチド配列データベースを探索
し、上記データベースが標本中に存在し得る核酸の複数の公知のヌクレオチド配
列を包含し、上記のデータベースからの配列が(i)発生信号により示されるよ
うな上記の1つ又はそれ以上の制限エンドヌクレアーゼの上記の認識部位の存在
間の同一長および(ii)発生信号により示されるような上記の1つ又はそれ以
上の制限エンドヌクレアーゼの同一認識部位をともに有する場合に上記のデータ
ベースからの配列が発生信号に適合するキットを提供する。
本発明はさらに、第十三の実施態様において、上記の1つ又はそれ以上の制限
エンドヌクレアーゼが消化断片の末端で5’オーバーハングを生じ、上記の短オ
リゴデオキシヌクレオチド鎖が各々一次及び二次連続部分から成り、上記の一次
部分が上記の制限エンドヌクレアーゼの1つにより生成されるオーバーハングと
相補的な5’末端配列であり、上記の長オリゴデオキシヌクレオチド鎖が各々上
記の短オリゴデオキシヌクレオチド鎖の上記の二次部分と相補的な3’末端配列
を包含するか、または場合によっては上記の1つ又はそれ以上の制限エンドヌク
レアーゼが消化断片の末端に3’オーバーハングを生成し、上記の長オリゴデオ
キシヌクレオチド鎖の各々が一次および二次連続部分から成り、上記の一次部分
が上記の制限エンドヌクレアーゼの1つにより生成されるオーバーハングと相補
的な3’末端配列であり、上記の短オリゴデオキシヌクレオチド鎖が各々上記の
オリゴデオキシヌクレオチド鎖の上記の二次部分の3’末端と相補的であるキッ
トを提供する。
本発明はさらに、第十三の実施態様において、上記の使用説明書がさらに、上
記の標本が上記のキット中の上記の1つ又はそれ以上の制限エンドヌクレアーゼ
の中から選択される特定の1つ又はそれ以上の制限エンドヌクレアーゼで消化さ
れる場合、当該の1つ又はそれ以上のDNA分子から予期される信号を包含し、
場合によっては上記の当該の1つ又はそれ以上のDNA分子が疾患状態で差別的
に発現されるcDNA分子であるキットを提供する。
本発明はさらに、第十三の実施態様において、制限エンドヌクレアーゼがAc
c65I、AflII、AgeI、ApaLI、ApoI、AscI、AvrI
、BamHI、BclI、BglII、BsiWI、Bsp120I、BspE
I、BspHI、BsrGI、BssHII、BstYI、EagI、EcoR
I、HindIII、MluI、NcoI、NgoMI、NheI、NotI、
SpeIおよびXbaIからなる群から選択されるキットを提供する。
本発明はさらに、第十三の実施態様において、上記の長オリゴヌクレオチド鎖
および短オリゴヌクレオチド鎖をアニーリングすることにより形成される1つ又
はそれ以上の二本鎖アダプターDNA分子を入れる1つ又はそれ以上の容器をさ
らに包含するキットを提供する。
本発明はさらに、第十三の実施態様において、請求項106のコンピュータ読
取りメモリを包含し、または場合によっては請求項114のコンピュータ読取り
メモリをさらに包含し、または場合によっては請求項122のコンピュータ読取
リメモリをさらに包含するキットを提供する。
本発明はさらに、第十三の実施態様において、DNAリガーゼを容器中に包含
し、または場合によってはDNA配列から末端リン酸塩を除去することができる
ホスファターゼを容器中にさらに包含するキットを提供する。
本発明はさらに、第十三の実施態様において、1つ又はそれ以上のプライマー
をさらに包含し、上記の各プライマーが上記の長鎖の1つの配列を包含する一本
鎖オリゴデオキシヌクレオチドから成り、そして場合によっては上記の1つ又は
それ以上のプライマーの各々がさらに(a)消化後の断片の末端に残存する上記
の1つ又はそれ以上の制限エンドヌクレアーゼの認識部位の一部である一次サブ
配列、および(b)上記の一次サブ配列に対して3’と連続する1つまたは2つ
の付加的ヌクレオチドの二次サブ配列を包含するキットであって、上記のプライ
マーが検出可能的に標識され、したがって上記の1つまたは2つの付加的ヌクレ
オチドと異なるプライマーが識別可能的に検出され得る異なる標識を有するキッ
トを提供する。
本発明はさらに、第十三の実施態様において、上記の使用説明書が、上記の断
片を銀で染色し、上記の断片をDNA挿入染料で標識し、または上記の断片上の
蛍光色素標識からの発光を検出することを包含する方法により各末端で消化され
る上記このような断片を検出することを包含するキットを提供する。
本発明はさらに、第十三の実施態様において、cDNA標本調製工程を実行す
るための試薬、1つ又はそれ以上の制限エンドヌクレアーゼによる消化の工程を
実行するための試薬、ライゲーション工程を実行するための試薬、およびPCR
増幅工程を実行するための試薬をさらに包含するキットを提供する。
4.図面の簡単な説明
本発明のこれらのおよびその他の特徴、局面および利点は、添付の図面、以下
の説明ならびに添付の請求の範囲を参照することによりさらによく理解されるよ
うになるであろう。
図1は、本発明のQEA(登録商標)法により生じた信号の典型的結果を示す
。
図2A、2Bおよび2Cは、本発明のQEA(登録商標)法のRE/ライゲー
ション実行のためのDNAアダプターを示す。この場合、制限エンドヌクレアー
ゼは5’オーバーハングを生じ、開放ブロックはDNAの鎖を示す。
図3Aおよび3Bは、本発明のQEA(登録商標)法のRE/ライゲーション
実行のためのDNAアダプターを示す。この場合、制限エンドヌクレアーゼは3
’
オーバーハングを生じる。
図4A、4Bおよび4Cは、QEA(登録商標)法のビオチン代替実施態様の
実例を示す。
図5は、QEA(登録商標)法のPCR実施態様のためのDNAプライマーを
示す。
図6Aおよび6Bは、本発明によるDNA配列データベース選択法を示す。
図7は、本発明のQEA(登録商標)実施態様のための実験の説明の実例を示
す。
図8Aおよび8Bは、本発明のQEA(登録商標)実施態様のための実験結果
の模擬データベースを確定するための方法の概説を示す。
図9は、QEA(登録商標)反応をシミュレートするための方法の詳細を示す
。
図10A〜Fは、図9の方法の作用の実例結果を示す。
図11は、本発明のQEA(登録商標)実施態様のための実験結果の模擬デー
タベースを確定するための方法の詳細を示す。
図12A、12Bおよび12Cは、本発明の方法を実行するコンピュータ系装
置、および代替的実施態様の実例を示す。
図13Aは、本発明のQEA(登録商標)およびCC実施態様のための実験計
画方法の詳細の実例を示し、図13Bは、本発明のQEA(登録商標)実施態様
のための実験計画方法の詳細の実例を示す。
図14は、標本中にそれらが存在すると思われるために、QEA(登録商標)
信号の原因であると考えられることが判明したDNA配列を規定するための方法
の実例を示す。
図15は、本発明のCC実施態様のための実例結果の模擬データベースを確定
するための方法の詳細を示す。
図16A、16B、16Cおよび16Dは、QEA(登録商標)法の好ましい
RE実施態様の好ましい手動および自動実行のための反応温度プロフィールの実
例を示す。
図17A〜Fは、QEA(登録商標)のRE/リガーゼ実施態様のSEQ−Q
EA(登録商標)代替的実施態様を示す。
5.詳細な説明
本発明によれば、ゲノムDNAの発現ヌクレオチドまたは遺伝子配列、完全ま
たは部分的、ならびに多数の成分を独自に同定するのに、実際の完全ヌクレオチ
ド配列を確定する必要はない。全配列は、本発明により配列を単に分類または確
定するのに必要であるよりはるかに多くの情報を提供する。例えば、ヒトゲノム
では、約105個の発現遺伝子が存在することが公知である。コード配列の平均
長は約2000ヌクレオチドであるため、考えられる配列の総数は約42000または約
101200である。発現ヒト遺伝子の実数は考えられるDNA配列の総数の考えら
れないほど小さな一部分(10-1195)である。cDNA配列の50bp断片をシー
ケンシングしてもその配列を分類するのに必要な情報の約1025倍の情報が生じ
るだけである。本発明を用いれば、標本中に存在すると思われる配列のデータベ
ースを使用させることにより標本の完全または部分配列確定よりもはるかに少な
い情報で標本中の配列を直接確定できる。このようなデータベースが利用できな
い場合、それでも標本中の配列は別々に分類し得る。
より一般的には、本発明は少数の反復単位からなるあらゆる生体高分子の配列
を分析するのに適応できるし、それらの天然の代表的なものは、考え得る物理学
的高分子の数よりはるかに少なく、少数のサブ配列が認識される。したがって、
それは天然DNA高分子だけでなく天然RNA高分子、タンパク質、グリカン等
にも適用できる。
コンピュータ科学では、大きな一組の可能性の中から少数の成員を簡潔に同定
するコードは、ハッシュコードと呼ばれる。本発明の目的は、発現DNA配列の
ための、あるいは存在するその他のあらゆる組のDNA配列のためのハッシュコ
ードを構築することである。いかなる非割り当てコードワードも有さない十分に
集団形成されたハッシュコードでは、ヒト遺伝子はすべて、約17ビット二進数
(217=1.3x105)でコード化される。20ビットコードは、約10%充
填または90%散在である(2020=1.0x106)。
本発明においては、コードは、標本配列中の短い核酸(好ましくはDNA)配
列(以後、「標的サブ配列」と呼ぶ)の存在を示す1つ又はそれ以上の信号から
構築され、好ましくは、QEA(登録商標)実施態様では、隣接標的サブ配列間
の標本配列に沿った長さの表現を含む。いくつかの実施態様では、標的サブ配列
の存在は、直接サブ配列認識手段により直接認識され、その例としては標的サブ
配列と結合および/または反応するREおよびその他のDNA結合タンパク質、
ならびに、標的サブ配列とハイブリダイズする例えばPNAまたはDNAのオリ
ゴマーが挙げられるが、これらに限定されない。他の実施態様では、有効な標的
サブ配列の存在は、おそらく多様なDNA結合タンパク質がオリゴマーのハイブ
リダイズとともに関与するプロトコール適用の結果として間接的に認識される。
後者の場合、多様なタンパク質またはオリゴマーは各々、別々のサブ配列を認識
できるし、有効標的サブ配列は別々のサブ配列の組合せである。望ましい組合せ
は、別々に認識されるサブ配列のすべてが隣接する状況でのサブ配列連結である
。このような有効標的サブ配列は、例えばREまたはPNAオリゴマー単独では
達成され得ない有益な特性を有する。しかしながら、本発明、特にそのコンピュ
ータ法は、当業界で利用できるあらゆる許容可能なサブ配列認識手段に適応でき
る。コンピュータ実行分析および計画法は、同一方法で標的サブ配列および有効
標的サブ配列を処理する。このような許容可能なサブ配列認識手段は、好ましく
は正確にそして再現可能的に標的サブ配列を認識して、適切な信号対ノイズ比を
有する認識信号を発生し、さらに好ましくは標的サブ配列間の長さに関する情報
を提供する。
標的サブ配列出現の表現を、好ましくは標的サブ配列出現間の長さの表現を含
有する本発明の信号は、本発明の種々の実施態様で異なる。いくつかの実施態様
では、例えばREが認識手段であり、サブ配列表現がサブ配列の独特のの同一性
を示す場合には、標的サブ配列は正確に認識される。他の実施態様では、例えば
短いオリゴマーが用いられ、この表現が「ファジー」である場合には、標的サブ
配列認識は精度が低い。短いオリゴマーの場合、ファジー表現は1つのヌクレオ
チドが標的サブ配列と異なる全サブ配列から成り、このようなサブ配列は各々、
おそらくは組の各成員が標的サブ配列である確率により計量される。さらに、長
さ表現は、信号を発生するために用いられる分離および検出手段に依っている。
電気泳動的分離の場合、電気泳動的に観察される長さは、平均基礎組成差による
、または検出のために用いられる標識化部分の作用による運動性差のために、お
そらくは5〜10%まで修正する必要がある。これらの修正はしばしば、総標本
配列が確定されるまで分からないので、信号の長さ表現は電気泳動的長さ(bp)
を用い、物理的長さ(bp)を用いない。簡便化のために、以下の説明では、別記
しない限り、信号は、誤差または偏りのない分離および検出手段により確定され
る長さを有する正確な認識手段により生じる場合と同様に、物理的に正確な長さ
を表すものと仮定される。しかしながら、特定の実施態様では、標的サブ配列は
ファジー法で表され、長さは、存在する場合には、分離および検出の偏りを含み
得る。
認識される標的サブ配列は、典型的には連続的である。これは、本発明に適応
可能なREに関して典型的である。しかしながら、本発明は、不連続標的サブ配
列または不連続有効標的サブ配列を認識する手段に適応できる。例えば、不連続
サブ配列を認識するオリゴマーは、不連続領域に変性ヌクレオチドを挿入するこ
とにより構築される。AGC−TATを認識する一組の16オリゴマーは、2つ
のヌクレオチド不連続領域を有する場合、図式TCGNNATA(式中、Nは任
意のヌクレオチドである)にしたがって構築される。あるいは、このような不連
続サブ配列は、式TCGiiATA(式中、「i」はイノシンであるか、または
あらゆる天然塩基とハイブリダイズできる任意のその他の「普遍的な」ヌクレオ
チドである)の1つのオリゴマーにより認識される。
しかしながら、典型的には、本発明はRNAのあらゆるin vivoまたはin vitr
o供給源から合成されるcDNA標本の分析に適用されるが、これに限定されな
い。cDNAは全細胞RNAから、ポリ(A)+RNAから、またはRNAの特
定のサブプールから合成され得る。このようなRNAサブプールはRNA予備精
製により生成され、例えば細胞質mRNAからの小胞体のmRNAの分離は主に
細胞表面または細胞外タンパク質をコードするmRNAを多く含む(Celis et
al.,1994,Cell Biology,Acadcmic Press,New York,NY)。このような富
mRNAは、例えば受容体を存在させるといったそれらのコード化タンパク質の
細胞表面または細胞外の役割により、診断的または治療的効用を増した。このよ
うな予備精製RNA
プールは、本発明のすべての実施態様に用い得る。一次鎖cDNA合成は、当業
界で公知のあらゆる方法により実行し得るし、当業界で公知のあらゆる先駆け的
方法を用い得る。例えば、一次鎖合成プライマーは、オリゴ(dT)プライマー
、無作為六量体プライマー、位相化プライマー、その混合物等である。特に、3
’末端にA、CまたはGを含有する位相化プライマーを別々のcDNA合成反応
に用いて、cDNA一次鎖を各々aT、GまたはCを有するポリ(A)+mRN
Aからボリ(A)+尾部まで生成する3つのプールに分配し得る。3末端チミジ
ンを含有しない考え得る12のオリゴ(dT)位相化プライマーを用いて、20
のプールを合成し得る。さらに、cDNAは、例えば供給源キャップmRNA中
に5’−キャップの存在を必要とすることにより、全長cDNAの生成に重きを
置いた方法により合成される。
本発明の2つの特定の実施態様は、それぞれ「定量的発現分析」(「QEA(
登録商標)」)および「コロニーコーリング」(「CC」)と呼ばれる。QEA
(登録商標)として公知の特定の実施態様は、好ましくは標本核酸配列中の一次
標的サブ配列の存在の指標、二次標的サブ配列の存在の指標、および標的サブ配
列間の長さの表示を包含する信号を発生する認識手段で標本を精査する。標的サ
ブ配列の一次鎖が標本中の単一核酸中で1回より多く起きた場合には、1つより
多い信号が生成され、各信号は標的サブ配列の隣接出現間の長さを包含する。
QEA(登録商標)実施態様はcDNAの混合物中の配列を分類し、確定する
ために選択されるが、しかし1つだけのcDNAを有する標本にも適応できる。
それは標本核酸のクローニングが必要ないという従来技術の方法を上回る相対的
利点を提供する。典型的には、標本混合物中の1つからすべての配列を確定する
のに十分な識別可能な信号を発生し得るように十分な対の標的サブ配列が選択さ
れる。例えば、先ず、あらゆる対の標的サブ配列は、分析される単一DNA分子
中に1回より多く生じ、それにより1つのDNA分子から異なる長さを有するい
くつかの信号を発生する。第二に、1対の標的サブ配列が分析される2つの異な
るDNA分子中に1回だけ生じる場合でも、ヒット間の長さは異なり、したがっ
て識別可能な信号が生成され得る。
QEA(登録商標)に用いられる標的サブ配列は、好ましくは、分析される標
本中に生じると思われる配列を含有するDNAデータベースの点から見て、本発
明のコンピュータ実行法により最適に選択される。ヒトcDNAの場合、発現さ
れたそして遺伝子的なヒトゲノム配列のシーケンシングにおける米国のヒトゲノ
ムプロジェクトの努力、米国外での努力、そして私的会社の努力は、いくつかの
利用可能なデータベースに収集されている(5.1項に記載)。
典型的には、QEA(登録商標)は「質問方式」または「組織方式」で実行さ
れる。質問方式実験は、限定数の当該の、おそらくは1〜100の遺伝子および
公知の配列の発現を確定することに集中する。最小数の標的サブ配列を選択して
信号を生成するが、その目標は限定数の遺伝子の各々が少なくとも1つの独特の
信号により標本中に生じると思われる他の遺伝子と区別されることである。言い
換えれば、このような QEA(登録商標)実験は、当該する各遺伝子がそれに
対して独特の少なくとも1つの信号を生じるように計画される(「良好」遺伝子
。下記参照)。QEA(登録商標)組織方式実験は、それらの発現にいかなる予
備知識も関心も必要とせずに、組織またはその他の標本中に発現されるできるだ
け多数の、好ましくは大多数の遺伝子の発現を確定することに焦点を合わせる。
標的サブ配列は、1つ、または好ましくはせいぜい2〜3個の配列を包含するク
ラス中の最大数の標本DNA配列を区別するために最適に選択される。好ましく
は、本発明のコンピュータ法が組織中に発現される大多数の、さらに好ましくは
ほとんどの遺伝子の発現を独自に確定し得るよう十分な信号が生成される。いず
れの方式でも、特定の実験の閾値および感度により確定されるように、信号が生
成され、検出される。閾値および感度のいくつかの重要な決定因子は、mRNA
の、したがってcDNAの初期量、実験中に実行される分子増幅量、および検出
手段の感度である。
QEA(登録商標)信号は、標的サブ配列に関する認識手段を包含する方法に
より生成され、その例としては、好ましいRE/リガーゼ実施態様における1つ
又はそれ以上のRE、あるいは代替的PCR実施態様におけるヌクレオチドオリ
ゴマープライマーが挙げられるが、これらに限定されない。両実施態様において
、本発明はある種類のQEA(登録商標)反応生成物を選択し、望ましくない生
成物を除去する実施態様を意図する。これらの実施態様は、その結果生じる信号
対
ノイズ(「s/n」)比を増大するのが有益である。
概して、RE/リガーゼ法は、以下の工程にしたがって進行する。本方法は、
高特異性を有する標的サブ配列を認識し、認識部位で配列を切断して、特定のR
Eの付着オーバーハング特性を有する断片を残す1つ、1対またはそれ以上のR
Eとの認識反応を用いる。各付着オーバーハングに、短いリンカーの助けを借り
て、特定のREが切断物を作り、したがって特定の標的サブ配列が後に同定され
るような方法で、特別に構築された標識化増幅プライマーをライゲートする。次
に、好ましくは全当該断片から信号を検出するのにちょうど十分な、そして非当
該断片、例えば線状増幅1回切断断片からの信号を相対的に非有意にするのにち
ょうど十分な、多数の周期に対して同一の特定の標識化プライマーを用いて、D
NAポリメラーゼがPCR増幅される。次に、変性または非変性条件でゲル電気
泳動を用いて、長さにより増幅標識化断片が分離され、断片の長さおよび標識が
光学的に検出される。場合によっては、結合ヒドロキシアパタイトまたはその他
の一本鎖特異的カラムにより、または一本鎖特異的ヌクレアーゼによる消化によ
り、一本鎖断片が除去される。さらに、本発明は、その他の機能的に等価な増幅
および長さ分離手段に適応できる。このように、断片を切断するREの同一性、
それにより存在するサブ配列、ならびに切断物間の長さが確定される。
RE/リガーゼ実施態様は、QEA(登録商標)信号の定量的特徴を増強する
、または標本配列識別を増大するいくつかの実施態様に適応できる。ある種の実
施態様は、感度および線状反応性といった定量的特徴を改善するために除去手段
を用いる。上記の、そしてPCR増幅工程で用いられる1つ又はそれ以上の特定
の標識化増幅プライマーは、プライマーに取り付けられる捕獲部分および固体支
持体、例えばビオチンおよびストレプタビジンビーズに取り付けられる結合パー
トナーを包含する付属除去手段を有する。このように、PCR反応のある種の生
成物、例えば各末端で異なるREで切断された断片は、バックグラウンド断片か
ら分離され、精製される。それにより、このような精製断片は感度増大を伴って
検出される。例えば、大多数の信号を含有するため、好ましくは、両端で異なる
RE対により切断される断片が分離される。N REに関しては、異なるREを
有する(N−1)/2対が認められるが、同−REを有するのはN対だけである
。
あるいは、cDNAは、少なくとも1つがビオチニル化される合成プライマー
を用いて、mRNA標本から合成される。ビオチニル化される合成プライマーが
1つだけである場合には、cDNAは環化される。いかなる場合でも、次にcD
NAは1つまたは1対のREで切断され、特定の標識化増幅プライマーが前記の
ような短いリンカーの助けを借りて切断端にライゲートされる。ビオチニル化c
DNA合成プライマーに取り付けられた1回切断端をストレプタビジンまたはア
ビジンビーズで除去して、ライゲートされた増幅プライマーを有するが最小1回
切断及び標識化バックグラウンド断片を有する高純度2回切断cDNA断片を残
す。十分に高感度の検出手段を用いて、増幅を用いずに、長さによって(例えば
電気泳動またはカラムクロマトグラフィーにより)分離後に、これらの精製2回
切断および標識化断片を直接検出し得る。増幅が必要な場合には、DNA1回切
断バックグラウンド断片の非存在が信号対ノイズ比を改善して、必要な増幅周期
を少なくする。それにより、PCR増幅偏向は低減または排除され、投入mRN
A量に対するQEA(登録商標)信号の線状反応性が改善される。
その他のRE/リガーゼ実施態様は、例えばREにより認識されるよりも長い
または少なく限定された標的サブ配列を認識することにより、あるいは切断断片
に対して内側の第三のサブ配列を認識することにより、QEA(登録商標)実験
における標本配列識別を増大する。この付加された情報は、しばしば、同一起源
の末端サブ配列及び長さを有する断片を生じる2つの標本配列を識別し得る。そ
れは、標的サブ配列の使用と同様に、本発明のコンピュータ実行データベースル
ックアップ法に用いられる。一実施態様では、認識される標的サブ配列は、初期
REの認識部位と連続する二次オーバーハングを生成するように増幅断片をII
S型REが切断するように位置する内部IIS型RE認識部位を有する増幅プラ
イマーを用いて、有効に延長される。初期標的末端サブ配列と連結される二次オ
ーバーハングの配列は、有効に長い標的サブ配列を生じる。あるいは、有効に長
い標的サブ配列は、PCR増幅中に位相化プライマーを用いて認識される。PC
R増幅工程は、元のRE認識部位の向こうに1つ又はそれ以上の付加的ヌクレオ
チドを認識するように構築される1つの位相化増幅プライマーを用いて、各プー
ルに関していくつかのプールに分けられる。これらの付加的ヌクレオチドは次に
、
有効に長い標的サブ配列に寄与する。
断片に対して内側の第三のサブ配列は、第三サブ配列と結合またばハイブリダ
イズする区別的標識化プローブにより認識される。検出前に付加されたこのよう
なプローブは、そのサブ配列を含有する断片から独特の信号を生じる。あるいは
、プローブは、第三サブ配列を有する断片からの信号を抑制し得る。例えば、P
CR増幅工程前に付加されたプローブは、第三サブ配列を有する断片の増幅を妨
げ、それによりこのような断片からのあらゆる信号を除去し、抑制する。このよ
うなプローブは、第三サブ配列を有する断片を認識し、切断するためのRE、あ
るいは第三サブ配列とハイブリダイズするための、PCRプライマーとしては役
立たないPNAまたは修飾DNAオリゴマーであるが、これらに限定されない。
さらに、第三サブ配列は、その結果生じるオーバーハングが初期REの認識配列
と連続しないように、それらの3’末端に十分近い増幅プライマーを切断するI
IS型REにより生成されるオーバーハングの配列である。
さらに、QEA(登録商標)実験の定量的特徴を改善するための、そして標本
配列の識別を改良するための種々の実施態様を有益に組合せて、同一の実験での
両改善を達成し得る。例えば、s/n比を増大するための除去手段は、増幅プラ
イマーを切断するIIS型REと組合せて、SEQ−QEA(登録商標)と呼ば
れる実施態様において標本配列識別を増大する。
QEA(登録商標)のための好ましいPCR法では、標的サブ配列の適切な収
集がコンピュータ実行QEA(登録商標)実験計画法により選択され、そして蛍
光色素で区別的に標識化されたPCRプライマーが合成されてこれらの標識サブ
配列とハイブリダイズする。プライマーは5.3項に記載したように設計されて
、短いサブ配列を確実に認識し、一方、PCR増幅で高い特異性を達成する。こ
れらのプライマーを用いて、最小数のPCR増幅工程は標本中のDNA配列中に
存在する感作サブ配列間の断片を増幅し、それにより標的サブ配列を認識する。
標識化増幅化断片は次に、ゲル電気泳動により分離され、検出される。さらに、
PCR実施態様は、RE/リガーゼ実施態様に関して前記した同一の実施態様に
適応できる。
QEA(登録商標)実験の認識反応から生成される信号は、本発明のコンピュ
ータ法により分析される。分析方法は、すべての公知のDNA配列、あるいは分
析される標本中に存在すると思われる実質的にすべてのまたは少なくとも大多数
のDNA配列のデータベースを用いたQEA(登録商標)実験を、そして実行さ
れる反応の説明をシミュレートする。シミュレーションは生成され得ると考えら
れる信号の各々に関してその信号に関与するデータベース配列を含有するダイジ
ェストデータベースを生じる。それにより、信号を発生し得る配列の発見は模擬
ダイジェストデータベースでのルックアップを伴う。コンピュータ実行計画法は
、実験で生じる情報を最大限にするために、QEA(登録商標)反応での標的サ
ブ配列の選択を最適化する。組織方式に関しては、本方法は、その定量的存在が
明確に確定される独自の信号を有する配列の数を最大にする。質問方式に関して
は、本方法は、独特の信号を有する当該配列の数だけを最大にし、標本中に存在
し得るその他の配列の認識を無視する。
コロニーコーリング(「CC」)として公知の第二の特定の実施態様は、長さ
情報を伴わずにサブ配列出現データを生成する。この方法はハイブリダイゼーシ
ョンのみを必要とするために、組織ライブラリーから構築される整列化単一配列
クローンでの遺伝子同定にとって好ましい。この実施態様は、コードの各ビット
が1つの標的サブ配列の存在または非存在を示す二進法的コードを構築する。2
0ビットコードの妥当性の点から見て、4〜8個の標的サブ配列を平行にプロー
ブすることにより、例えば多様なプローブの識別可能な蛍光標識を用いることに
より、あらゆる発現ヒト遺伝子の存在または非存在はまさに3〜5つの別々のプ
ローブ工程で確定可能であるべきである。信号生成におけるこのような経済性を
有するこのような簡潔な方法は、非常に有用である。あるいは、光学的導波管を
基礎にした近年の実時間ハイブリダイゼーション検出法(Stimson et al.,1995,
Proc.Natl.Acad.Sci.USA,92:6379-6383)が、検出に用い得る。これらの
方法は、そうでなければハイブリダイゼーションと検出との間に必要な洗浄工程
を排除することにより、そして検出工程をスピードアップすることにより、ハイ
ブリダイゼーション検出をより効率よくする。
プローブハイブリダイゼーション反応により生成されるハッシュコードは、本
発明のコンピュータ実行法により解明される。本分析方法は、標的サブ配列のリ
ストおよび分析される標本中に存在すると思われるDNA配列のデータベースを
用いて、CC実験をシミュレートする。シミュレーションにより、各ハッシュコ
ードに関してそのコードを生成し得ると考えられる全配列を含有するハッシュコ
ード表が得られる。それにより、検出されたハッシュコードの解釈は、考え得る
配列を見つけだすために表でのルックアップを必要とする。
最大量の情報を生成する最小組の、好ましくは約20以下の標的が得られるた
めには、サブ配列が注意深く選択されるのが好ましい。本発明のコンピュータ実
行法は、模擬化ハッシュコード表中の非エンプティーハッシュコードの数を最適
化することにより、標本中に出現すると思われる配列の与えられたデータベース
にとって最適組の標的サブ配列を確定する。
最大情報は、標的サブ配列が考えられる標本配列中に無作為に完全に出現する
場合に、即ちそれらの出現の見込みが約50%で、1つのサブ配列の存在が他の
いかなるサブ配列の存在とも無関係である場合に得られる。したがって、信号を
生成するために選択される標的サブ配列は、好ましくは分析されるDNA配列標
本中に約50%未満、そして少なくとも5〜10%よりしばしば多く、さらに好
ましくは10〜15%よりしばしば多く出現する。もっとも好ましい出現の確率
は、25〜50%である。さらに、1つの標的サブ配列の存在ば、好ましくは、
確率的に他のいかなるサブ配列の存在とも無関係である。
ヒトDNA配列データベースからの発現RNAに関するデータを用いると、こ
れはサブ配列が好ましくはcDNA分類に関して約5〜8bp長未満であることを
意味する。典型的には、その結果生じる好ましい標的サブ配列は、4〜6bp長で
ある。より長い配列は、発現頻度が低すぎて、使用するには好ましくない。しか
しながら、gDNAを分類するには、gDNA断片は一般に、プラスミド挿入物
に関する少なくとも5キロ塩基(「kb」)からP1挿入物に関する100kb
以上までのより大きな長さを有し、したがって典型的にはより多くの配列変動性
を有し、より長い標的サブ配列を要するために、20〜40bpまでのより長いサ
ブ配列が好ましくは用いられる。
短い標的サブ配列にとって好ましいハイブリダイゼーションプローブは、標識
化ペプチド−核酸(PNA)である。あるいは、標的サブ配列を共通サブ配列と
して含む変性長DNAオリゴヌクレオチドの組が用いられる。これらの変性組は
、4〜6merと比較した場合、ハイブリダイゼーション特異性の改善を成し遂げ
る。各々のプローブが区別的にそして識別可能的に蛍光色素で標識されるプロー
ブ組は、高緊縮性の状態で整列化DNA配列クローンとハイブリダイズされ、光
学的に検出されて、標的サブ配列の存在を検出する。例えば、5つの蛍光色素が
同時に識別され、20のサブ配列観察が遺伝し同定に必要とされる(20ビット
コード)実施態様では、コロニー中のあらゆる遺伝子は4つのハイブリダイゼー
ション工程だけで同定され得る。交互に、DNAハイブリダイゼーションの光学
的導波管検出を基礎にした効率の良いハイブリダイゼーション検出手段が用いら
れる。異なるプローブに関連して異なるサイズおよび形状の粒子を用いることに
より、その結果生じる光散乱の差を用いて、これらの導波管法で同時に多数のプ
ローブのハイブリダイゼーションを検出し得る。
標的サブ配列は、単一遺伝子だけでなく、よりおおざっぱに遺伝子組をも識別
するために選択される。特定のパターンのヒットが特定の型の遺伝子の存在を示
すように、より少ない標的サブ配列が選択される。当該遺伝子の型は、癌遺伝子
、腫瘍抑制遺伝子、成長因子、細胞周期遺伝子または細胞骨格遺伝子などである
。
高緊縮性ハイブリダイゼーションが特定される本発明の実施態様では、このよ
うな条件は一般に、約1mM未満のSSCの濃度(NaCl 173.5g、Naクエ
ン酸塩 88.2g、H2Oで全体を1Lとする)と等価の低塩濃度、およびハイブリ
ダイズDNAのTmに近いかまたはそれ以上の温度を包含する。これに対比して
、低緊縮性の条件は一般に、約150mM以上のSSCの濃度と等価の高塩濃度、お
よびハイブリダイズDNAの温度Tm以下の温度を包含する。
DNAオリゴマーが、ハイブリダイゼーションおよび鎖延長プライミングを含
めた機能を実行するために特定化される本発明の実施態様では、代替的に同様の
機能を実行する以下のヌクレオチド模擬物のものを包含するオリゴマーが用いら
れる。ヌクレオチド模造物は、DNAとの特異的ワトソン−クリック様塩基対合
が可能な分子を生成するために重合されるサブユニット(古典的ヌクレオチド以
外)である。オリゴマーは、DNAまたはRNA、あるいはそのキメラ混合物ま
たはその誘導体または修飾バージョンである。オリゴマーは塩基部分、糖部分、
またはリン酸塩主鎖で修飾され得る。オリゴマーとしては、その他の付加群、例
えばペプチド、ハイブリダイゼーション引き金化開裂剤(例えば、Krol et al.,
1988,Bio Techniquess 6:958-976参照)または挿入剤(例えば、Zon,1988,Ph
arm.Res.5:539-549参照)が挙げられる。オリゴマーは、別の分子、例えばペプ
チド、ハイブリダイゼーション引き金化架橋剤、運搬剤、ハイブリダイゼーショ
ン引き金化開裂剤等と共役される。
オリゴマーはさらに、以下の群から選択される修飾塩基部分である少なくとも
1つのヌクレオチド模擬物を包含するが、これらに限定されない:5−フルオロ
ウラシル、5−ブロモウラシル、5−クロロウラシル、5−ヨードウラシル、ヒ
ポキサンチン、キサンチン、4−アセチルシトシン、5−(カルボキシヒドロキ
シルメチル)ウラシル、5−カルボキシメチルアミノメチル−2−チオウリジン
、5−カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、β−D−ガ
ラクトシルクエオシン、イノシン、N6−イソペンテニルアデニン、1−メチル
グアニン、1−メチルイノシン、2,2−ジメチルグアニン、2−メチルアデニ
ン、2−メチルグアニン、3−メチルシトシン、5−メチルシトシン、N6−ア
デニン、7−メチルグアニン、5−メチルアミノメチルウラシル、5−メトキシ
アミノメチル−2−チオウラシル、β−D−マンノシルクエオシン、5’−メト
キシカルボキシメチルウラシル、5−メトキシウラシル、2−メチルチオ−N6
−イソペンテニルアデニン、ウラシル−5−オキシ酢酸(v)、ワイブトキソシ
ン、シュードウラシル、クエオシン、2−チオシトシン、5−メチル−2−チオ
ウラシル、2−チオウラシル、4−チオウラシル、5−メチルウラシル、ウラシ
ル−5−オキシ酢酸メチルエステル、3−(3−アミノ−3−N−2−カルボキ
シプロピル)ウラシルおよび2,6−ジアミノプリン。オリゴマーは、アラビノ
ース、2−フルオロアラビノース、キシルロースおよびヘキソースからなる群か
ら選択される少なくとも1つの修飾糖部分を包含し得るが、これらに限定されな
い。オリゴマーはホスホロチオエート、ホスホロジチオエート、ホスホロアミド
チオエート、ホスホラミデート、ホスホルジアミデート、メチルホスホネート、
アルキルホスホトリエステルおよびホルムアセタルまたはその類似体からなる群
から選択される少なくとも1つの修飾ホスフェート主鎖を包含し得る。
オリゴマーは、α−アノマーオリゴマーであり得る。α−アノマーオリゴマー
は、通常のβ−ユニットとは逆に、鎖が互いに平行する相補的RNAと特異的二
本鎖ハイブリッドを形成する(Gautier et al.,1987,Nucl.Acids Res.15:66
25-6641)。
本発明のオリゴマーは、当業界で公知の標準的方法により、例えば自動DNA
合成機(Biosearch,Applied Biosystems等から市販されているような)を用
いて合成される。実例として、ホスホロチオエートオリゴ体は、Stein等(1988,
Nucl.Acids Res.16:3209)の方法により合成され、メチルホスホネートオリゴ
体は、制御化細孔ガラスポリマー支持体の使用により調製される(Sarin et al
.,1988,Proc.Natl.Acad.Sci.U.S.A.85:7448-7451)。
本発明の特定の実施態様では、一組の標的サブ配列が認識されるように、確実
に特異的認識を達成するには短すぎるDNA配列のサブ配列と特異的にハイブリ
ダイズし得るオリゴマーを用いるのが好ましい。さらに、PCRを用いる場合に
は、Taqポリメラーゼはハイブリダイゼーション不適合性を耐容するので、P
CR特異性は一般にハイブリダイゼーション特異性より低い。このようなオリゴ
マー認識短サブ配列が好ましい場合、それらは以下の方法を含めた方法で構築さ
れるが、それらに限定されない。短DNAサブ配列との確実なハイブリダイゼー
ションを達成するには、認識される共通のサブ配列と相補的な短配列を含有する
組の各成員との特異的ハイブリダイゼーションを達成するのに十分な全体長を有
して構築されるDNAオリゴマーの変性組が用いられる。あるいは、認識される
サブ配列と相補的な短配列を用いて、そして付加的普遍的ヌクレオチドまたはあ
らゆる天然ヌクレオチドとハイブリダイズできるヌクレオチド模擬物を用いて、
長DNAオリゴマーが構築される。ヌクレオチド模擬物は、重合されてDNAと
の特異的ワトソン−クリック様塩基対合し得る分子を生成するサブユニットであ
る。あるいは、オリゴマーは、天然ヌクレオチドに比して改良されたハイブリダ
イゼーションエネルギー性を有するDNA模擬物から構築される。
好ましい模擬物は、正常DNA塩基が付加された連結N−(2−アミノエチル
)グリシン主鎖を基礎にしたペプチド−核酸(「PNA」)である(Egholm et al.,
1993,Nature 365:566-67)。このPNAは特異的ワトソン−クリック塩基対合に
従うが、しかし結合の遊離エネルギーは大きく、それに準じて融解温度は高い。
適切なオ
リゴマーは、PNAから、またはPNAとDNAの混合オリゴマーから全体的に
構築される。
DNA断片が長さにより分離される本発明の実施態様では、当業界で公知のあ
らゆる長さ分離媒体が用いられる。1つの代替的分離手段は、篩分け媒体を通し
てDNA断片を噴射するための力で結合される断片長により分離のための篩い分
け媒体を用いる。篩い分け媒体は、10〜1000bpDNA断片を分離するのに適した
濃度の、ポリマーまたはゲル、例えばポリアクリルアミドまたはアガロースであ
る。この場合、噴射力は媒体を通して印加される電圧である。ゲルは、厚いまた
は薄い板あるいは毛管からなる電気泳動的形状で配置される。ゲルは非変性また
は変性である。交互に、篩い分け媒体はクロマトグラフィー的分離のためにこの
ように用いられるが、この場合、圧力は噴射力である。標準または高速液体クロ
マトグラフィー性(「HPLC」)長分離手段が用いられる。代替的分離手段は
、電荷、質量、または電荷対質量比といった分子特性を用いる。10〜1000bp断片
を分離し得る質量分析手段が用いられる。
このような分離手段により確定されるDNA断片長は、分離手段により導入さ
れる偏りまたは誤差に対する調整後の、標的サブ配列間の塩基対の物理的長さ、
および実験的変数(例えば検出可能な標識の存在、アダプター分子とのライゲー
ション)による長さの変化を示す。表示された長さは、両方の上記の長さが上記
の分離手段における偏りおよび誤差に対する修正ならびに実験的変数に基づく修
正を適用後に等しい場合に、上記のデータベースからの配列中の標的サブ配列の
出現間の物理的長さと同一である。例えば、電気泳動により確定された表示長は
、平均塩基組成による運動性偏りまたは慣用的ソフトウエアプログラム、例えば
Applied Biosystems,Inc.(Foster City,CA)からのGene Scan Softw
areによる付加標識部分および/またはアダプター鎖による運動性変化に対して
調整され得る。
DNA断片が標識され、検出されねばならない本発明の実施態様では、当業界
で公知のあらゆる両立式標識化および検出手段が用いられる。光学での、そして
光学的認識における蛍光色素の進歩により、ゲル中でのフィルターまたは帯上の
スポットにおけるような、それらが空間的に完全に重なり合っている場合でも、
多数の標識化DNA断片を識別できるようになった。いくつかの認識反応または
ハイブリダイゼーションの結果が、同一ゲルレーンまたはフィルタースポットで
多重系にされる。蛍光色素は、6〜8個の別々の物質を同時に識別できるDNA
標識に用い得る(Ju et al.,1995,Proc.Natl.Acad.Sci.USA 92:4347-43
51)。
本発明に適応できる蛍光色素およびDNAを標識するためにこのような蛍光色
素を用いる方法の実例は、6.11項に記載される。
蛍光による単一分子検出が、現在できるようになっており(Eigen et al.,19
94,Proc.Natl.Acad.Sci.USA 91:5740-5747)、使用に適応できる。
DNAを検出するために挿入DNA染料が用いられる本発明の実施態様では、
当業界で公知のあらゆるこのような染料が適応可能である。特に、このような染
料としては臭化エチジウム、ヨウ化プロピジウム、Hoechst 33258、Hoechst 3
3342、アクリジンオレンジおよび臭化エチジウムホモ二量体が挙げられるが、こ
れらに限定されない。このような染料としてはさらに、Molecular Probes(E
ugene,OR)からのPOPO、BOBO、YOYOおよびTOTOが挙げられる
。
最後に、利用可能な代替的高感度検出手段としては、ポリアクリルアミドゲル
の銀染色(Bassam et al.,1991,Analytic Biochemistry 196:80-83)、なら
びに挿入染料の使用が挙げられる。この場合、ゲルは撮影され、写真は従来のコ
ンピュータ業界で慣用的なスキャナー装置により走査されて、分離および検出断
片のコンピュータ記録を生成される。さらなる代替手段は、フィルター(例えば
ニトロセルロース)上で電気泳動的分離ゲルをブロティングし、次に付着DNA
を可視化するために当業界で公知のあらゆる可視化手段を適用することである(
例えば、Kricka et al.,1995,Molecular Probing,Blotting,and Sequencin
g,Academic Press,New York 参照)。CC実施態様であらゆる手段を用い
得るように、特に、1つ又はそれ以上の試薬または酵素との二次反応を要する可
視化手段が用いられる。
本発明で用いるのに好ましい分離および検出装置は、1995年5月9日に提出さ
れた同時係属中の米国特許出願第08/438,231号に見出される(この記載内容は、
参照により本明細書中に含まれる)。本発明に適応可能なその他の検出手段とし
ては、Applied Biosystems Inc.(Foster City,CA)、Pharmacia(AL
F)、Hitachi、Licorから市販されている電気泳動機が挙げられる。同時に4
つの染料分解ができる唯一の機械であるので、これらの中ではApplied Biosys
tems機が好ましい。
以下の小節および付随する実施例の項で、QEA(登録商標)およびCC実施
態様を詳細に説明する。
5.1.定量的発現分析
組織方式での本発明の本実施態様は、好ましくは、組織標本からの全細胞RN
Aまたは全細胞mRNAから得られるようなcDNAの混合物中の各cDNA配
列に独特の1つ又はそれ以上の信号を生成して、このような単数または複数の信
号の強度を標本またはライブラリー中のcDNA配列の相対量と定量的に関連さ
せる。質問方式では、この実施態様は、好ましくは、定量的方法で2〜3の当該
標本配列のみを独自に識別する信号を生成する。信号が少数の配列、典型的には
2〜10個の配列の組だけを独自に確定するのはあまり好ましくない。QEA(
登録商標)信号は、DNA標本中の標的サブ配列の対の存在および隣接サブ配列
対間の長さの指標を包含する。それに代わるものとしては、標的サブ配列の対の
間の第三のサブ配列の存在を認識することが挙げられる。さらに別の実施態様(
「5’−QEA(登録商標)」)では、供給源mRNAの5’キャップと明確に
関連して、サブ配列の1つがタンパク質コード配列の真の末端である。信号は、
好ましくは既存のライブラリーロボットによる簡単な自動化を可能にするように
生成される。開示の簡便性に関しては、本発明の詳細な説明は複数のcDNA配
列を包含する標本の分析に向けられているが、これらに限定されない。それは単
一配列を包含する標本、あるいは他の種類のDNAの配列または核酸を一般的に
包含する標本に等しく適用できる。
cDNAに関して以下に説明するが、DNA標本はcDNAおよび/またはゲ
ノムDNAであり、好ましくはDNA配列の混合物を包含すると理解される。特
定の実施態様では、DNA標本は、全細胞RNAもしくは全細胞mRNAのcD
NAのアリコートであり、もっとも好ましくはヒト組織から得られる。ヒト組織
は疾患もしくは正常である。一つの実施態様では、ヒト組織は、例えば前立腺癌
、乳癌、結腸癌、肺癌、リンパ性または造血性癌等からの悪性組織である。別の
実施態様では、組織は疾患またはその他の生物学的工程のin vivo動物モデルか
ら得られる。この場合、モデルとされる疾患は、普通は癌と同様に、糖尿病、肥
満症、リウマチ性疾患または自己免疫疾患などが挙げられる。さらに別の実施態
様
では、標本はin vitro培養およびモデルから得られる。本発明はさらに、植物、
酵母菌、真菌等における遺伝子発現を調べるために適用するのが有益である。
cDNA、またはそれが合成されるmRNAは、信号を生成するためにほぼ閾
値レベルで存在しなければならず、このレベルは特定のQEA(登録商標)実験
の条件によりある程度まで確定される。例えば、このような閾値は好ましくは、
標本中に存在することが検出される少なくとも1000mRNA分子の配列、さらに
好ましくは少なくとも10,000mRNA分子の配列である。当該型の1つのまたは
2〜3個だけのmRNAが標本mRNAを得るのが望ましい組織の各細胞中に存
在する場合、少なくとも対応する数のこのような細胞が初期組織標本中に存在す
る必要がある。特定の実施態様では、検出されるmRNAは、全標本RNAに対
して1:105〜1:106の比率で存在する。低比率を用いて、QEA(登録商
標)実験中にさらなる分子増幅が実行され得る。
組織由来プール中に出現するcDNA配列は短い非翻訳済配列および翻訳済タ
ンパク質コード配列を包含し、これは順次、完全タンパク質コード配列またはコ
ード配列の何らかの初期部分、例えば発現配列タッグである。コード配列は、D
NA配列データベースに入れられる未だ不明の配列または遺伝子、あるいはすで
に公知の配列または遺伝子を示す。配列データベースの実例としては、Nationa
l Center for Biotechnology Information(「NCBI」)(Bethesda,MD
)(GenBank)により、そしてEuropean Bioinformatics Institute(「EM
BL」)(Hinxton Hall,UK)により利用可能にされたものが挙げられる。
QEA(登録商標)法はさらに、cDNAに対するその適用と同様にゲノムD
NAの標本にも適用可能である。gDNA標本では、当該情報としては、転座の
出現および同一性、遺伝子増幅、対立遺伝子に関する異型接合性の損失等が含ま
れる。この情報は癌の診断および病期分類における問題の情報である。癌患者で
は、配列の増幅は癌遺伝子を反映する可能性があり、一方異型接合性の損失は腫
瘍抑制遺伝子を反映し得る。このような当該配列を用いて、標的サブ配列を選択
し、QEA(登録商標)実験により生成される信号を予測し得る。当該配列につ
いての予備知識がなくても、QEA(登録商標)信号パターンの検出および分類
は、正常状態と疾患状態の比較に、あるいは疾患状態の進行を観察するのに有
用である。疾患状態の進行に関する遺伝子発現情報は、疾患の背後の遺伝的メカ
ニズムを説明し、有用な診断マーカーを発見し、選択を指導し、治療の結果を観
察するために、有用である。信号の差異は、関連する遺伝子(単数または複数)
がすでに公知であるか、あるいはシーケンシングする必要があるかを同定する。
QEA(登録商標)信号パターンの分類は、実例的実施態様では、当該パター
ン間の有意差を確定するには、統計学的分析が必要である。これは、多くの特徴
、例えば疫学的病歴、組織病理学的状態、治療歴などのうちの1つが同様である
一次グループ分け標本を含む。次に同様の標本からの信号パターンを、例えば各
個体信号の平均および標準偏差を出すことにより、比較する。標準偏差が平均よ
り低い限定変動性を有する個々の信号は、この特定の特徴を有する標本の遺伝定
数を示す。一組の組織標本からのこのような限定変動性信号を、次に、別の組の
組織標本からの限定変動性信号と比較する。この比較で異った信号は、組織標本
間の遺伝子発現の有意差を示し、例えば疾患の進行により引き起こされる差異の
ような標本間の生物学的差異を反映する場合に興味深い。例えば、発現の有意差
は、組織中での発現の標準偏差の合計を超える2つの組織間の遺伝子発現の差に
より検出される。その他の標準的統計学的比較を用いても、発現のレベルおよび
発現レベルの有意差を確定し得る。
標的サブ配列選択は、本発明の実施に際して重要である。サブ配列の選択に関
しては2つの主な考え方があり、第一は冗長性、即ち独特の信号が各標本配列に
関して生成されると思われる遺伝子当たりの十分な標的サブ配列対出現(「ヒッ
ト」として公知である)が認められることであり、第二は、分解能、即ち標本中
に非常によく似た長さを有する標的サブ配列対が出現して信号を解明できないと
いうことがないことである。十分な冗長性のためには、標本中の遺伝子またはD
NA配列当たり、平均、約3つの標的サブ配列対ヒットがあるのが好ましい。各
遺伝子当たり、最小で少なくとも1つの対ヒットがあると非常に好ましい。真核
細胞性発現配列のデータベースの試験で、遺伝子当たり3対ヒットの平均値は一
般にこの最小判定基準を十分に保証すると思われる。
十分な分解能は、選択される分離および検出手段に依っている。分離および検
出手段の特定の選択に関しては、認識反応は、好ましくは分離されおよび識別的
に検出されるより多くの断片を生じるべきでない。好ましい実施態様では、ゲル
電気泳動は、長さによりDNA断片を分離するのに用いられる分離手段である。
既存の電気泳動法は1000bp長までの配列の3塩基対(「bp」)長差の有効な分解
を可能にする。断片塩基組成についての知識が与えられると、異なる塩基組成に
よる運動性の小さな差を予測し、修正することにより、1bp以下の有効な分解能
が可能になる。しかしながら、容易に達成可能な3bp分解能は、本明細書中の本
発明の説明における実施例により想定される。検出効率の増大にとっては、でき
るだけ多くの認識反応からの識別的標識化物質が1つのゲルレーンでの分離のた
めに組合せられるのが好ましいが、これに限定されない。この組合せは、使用さ
れる検出手段により識別可能な標識の数により限定される。好ましくは3bpまた
はそれ以上の分解能を有する長さによるDNA断片の分離および検出のためのあ
らゆる代替手段を用い得る。例えば、このような分離手段は、厚いまたは薄い板
、あるいはカラム電気泳動、カラムクロマトグラフィーまたはHPLC、あるい
は質量分析のような物理的手段である。
冗長性および分解能判定基準は、サブ配列選択を指導するのに適した概算で等
式1および2に確率的に表される。これらの等式において、cDNA配列混合物
中の遺伝子の数はN、平均遺伝子長はL、標的サブ配列対はM(認識手段の対の
数)、そして典型的標本配列中での各標的サブ配列出現の確率、またはヒッティ
ングはpである。各標的サブ配列は好ましくは各標本配列とは無関係に出現する
よう選択されるため、任意のサブ配列対の出現の確率はp2である。等式1は標
本配列当たり3対出現の冗長性条件を表しており、各標的サブ配列の出現の確率
は無関係であると仮定される。
Mp2= 3 (1)
等式2は、平均で3塩基対より近くない長さの断片を有する分解能条件を表す
。この等式は均一分布を有する実際の断片長分布を概算する。
分析するためのライブラリーまたは標本中の配列の数(ライブラリー複雑性)
である予期値N、および平均発現配列(または遺伝子)長Lが与えられると、等
式1および2は、サブ配列出現確率および必要なサブ配列の数に関して解答され
る。この解法は、QEA(登録商標)を実行するために選択される特定の実験方
法により指図される特定の冗長性および分解能判定基準による。代替値は、本実
施態様の他の実行に必要である。
例えば、全ヒトゲノムは約105個のタンパク質コード配列を含有し、平均長
は2000である。これらのパラメーターに関する等式1および2の解はp=0.082
、そしてM=450である。それにより、全ヒト組織中の全遺伝子の発現は、450標
的サブ配列対で分析され、各サブ配列は8.2%の出現の独立した確率を有する。1
995年5月9日提出の同時係属中の米国特許出願第08/438,231号に記載された分
離および検出装置を用いる場合に考えられるような、電気泳動レーン当たり8つ
の蛍光的標識化配列対が光学的に識別され、検出される実施態様では、450反応
がたった57レーンで分析される。それにより、全ヒトゲノム発現レベルを完全に
確定するためには、必要な電気泳動プレートは1つだけである。出願人に公知の
もっともよい市販機械は1つのレーンで4つの蛍光標識を区別できるだけである
ため、このような機械を用いて完全ゲノム分析を実行するにはレーン数を対応さ
せて増大する必要がある。
さらに別の例として、典型的に複雑なヒト組織は約15,000遺伝子を発現すると
概算される。N=15000およびL=2000に対する解は、p=0.21およびM=68で
ある。したがって、典型的組織中での発現は68標的サブ配列を用いて分析され
、各サブ配列は21%の出現の独立した確率を有する。ゲル電気泳動レーン当た
り4つのサブ配列対を動かすと仮定すると、あらゆるヒト組織中での遺伝子発現
頻度を確定するためには、68反応を17レーンで分析し得る。したがって、本
方法が、既存の電気泳動系の能力内で非常に簡便化された定量的遺伝子発現分析
をなし得ることは明らかである。
これらの等式はサブ配列対を採集するための適切な指針を提供する。典型的に
は、標的サブ配列出現の好ましい確率は、約0.01〜0.30である。特定のサブ配列
およびRE認識部位の出現の確率は、DNA標本配列のデータベースから確定し
得る。実施例6.2は、実例的RE認識部位に関するこれらの確率を記載する。
適切な標的サブ配列は、これらの表から選択される。コンピュータ実行QEA(
登録商標)実験計画法は、この初期選択を最低化し得る。
QEA(登録商標)の別の使用法は、2つの異なる組織間のわずか2〜3個の
、典型的には1〜10個の遺伝子または標本配列の発現を直接比較することであ
り、組織中の全遺伝子の発現を確定するよう探索する組織方式の代わりの質問方
式である。この質問方式では、2〜3個の標的サブ配列を選択して、それらの中
で、そして存在すると考えられる他のすべての配列から問題の遺伝子を区別する
。以下に記載するコンピュータ計画法は、この選択をなし得る。4つのサブ配列
対が同定に十分である場合には、各組織で実行される4つの認識反応からの断片
は、好ましくは同一ゲルの2つの別々のレーン上で分離され、検出される。2つ
のサブ配列対が同定に十分である場合には、2つの組織は好ましくは同一レーン
で分析される。同一ゲルからの信号のこのような比較は、別々の電気泳動動作間
の差による測定変動性を排除することにより定量的結果を改良する。例えば、罹
患および正常組織標本内の2〜3個の標的遺伝子の発現は、迅速且つ確実に分析
される。
QEA(登録商標)の質問方式は、特定の当該遺伝子の配列がまだ分からない
場合でも、有用である。分別的発現特徴は、2つの異なる標本に適用されるQE
A(登録商標)反応の結果を比較することにより、確認される。反応生成物の分
離および検出がゲル電気泳動による場合、このような比較は、ゲル帯または既存
の断片の蛍光痕跡を比較することにより、なし得る。このような示差的発現特徴
は、当業界で公知の方法(例えば、ゲルからの電気的溶離)によりゲルから回収
し得るし、DNA断片は、慣用的技法により、例えばシーケンシングによって分
析し得る。典型的には部分的であるこのような配列は、プローブとして用いて(
例えばPCRまたはサザーンブロットハイブリダイゼーションで)、全長配列を
回収し得る。このように、QEA(登録商標)法は新規の示差的発現cDNAの
発見を、またはgDNAの状態の変化を手引きする。新しく同定された遺伝子の
配列は、一旦確定されると、それを用いて新規の遺伝子の示差的発現をさらに分
析するためのQEA(登録商標)標的サブ配列選択を指導し得る。
主に標的サブ配列を認識する認識手段が異なるQEA(登録商標)の代替的実
施態様をここに記載する。これらの主な差異は、認識手段から信号がどのように
生成されるかという二次的差に関連する。PCR実施態様では、標的サブ配列は
DNA標的サブ配列とハイブリダイゼーションし、隣接プライマー対間のセグメ
ントの増幅のためのPCRプライマーとして作用するオリゴマーにより認識され
る。標本からの増幅断片は、好ましくは電気泳動により分離される。標的サブ配
列の選択、プライマーハイブリダイズ部位、出現の確率と独立性判定基準の充足
は、おそらくは、分析される標本中に存在すると予期される配列、例えばヒトG
enBank配列を含有するデータベースからなされ、コンピュータ実行実験計画法
により最適化される。好ましい実施態様では、サブ配列選択は、配列データベー
スを用いて、好ましくばすべての4〜8merの頻度を含有するオリゴマー頻度表
を列挙することにより開始する。これらの表から、等式1および2による出現の
必然的確率を有する標的サブ配列が選択され、例えばサブ配列のあらゆる選択さ
れた対による出現の条件確率が対の個々のサブ配列の出現の確率の生成物である
ことを点検することにより、独立性に関して点検される。初期選択は、多数の標
本配列から独特の断片を生成する標的サブ配列組を確定するために、最適化され
る。PCRプライマーは、選択されたサブ配列と相補的な3’末端を用いて合成
され、PCR実施態様に用いられる。実施例6.1は、特定の実施例における本
方法による信号出力を示す。
好ましい実施態様は、DNA結合タンパク質、特にIIS型REを含めたRE
を用いて、標的サブ配列で標本配列を認識し、開裂する。長さの明らかでない残
存する望ましくない断片を希釈するために、供給源cDNA配列にのみ依ってい
る長さを有する所望の断片を増幅手段により増幅する。典型的には、所望の断片
はREにより2回切断され、一方望ましくない断片は1回切断されるが、これに
限定されない。しかし、5’−QEA(登録商標)では、1回切断断片は明確な
長さを有し、問題の断片である。望ましくない1回切断断片は、親和性手段(例
えばビオチン標識)、物理的手段(例えば、ヒドロキシアパタイトカラム分離)
、または酵素的手段(例えば1本鎖特異的ヌクレアーゼ)により、除去し得る。
所望の2回切断断片から望ましくない1回切断断片を十分に除去すると、増幅工
程なしで断片検出が可能になる。RE代替実施態様に関しては、従来の確率また
は
出現および独立性判定基準にできるだけ近づくように合わせるために、利用可能
なREの認識部位に限定されるけれども、考え得る標的サブ配列は上記と同様に
選択される。例えば、種々のRE認識部位の出現の確率は、可能性のある標本配
列のデータベースから確定され、REは、出現の確率が等式1および2にできる
だけ近い判定基準を満たす認識サブ配列を用いて選択される。多数のREが選択
判定基準を満たす場合、サブセットは、例えば出現の条件確率を用いる従来の方
法で確定される認識サブ配列を別々に出現するREのみを含むことにより選択さ
れる。初期選択は、コンピュータ実行実験計画法により、場合によっては最適化
される。
REの数Reは、好ましくは、RE対の数が等式1で確定した場合に約Mであ
るように選択される(ここで、MとReの関係は、等式3により示される)。
例えば、許容可能な20REの一組は、210サブ配列対を生じる。
一般に利用可能な多数のREがあり、その認識配列は広範な出現確率を有し、
それによりREは本発明のために選択される。REの実例を6.2項に列挙する
。
PCRおよびRE実施態様は、異なる精度および柔軟性特性を有する。RE実
施態様は、緊縮ハイブリダイゼーション条件下でも、酵素的認識およびその後の
ライゲーション反応が一般にそのサブ配列標的との短PCRプライマーのハイブ
リダイゼーションより特異的であるため、一般により正確で、擬陽性および擬陰
性確認が少ない。
制限エンドヌクレアーゼ(「RE」)は一般に、特異性のみにより、それらの
4〜8bp認識部位に結合し、好ましくは少なくとも2bpオーバーハングでDNA
を切断する。用いられるREが公知の配列及び特定のREの特徴を有するオーバ
ーハングを生成するのが好ましいけれども、未知の配列のオーバーハングを生じ
る他のRE、例えばIIS型制限酵素として公知のものを用いて初期標的サブ配
列をより長く有効な標的サブ配列に延長し得る。位相化プライマーも、長い有効
な標的サブ配列を認識するのに用い得る。初期REのオーバーハングは、アダ
プターのハイブリダイゼーション、その後の1本鎖のこのアダプター、即ち増幅
プライマーのライゲーションにより特異的に認識される。増幅プライマーをライ
ゲートするために本発明のこの代替実施態様に用いられるリガーゼ酵素は、その
ハイブリダイゼーション要件が非常に特異的である。ライゲーション部位近くで
1bpの不適合が生じても、ライゲーションは妨げられる(米国特許第5,366,877
号(Keith et al.)1994年11月22日提出;米国特許第5,093,245号(Keith et
al.)1992年3月3日提出)。一方、そこで用いられたPCRおよび好ましいT
aqポリメラーゼは、延長プライマーのハイブリダイゼーション不適合を耐容す
る。したがって、PCR実施態様は、オリゴマープローブの標的サブ配列とのハ
イブリダイゼーションにおける不適合から生じる擬陽性信号を生成し得る。しか
しながら、150超〜200のREが目下市販されており、広範囲のヌクレオチド配列
を認識する。
QEA(登録商標)実験は、典型的には2〜10配列からなる小組に標本配列
を識別するのに適応できる。このようにより粗い粒子分析は、より少ないサブ配
列対、より少ない認識反応、そしてより少ない分析時間を要する。あるいは、少
数の標的サブ配列対は、標本中の他のすべての配列から当該配列の特定の組を独
立して識別するために、最適に選択される。これらの標的サブ配列は、特定の標
本配列からの断片を生成するREから、あるいはPCR実施態様の場合には、こ
の特定組の配列に関して最適化された一組のサブ配列から選択される。
QEA(登録商標)認識反応およびコンピュータ実行実験分析および計画方法
を実施するための実行例の詳細を以下の小節に示す。詳細な実験プロトコールは
6項に示す。これらの実行は本発明の本実施態様が従来記載されたQEA(登録
商標)信号を生成するあらゆる方法により実行されるように、説明のためのもの
であって、これらに限定されない。
5.2.QEA(登録商標)のRE実施態様
QEA(登録商標)の好ましい制限エンドヌクレアーゼ(「RE」)実施態様
は、分析される標本配列の標識化断片を生成するために、認識反応として公知の
新規の同時的REおよびリガーゼ酵素反応を用いる。これらの標識化断片を次に
、
増幅手段により場合によっては増幅し、分離手段により長さによって分離し、検
出手段により検出して、各断片の長さで各断片を切断するREの同一性を包含す
るQEA(登録商標)信号を産生する。RE/リガーゼサブ配列認識反応は、良
好な信号対ノイズ比で、特異的に且つ再現可能的にQEA(登録商標)信号を生
成する。この反応に好ましいプロトコールは、中間抽出または緩衝液交換をせず
に、単一試験管内で、増幅を含めたすべての工程を実行する。このプロトコール
は、好ましくは標準実験室ロボットにより自動的に実行される。
REは短い、通常は4〜8bp長の、「認識部位」と呼ばれ、各REを特徴づけ
るDNA標的サブ配列と特異的に結合する。用いられるREは、これらの認識部
位で(またはその近くで)配列を切断して、好ましくは一本鎖オーバーハングを
有する特徴的(「付着」)末端を生成し、これは通常は認識部位の一部を組み入
れる。その認識部位の外側を切断するIIS型REを用いて、初期標的サブ配列
を長い有効な標的サブ配列に延長して、コンピュータ実行データベースルックア
ッブに用い得る。
好ましいREは6bp認識部位を持ち、4bp5’オーバーハングを生成する。あ
まり好ましくないREは2bp5’オーバーハングを有する。2bpオーバーハング
は4bpオーバーハングよりも低いリガーゼ基質活性を有するため、これらはあま
り好ましくない。RE実施態様はすべて、2及び4bpの3’オーバーハングに適
応できる。増幅プライマーハイブリダイゼーション部位がRE/リガーゼ認識反
応の生成物の二本鎖の各々の上に存在し得るためには、実験的増幅を要する。R
E生成5’および3’オーバーハングは、好ましくは同一認識反応には用いられ
ない。さらに、好ましいREは以下の付加的特性を有する。その認識部位および
オーバーハング配列は、好ましくは増幅プライマーがそのライゲーションが反応
部位を再作成しない切断末端に対して成されるように意図される。それらは、好
ましくは37℃以下で、特に最適リガーゼ温度である16℃以下で十分な活性を
有して望ましくないライゲーション生成物を切断し、65℃以上で熱不活性化さ
れて、したがってPCR増幅はRE/リガーゼ反応混合物にPCR試薬を単に付
加することにより実行され得る。それらは、好ましくは低い非特異的切断及びヌ
クレアーゼ活性を有し、切断して完了する。特定の実験のために選択さ
れるREは、好ましくは、前記の出現および独立性判定基準を満たす認識部位を
有する。ヒトおよびマウスcDNAを分析するための好ましいRE対を、6.1
0項に列挙する。
供給源cDNA配列にのみ依っており、cDNA合成条件とは無関係な、明確
な且つ再現可能な長さを有するcDNA断片のみが、問題のものである。明確な
長さを有するこのような断片のみが、その本来の標本配列を確定するために、実
験分析法に適応可能である。各末端でREにより2回切断されたcDNA断片は
、元のcDNAの配列にのみ依る長さを有し、したがって、問題のものである。
REにより5’末端で1回切断され、ポリ(A)尾部によりその3’末端で終結
するcDNA断片は、cDNA合成条件に強く左右される変動性且つ非再現可能
性の長さを有する。REにより一端で1回切断され、他端で変動性長尾部を有す
るこのような断片は、問題のものではない。2回切断断片からの信号を、1回切
断断片からの望ましくない信号と分離するために、REA(登録商標)のある種
のRE実施態様は、指数関数的に2回切断断片を増幅し、一方1回切断断片の方
は、線状的に増幅するだけである。この増幅は、好ましくはPCR法により実行
する。その他のRE実施態様は、いずれかの型の断片で標的化される除去手段に
より、1回および2回切断断片を分離する。好ましい除去手段は、ビオチン捕獲
部分およびストレプタビジン結合パートナーを包含する。除去手段は、示差的増
幅を補充または置換し得る。一方、REによりその3’端で1回切断され、供給
源mRNAの5’キャップと固定関係にある配列によりその5’末端で終結され
るcDNA断片は、明確な長さを有し、当該物である。このような断片は5’−
QEA(登録商標)と呼ばれる本明細書中に記載の6.3.3項のプロトコール
にしたがってcDNAを合成し、認識反応を実行し、そして除去手段により当該
断片を分離することを包含する方法により生成される。あるいは、その5’末端
で1回切断され、3’ポリ(A)+尾部の開始に関して固定関係で終結されるこ
とによる長さによる明確な配列を有する場合、断片は問題のものである。
本発明は、当業界で公知の代替的増幅手段に適応できる。望ましくない1回切
断断片のための除去手段が利用できない場合、1回切断断片からの信号が相対的
に抑制されるように、代替的増幅手段は、1回切断断片に対して2回切断断片を
優先的に増幅しなければならない。一方、1回切断断片に対する除去手段がある
実施態様において使用できない場合には、代替的増幅手段が増幅傾向を有するの
はあまり好ましくはない。除去手段を用いるRE実施態様では、この手段は、1
回または2回切断断片を除去するために用いられる。公知の代替的増幅手段は、
Kricka et al.,1995,Molecular Probing,Blotting,and Sequencing,chap.1
and table IX,Academic Press,New Yorkに列挙されている。これらの代
替的手段のうち、T7RNAポリメラーゼを用いるものが好ましい。
ある種のその他の実施態様は、物理的除去手段を用いて、好ましくは増幅の前
に、望ましくない1回切断断片を直接除去する。1回切断断片除去は、例えば、
ビオチニル化プライマーでcDNAを合成することによる場合と同様に、消化の
前に、DNA末端を捕獲部分で標識することにより、成し遂げ得る。消化後に、
標本を固相に固定された捕獲部分の結合パートナーと接触させることにより、1
回切断断片を除去する。あるいは、その1つが捕獲部分で標識されるプライマー
で断片を増幅することによるのと同様に、2回切断断片を捕獲部分で標識する。
増幅生成物を固体支持体に固定された結合パートナーと接触させ、洗浄し、次に
変性させる。それにより、その一端が捕獲部分で標識される2回切断断片だけが
分離される。あるいは、一本鎖特異的カラム分離または一本鎖特異的ヌクレアー
ゼにより、一本鎖断片が除去される。
本発明は、以下の最小要件を満たすあらゆる除去手段に適用可能である。除去
手段は捕獲部分および結合パートナーを含む。捕獲部分はハイブリダイゼーショ
ンの崩壊または鎖延長反応を伴わずに、DNAオリゴマーに連結できる。結合パ
ートナーは、固相支持体に付着できて、DNA変性条件で、捕獲部分をこのよう
な支持体に結合する。好ましい除去手段は、ビオチン−ストレプタビジンである
。本発明に適応可能なその他の除去手段としては、その対応する抗体により除去
される種々のハプテンが挙げられる。ハプテンの例としては、ジゴキシゲニン、
DNPおよびフルオレセインが挙げられる(Holtke et al.,1992,Sensitive c
hemiluminescent detection of digoxigenin labeled nucleic acids:a fast an
d simple protocol for applications,Biotechniques 12(1):104-113およびOl
esen et al.,1993,Chemiluminescent DNA Sequencing with multiple labe
ling,Biotechnique 15
(3):480-485)。
QEA(登録商標)のRE/リガーゼ実施態様は、認識部分を使用する。いず
れかの認識反応において、各認識部分は1つだけのREにより切断されるオーバ
ーハングとハイブリダイズし得るか、またはそれとライゲートされる。それによ
り、そのREの認識配列が同定される。認識部分は、典型的には、部分的に二本
鎖のDNAオリゴマーを包含し、各々のオリゴマーは一認識反応において付着端
を生成される1つのREとだけ特異的にハイブリダイズし得る。PCR増幅を用
いるRE/リガーゼ実施態様では、認識部分はさらにPCRのためのプライマー
手段を提供し、それによりRE切断端の標識および認識を提供する。例えば、一
認識反応で一対のREを用いて、いくつかが両端で一次REの認識配列を有し、
いくつかが両端で二次REの認識配列を有し、残りのものがいずれかの末端で各
REの一認識配列を有する2回切断断片を生じる。さらにREを用いて、標本配
列に沿って隣接するRE認識部位からのRE切断端のすべての対単位の組合せを
有する2回切断断片を生成する。これらの切断組合せはすべて、各々が異なるサ
ブ配列対の存在、元のcDNA配列中に存在するRE認識部位に関する独自の情
報を提供するために、好ましくは識別される必要がある。したがって、認識部分
は、好ましくは、反応で作られる各RE切断を特異的に標識する独特の標識を有
する。多数のREが標識化認識部分として単一反応に用いられる場合、各RE切
断物を独自に標識するために用いられる。特定の系における検出可能な標識が、
例えば蛍光色素による場合には、1つのREで切断される断片はREに関連した
1つの蛍光色素からの単一の蛍光信号を有し、一方2つのREで切断される断片
は、1つは各REに関連した蛍光色素からのものである、混合型の信号を有する
。したがって、蛍光色素標識の考え得る対はすべて、好ましくは認識可能である
。あるいは、ある種の標的サブ配列情報が必要でない場合には、認識部分は区別
的に標識される必要はない。PCR増幅を用いる実施態様では、対応するプライ
マーは標識されない。銀染色を用いて電気泳動ゲル上に分離された断片を認識す
る場合には、種々のRE組合せにより切断される断片は認識可能でないので、認
識部分は標識される必要がない。
認識反応条件は、好ましくは、6.4項に記載の方法により、RE切断及び認
識部分ライゲーションが完全に完了するように、即ち、反応中の全REの全認識
部位が切断され、認識部分へとライゲーションされるように、選択される。この
ようにして、分析中の配列から生成した断片は、その反応において、隣接するR
E認識部位の間にのみ存在する。内部にRE認識部位を含む断片は残存しない。
一つの認識反応において複数のREを使用することが可能である。一つの反応中
のREが過多であると、配列が過剰の頻度で切断され、分離手段によって明確に
分離することができない、10から数百塩基対という長さの短い断片を多く含む
圧縮された長さ分布が生じうる。例えば、ゲル電気泳動では、断片の長さが接近
しすぎている場合、断片は平均3bpよりも近接していてはいけない。また、R
Eが過多の場合、異なるサンプル配列から同じ長さ及び末端サブ配列を有する断
片が生じうる。最後に、断片標識を区別しようとする場合には、区別可能に標識
された付着末端を得ることができるREのみが使用される。これらを考慮するこ
とにより、一つの認識反応において最適に使用することができるREの数が限定
される。2個のREを使用することが好ましく、1個、3個、4個のREが次に
好ましい。ヒトcDNAサンプルの解析に好ましいREの対を6.10項に挙げ
る。
付加的なレベルのサンプル配列判別は、内部サブ配列(本明細書において“第
三標的サブ配列”と呼ぶ)の存在頻度を検出することにより可能となる。第三標
的サブ配列の有無は、コンピューターを用いた本発明の実験的分析法において、
さらに、二つの末端サブ配列及び断片長を同定し、この判別を行わなければ同一
の断片シグナルの由来をさらに判別する際に、使用することができる。
特異的第三内部サブ配列を含む断片は、このような断片を標識もしくは抑制す
ることにより、又はIIS型REを用いることにより、検出することができる。
第三内部サブ配列を有する断片を標識するためには、この標的サブ配列に結合す
る区別可能な標識を有するプローブを、検出の前、又は分離及び検出の前に、そ
の断片に付加する。検出時、この第三サブ配列を有する断片は、プローブ由来の
シグナル、好ましくは蛍光を生じる。このようなプローブは、標識PNA又はD
NAオリゴマーであってよい。短いDNAオリゴマーは、特異的なハイブリダイ
ゼーションを行うように、普遍的なヌクレオチド、又は天然のヌクレ
オチドの縮重セットを用いて伸長させる必要があることもある。第三サブ配列を
含む断片は、様々な方法により抑制することができる。該断片の不在は、抑制因
子が含まれていない認識反応を、抑制因子が含まれている反応と比較することに
より、決定される。第一に、PCR増幅を用いた態様において、PCR中のポリ
メラーゼ伸長を阻害する、この第三サブ配列とハイブリダイズするプローブを増
幅前に添加する。このサブ配列を含む配列は、せいぜい直線的にしか増幅されず
、従ってそのシグナルは抑制されるであろう。このようなプローブは、PNA又
は改変DNAオリゴマー(ddNTPという3’ヌクレオチドを有する)であっ
てよい。第二に、第三サブ配列がREにより認識される場合には、このREを、
対応する特異的プライマーを含まないRE−リガーゼ反応へと添加する。そのこ
とにより、第三サブ配列を含む断片は、一端にのみプライマーを有し、せいぜい
直線的にしか増幅されない。これらの態様はいずれも、配列を認識するため、又
は指数関数的なPCR増幅を阻害するための複数のプローブを使用することによ
り複数の内部配列に対して行うことが可能である。元のcDNA断片配列との結
合部の近傍でプライマーを切断するIIS型REは、最初のRE認識配列と連続
していない突起を生じる。このような突起の配列は、第三内部サブ配列として使
用しうる。
5.2.1.認識部分構造
本明細書においてアダプター又はリンカー・プライマー・オリゴマーとも呼ば
れる認識部分の構築は重要であり、個々の認識反応工程をさらに詳述する前に、
それを説明する。まず、その基本構造を説明し、次に種々のQEA(登録商標)
に適用可能ないくつかの増強を説明する。好ましい態様において、アダプターは
部分的二本鎖DNA(“dsDNA”)である。あるいは、好ましいDNAポリ
マーの性質と一致する性質を有する核酸のオリゴマーとしてアダプターを構築し
てもよい。別の増幅手段を用いた態様においては、好ましくは、アダプターは必
要に応じて増幅手段のためのプライマーとして機能する。
まず、基本的なアダプター構造に戻ると、図2Aは、ライゲーション反応に関
与するDNA分子を示している。ここでは、慣習に従い、上鎖の5’末端及び下
鎖の3’末端が左方となるよう示されている。dsDNA201は、好まし
くは4bpの5’突起202を生じるよう、左端がRE切断されているサンプル
cDNA配列の断片である。アダプターdsDNA209は、本発明により提供
される合成基質である。アダプター209の構造は、RE分解及びアダプター・
ライゲーションが好ましくは完全に進行し、不要な産物及び増幅の偏りが最少限
となり、かつ(必要であれば)特定の標識が切断末端へと結合するように選択さ
れる。アダプター209は、プライマーと呼ばれる鎖203、及びリンカーと呼
ばれる部分的相補鎖205を含む。プライマーはアダプターの長鎖としても知ら
れ、リンカーはアダプターの短鎖としても知られる。
リンカー即ち短鎖は、プライマーの3’末端が突起の5’末端に隣接するよう
に、REにより生じた突起及びプライマーへとハイブリダイズすることにより、
REによるcDNA切断部とプライマー即ち長鎖とを連結する。この配置におい
て、プライマーは効率的に切断dsDNAへとライゲーションされうる。従って
、リンカー205には、RE突起202に相補的なサブ配列206、及びプライ
マー203の3’末端204に相補的なサブ配列207が含まれる。サブ配列2
06は、最も好ましくは、RE突起と同一の長さである。サブ配列207は、好
ましくは8ヌクレオチド長であり、次に好ましくは4から12ヌクレオチド長で
あるが、適当なTmにおいて一つの認識反応で一つのプライマーにのみリンカー
が確実にハイブリダイズする限り、いかなる長さであってもよい。適当なTmは
、プライマー203の自己アニーリングTmより低いことが好ましい。そうする
ことにより、反応混合液中に存在するリンカーがハイブリダイズしPCRプライ
マーとして機能し、それにより偽の断片長が生じることがないよう、後続のPC
R増幅条件が制御されるようになる。好ましいTmは、約68℃より低い。また
、リンカー205は、好ましくは、dsDNA201の下鎖の3’へとライゲー
ションされないよう、5’末端のリン酸を欠如している。より重要なこととして
、末端のリン酸の欠如は、自己アニーリングしたアダプターのライゲーション及
びダイマー形成をも防ぐ。アダプターの自己ライゲーションは、切断cDNA断
片へのアダプター・ライゲーションと競合するため、不利である。さらに、アダ
プター・ダイマーは後続の増幅工程において増幅され、増幅ノイズと呼ばれる不
要な断片を生じる。末端のリン酸は、当技術分野にお
いて既知のホスファターゼを用い、次にその酵素を分離することにより、リンカ
ーから除去することができる。具体例としてのアルカリホスファターゼ反応のプ
ロトコルを6.3.4項に示す。
プライマー即ち長鎖203は、リンカー205の3’末端サブ配列207に相
補的な3’末端サブ配列204を有する。各REにより生じた突起が検出できる
ように、各認識反応において、各REにより生じた突起が特有のプライマーへと
ライゲーションされることが好ましい。従って、各認識反応において、プライマ
ー及びリンカーは、各プライマーがただ一つのリンカー205に相補的でありそ
れにハイブリダイズするように、かつ、REとハイブリダイズする各リンカーが
特有のプライマーとハイブリダイズするための特有の配列207を有しているよ
うに、選択されることが好ましい。プライマー/cDNA突起ライゲーション反
応が完全に進行するように、プライマー203は、cDNA末端202とライゲ
ーションされるとき、一つの認識反応中にいかなるRE認識配列も再生しないこ
とが好ましい。さらに、プライマー自己ライゲーションを防ぐため、プライマー
203は5’末端リン酸を有していないことが好ましい。増幅ノイズを最少限に
するために、プライマー203は元のサンプル混合液中に存在するいかなる配列
にもハイブリダイズしないことが好ましい。このようなハイブリダイゼーション
が起こると、後続のPCR工程により最初のREにより切断されたのではない不
要な断片が増幅されうる。プライマー203のTmは、50℃から80℃の範囲
で、高いことが好ましく、より好ましくは68℃より高い。このことにより、プ
ライマーのみが新たな鎖を開始し、リンカーはそれを開始せず、残存するリンカ
ーはPCRサイクル中を通して融解しているよう、後続のPCR増幅が制御され
る。例えば銀染色又はインターカレーションを起こす色素を用いた、ゲル電気泳
動による断片の分離及び検出の場合、プライマーは標識されていなくてもよい。
例えば、このTmは、好ましくは40〜60%、最も好ましくは55〜60%の
G+C含有量と、最も好ましくは24ヌクレオチド、好ましくは18から30ヌ
クレオチドの長さとの組み合わせを有するプライマーを使用することにより達成
されうる。プライマー203は、蛍光色素208で標識されていてもよい。しか
し、好ましくは複数の標識を同時
に区別することができる、いかなるDNA標識システムも、本発明において使用
可能である。一般的に、プライマー即ち長鎖は、好ましくは、特定の条件下で、
特に所望のTmにおいて、特異性が高く、ダイマー及びヘアピン構造を含まず、
かつ安定な二本鎖を形成することができるように、構築される。例えば、ナショ
ナル・バイオサイエンス社(National Biosciences,Inc)(Plymouth,MN
)のマッキントッシュ用OLIGO(登録商標)バージョン4.0のような、こ
れらの原理に従ったプライマー構築のためのソフトウェア・パッケージが入手可
能である。特に、Tmに関する公式は、OLIGO(登録商標)リファレンス・
マニュアルのEqn.I、2頁目に示されている。
図2Bは、上記の説明に従い構築された、アダプターの2つの具体例、及びそ
の成分であるプライマー及びリンカーを図示している。アダプター250は、R
E、BamHIに特異的であり、BamHIにより作成された5’突起に相補的
な3’末端を有している。アダプター251は、同様に、RE,HindIII
に特異的である。6.10項には、本発明に従い使用することができるアダプタ
ーが、より包括的に列挙されている。しかし、それらに限定されるわけではない
。本発明の合成オリゴヌクレオチドは全て、合成コストを最小限に抑えるため、
機能的役割を有しながら、可能な限り短いことが好ましい。図2Cに図示されて
いるさらに別の方法は、ヘアピンループ構造212中の一本鎖DNA自己ライゲ
ーションによるアダプターの構築である。ループ212のサブ配列は、リンカー
205及びプライマー203の対応するサブ配列に類似した構造を用いて構築さ
れる。ヘアピンループ211の配列は、例えば、C4からC10である。
3’突起を生成するREは、次に好ましく、異なるアダプター構造を必要とす
る。3’突起用の好ましい基本アダプター構造を図3Aに示す。dsDNA30
1は、3’突起302を生成するREにより切断されたサンプルcDNAの断片
である。アダプター309は、プライマー即ち長鎖304、及びリンカー即ち短
鎖305を含む。プライマー即ち長鎖304には、3’突起302に相補的で長
さが等しいサブ配列306、及びリンカー305に相補的なサブ配列307が含
まれる。また、区別可能にプライマー304を標識する標識308
を有していてもよい。5’突起用のアダプターの場合と同様に、RE分解及びラ
イゲーションの反応が完全に進行するように、プライマー304は、好ましくは
、自己ライゲーションを防止するため5’末端のリン酸を有さず、好ましくは、
プライマーがdsDNA301とライゲーションするとき、一つの認識反応中に
いかなるREの認識部位も形成されないような配列を有する。増幅ノイズを最少
限にするため、プライマー304は、最初のサンプル混合液中のいかなる配列と
もハイブリダイズしないことが好ましい。プライマー304のTmは、50℃か
ら80℃の範囲で、高いことが好ましく、より好ましくは68℃より高い。この
ことにより、プライマーのみが新たな鎖を開始し、リンカーはそれを開始しない
よう、後続のPCR増幅が制御される。例えば、このTmは、好ましくは40〜
60%、最も好ましくは55〜60%のG+C含有量を有し、最も好ましくは2
4ヌクレオチド、好ましくは18〜30ヌクレオチドのプライマー長を有するプ
ライマーを使用することにより達成されうる。反応中の各ブライマー304は、
区別可能な標識308を有していてもよい。該標識は、好ましくは、蛍光色素で
ある。
リンカー即ち短鎖305は、3’突起302に隣接する位置で、プライマー3
04のサブ配列307に相補的であり、それにハイブリダイズする。リンカー3
05は、最も好ましくは8ヌクレオチド長であり、次に好ましくは4〜16ヌク
レオチド長であり、自己ライゲーションを防止するため末端リン酸をもたない。
このリンカーはライゲーションの特異性及び活性を促進するのみで、5’の場合
のように、切断されたdsDNAへプライマー304を連結させることはない。
さらに、リンカー305のTmは、プライマー304の自己アニーリングTmより
低いことが好ましい。そうすることにより、反応混合液中に存在するリンカーが
ハイブリダイズしPCRプライマーとして機能し、それにより偽の断片長が生じ
ることがないよう、後続のPCR増幅条件が制御されるようになる。図3Bは、
RE、NlaIIIの場合のアダプターの具体例を、そのプライマー及びリンカ
ーと共に図示している。5’突起の場合と同様に、3’アダプターもまた、ヘア
ピンループ構造から構築しうる。
次に、いくつかのアダプター構造増強について説明する。これらの増強の使用
は、後記のプロトコルの説明において詳述する。一つの選択肢において、アダプ
ター・プライマー鎖は、複合標識部分に加えて、又はその代わりに、複合捕捉部
分を有していてもよい。該標識部分は、捕捉部分をその結合パートナーへと結合
させることにより、様々なクラスのRE/リガーゼ反応産物を分離する際に有利
である。許容される好ましい捕捉部分及び結合パートナーは、既に記載されてい
る。さらに、プライマーが複合捕捉部分を有している場合、特に、解離しにくい
ストレプトアビジン複合体を形成するビオチンを有している場合には、結合した
捕捉部分からの制御された放出を達成するために、プライマー中に放出手段を含
ませることが有利である。放出手段には、制御された方法で切断することができ
るサブ配列を、プライマー中に含ませることが含まれる。該サブ配列の一つの例
は、一つ又は複数のウラシル・ヌクレオチドである。この場合、ウラシルDNA
グリコシダーゼ(UDG)による分解、及びそれに続くアルカリpHでの糖バッ
クボーンの加水分解により、放出が起こる。該サブ配列の別の例は、サンプルの
配列中の、切断するとしても極めて稀にしか切断しないREが認識するサブ配列
である。ヒトcDNA配列の場合、この種類の好ましいREは、哺乳動物DNA
に、存在するとしても極めて稀にしか存在しない8bpの認識配列を有する、A
scIである。AscIは、さらに有利なことに、DNA分子の末端において活
性である。この場合、このRE、即ちAscIによる分解により鎖2351が放
出される。
他の増強において、アダプターは、ハイブリッド・プライマーから構築するこ
とができる。該ハイブリッド・プライマーは、断片の直接配列決定を促進するよ
う、又は解析中のDNAサンプルが由来する組織を用いたその場でのハイブリダ
イゼーションのためのRNAプローブの直接的な作成を促進するように設計され
る。直接配列決定用のハイブリッド・プライマーは、存在するプライマーの5’
末端へと、M13−21プライマー、M13逆プライマー、又は同等の配列をラ
イゲーションさせることにより構築される。このようなハイブリッド・アダプタ
ーにより作成された断片は、分離手段から除去され、増幅され、通常のシステム
を用いて配列決定される。このような配列情報は、既知の配列について配列決定
を確認するためにも、未知の配列について推定新規遺伝子を
単離するためにも使用することが可能である。RNAハイブリダイゼーション・
プローブの直接的な作成のためのハイブリッド・プライマーは、存在するプライ
マーの5’末端にファージT7プロモーターをライゲーションさせることにより
構築される。このようなハイブリッド・アダプターを用いて作成された断片は、
分離手段を用いて除去され、通常のシステムによりアンチセンスRNAへと転写
させることができる。このようなプローブば、目的のシグナルが正確にはどのよ
うな細胞型で発現しているのかを決定するための、DNAサンプルの起源の組織
を用いたその場でのハイブリダイゼーションに使用することが可能である。この
ようなハイブリッド・アダプターを、6.8項に例示する。
さらに別の増強においては、既に記載されているアダプターを使用するが、P
CRプライマー鎖には、フェイジング・プライマーとして作用するように、アダ
プター・プライマー鎖の3’に付加的なサブ配列が含まれる。即ち、最初のRE
標的認識サブ配列を越えて付加的なヌクレオチドを認識するため、PCR増幅反
応が使用される。図2Dは、このような選択的なフェイジング・プライマーを例
示している。図中、平滑末端化RE/リガーゼ反応後、PCR増幅サイクル直前
のサンプルdsDNA201が示されている。dsDNA201は、標的認識サ
ブ配列227を認識するREにより、221の位置で切断され、突起202を生
じており、アダプター・プライマー鎖203へとライゲーションされており、そ
して、72℃で10分間インキュベーションすることにより鎖220により平滑
末端を有する二本鎖へと完成されている。これに限定されないが、明確化するた
め述べると、RE認識サブ配列227は典型的には突起202を1bp越えて伸
長される。他の相対的な位置は、突起の長さ及び認識配列により決定される。左
側が5’末端となるよう図示された、選択的なPCRフェイジング・プライマー
222は、鎖203と同一の配列を有するサブ配列223、RE突起202と同
一の配列を有するサブ配列224、もし存在するならばRE認識サブ配列227
の残存部分からなる配列を有するサブ配列225、及びP個のヌクレオチドから
なるサブ配列226を含む。長さPは、好ましくは1から6であり、より好まし
くは1又は2のいずれかである。PCRプライミングのため、サブ配列223及
び224は、dsDNA201の対応す
るサブ配列にハイブリダイズする。サブ配列225は、認識サブ配列227の残
存部分、典型的には1bpにハイブリダイズする。サブ配列226は、対応する
部位228中の相補的ヌクレオチドを有する断片201にのみハイブリダイズす
る。Pが1である場合、PCRプライマー222は、PCR増幅のため、4個の
可能な断片201のうちの1個を選択し、Pが2である場合には、16個のうち
の1個を選択する。4(又は16)個のプライマー222を用いると、4(16
)個のアリコート又はRE/リガーゼ反応産物において、可能なヌクレオチド(
対)のうちの一つを有するそれぞれが、増幅のため、可能な断片201のうちの
一つを選択する。これらのプライマーは、フェイジング・プライマーと類似して
いる(1993年3月31日に公開された欧州特許出願第0 534 858
A1号)。
長さがPbpのサブ配列226を有するPCRプライマー222を使用するこ
との効果は、最初に認識されたRE標的サブ配列が、サブ配列226に相補的な
サブ配列と連結した最初のRE標的サブ配列からなる、有効な標的サブ配列へと
伸長されることである。それにより、RE態様に特徴的な特異性及び正確性を保
持しつつ、多くの付加標的サブ配列が認識されうる。例えば、4bpのサブ配列
を認識するREは、パリンドローム状である必要がない、有効な5又は6bpの
標的サブ配列を用いた、このような組み合わせ反応において使用することができ
る。6bpの配列を認識するREは、7又は8bpの配列を認識するため、組み
合わせ反応において使用することができる。このような有効な認識配列は、後記
のコンピューターを用いた設計及び解析の方法へと入力される。
さらに別の増強においては、付加的なサブ配列情報が、特異的に位置するII
S型RE認識サブ配列を有するプライマーを含むアダプターから作成され、その
後IIS型REによる分解及び作成された突起の配列決定が行われる。好ましい
態様において、IIS型認識サブ配列は、作成された突起が、アダプターがハイ
ブリダイズする末端を切断した最初のREの認識サブ配列に隣接するように配置
される。この態様において、効果的な標的サブ配列は、IIS型突起の配列と、
最初の認識配列とを連結することにより形成される。他の態様にお
いては、IIS型認識配列が、作成された突起が最初の認識配列と隣接しないよ
うに配置される。この場合には、突起の配列は、断片中の第三内部サブ配列とし
て使用される。いずれの場合にも、付加的に認識されたサブ配列は、断片の由来
配列を決定する能力を高めるためコンピューターを用いた実験的解析法において
使用される。この増強は、図17A〜Eに図示され、5.2.3項(“SEQ−
QEA(登録商標)態様”)に詳述されている。SEQ−QEA(登録商標)態
様において使用されるプライマーには、標識部分、捕捉部分、及び放出手段を含
む、増強の組み合わせが有利に含まれている。
さらに別の態様、及びQEA(登録商標)のRE/リガーゼ態様の改良を実施
するために、既に記載されたプライマー及びリンカーが、既に記載された態様の
組み合わせにより、そして当業者に既知の他の代替法により、増強されうること
は、当業者には明らかであろう。本発明は、本明細書に記載された態様と実質的
に同等のこれらの改変型を含む。
5.2.2.RE/リガーゼ法の工程
QEA(登録商標)の好ましいRE/リガーゼ態様の工程には、以下のような
工程が含まれる。第一に、一つの反応において、一つ又は複数のREによりcD
NAサンプルを切断し、そのREに対応するアダプターをハイブリダイズさせ、
そして切断末端にアダプターのプライマーをライゲーションさせる。第二に、必
要に応じて断片を増幅する。第三に、長さにより断片を分離し、断片の長さ及び
断片標的末端のサブ配列を検出する。必要に応じて、第一の工程の前に、6.3
項に記載の方法のような、当業者に周知の方法により、cDNAサンプルを合成
してもよい。選択的に、分離、検出の前に、不要なDNA断片又はRE/リガー
ゼ反応産物を除去する工程を、増幅工程の後に追加することにより、QEA(登
録商標)のシグナル対ノイズ比を増加させること、即ち、得られるシグナルの解
釈を単純化することが可能である。5’−QEA(登録商標)及びSEQ−QE
A(登録商標)として知られるものを含む、さらに別のRE/リガーゼ態様が記
載されている。
より詳細には、RE/リガーゼ態様は、合成前のcDNA、又はcDNA合成
の起源となる組織サンプルもしくはmRNAで開始する。cDNAを合成する
ときには、例えば6.3項の方法及び手段を使用することができる。QEA(登
録商標)では、ベクターへのクローニングは必要とされない。組織サンプルの場
合、最初の工程は、極めて慣習的な組織サンプルからのRNAの分離である。分
離されたRNAは、好ましくは、特定の細胞画分から分離された、ポリ(A)+
精製されたRNA、即ちmRNA、又は次に好ましくは全細胞RNAである。分
離の工程には、例えば、6.3.1項のプロトコルに従った、RNase抽出、
DNase処理、及びmRNA精製が含まれる。mRNAからの第一鎖及び第二
鎖cDNAの合成は、6.3.2項のプロトコルに従い行うことができ、次に好
ましくは6.3.4項のプロトコルに従い行うことができる。mRNAが少量の
場合、又ば起源mRNAの5’キャップ構造の外側の相補配列を含む全長cDN
Aを有することが有利である場合には、6.3.3項の合成プロトコル、又は機
能的に同等のプロトコルを使用することが好ましい。
どのように得られたとしても、QEA(登録商標)のRE/リガーゼ態様にお
いて使用されるcDNAは、末端のリン酸を有していないことが重要である。こ
れは、その後の断片の長さによる分離及び検出におけるノイズを最小限に抑える
ためである。ノイズは、REにより一端のみで切断され、もう一方は様々な長さ
のオリゴ(dT)テールにより終結している不要な断片が、指数関数的に増幅さ
れることにより引き起こされる。一端のみが切断された断片の平滑末端がライゲ
ーションを起こすと、2つの切断末端にプライマーがライゲーションされている
単一のdsDNA、即ち見かけの二重切断断片が形成されるため、そのような一
端のみが切断された断片が指数関数的に増幅されることにより、相当のバックグ
ラウンド・ノイズが生じうる。このような断片の長さは、cDNA合成の条件に
より変化し、ゲル電気泳動において拡散したバックグラウンド・ノイズを生じる
。このノイズは、正常に二重切断された断片に由来するシャープなバンドを不明
確なものにしてしまう。このバックグラウンドは、cDNAの完全性を破壊する
ことなく、最初にcDNAサンプルから全ての末端リン酸を除去することにより
、このような一端が切断されたcDNA断片の平滑末端ライゲーションを防止す
ることにより、除去することができる。このように、DNAサンプルの最終調製
工程は、必要に応じて、cDNAサンプルから
末端リン酸を除去することである。
このように、cDNAサンプルの最終調製工程は、必要に応じて、cDNAサ
ンプルから末端リン酸を除去することである。末端リン酸除去は、好ましくは、
熱不活化したホスファターゼを用いて行われる。ホスファターゼの活性は、好ま
しくは、アダプターと二重切断断片との目的とするライゲーションが阻害されな
いよう、RE分解及びアダプター・ライゲーションの工程の前に除去される。熱
不活化により、分離又は抽出の工程を行うことなくホスファターゼを除去するこ
とが可能となる。好ましいホスファターゼは、冷温生育性バレンツ海(北極)エ
ビ(cold living Barents Sea(arctic)shrimp)由来のもの(米国バイオケミ
カル社(U.S.Biochemical Corp.))(“シュリンプ・アルカリホスファター
ゼ”又は“SAP”)である。末端リン酸除去は、解析中のcDNAの各集団に
ついて一度だけ行う必要がある。他の態様において、ベーリンガー・マンハイム
(Indianapolis,IN)のウシ小腸アルカリホスファターゼのような、別のホス
ファターゼを、末端リン酸除去に使用することができる。熱不活化されていない
ものについては、フェノール・クロロホルム抽出などにより、RE/リガーゼ反
応の前にcDNAサンプルからホスファターゼを分離する工程が必要となる。
次に、調製されたcDNAを、それぞれ1ピコグラム(“pg”)から200
ナノグラム(“ng”)のcDNAを含むバッチへと分割し、各バッチを別々に
本方法のその後の工程により処理する。いずれのQEA(登録商標)モードを実
施するにも十分な数のバッチを作成する。好ましくは、ヒト組織における発現遺
伝子の大多数からの、遺伝子発現を解析するための組織モード実験では、約15
,000の異なるcDNA配列の存在を決定することが必要である。例えば、一
つのサンプルを約50バッチに分割し、各バッチについてRE/リガーゼ認識反
応を行い約200〜500の断片、より好ましくは10から1000bp長の2
50〜350の断片を生成させる。ここで、断片の大多数は、好ましくは、異な
る長さを有し、特有の一つのcDNA配列に由来している。好ましい組織モード
解析には、それぞれ約300のバンドを生成する約50のバッチが含まれる。質
問モード実験では、おそらく1から100までの、あるサブセットの発現遺伝子
のみを問題としているため、比較的少ない認識反応が使用され
る。一実験における認識反応の数は約1から10であり、約1から10のcDN
Aバッチが調製される。
cDNA調製の後は、サンプルcDNA配列のRE切断、及びサンプルcDN
A配列へのアダプター・ライゲーションが同時に行われる重要な工程である。調
製されたサンプルは、一つ又は複数のREにより切断される。より短い断片から
なる圧縮された長さ分布を回避し、かつ使用される全REに対して十分に区別可
能な標識が利用可能となるよう、RE及び関連するアダプターの数は好ましくは
限定される。あるいは、増幅された断片が関連する認識配列を有しないよう、R
Eを関連するアダプターなしで使用することが可能である。これらの配列の不在
は、特定のREで偶然にも同一の長さの断片を生じる遺伝子をさらに区別するた
めに利用される。
同時に発生するアダプター・ライゲーション及びRE切断のため、同一の反応
混合液(本明細書においてQlig混合液と呼ぶ)、RE、アダプター及びリガ
ーゼ酵素を同時に存在させる。反応液中のRE酵素の量は、好ましくは約10倍
ユニット過剰である。量が実質的に多い場合には、星状の活性(非特異的な切断
)が引き起こされるために好ましくなく、量が実質的に少ない場合には、低速で
部分的な分解が起こり、従って、サブ配列分布の同定が不完全で不正確なものと
なるため好ましくない。RE及び対応するアダプターは、前出の説明に従い選択
される。6.10項の表10には、REならびに対応するアダプター及びリンカ
ーの具体例が列挙されている。6.10.1項の表11には、ビオチン標識され
たプライマーの組み合わせの具体例が列挙されている。本方法は、10から37
℃の温度範囲において活性を有する全てのリガーゼ酵素に適用可能である。T4
DNAリガーゼが好ましいリガーゼである。他の態様において、クローン化さ
れたT4 DNAリガーゼ又はT4 RNAリガーゼを使用することも可能であ
る。さらに別の態様において、平滑末端のライゲーション活性が低い、エピセン
プレ(Epicenpre)(マディソン、ウィスコンシン州)のアンプリゲース(Amp
ligase)(登録商標)熱安定DNAリガーゼのような、熱安定リガーゼを使用す
ることが可能である。これらのリガーゼを用い、下記のようなRE−リガーゼ反
応用の基本的な熱プロフィールを反復的にサイクルさせる
ことにより、より完全なRE切断及びアダプター・ライゲーションが可能となる
。
Qlig混合液中には、当業者に既知の必要なバッファー、及びATPも含ま
れる。その後の増幅が自動的に進行するように、Qlig混合液中には過剰のプ
ライマーが含まれることが好ましい。好ましくは、プライマー及びリンカーは、
約20:1の比で存在し、1ngのcDNAが使用される場合、適当な全プライ
マー量は約20pmである。次に好ましくは、10:1の比である。また、ベタ
イン(Betaine)(シグマ・ケミカルズ社(Sigma Chemicals))が、Qli
g反応混合液中に存在することが好ましい。ベタインは、ライゲーション活性を
促進することにより、ほぼ同じ原濃度の断片からのシグナルの均一性を高めるこ
とが見いだされている。ベタインはまた、産物を増幅することが困難なPCR増
幅も改善する。
望ましくない物質を最小限にするために、RE/リガーゼ反応条件を最適化する
。既に説明されているように、cDNAサンプルからの末端燐酸塩の除去によって、
cDNA平滑末端の望ましくないライゲーションをも同時に防ぎ、結果として生じる
ダイマーのその後の対数増幅をも防ぐ。望ましくない物質のもう1つの種類は、
断片コンカテマー(concatamer)であり、これらは、切断されたcDNA断片の粘着性
末端がハイブリダイゼーションし、共にライゲートする時に形成されるものであ
る。断片コンカテマーは、望ましくないあらゆるコンカテマーを切断するために
、ライゲーションの間、制限酵素活性を維持することによって除去される。さら
には、ライゲートされたプライマーはそれ以上のRE切断を終了させるが、それは
、プライマーがRE認識サブ配列(subsequence)を再び作らないからである。従っ
てRE及びリガーゼ反応を、完全な消化及びアダプターライゲーションの方へと向
けることによって、コンカテマー形成を制限するためには、高いモル過剰のアダ
プターが好ましい。最後に、プライマー及びリンカーには末端燐酸塩が欠如して
いるので、望ましくないアダプターの自己ライゲーションが妨げられる(これは
、好ましくは燐酸塩を用いない合成によるものであり、これより好ましくはない
が、ホスファターゼでのこれの予備処理によるものでもある)。
完全な切断及びライゲーションには、RE/リガーゼ反応の温度プロフィールが
重要である。好ましいプロトコルは、いくつかの工程を含んでいる。第一工程は
、実質的に完全な切断を行なうのに十分な時間の間、最適なRE温度で、例えば37
℃で30分間実施される。用いられるリガーゼは、好ましくは第一工程の間中、活
性である。第二工程は、アダプターアニーリング及びプライマーライゲーション
に最適な温度、例えば16℃になるまで、−1℃/分での傾斜温度(ramp)で実施
される。第三工程は、切断された物質の実質的に完全なプライマーライゲーショ
ンを行なうが、これは例えば16℃で60分間実施される。用いられるREは、好まし
くはこの第三工程の間中、活性である。第四工程はまた、認識部位及び望ましく
ないライゲーション物質の完全な切断を行なうのに最適な活性を得るための温度
、例えば37℃で15分間実施される。第五工程は、Qlig酵素を熱不活性化するため
の工程であり、例えば65℃より上で実施される。節6.4.1.の好ましい単一管プロ
トコルにおいてのように、PCR増幅が直ちに行なわれることになるの
であれば、この第五工程は72℃で20分間行なわれ、次に記載される追加反応が実
施される。PCR増幅が直ちに行なわれないのであれば、Qlig反応の結果ば、節6.4
.5.のような、はるかに好ましくない多管プロトコルにおいてと同様、4℃に維
持される。この温度プロフィールは、サブ配列PCRプロフィールと共に、図16Dに
示されている。
これより好ましくないプロフィールは、前記温度プロトコルの最初の4工程の
反復サイクルである。すなわち、最適RE温度から、最適アニーリング及びライゲ
ーション温度まで、それから戻って最適RE温度までのサイクルである。追加の温
度サイクルは、さらにRE/リガーゼ反応を完成に至らせるような働きをする。こ
のプロフィールでは、熱安定リガーゼ酵素を用いるのが好ましい。制限酵素の大
部分は、通常の16℃のライゲーション温度において活性であり、これによって、
熱サイクルを用いずに望ましくないライゲーションを防ぐ。しかしながら交互最
適ライゲーション条件と最適RE条件とを含む温度プロフィールは、両方の酵素反
応を、ある一定の温度においての場合よりも迅速に進行させることができる。プ
ロフィールの例としては、37℃の最適RE温度から、−1℃/分の傾斜温度におけ
る16℃の最適アニーリング及びライゲーション温度までの間、ついで16℃の最適
ライゲーション温度まで、それから戻って37℃の最適RE温度までの周期的なサイ
クルがある。これらの温度サイクルを約2〜4回完了した後、RE及びリガーゼ酵
素は、65℃より上でで10分間の最終段階によって熱不活性化される。
これらの熱プロフィールの調節は容易であり、これらの熱プロフィールは、商
品として入手しうる、コンピュータ管理されたサーモサイクラー、例えばMJ Res
each(Watertown,MA)又はPerkin Elmer(Norwalk,CT)のものを使用して、自
動的に行なわれる。
Qligミックス及び反応温度プロフィールは、分析された配列混合物に存在する
すべてのRE認識位置の実質的に完全な切断、及びプライマーの実質的に完全なラ
イゲーションを行なって末端を切断するように設計されている。各プライマーは
、ある特定のRE切断末端に対する1つの反応において独特なものである。発生し
た断片は、隣接するRE認識位置によって制限される。この時、実質的に
どの断片も内部未消化部位を含んでいない。さらには最小限の望ましくない自己
ライゲーション物質及びコンカテマーが形成される。この発明は、実質的に完全
な切断及びライゲーションについて同じ効果を得ることができるものであれば、
その他の温度プロフィールにも適合しうる。これに代りうるプロフィールの例は
、節6.4.の添付実施例に記載されている。
RE/リガーゼ工程の後に、二重切断cDNA断片の増幅工程がある。PCRプロトコ
ルはこの発明の実施態様の例に記載されてはいるが、末端配列に基づいて増幅さ
れる断片を選ぶような増幅方法はすべて、この発明に適合しうる(前記参照)。
検出手段、あるいは単一分子検出手段でさえ、これらの手段の十分に高い感度が
あれば、増幅工程は全部を省くことができる。分子増幅はこの方法の定量的応答
を歪めることが多いので、このことは好ましい。
この発明に用いられるPCR増幅プロトコルは、最大限の特異性及び再生産性を
有するように設計されている。第一に、リンカーが実質的に融解したままであり
、DNA鎖を開始させることができない場合、PCR増幅によって、望ましくない物質
の生産がより少なくなる。これは、例えばリンカーのTmの近く又はそれ以上の温
度ですべての増幅工程を実施することによって行なわれる。第二に、増幅プライ
マー、一般に図2Aの鎖203(及び図3Aの304)は、好ましくは50℃以上、最も好ま
しくは68℃より上の高いTmを有することによって、高い増幅特異性のために設計
されており、ミスマッチを最小限にして特異ハイブリダイゼーションが確保され
る。これらはさらに、分析されるあらゆる本来の(native)cDNAとハイブリダイゼ
ーションされないように選ばれる。前記の位相性(phasing)プライマーは、PCR増
幅にも代替的に用いられるが、これらも同様な特性を有する。第三にPCR温度プ
ロフィールは、好ましくは特異性及び再生産性のために設計されている。高いア
ニーリング温度は、プライマーのハイブリダイゼーションミスを最小限にする。
延長時間を長くすると、より小さい断片に関するPCRの偏りが減少する。融解時
間を長くすると、高いG+C含有量に関連したPCR増幅の偏りが減少する。好まし
いPCR温度サイクルは、95℃で30秒、ついで57℃で1分、ついで72℃で2分であ
る。この好ましいPCR温度プロフィールは、図16Dに示されている。第四に、PCR
反応ミックスにベタインを含ませるのが好ましい。これは、
増幅が難しい物質の増幅を改良することが分かったからである。さらに偏りを減
少させるために、大きな増幅容積と、最小数の増幅サイクル、すなわち一般に10
〜30サイクルが好ましい。
増幅の特異性、収率、あるいは再生産性を上げるよう設計されたその他のあら
ゆる技術も、この方法に適用することができる。例えばこのような技術の1つは
、PCR反応に、dGTPの代りに7−デアザ−2'−dGTPを用いることである。これは
、G+Cが豊富な標的に対するPCR効率を高めることが証明されている(Mutter et
al.,1995,Nuc.Acid Res.23:1411-1418)。さらにもう1つの例として、こ
のような技術のもう1つのものは、反応混合物に、塩化テトラメチルアンモニウ
ムを添加することである。これはTmを上げる効果がある(Chevet et al.,1995,N
ucleic Acids Research 23(16):3343−3344)。
RE/リガーゼ反応生成物の多数の同一サンプル、例えば加工処理されたQligミ
ックスを、多数のPCR増幅で加工処理するのは有利であろう。多数の同一サンプ
ルを同数のサイクルで増幅することは、別々に増幅された各アリコートからのシ
グナルを比較することによって、信頼性と定量的応答をチェックするのに役立つ
。多数の同一サンプルを、増幅サイクルの数を次第に増して、例えば10サイクル
、15サイクル、20サイクルで増幅することは、次の点において好ましい。すなわ
ち比較的少数のサイクルでの増幅は、より定量的により優勢な断片を検出するこ
とができるが、一方で比較的多数のサイクルでの増幅は、より優勢でない断片を
、あまり定量的でなく検出することになるからである。
RE/リガーゼ反応と同じ反応管でPCR増幅加工を行なうのが好ましい。これは
、自動化を促進するからである。第一にPCR反応ミックスは、ここではQPCRミッ
クスと呼ばれているが、これは適切なDNAボリメラーゼであるdNTPと、PCR緩衝液
とから作られ、プライマー鎖はまったく含まない。QPCRミックス組成物の例は、
節6.4.の実施例に見られる。QPCRミックスを反応管に入れ、72℃の付近であるが
これより低い温度で融解するワックス層を、QPCRミックスの上に層状に積み重ね
る。Qligミックスをワックス層の上に載せ、前記の温度プロフィールに従って加
工処理する。これはワックスを融解させない。RE/リガーゼ反応が完了したら、
72℃で20分間、管をインキュベーションする。このインキュベー
ションによって、リンカーが断片から融解し、これによってワックス層が融解さ
れ、加工処理されたQligミックスとQPCRミックスとが結合され、最後にDNAポリ
メラーゼが断片を平滑末端dsDNAに至るまで完成することができる。このインキ
ュベーション後、いくつかのサイクルに対して好ましいプロトコルに従って、PC
R温度プロフィールが実施される。
好ましい単一管の実施態様において、QligミックスとQPCRミックスは、意図さ
れた工程より前には混ざり合わないことが重要である。ワックス層におけるヘヤ
ラインクラックによるわずかな混合でさえ、反応の汚染を生じることがある。こ
のような混ざり合いを防ぐために好ましいワックスは、パラフィンワックスとCh
illoutTM14ワックスとの、各々90:10の割合での混合物である。パラフィンは、
Fluka Chamical,Inc.(Ronkonkoma,N.Y.)からパラフィンワックスのカタログ番
号76243として入手しうる、58℃〜60℃で融解する高精製パラフィンワックスで
ある。Chillout 14液体ワックスは、MJ Researchから入手しうる低融解精製パラ
フィン油である。このワックス層は、次のようにして作られる。好ましいワック
スを管の側面部の上半分の上に融解させて、反応管に予めワックスを塗る。注意
深くこのワックス層を避けて、QPCRミックスを加える。ついで、管を75℃で2分
間インキュベーションして、QPCRミックスの表面上にワックス層を融解させる。
ついで管の温度を、最終温度25℃に達するまで2分毎に5℃ずつ下げて、このワ
ックス層を注意深く固化する。ついでQligミックスを、このワックス表面の上に
静かに加える。この単一管プロトコルは、約72℃で融解するようなその他のあま
り好ましくないワックス、例えばAmpliwaxビーズ(Perkin−Elmer,Norwalk,CT)
にも適用できる。さらにはその他のいわゆるPCR「ホットスタート」手順も用い
ることができる。例えば当初からポリメラーゼの活性を妨害するために感温抗体
(Invitrogen,CA)を用いる方法である。
あるいはまた、PCR増幅は別の管で実施されてもよい。この場合、QPCRミック
スは第二管で調製される。加工処理されたQligミックスの入っている第一管を、
72℃で約10分間インキュベーションして、断片からリンカーを融解させる。つい
でQligミックスのアリコートを、第二管でQPCRミックスと組合わせ、さらに10分
間72℃でのインキュベーションを行なうと、断片が平滑末端dsDNAに至る
まで完成される。このインキュベーションの後、PCR温度プロフィールが、いく
つかのサイクルに対して好ましいプロトコルに従って実施される。
増幅工程に続いて、長さによる分離及び断片検出の前に、任意の浄化及び分離
工程を実施することも有利であろう。これは、いくつかの望ましくないDNA鎖を
実質的に除去し、これによってQEATMシグナルのシグナル対ノイズの割合を改善
するため、あるいは反応生成物を実質的に様々な種類に分け、これによって、シ
グナルの曖昧さを取り除くことで、検出した断片パターンの解釈を単純化するた
めである。例えば直線増幅によって生じた未使用プライマー鎖及び一本鎖は、そ
の後の工程では望ましくない。これらの工程は、接合捕獲部分(conjugated cap
ture moieties)及び解放手段を含む前記プライマーエンハンスメントをベース
としている。
これらの任意工程の1つの実施態様であって、用いられる2つのプライマーの
うちの1つが接合捕獲部分を有するような実施態様において、QEATM反応生成物
はいくつかのカテゴリーに入る。捕獲部分がビオチンであるような場合、これら
のカテゴリーには次のものがある(これは非限定的なものとして記載されている
):
a)どの鎖もビオチン部分を有していないdsDNA断片;
b)接合ビオチン部分を有するただ1つの鎖を有するdsDNA断片;
c)両方の鎖と接合したビオチン部分を有するdsDNA分子断片;
d)接合ビオチンを含むか、又は含まない、望ましくないssDNA断片;
追加の方法工程は、増幅断片と、固体支持体に付着したストレプトアビジン、
好ましくはストレプトアビジン磁気ビーズとの接触工程、未結合DNAを除去する
ための非変性洗浄緩衝液でのビーズの洗浄工程、ついで変性負荷緩衝液(loading
buffer)でのビーズの再懸濁工程、及びビーズのこの緩衝液からの分離工程があ
る。ついで変性一本鎖を、分離及び検出工程に送る。
これらの工程の結果として、ビオチンを含まないカテゴリー「b」の鎖だけが
、分離及び検出のために負荷緩衝液において除去される。これにより種々のREに
よって両末端が切断され、かつ一本鎖汚染物質を含まない断片だけが分離され、
最小限のノイズで検出される。カテゴリー「a」の物質はビーズと結合されず、
非変性洗浄緩衝液において洗い流される。同様に、ビオチン部分を含まない「d
」の種類の物質も洗い流される。接合ビオチンを含む物質はすべて、洗浄後、ス
トレプトアビジンビーズによって保持される。変性負荷緩衝液は、ビーズに接着
したカテゴリー「b」及び「c」の物質を変性させるが、カテゴリー「c」の物
質の両方の鎖はビオチンと接合し、ビーズと接着したままである。同様に接合ビ
オチンを含む「d」の種類の物質は、ビーズによって保持される。
もう1つの実施態様において、「c」の種類の断片を回収するために、ビオチ
ン化プライマーは解放手段を含んでいてもよい。変性緩衝液における懸濁工程後
、分離及び検出のために、ビオチン化鎖を解放するために、解放手段、例えばUD
G又はAscIを用いることができる。以前に検出されたものに加えて、この第二分
離において検出された断片は、従って「c」の種類の物質を表わす。
当業者にはこの他の実施態様も明らかであろう。例えば2つ又はそれ以上の種
類の捕獲部分を、様々な種類の物質を分離するために単一反応において用いるこ
とができる。捕獲部分は、同様な分離を行なうために解放手段と結合されうる。
ラベル部分を捕獲部分と組合わせて、分離を確かめるか、あるいは複数の反応を
平行して行なうことができる。
この発明は、技術で知られている一本鎖分離及び物質濃縮のためのその他のあ
まり好ましくない手段にも適用される。例えば一本鎖は、一本鎖特異性エキソヌ
クレアーゼの使用によって除去することができる。Mung Beanエキソヌクレアー
ゼ、ExoI又はSlヌクレアーゼを用いることができるが、ExoIヌクレアーゼが好
ましい。その理由は、一本鎖に対する特異性が高いからである。Slヌクレアーゼ
が最も好ましくない。望ましくない鎖を除去するためのその他の方法には、ゲル
濾過及びアフィニティカラム分離と言ったアフィニティをベースとした方法があ
る。増幅物質は、エタノール沈殿又はカラム分離によって濃縮することができる
。
最後のQEATM工程は、増幅断片の長さによる分離、ついで断片長さ及び末端ラ
ベル(あるとすれば)の検出である。cDNAサンプルから切断された断片の長さは
一般に、数十bpからおそらくは1000bpまでの範囲に亙っている。好ましくは1000
塩基対配列において少なくとも3つの塩基対までの適切な長さへの分離を
含むあらゆる分離方法を用いることができる。この技術において知られているあ
らゆる適切な形状において、ゲル電気泳動を用いることが好ましい。
ゲル電気泳動は、3つ又はそれ以上の塩基対によって異なる別々の断片を分離
することができ、平均的な断片組成を知ることにより、また組成によって誘発さ
れた移動性の差を修正して、1bpまで長さの精度を得ることができる。好ましい
電気泳動装置は、分析用の遺伝子走査ソフトウエア(ABI)を用いたABI 377(Appli
ed Biosystems,Inc.)自動シークエンサーである。電気泳動は、反応生成物を負
荷緩衝液に懸濁することによって実施することができる。緩衝液は非変性的なも
のであってもよく、ここにおいてdsDNAはハイブリダイゼーションされたままで
あり、両方のプライマーのラベル(もしあれば)を含んでいる。緩衝液はまた変
性的なものであってもよく、ここにおいてdsDNAは一本鎖へと分離される。これ
らの鎖は一般に、共に移動すると予測されている(これは、鎖の組成、又は意味
を表わす(significant)鎖の第二構造において大きな平均差がない場合である)
。長さの分布は、様々な検出手段によって検出される。ラベルがまったく用いら
れない場合、例えばAg染料及び挿入ダイのような手段を用いることができる。
ここで、反応生成物を前記プロトコルに従っていくつかの種類に分け、各帯がそ
の標的末端サブ配列に関して明白に同定されうるようにするのが有利であろう。
フルオロクロムラベルの場合、多数のフルオロクロムラベルが一般にゲル中の単
一帯から分離されるので、いくつかのREでの認識反応か、その他の認識手段のど
ちらかの生成物、あるいはいくつかの別々の認識反応の生成物を、単一のレーン
で分析することができる。しかしながら1つの帯が多数のフルオロクロムラベル
からのシグナルを表わす場合、解釈はあいまいになることもある。すなわち、多
数のREで切断された1つの断片によるか、あるいは1つのREによって各々が切断
された多数の断片によるような帯である。この場合、反応生成物をいくつかの種
類に分けるのも有利であろう。
特異性REの実施態様に関する好ましいプロトコルは、節6.4.に詳細に記載され
ている。
5.2.3. SEQ-QEATM の実施態様
SEQ−QEATMは、節5.22.において既に記載されているQEATM方法のRE/リ
ガーゼの実施態様の、好ましい実施方法のもう1つの実施態様である。IIS型RE
に関する認識部位を含む、特別に構成されたプライマーを有するアダプターを用
いることによって、SEQ−QEATM方法では、当初から断片を切断するREの認識サブ
配列に隣接する追加4−6末端ヌクレオチドを同定することができる。従って効
率的な標的サブ配列は、当初RE認識サブ配列と、追加4−6末端ヌクレオチドの
コンカテマー化であり、従ってこれは長さが少なくとも8〜12ヌクレオチドであ
り、好ましくは長さが少なくとも10ヌクレオチドである。この比較的長い効率的
標的サブ配列は、次に、節5.4.(「QEATM分析及び設計方法」)に記載されてい
るQEATM分析に用いられる。これは、断片が由来する配列又は遺伝子を同定する
ための配列データベースの調査である。比較的長い効率的標的サブ配列は、これ
らの方法が断片について1つの独特の源配列を決定する能力を高める。
この節では、説明を簡単にするため、かつ非限定的なものにするため、最初に
IIS型REについて記載し、次に特別な構成のプライマーについて、次に、追加ヌ
クレオチドを認識するために用いられるSEQ−QEATM方法の追加方法工程について
記載するものとする。
IIS型REは、IIS型REの認識配列の外側の位置においてdsDNA分子を切断する制
限エンドヌクレアーゼ酵素である(Szybalski et al.,1991,Gene 100:13−26)。
図17Cは、認識サブ配列1720の外側において1708及び1709の位置で、dsDNA 1730
を切断するIIS型RE1731を示している。IIS型REは好ましくは、2つの鎖上で認識
配列から別々に離れた位置において2つのdsDNA鎖を切断することによって、突
出部を発生させる。認識サブ配列及び切断部位への移動は、REによって決定され
、かつこれは知られているものであるが、発生した突出部の配列は、dsDNA切断
によって決定され、特にIIS型認識区域の外側のそのヌクレオチド配列によって
決定されるが、これは最初からは知られていない。従ってSEQ−QEATMの実施態様
において、IIS型REによって発生した突出部は、配列が決定されている。節6.10.
1.の表17は、SEQ−QEATM方法への使用に適したいくつかのIIS型RE、及びこれら
に関連する特徴を列挙している。これには、両方のDNA鎖におけるこれらの認識
サブ配列と、これらの認識サブ配列から各々の切断部位への移動も含まれている
。特異性が高く、少なくとも4bpの突出部を発生させ
るREを用いるのが好ましい。これば当初から断片を切断するREの残りの認識サブ
配列に亙って広がるように、認識サブ配列を超えて少なくとも4又ば5bp移動す
るものである。FokI及びBbvIが、SEQ−QEATM方法にとって最も好ましいIIS型RE
である。
次に、ハイブリダイズされてSEQ−QEATM用のアダプターを形成する特別なプラ
イマー、及び必要であれば特別なリンカーは、節5.2.1において既に記載された
構造に加えて、IIS型認識サブ配列を有している。これは、IIS型酵素によって発
生した突出部が、当初標的末端サブ配列と隣接するように配列することが重要で
ある。この追加のサブ配列の配置は、図17A〜Eに関連して記載されている。これ
らの図面は、もう1つのSEQ−QEATMの実施態様における工程を示している。図17
Bは、dsDNA 1702を概略的に示している。これは、1つの末端においては第一RE
によって、もう1つの末端においては異なる第二当初REによって、もとのサンプ
ル配列から切断された断片である。この際、アダプターは十分にハイブリダイズ
されているが、これはプライマーライゲーションの前である。従ってリンカー鎖
1711は、プライマー鎖1712、及び第一REによって発生した5'突出部へハイブリダ
イズされており、ここではプライマー1712を、その次のライゲーションのために
、断片1702に隣接して固定させている。プライマー1712は、IIS型RE 1721に関す
る認識サブ配列1720を有している。リンカー1711は、認識サブ配列1720と重なり
合い、これとハイブリダイズする範囲まで、補足認識サブ配列1721を有している
。さらにはプライマー1712は、好ましくは接合標識部分1734、例えば蛍光FAM部
分を有している。同様にリンカー鎖1713は、プライマー鎖1714、及び第二REによ
って発生した5'突出部とハイブリダイズしている。プライマー1714は、好ましく
は接合補足部分1732、例えばビオチン部分、及びサブ配列1723によって表わされ
る解放手段を有している。
図17Bにおいて、ヌクレオチド1707のところで終了しているサブ配列1704は、
もとのサンプル配列の切断後に残っている第一REの認識サブ配列の部分である。
IIS型RE認識サブ配列の配置は、このサブ配列の長さによって決定される。図17A
は、サブ配列1704の長さが、どのようにして第一REの特性によって決定されるか
を概略的に示している。第一当初REは、次のような種類のものになるように
選ばれる。すなわち、サンプルdsDNA 1701の、ヌクレオチド1707で終了している
サブ配列1703を認識し、かつ認識サブ配列1703内にある位置1705において、dsDN
A 1701の2つの鎖を切断するものである。第一REが既知の標的サブ配列を認識す
るためには、サブ配列1703がすべて第一REによって決定され、不定ヌクレオチド
が無いようにすることが特に好ましい。この切断の結果、突出サブ配列1706が発
生し、これは既知の配列を有するが、その理由は、これの全部が、決定された認
識サブ配列1703の中にあるからである。従ってサブ配列1704は、認識サブ配列17
03の部分が第一REによって切断された断片上に残っているので、この長さは突出
部1706の長さより短くなく、一般的にはこれより長い。一般的にかつ好ましくは
、サブ配列1703の長さは6であり、パリンドローム的である。位置1705は、サブ
配列1703に対称的に配置され、突出部1706は長さが4である。従って認識サブ配
列1703の残りの部分1704の一般的な長さは、5である。
ここではIIS型認識配列1720の好ましい配置が、図17Cを参照して記載されてい
る。この図面は、dsDNA 1730を示しているが、これは、プライマーライゲーショ
ン工程、プライマー1712と1714でのPCR増幅工程、固体層基質へ付着した結合相
手1733への捕獲部分1732の結合工程、及びIIS型RE 1731のその認識サブ配列1720
への結合工程というその他の工程の後で、図17BのdsDNA 1730から由来するもの
である。サブ配列1722は、認識サブ配列1720と位置1705におけるプライマー1712
の末端との間のサブ配列である。IIS型REは、dsDNA 1730をヌクレオチド位置170
8及び1709において切断し、これによって、これらの位置間に、1つの例である5
'突出部1724を発生させるのが示されている。この突出部が当初標的末端サブ配
列1703の残りの部分1704と隣接するためには、ヌクレオチド1709は、サブ配列17
04を終了させるヌクレオチド1707に隣接している。従ってIIS型認識配列1720は
、好ましくはプライマー1712上に配置され、従ってサブ配列1704の長さ+サブ配
列1722の長さは、IIS型RE 1731の最も近くの切断距離に等しい。例えばFokIの場
合、最も近くの切断距離は9であり、サブ配列1704の典型的な長さは5であるの
で、その認識配列は、好ましくはプライマー1712の末端から5bpのところに位置
している。BbvIの場合、最も近くの切断距離は8であるので、その認識配列は好
ましくはプライマー1712の末端
から3bpのところに位置している。
最後に図17Dは、IIS型RE 1731による切断後のdsDNA 1730を概略的に示してい
る。dsDNAはヌクレオチド1708と1709との間、及びこれらを含む5'突出部1724を
有する。ここにおいてIIS型REは、図17CのdsDNA 1730を切断する。この突出部は
、以前のサブ配列1704と隣接しており、これは、切り取られた第一REの認識配列
の残りの部分である。これより短い鎖は、サブ配列1723によって表わされる解放
手段を含むプライマー1714を有している。dsDNA 1730は、捕獲部分1732と結合相
手1724を通じて固体相支持体に結合したままである。標識部分1734は、IIS型RE
1731による切断の完了を監視するために用いることができる。
この発明はまた、認識配列1720のその他のあまり好ましくない配置にも適合し
うる。認識配列1720が最適かつ好ましい距離以上に、プライマー1712の3'末端の
より近くに配置されるならば、IIS型RE 1731によって生じた突出部は、第一REの
認識サブ配列1703と隣接せず、隣接した効率的標的サブ配列は発生しない。この
場合、場合によっては、IIS型RE発生突出部の決定された配列は、QEATM実験分析
方法において第三内部サブ配列情報として用いることができ、必要であればさら
に断片1702の源配列を決定することができる。認識配列1720が、最適かつ好まし
い距離以上に、切断されたプライマーの3'末端からより遠くに配置されるならば
、IIS型REによって生じた突出部は、第一REの認識サブ配列1703と重なり合う。
この場合、現に隣接している効率的標的サブ配列の長さは、IIS型突出部の長さ
と第一RE認識サブ配列の長さとの合計より短い。これによって、効率的標的末端
サブ配列情報は失われる。認識配列1710が、最も遠い切断距離以上に、3'末端か
らより遠くに配置される場合、追加情報はまったく得られない。
プライマー1714はまた、いくつかの追加構造を有している。第一にプライマー
1714は、その5'末端の近くにあるか、又はこれと接合している捕獲部分1732を有
している。ビオチン/ストレプトアビジンが、好ましい捕獲部分/結合相手ペア
であり、これらは次の記載において用いられてはいるが、この発明に限定される
わけではない。第二に、サブ配列1723として表わされる解放手段を有している。
前記のように、この解放手段によって、図17Dの鎖1735の捕獲部分/結
合相手複合体からの制御解放が可能になる。このもう1つの方法は、このような
あらゆる制御解放手段に適合している。これは、サブ配列1723が、1つ又はそれ
以上のウラシルヌクレオチドである場合、及びこれがサンプル例えばAscIの配列
において、まったくではないにせよ、極端にまれにしか切断しないREの認識サブ
配列である場合も含んでいる。解放手段は、ビオチン−ストレプトアビジンの場
合に特に役に立つ。これは引き離すのが難しい複合体を形成するものであるから
である。
節6.10.1の表18は、SEQ−QEATMの好ましい実施に関するプライマー、リンカ
ー、及び組合わされたREの例を列挙している。この好ましい実施においては、隣
接する効率的標的末端サブ配列が形成される。この記載は、5’IIS型発生突出部
の発生を示している。プライマーは同様に、IIS型を用いて、あまり好ましくな
い3'突出部を発生させるように構成されていてもよい。このIIS型は、最も近い
切断距離が、5'鎖の上ではなく、3'鎖の上にあるものである。
最後にここで、SEQ−QEATMの方法工程を記載する。第一にSEQ−QEATMは、前記
の特別なプライマー及びリンカーを用いて、QEATMのRE/リガーゼの実施態様を
実施すること、ついで第二に、SEQ−QEATMに独特ないくつかの追加工程を実施す
ることが含まれる。図17B〜Eは、SEQ−QEATM方法における様々な工程を示して
いる。図17Bは、プライマーライゲーションの直前に2つの異なるREによって消
化されたサンプル配列からの断片を示している。図17Cは、プライマーライゲー
ション、鎖平滑末端、及びPCR増幅後のサンプル配列を示している。これらのQEATM
工程は、好ましくは節5.2.2に記載された実施態様に従って実施されるが、そ
の代りにRE/リガーゼ実施態様によって実施することもできる。SEQ−QEATMに独
特な追加工程には、まず第一に、増幅断片を固体相支持体に結合させる工程(こ
れも図17Cに示されている)、第二に、結合断片を洗浄する工程、第三に、用い
られたプライマー1712に対応するIIS型REによって結合断片を消化する工程が含
まれる。IIS型消化は好ましくは、完全な消化を行なうのに適した反応条件で実
施される。この完全な消化は、結合され、消化された配列を洗浄した後、任意の
標識部分1734の不存在を確認することによってチェックすることができる。図17
Dは、IIS型REによる完全な消化後に残っているdsDNA断片1730を示
している。IIS型消化の前に、結合された増幅RE/リガーゼ反応生成物のアリコ
ートを変性させ、標識された5'鎖を含む上澄み液を、長さに従って、例えばゲル
電気泳動によって分け、種々のREによって二重切断された各断片の長さを決定す
る。
次のSEQ−QEATM追加工程は、突出部1724の配列決定である。これはこの技術に
おいて知られたあらゆる方法で実施することができる。より少ない断片量に適し
た好ましい実施態様において、ここで位相性QEATM方法と呼ばれているもう1つ
の方法は、この突出部の配列決定のために用いることができる。位相性QEATMは
、RE/リガーゼ反応が、短い突出部、この場合はIIS型発生突出部を認識する正
確な配列特異性に依存するものである。図17Eは、この実施態様の第一工程を示
している。この実施態様では、標識部分1753を有するプライマー1751とリンカー
1750とから構成されるQEATM方法アダプターが、固体相支持体に結合したIIS型消
化断片1730における突出部1724とハイブリダイズされている。単なる例にすぎな
いが、ここでは突出部1724は4bpの長さのものとして示されている。この実施態
様において、特別な位相性リンカーが用いられる。突出部1724の各ヌクレオチド
位置、例えば位置1754の場合、リンカー1750の4つのプールが調製される。各プ
ールにおけるリンカーはすべて、1つの固定されたヌクレオチド、すなわちA、
T、C、又はGのどれか1つを、その位置、例えば位置1755に有しているが、す
べての組合わせにおけるランダムヌクレオチドが、その他の3つの位置に存在す
る。突出部の各ヌクレオチド位置において、4つのRE/リガーゼ反応が、QEATM
プロトコルに従って実施される。1つの反応には、4つの対応するプールの1つ
からのリンカーが用いられる。1つのプールだけから来るリンカー、すなわち位
置1754において突出部1724を補足するヌクレオチドを有するものは、ミスを伴な
わずにハイブリダイズし、これらのリンカーだけが、プライマー1751の断片1730
の5'鎖へのライゲーションを引起こすことができる。4つのRE/リガーゼ反応の
結果生じたものが変性され、長さに従って分けられる場合、4つの反応のうちの
1つの反応だけが、断片1730の長さに対応する長さにおいて標識された物質を生
じうる。これはすなわち突出部1724の位置1754を補足するリンカーでの反応であ
る。これによって、突出部1724の各ヌクレオチド位置
に対して4つのRE/リガーゼ反応を実施することによって、この突出部の配列決
定を行なうことができる。場合によっては、これら4つのRE/リガーゼ反応の生
成物は、さらにPCR増幅されてもよい。もう1つのオプションとして、リンカー1
750が、サブ配列1752において固定ヌクレオチドにのみ関連したサブ配列1756を
含んでいる場合、及びこれらの独特のサブ配列を補足する4つの別々にかつ区別
可能に標識されたプライマー1751が用いられる場合、1つの突出部位置について
の4つのRE/リガーゼ反応は、すべて同時に1つの反応管において実施すること
ができる。この突出部配列決定のもう1つの実施態様の場合、解放手段1723は、
プライマー1714から省くことができる。
もう1つの実施態様において、5'突出部の配列決定は、標準サンガー反応によ
って実施することができる。従って鎖1735は、DNAポリメラーゼによって標識ddN
TPの存在下に比較的高い濃度においてdNTPまで伸長されて、短い4−6bp伸長へ
の頻繁な組込みを行なう。一部伸長された鎖1735は解放されるが、これは、断片
1730を変性し、洗浄し、ついで解放手段1723が固体相支持体に結合した捕獲部分
から鎖1735を解放することができるようにすることによってなされる。この解放
され、一部伸長された鎖は、ついで長さによって例えばゲル電気泳動によって分
けられ、ddNTPを終了させる鎖が、この断片に関して以前に見られた長さのとこ
ろにおいて観察される。このようにして、各断片の4−6bp突出部1724は、速や
かに配列決定することができる。
効率的標識サブ配列情報は、第一REの認識サブ配列の配列へ、IIS型突出部の
配列をコンカテマー化することによって形成され、ついでQEATM実験分析方法に
インプットされ、これは、問題の断片源を決定するために、長い標識サブ配列と
して用いられる。この比較的長い効率的標識サブ配列情報によって、好ましくは
正確かつ独特なサンプル配列同定が可能になる。
5.2.4. 代替の5'-QEATMRE実施態様
この発明のQEATM実施態様において、認識反応によって生じたサンプルから来
る核酸の1つ又はそれ以上の断片が、明確な長さを有するものであること、すな
わち各断片の長さが核酸の配列にのみ依存しており、実験条件、例えば核酸の合
成条件によるものではないということが重要である。さらには、断片の長さは、
サンプルの核酸のヌクレオチド配列から正確に断定できるということが、節5.4
の実験分析及び設計方法にとって重要である。好ましいQEATMのRE/リガーゼ実
施態様において、これらの目標は、主として、1つ又はそれ以上のREによって両
末端が二重切断された断片からのシグナルを選ぶことによって達成される。隣接
するRE認識サブ配列間のヌクレオチド距離は、サンプルからの核酸の配列によっ
てのみ決定される。同様に、記載されているその他の方法及び延長部は、核酸配
列にのみ依存する追加のシグナル情報を発生させる。これらの実施態様において
、核酸例えばcDNA合成条件は、従って、好ましくはこれらが、インプットされた
mRNAを適切に表わすという点において、間接的重要性があるだけである。
その他のRE/リガーゼ実施態様は、核酸の断片からのシグナルを利用している
。これらの断片は、1つの末端がREによってシングル切断されているだけである
が、それにもかかわらずヌクレオチド配列にのみ依存して明確な長さを有する。
これは、もう一方の末端を固定する特別なcDNA合成条件があるからである。従っ
てこれらの実施態様については、cDNA合成条件は次の点において直接的重要性を
有する。すなわち、これらの実施態様は、特別な条件に従って合成されたcDNAの
場合にのみ用いることができるという点においてである。一般にこれらの条件は
、cDNAが既知の関係において開始されるか、あるいは終了することを保証する。
このことはここでは、インプットmRNA上の一般的な目印に「アンカーされた」と
呼ばれている。特に好ましいアンカーの目印は、インプットmRNAの3'末端に存在
するポリ(A)+尾部、又はインプットmRNAの5'末端に存在するキャップである
。例えば源mRNAの5'キャップに対して固定関係にあるこれらの5'末端において終
了し、単一REの最も近い認識サブ配列においてその3'末端が切断されているcDNA
断片は、明確な長さを有しており、QEATMシグナルを発生させる。これはサンプ
ルにおける源核酸を決定するのに用いることができる。同様に、源mRNAに存在す
るポリ(A)+尾部の5'末端に対して固定関係にあるこれらの3'末端で終了し、
単一REの最も近い認識配列においてその5'末端が切断されているcDNA断片は、明
確な長さを有しており、QEATMシグナルを発生させる。これもサンプルにおける
源核酸を決定するのに用いることができる。
まず5'アンカーcDNAの場合を考えると、このようなcDNAは、インプットmRNA上
の手がつけられていない5'キャップの存在を必要とするプロトコルによって、合
成することができる。このような好ましいプロトコルの1つの例が、節6.3.3に
記載されている。このプロトコルは、RNAリガーゼの使用に依存しているが、こ
れは、5'キャップに隣接するヌクレオチドにおいて源mRNAへ、DNA−RNAキメラを
ライゲートするものである。このキメラは、キメラの3'末端においてリボヌクレ
オチドトリプレットGGAへの第一DNAサブ配列5'を含んでいる。DNA−RNAキメラの
RNA成分は、好ましくはGGAであるが、源mRNAへキメラの選ばれたリガーゼによる
効率的ライゲーションを促進するものであれば、あらゆるRNAサブ配列を用いる
ことができる。DNAオリゴヌクレオチド成分はあとでプライマーとして用いられ
、ここでは「5'−キャップ−プライマー」オリゴヌクレオチドと呼ばれている。
このライゲーションは、アルカリホスファターゼでインプットmRNAを脱燐酸化し
、ついで5'−キャップを酸ピロホスファターゼ、好ましくはタバコ酸ピロホフフ
ァターゼで開裂することによって行なわれる。この際、ライゲーションに必要な
5'−燐酸塩を、5'−キャップを有するmRNA上にのみに残す。ライゲーション工程
の間、過剰のプライマーは、インプットmRNAの自己ライゲーションを妨げるため
に用いられる。好ましいRNAリガーゼは、T4 RNAリガーゼである。ついで第一鎖
合成は、第一DNAサブ配列を含む第一DNAプライマーを用いて実施される。従って
すべてのcDNAは、5'−キャップを有するインプットmRNAから生じる。ついで、こ
の技術で知られている第二鎖プライマーを用いて、第二鎖合成を実施する。好ま
しくは第二鎖プライマーは、混合されたか、あるいは別々のプールの3つの第二
鎖プライマーであり、これらの各々は、この技術で知られているような、3オリ
ゴ(dT)1−ヌクレオチド位相性プライマーの1つへの第二DNAサブ配列5'を含
んでいる(Liang et al.,1994,Nuc.Acid Res.22:5763−5764)。あるいはまた、こ
の技術で知られているその他のプライマーを用いることもできる。これには単一
オリゴ(dT)プライマー、配列特異性プライマー、あるいはランダムプライマー
がある。少量のインプットmRNAに対して、第一DNAプライマー、及び第二DNA配列
を含む第二DNAプライマーが、合成cDNAを増幅するためのPCR反応に用いることが
できる。このQEATM実施態様は、5'末端を5'mRNAキ
ャップに対して固定関係にアンカーして、cDNAを製造するために、この技術で知
られたその他の方法にも適用しうる。例えばCap FinderTMPCR cDNA Library Con
struction Kit Clonetech(Palo Alto,CA)である。同様にSchmidt et.al.1996 Nu
c.Acids.Res.24:1789−1791参照。
第一及び第二DNAプライマー配列は、好ましくはいくつかのガイドラインに従
って選ばれる。第一にこれらは、cDNAサンプル核酸からのあらゆるPCR生成物を
、これら自体で発生させないように選ばれる。第二に、これらは、非常に切迫し
た条件下にハイブリダイズさせるのに十分な長さ及び平均塩基含有量(約60%
G+C)を有するものである。第三に、これらは意味を表わす第二構造を有して
いない。最後にこれらは、その後のクローン化又は発現を促進するために、RE認
識部位、イニシエイター等を含んだものであってもよい。第一及び第二プライマ
ーの例は節6.3.3に記載されている。このようなガイドラインに従うプライマー
構成のためのソフトウエアパッケージを購入することができる。これの例の1つ
は、OLIGOTMVersion4.0 For Macintosh from National Biosciences,Inc.(Plymo
uth,MN)である。
実施例の5'アンカープロトコルに従って合成されたcDNAがあるので、この5'−
QEATM実施態様は、任意の浄化及び分離工程を含む、節5.2.2の一般的な方法に従
って実施される。特にQPCRミックスは、前記のように調製される。Qligミックス
は、断片を切断するのに選ばれた1つのRE及びプライマー過剰の組合わされたア
ダプターを含んでいる。これらのプライマーば好ましくは標識され、最も好まし
くは接合捕獲部分を有していない。同様に、PCR増幅に対して十分な量で、余分
のプライマーがQligミックスに含まれている。これは第一DNAプライマーであり
、すなわち接合ビオチン部分又はその他の捕獲部分と共に、ここで合成されたcD
NAの5'末端に現われているキメラのDNA部分である。RE/リガーゼ反応及びその
次のPCR増幅は、前記のように実施され、その結果次の種類の断片となる。第一
に、選ばれたREによってシングル切断された断片がある。これらは、第一DNAプ
ライマーの存在のために対数的に増幅され、かつこれらの5'末端にビオチン標識
された第一DNAプライマーを有している。第二に、ビオチン標識を含まない、選
ばれたREによって二重切断された対数的に増幅された断片があ
る。第三に、直線的に増幅され、標識されず、シングル切断された断片があって
もよい。これらの反応生成物と、ストレプトアビジンビーズとを接触させて洗浄
した後、第一の種類の断片だけを保持する。すなわち5'末端に隣接したシングル
切断された断片である。変性負荷緩衝液中にビーズを再懸濁させた時、このよう
な断片からの変性一本鎖だけが、分離及び検出工程後にシグナルを発生させる。
これらのシグナルは明確な長さを有する。その理由は、5'末端に最も近いRE認識
部位が、核酸の配列によってのみ決定されるからである。
3’固定cDNAのあまり好適でない場合に着手すると、このようなcDNA
は位相性プライマーを利用する技術で知られたプロトコルで合成できる。このよ
うな位相性プライマーは最初のDNAサブ配列からなり、それは既述のプライマ
ー指針、一つのヌクレオチド位相性プライマーサブ配列の三個のオリゴ(dT)
の一つへ5’、によって構築される(Liang et al.,1994)。6.3.3節
の配列MBTA、MBTC、及びMBTGはこのようなプライマーの典型である
。RE/リガーゼ及びPCR増幅反応はは、Qlig ミックスで使用される外
部プライマーが接合ビオチン及び他の捕捉部分により先行のcDNA合成で使用
した最初のDNAサブ配列であることを除き、5’−QEATM実施態様のプロト
コルによって行われる。プロトコルの完了後、信号は3’末端に隣接する選ばれ
たREにより断片切取りからだけ発生する。3’末端に最近接のRE認識部位は
核酸の配列によってのみ決定されるので、これらの信号は有限の長さを有する。
この節のプロトコルによる単独に切断した断片から発生した信号は、特定の信
号のサンプル核酸源を決定するために、節5.4のコンピュータ実行実験分析法
によって使用できる。分析法は5’又は3’末端cDNA配列が標的末端配列の
一つであるために、コンピュータ技術に熟練した人に明白である方法で最小限の
適用を必要とする。この適用は、一つの標的末端サブ配列が必要とする3’又は
5’末端である信号に単に特異的に標識することを含んで、又はコンピュータ処
理に先立つデータベースからの核酸配列入力にこれらの人工配列に適当で連結す
るように3’又は5’末端を表す人工的又は天然には生じない標的サブ配列を発
生した信号に含むことによって、いくつかの方法で行うことができる。コンピュ
ータ実行実験計画法への同様な最少適用は単独に切断した断片を発生する実験を
創出し、最適化するために行うことができる。
この節、特に5’−QEATMに記載した実施態様はここに記載のQEATM実施
態様と組合わせて実行できる。このような組合せがいかにして実行できるかは当
業者には明白であろう。特異的に、cDNAの末端から有効な標的サブ配列の距
離に関する情報に沿って単独に切断した末端に関するより長い有効標的サブ配列
情報を含む信号を得るために、5’−QEATMとSEQ−QEMTMを組合わせる
ことは有益である。
5.2.5. 更なる代替のRE実施態様
この節の実施態様は、接合捕捉部分を有するプライマーによる第一及び第二鎖
合成のいずれかから、又はこのようなプライマーによるcDNAのPCR増幅か
ら恐らく得られる、接合捕捉部分とcDNAを利用することで少なくとも部分的
に望ましくないRE/リガーゼ反応生成物を除去する。好適な捕捉部分はビオチ
ンで、それに対応する結合相手は固体支持体、好ましくは磁気ビーズに付けられ
たストレプトアビジンである。これらの実施態様は他の捕捉部分及び対応する結
合相手に適用可能である。
十分に敏感な検出手段と共に第一QEATM実施態様はPCR増幅工程を有利に
最少にし、あるいは共に除去できる。PCR増幅は、断片長、平均塩基組成、及
び二次構造のような因子に依存する、技術的によく知られた非直線的応答を不利
益に有する。定量的応答を改善するために、PCR増幅工程を除去するか、ある
いは少なくともPCR循環の数を最少にすることが好ましい。ついで出力信号強
度は、その信号を発生する入力核酸の存在率にほとんど直線的に対応する。
既述のRE/リガーゼ実施態様では、増幅工程は、関心のある断片からの信号
を増幅すること、及び同時に一定の配列依存性長さ無しの望ましくない断片から
の希釈することの両方に役立つ。例えば、節5.2.2.のプロトコルで、RE
により二重に切断され、アダプタに結合された断片は指数的に増幅されるが、R
Eにより単独に切断された望ましくない断片は最良に直線的に増幅される。増幅
の10周期の後、二重に切断された断片は1000倍増幅されるが、単独で切断された
断片は10倍増幅されるので、1%又はそれ以上の相対的存在率のサンプル核酸か
らの断片は背景の雑音の上に検出できるが、1%又はそれ以下の相対的存在
率のサンプル核酸からの断片は望ましくない背景中に消失できる。一層の増幅循
環はより大きい感度及び稀な配列からの稀な断片を観察するためのより大きい能
力の両方を可能にする。
さらに敏感な検出手段は観察可能な信号を発生するために増幅に対する要求を
減少する。標準蛍光検出手段の場合に、蛍光色素(約105分子)の6×10-18
モルの極小が検出のために必要である。1グラムのcDNAは約10-6モルの転
写物を含むので、mRNAのマイクログラム量から少なくとも1%相対的水準ま
で転写物を検出することが可能である。より大きいmRNA量で、比例的に稀な
転写物が検出可能である。感度増加の標識化及び検出案はより少ないmRNAの
使用を可能にする。感度増加のこのような案は、Ju et al.,1995,Fluorescent
energy tranfer dye−labeled primers for DNA sequencing and analysis、Pr
oc.Natl.Acad.Sci.USA 92:4371−4351に記載される。可能な単一分子検出
手段は現存する蛍光手段よりも約105倍敏感である(Eigen et al.,1994,Pro
c.Natl Acad.Sci.USA 91:5740-5747)。
増幅工程を最少にするか又は除去するために、この節に記載された最初の実施
態様は、関心のある二重に切断された断片から望ましくない単独に切断された断
片を除去うするために捕捉部分を用いることにより望ましくない信号を希釈する
ための増幅の必要性を最少にする。節5.2.2.のプロトコルでは、二重に切
断された断片だけが入力核酸の配列に依存するだけの一定の長さを有する。単独
に切断された断片はcDNA合成条件に依存して、非診断的長さを有する。この
プロトコルでは、PCR増幅は検出に十分な信号強度を発生するために任意に使
用できる。既述のプロトコルで発生した背景雑音を最少にすることは必要でない
。このプロトコルの工程は、捕捉部分、cDNAの環状化、REによる切断、及
びアダプタへの連結反応を用いるcDNAの合成からなる。単独に切断された末
端はついで捕捉部分の結合相手が固定される固相と反応生成物を接触して除去さ
れる。
図4A、4B、及び4Cはこの別のプロトコルを図解し、それは好ましくはR
E/リガーゼ反応生成物から単独に切断した3’及び5’cDNA末端の直接除
去のための捕捉部分としてビオチンを使用する。cDNA第一鎖は、例えば、チ
ミジンヌクレオチドに結合したビオチン分子と共にオリゴ(dT)プライマーを
用いる、節6.3.3の方法によって合成される。例えば、このようなプライマ
ーは、ほぼmに等しいnを有し、及び十分に大きい、約12から20までのn+
mを有する、TnT(ビオチン)Tmであるので、プライマーはmRNAのポリ(
A)尾部に確実にハイブリダイゼーションするだろう。ランダム六量体のような
、他のビオチン標識化プライマーも使用されるだろう。二重鎖cDNAはついで
節6.3.3によって合成される。この実施態様では、末端リン酸は保持される
。図4Aはこのような末端407及び408を有するcDNA401、ポリ(dA)配列4
02、付けられたビオチン404を有するオリゴ(dT)プライマー403を図解する。
サブ配列405はRE1に対する認識配列であり;サブ配列406はRE2に対する認識
配列である。断片は409はこれらの隣接RE認識配列で定義されるcDNA配列
である。断片423及び424は、サブ配列405及び406における開裂:RIから生じる
単独切断断片である。
次に、cDNAは循環に結合される。例えば、T4DNAリガーゼを用いる連
結反応は十分に希釈な条件下で行われるので、支配的に分子内の連結反応は分子
間の、鎖状体形成連結反応の最少だけで、cDNAを環状化して生じる。環状化
対鎖状体を選好する反応条件は、Maniatis,1982,Molecular Cloning A Laborato
ry Manual,pp.124−125,286−288,Cold Spring Harbor,NYに記載される。
約1μg/mlより下のDNA濃度は環状化を選好するのに適当であることが分
かった。必要ならば、鎖状体はゲル電気泳動を用いる寸法分離により環状化した
単独分子から分離できる。図4Bは環状化したcDNAを図解する。平滑断端連
結反応は末端407及び408の間に生じた。
ついで、環状化された、ビオチン標識された、cDNAはREで切断され、各
特有RE切断に対して独自に認識し、恐らく独自に標識されたアダプタに連結さ
れる。RE/リガーゼ工程は上記節、例えば節5.2.2に記載された方法で行
われるので、RE消化及びプライマー連結反応は鎖状体及び他の望ましくない連
結反応生成物の最少の生成で完了まで進行する。次に、望ましくない単独切断末
端は反応生成物をストレプトアビジン又はアビジン磁気ビーズに接触することに
より除去され、各末端に連結したRE特異性認識配列を有する二重切断断片だけ
を残す。図4Cはこれらの工程を図解する。配列405及び406はRE1及びRE2に
よりそれぞれ切断され、RE1及びRE2による切断に特異的なアダプタ421及び4
22はそれぞれオーバーハング上へ連結される。それによって、断片409は環状化
したcDNAから離脱され、アダプタ421及び422はそれに連結される。環状化し
たcDNAの残りの配列は連結アダプタ421及び422を有する単独切断末端423及
び424からなる。両方の単独切断末端は結合したビオチン404を有するプライマー
配列403に接続される。除去はストレプトアビジン又は恐らく磁気ビーズからな
る基質425に固定されるアビジン420と接触して達成される。今や単独切断末端か
ら分離された、二重に切断標識化された断片409は長さによって分離され、最小
化した背景雑音信号で検出できる。
それによって、関心のある標識化二重切断末端は、望ましくない標識化単独切
断末端からの信号からの最少混入で検出できる。重要なことに、検出した信号は
源cDNAの相対的存在率及びこのように遺伝子発現水準をより定量的に反映す
る。任意に、信号水準が直接検出にはあまりにも低いならば、反応生成物は、例
えば関心のある遺伝子又は配列を検出するために節5.2.2の方法によって最
少数の循環を受けることができる。例えば、循環の数は、背景混入又は雑音とは
無関係に4から8までほどに小さくできる。このようにして、この実施態様では
、増幅は単独切断末端からの信号を抑制する必要が無く、好適なより定量的な応
答信号強度が生じる。
別のQEATM実施態様はRE/リガーゼ反応に先立ってcDNAサンプルを増
幅し、除去手段で望ましくない断片を除去し、ついで反応生成物を分離し、検出
する。あるいは、関心のある断片の一層の増幅がRE/リガーゼ工程後に行うこ
とができる。
この実施態様では、最初、節6.3.1によって組織サンプルから恐らく調製
された、二重鎖cDNAは接合捕捉部分、好ましくはビオチンプライマーを用い
てPCR増幅される。全て標識された、技術で知られた何らかの適当なプライマ
ーが使用できる。例えば、正味の配列選好を有しない一組の任意のプライマーが
使用できる。さらに例えば、cDNAが節6.3.3のプロトコルによって合成
されると、そのプロトコルの工程6の方法は、MA24及びMB4の両方が接合
ビオチンを有することを除き、使用できる。両端に結合したビオチンを有する生
じるcDNAは一つ又はそれ以上のREで切断され、使用したREに対応するア
ダプタに連結される。アダプタプライマーは任意に標識化できるが、接合ビオチ
ンを有することはできない。RE/リガーゼ反応は、RE消化及びアダプタ連結
反応が鎖状体及び他の望ましくない連結反応生成物の最少生成で完了まで進行す
るように、節5.2.2のプロトコルによって好適に行われる。反応生成物は、
REにより二重に切断され、接合ビオチンを有しない、関心のある断片、及び単
独に切断され、cDNAの末端から誘導する、一端に接合したビオチンを有する
望ましくない断片からなる。次に、望ましくない単独切断は反応生成物をストレ
プトアビジンビーズに接触させることで除去される。任意に、関心のある精製断
片は平滑断端にでき、関心のある信号を観察するために最小数の循環に対してさ
らにPCR増幅を受ける。最後に、生成物は、先行する節のように、長さによる
分離によって、DNAの‘検出によって、及びRE切断各断片を示す、任意に標
識化したアダプタプライマーについて分析される。
他の直接除去手段はこの発明で択一的に使用されるだろう。このような除去手
段は、限定されないが、一本鎖特異性ヌクレアーゼによる消化又は例えばヒドロ
キシアパタイトを含有する一本鎖特異性クロマトグラフィーカラムを通る通過を
含む。
接合捕捉部分を有するcDNAを用いるこれらの択一的プロトコルが種々の方
法で他のQEATM実施態様と組合わせることができることは当業者に明白である
。本発明は全てのこのような実質的でない異なる変更を包含する。
5.3. QEATMPCR実施態様
REを用いないQEATM法の択一的実行はPCR、又は選ばれた、増幅プライ
マーにより認識された標的配列間のcDNA断片を選択し、増幅するための択一
的増幅手段に基づく。一般的に、Innis et al.,1989,PCR Protocols A Guide
to Methods and Applications,Academic Press,New York,及びInnis et al.
,1995,PCR Strategies,Academic Press,New Yorkを参照。
既述の方法で選ばれた4及び8塩基対の長さの間の典型的標的サブ配列は、寄
り長いサブ配列と比較すると、その大きい発生確率、及び情報含量のために好適
である。しかし、この短いDNAオリゴマーは、PCRプライマーとして効果的
に使用されるためにその補足的サブ配列に確実に、再現的にハイブリダイゼーシ
ョンしないだろう。ハイブリダイゼーション信頼性は、プライマー組成及び長さ
、アニーリング温度並びに塩濃度のような緊縮条件、及びcDNA混合複雑性を
含む、変数に強く依存する。遺伝子呼出しに対して有効であるハッシュコードに
対して、サブ配列認識が可能な限り特異的で再現的であるので、基礎サンプル配
列だけを代表するよく分解された帯が生成することは非常に好適である。このよ
うにして、プライマーとして選ばれた標的サブ配列に相補的な単独の短いオリゴ
ヌクレオチドを直接用いる代りに、注意深く設計されたプライマーを用いること
は好適である。
QEATMのRE実施態様は、入力DNA濃度に関して103範囲にわたって再現
性のある信号パターンを生成することを証明した。PCR実施態様は、入力DN
A濃度及び初期ハイブリダイゼーション温度が再現性のある結果を生じるために
厳密でなければならないので、あまり好適ではない。
好適なプライマーは図5のモデルによって構築される。プライマー501は三個
の成分から構築され、5’から3’へ配列して、それは504、503及び502である
。下に記載した成分503は任意である。成分502はプライマー501が認識するため
に設計される、サブ配列に相補的である、配列である。成分502は典型的に4−
8bp長さである。成分504は、最終プライマーが分析されるべきcDNAサン
プルのいかなる本来の配列ともハイブリダイゼーションしないように選ばれる;
すなわち、プライマー501は分析されるべきサンプルに存在することが既知のい
かなる配列ともアニールしない。成分504の配列も選ばれるので、最終プライマ
ーは50℃を超える融点を有し、好ましくは68℃より上である。平均プライマ
ー組成を選択する融点を制御するための方法は上述した。
PCR実施態様におけるプライマー501の使用は第一アニーリング工程を含み
、それは3’末端成分502を末端成分504の存在でその標的配列にアニールするこ
とを可能にし、それはハイブリダイゼーションしないだろう。好ましくは、この
アニーリング工程は、生じる信号パターンの再現性を最大にするために実験的に
決定される、36と44℃の間の温度である。DNA濃度は約10ng/50m
lで、再現性を最大にするために同様に決定される。他のPCR条件は標準で、
節6.6に記載される。一旦アニールされると、3’末端は引き続く第一延長工
程のためにプライマー延長点として役立つ。第一延長工程は好ましくは72℃で
1分間である。
緊縮条件が正確な相補性がハイブリダイゼーションのために必要でないならば
、誤った正の信号が発生し、それは標的サブ配列の不正確な認識から生じる信号
である。これらの誤った正の帯の発生が、DNAサンプル配列が解決を必要とす
る、認識の不明確さを増加して認識されるために、実験的分析方法で考慮される
。これらの帯は標的サブ配列の不正確なハイブリダイゼーション適合を可能にす
ることで考慮され、不正確の程度はハイブリダイゼーション条件の緊縮性に依存
する。この場合、発生した信号はサンプル中の実際のサブ配列のファジー表現だ
けを含み、ファジーの程度はサブ配列の長さ及び緊急性条件の関数で、自由エナ
ルギー、及びハイブリダイゼーションの温度を結びつける。自由エネルギー及び
温度を与えると、種々の可能な現実のサブ配列が既知の熱力学平衡計算で近似的
に決定できる。
サブ配列PCR循環はついで高温、高い緊縮性アニーリング工程を使用する。
高い緊縮性アニーリング工程は全プライマーの正確なハイブリダイゼーションを
保証する。誤った正の帯は発生しない。好ましくは、これらのPCR循環は65
℃アニーリング工程と95℃融解工程の間で交替し、それぞれ1分間である。
任意の成分503は第一の低い緊縮性アニーリング工程の特異性を改善し、それ
によって発生した誤った帯を最少にするために使用できる。成分503は−(N)j
−で、ここでNは何らかのヌクレオチド、jは典型的には2と4の間で、好まし
くは2である。全ての可能な成分503の使用は、プライマーの縮退した組、j=
2ならば16プライマー、を生じ、それは標的サブ配列より長い3’末端サブ配
列に有効にj個の塩基を有する。これらの長い相補的末端配列は改良したハイブ
リダイゼーション特異性を有する。あるいは、成分503は−(U)j−で、ここで
Nは「共通」ヌクレオチドで、jは典型的には2及び4の間、好ましくは3又は
4である。イノシンのような共通ヌクレオチドはいかなる他の天然に生じるヌク
レオチドと塩基対を形成することができる。この代替において、単独プライ
マー501は標的より長い有効j塩基の3’末端サブ配列を有し、このようにして
ハイブリダイゼーション特異性を改良した。
あまり好適ではないプライマーの設計は、特異的で再現性のあるハイブリダイ
ゼーションを達成するために十分な長さの縮退オリゴヌクレオチドの組からなり
、ここで組の各構成は選ばれたもの、標的配列に相補的な共有サブ配列を含む。
例えば、サブ配列がGATTと認識されると、使用したプライマーの組はNNA
ATCNNの形の全配列で、ここでNは何らかのヌクレオチドである。縮退プラ
イマーの組も不連続性サブ配列の認識を可能にする。例えば、GA−−TTはN
AANNTCNNの形の全配列によって認識されるだろう。あるいは、共通ヌク
レオチドは‘N’で表される縮退ヌクレオチドの代りに使用される。
単独反応で使用された各プライマー又はプライマーの組は好ましくは検出のた
めに明確に標識される。電気泳動断片分離を用いる好適な実施態様では、標識化
は光学的検出手段で同時に識別できる、蛍光色素による。
例示的実験プロトコルはここで要約され、節6.6に詳細に記述される。全細
胞mRNA又は細胞mRNAの精製サブプールはcDNA合成に使用される。第
一鎖cDNA合成は、例えば、オリゴ(dT)プライマー又は択一的に位相性プ
ライマーを用いて節6.3によって行われる。あるいは、cDNAサンプルはい
かなる源泉からも調製でき、直接得られる。
次に、第一鎖cDNAサンプルを用いて、選択したプライマーの組のプライマ
ーは慣用のPCR増幅プロトコルに使用される。プライマーの高いモル数過剰は
、標的cDNA配列に隣接し、遺伝子が増幅される、プライマー部位の間の断片
だけを保証するために好適に使用される。全ての可能なプライマー結合部位に結
合するプライマーの高いモル数過剰で、増幅した断片は内部にプライマー認識部
位を含むはずである。多くのプライマーが、同時分離及び検出のために標識され
るように一つの反応で使用されると、RE実施態様の様に、それは適当に分解し
た長さ分布を発生する。例えば、蛍光色素標識が使用されると、蛍光色素の各対
は好ましくは一つの帯で識別可能で、分離対は好ましくは分離帯で識別可能であ
る。増幅後、断片は分離され、ゲル電気泳動のために再けん濁され、光学的に検
出される。それによって、その末端に標的サブ配列の特定の対を有する断片の長
さ分
布が確認される。
特異的PCR実施態様に対する好適なプロトコルは節6.6に詳細に記載され
る。
5.4. QEATMの分析方法および設計方法
本発明は、本発明の定量的発現分析の実施態様のための方法の2つのグループ
を提供する:第一に、QEATM実験設計方法;および、第二に、QEATM実験分
析方法。理論的には設計が分析に先立つが、実験設計の方法は、実験分析の一部
として本明細書に記載される基本的方法に依存する。従って、実験分析の方法が
初めに記載される。
下記において、標的サブ配列を認識するためにREが使用される好ましいQE
ATM実施態様に関して、記載がなされることが多い。しかし、そのような記載は
制限するものではなく、記載される全ての方法が、全てのQEATM実施態様に対
して等しく適合可能であり、標的サブ配列が、核酸または核酸模擬体(nucleic a
cid mimic)によって認識されるもの、およびハイブリダイズによって標的サブ配
列を認識するプローブを含む。
さらに、下記の記載は、これらの方法の現在の好ましい実施態様に向けられて
いる。しかし、コンピューターおよびシミュレーション分野の当業者にとって、
これらの方法の多くの他の実施態様が、記載されているものと実質的に同等であ
ること、および、実質的に同じ結果を得るために使用することができることが、
明白である。本発明は、そのような代替的実行、および、それの現在の好ましい
実行を含む。
5.4.1 QEATM実験分析方法
分析方法は、第一に、分析されるDNAサンプルを表わすDNA配列のデータ
ベースを選択し、第二に、このデータベースおよび実験の記述を用いて、実験中
に発生するDNA断片によって生じる、シミュレーションされた信号のデーター
ベース中に包含されたシミュレーションされた信号のパターンを引き出し、第三
に、どの特定の検出信号に関しても、シミュレーションされた信号のパターンま
たはデータベースを用いて、この信号を発生させる可能性のある源サンプルにお
ける配列を予測することを含んで成る。さらに、分析方法は、ユーザーインター
フェースを使用するための小休止(an easy)を与え、信号が多数の配列から発
生し得る場合に、実際に信号を発生させる配列の決定を可能にし、統計的相関関
係を示して、多数のサンプル中において意図する信号を素早く決定する。
第一の分析方法は、分析されるサンプルを表わすDNA配列のデータベースを
選択することである。本発明の好ましい使用においては、分析されるDNA配列
が、組織サンプル、一般に、診断目的または研究目的のために検査されるヒトの
サンプルから由来する。この用途においては、データベース選択は、全ての観測
されたDNA配列を包括的に記録する一般に利用可能な1つまたはそれ以上のデ
ータベースから開始される。そのようなデータベースは、National Center fo
r Biotechnology Information(Bethesda,MD)からのGenBank、European
Bioinformatics Institute(Hinxton Hall,UK)におけるEMBL Data L
ibrary、およびNational Center for Genome Research(Santa Fe,NM)か
らのデータベースである。しかし、どのような由来の多数のDNA配列のどのよ
うなサンプルでも、本発明の方法によって分析することができるので、分析され
るそのようなサンプル中に存在する可能性のある配列に関する項目(entries)
を有するどのようなデータベースでも、コンピューター法のさらなる段階に使用
することができる。
図6Aは、データベースから引き出される総合的組織から出発する、好ましい
データベース選択方法を例示している。データベース1001は包括的入力データベ
ースであり、例示的なフラットファイル(flat-file)、または図6Bに示すよ
うな、1つの列(one row)を有する関係構造(relational structure)1010、
あるいは各登録DNA配列に関するレコード1014を有する。コラムまたはフィー
ルド1011は、アクセス番号フィールドであり、データベース1001における各配列
を独特の方法で同定する。ほとんどのそのようなデータベースは冗長な項目を有
し、即ち、1つの生物学的配列から引き出される多数の配列記録が存在する。コ
ラム1013は、項目の事実上のヌクレオチド配列である。1012によって表わされる
複数のコラムまたはフィールドは、この項目を同定する他のデータを有し、例え
ば、これがcDNA配列であるかまたはgNDA配列であるか、cDNAである
とすれば、これが完全な長さのコーディング配列であるかまたは断片である
か、その配列またはそれの生産物(product)の種源、既知であれば、その配列
を有する遺伝子の名前などのデータを有する。1つのファイルとして示されてい
るが、DNA配列データベースは区分(divisions)中に存在することが多く、
全ての関連する区分からの選択が、本発明によってなされる。例えば、GenBan
kは15の異なる区分を有し、その中で、発現配列タグ(EST)を有するES
T区分および分離データベースdbESTは、発現配列を有するので、特に関心
のあるものである。
特定の組織型に関する特定の実験を表わすための基準を満たす全ての記録が、
包括的なデータベースから選択される。このことは、包括的データベース中の全
レコードを連続的に走査する従来技術によって、基準を満たすものを選択し、選
択されたデータベース中の選択されたレコードを記憶させることによってなされ
る。
例示的選択方法を下記に記載する。ゲノムDNAサンプルを分析するために、
データベース1001を、ヒトgDNAに関する基準1002に対して走査して、選択デ
ータベース1003を形成する。発現された遺伝子(cDNA配列)を分析するため
に、いくつかの選択代替物が利用できる。第一に、ゲノム配列を走査して、どの
サブ配列(エキソン)が発現されるかを予測することができる。従って、発現予
測1004に従って選択することによって、選択データベース1005が形成される。第
二に、ドメイン配列(CDS)をコードするcDNA配列のような観測された発
現配列、およびESTが、選択1006となって、発現配列の選択データベース1007
を形成することができる。さらに、予測され、観測された発現配列を、他の、お
そらくはより包括的な、発現配列の選択データベースの中に、組み込むことがで
きる。第三に、前記方法のいずれかによって決定された発現配列を、データベー
スレコード中の興味ある利用可能な指標1008によってさらに選択して、より標的
化された選択データベース1009を形成することができる。配列データベース中に
存在する利用可能な関連フィールド、指標、または組み合わせに従って、選択す
ることができる配列によって、選択データベースを制限なく構成することができ
る。
第二の分析方法は、サンプル中に存在する可能性のある配列の選択配列データ
ベース、および意図された実験の記述を用いて、実験中に発生されるDNA断片
によって生じるシグナルのパターンを引き出す。このパターンを好都合な方法に
よって、コンピューター実行中に記憶させることができる。下記において、制限
することなく、それが情報のテーブルとして記憶されると記載している。このテ
ーブルを、個々のレコードとして記憶させてもよいし、または、好都合に利用可
能な関連データベースのようなデータベースシステムを用いて記憶させてもよい
。または、パターンを単に、パターンを表すインメモリ(in-memory)構造のイ
メージとして、記憶させてもよい。
QEATM実験は、DNAサンプル配列に適用されるいくつかの独立した認識反
応を含み、各反応において、標識DNA断片がサンプル配列から生じ、その断片
はサンプル配列中のある標的サブ配列間に存在する。標的サブ配列が認識され、
QEATM法の好ましいRE実施態様によって、またはQEATMのPCR実施態様
によって、断片が発生される。下記の記載は、RE実施態様に焦点を当てている
。
図7は、好ましいQEATM実施態様の例示的記述1100を示す。フィールド1101
は、DNAサンプル源である組織サンプルの記述を有する。例えば、1つの実験
は、正常な前立腺サンプルを分析することができ;それ以外は同一である第二の
実験は、前癌性変化を有する前立腺サンプルを分析することができ;および、第
三の実験は、癌性の前立腺サンプルを分析することができる。次に、これらのサ
ンプル間の遺伝子発現における差異を、癌疾患症状の進行と関係づける。そのよ
うなサンプルは、ヒトの癌または悪性腫瘍から引き出すことができる。
主要列1102、1105、および1109は、組織サンプル1101からのDNAが受ける、
分離した個々の認識反応を記述している。数個から、サブ配列を認識するための
対の利用可能な認識手段が存在するほど多数の、どのような数の反応でも、実験
中に集めることができる。図7は、15個の反応を例示している。例えば、主要
列1102によって特定される反応1は、副列(minor row)1103および1104中に記
述される、制限エンドヌクレアーゼ1および2の認識部位である、標的サブ配列
間に、断片を発生させる。さらに、RE1切断末端(cut end)は、LABEL
1によって標識される標識部分によって認識され、RE2末端は、LAB
EL2によって認識される。同様に、反応15、1109は、標識3および4、副列
1110および1111によってそれぞれ標識される制限エンドヌクレアーゼ36および
37を利用する。
メジャー列1105は、3つのRE(制限エンドヌクレアーゼ)と1つの分離した
プローブを用いる変異型QEATM反応を表している。先述の如く、有用な断片分
布が得られさえすれば、単一の認識反応で多くのREを使用することができる。
但し、REが多すぎると、長さ分布が圧縮してしまう。更に、断片末端を標識す
るのではなく、断片内で反応が生じることを意図した標的サブ配列用プローブを
使用することもできる。例えば、QEATMPCR増幅ステップ後に付加した標識
プローブ(ある与えられた実施態様にこのステップが存在する場合)であるPC
R後プローブは、断片の内部的なサブ配列を認識することができる。従って、こ
のPCR後プローブを用いることにより1つの付加的なシグナルが得られ、この
シグナルを利用して、長さと末端配列が同じで内部配列が異なる断片を生成する
2つのサンプル配列を識別することができる。また、別な例として、QEATMP
CRステップ前に付加した、DNAポリメラーゼで伸張することができないプロ
ーブを用いる場合には、このプローブの標的サブ配列を含む断片のPCR増幅が
妨害される。検出可能なシグナルを発生させるためにPCR増幅が不可欠な場合
(ある与えられた実施態様において)、このプローブはそのような断片の検出を
妨害する。ある一つの断片を不在化することにより、以前不明瞭であった検出帯
が明瞭化する場合がある。そのようなPCR妨害プローブは、ポリメラーゼ伸張
を妨害するよう修飾(例えば、3’末端にジデオキシヌクレオチドを取り込むこ
とにより)したPNAオリゴマーやDNAオリゴマーの縮重したセットであって
よい。
代替的に位相性PCRプライマーを使用する場合、それらの特別な認識サブ配
列と標識化は、その生成物が増幅に用いられるRE/リガーゼ反応を表す列に示
されている。
次に、第8A図は、分析したサンプルの最も可能性の高いDNA配列を表すよ
う選択したデータベース1201とQEATM実験の開示1202から、シミュレーション
法1203が、模擬データベース1204に記憶された模擬シグナルの中からQEATM実
験の結果を表すパターンを決定する全体的な様子を示している。実験のシ
ミュレーションは、同一のDNA配列サンプルを実際に実験した場合に得られる
ものと同じ断片長さ及び末端サブ配列を入力データベースから選び出す。
別な方法として、模擬パターンや模擬データベースを必要としない方法もあり
、その場合には、各配列毎に1つずつDNAデータベースを調べ、模擬消化を行
って、入力シグナルと比較する。多数のシグナルを調べる必要がある場合や、同
じQEATM実験を何回も行う必要がある場合は、模擬データベースを利用する方
が好ましい。逆に言えば、数回の実験からほんの僅かな数のシグナルを調べれば
済む場合には模擬データベースを用いる必要ばない。どんな時に模擬データベー
スを使ったらより効果的になるかについての定量的な判断は、様々な操作の費用
解析やDNAデータベースのサイズに依存しており、コンピュータの技術分野で
良く知られている仕方で説明することができる。しかし、以下では、制限を設け
ることなく、模擬データベースを引き合いに出して説明する。
第8B図は模擬データベースの典型的な構造を示している。ここでは、実験に
対して定義された個々のすべての認識反応の模擬結果が、矩形のテーブル1210に
まとめられている。本発明は同等の情報を含む他のデータベース構造にも同様に
適用することができる;例えば、各反応が1つの分離したテーブルに配列される
ような構造であってもよい。テーブル1210の列は可能な断片の長さによりインデ
ックスが付けられている。例えば、列1211は長さ52の断片を含んでいる。テーブ
ル1210のコラムは、可能な末端サブ配列、及び、該当する場合、ある特定な実験
反応のプローブ・ヒットによりインデックスが付けられている。例えば、コラム
1212、1213、及び1214は、反応1(R1)で発生するすべての断片を含んでおり
、それぞれ、両末端サブ配列がRE1で認識される断片、一方の末端サブ配列が
RE1で認識され、他方の末端サブ配列がRE2で認識される断片、及び両末端サ
ブ配列がRE2で認識される断片を表している。他のコラムは、実験の他の反応
に関係している。最後に、テーブル1210の記載事項は、特定の長さ及び末端サブ
配列を有する断片を表す、データベースの配列の受け入れ番号リストを含んでい
る。例えば、記載事項1215は、受け入れ番号A01のみが、R1のRE1で認識され
る両末端サブ配列を有する長さ52の断片を発生させることを示している。同様に
、記載事項1216は、受け入れ番号A01とS003が、反応
2のRE3で認識される両末端サブ配列を有する長さ151の断片を発生させること
を示している。
別の実施態様では、テーブルの内容に様々な情報を追加することができる。あ
る場合には、この情報が、用いた分離手段及び検出方法によりもたらされる結果
を解釈する上で助けとなることがある。例えば、電気泳動法で分離した場合、こ
れらの情報を利用して、検出した電気泳動DNA長さを補正し、真の物理的なD
NA長さを得ることができる。このような補正法は電気泳動の技術分野で良く知
られており、平均塩基組成及び蛍光色素標識物質に応じて補正が行われる。これ
らの補正を行うためのパッケージが市販されており、その1つがApplied Bios
ystems Inc.(Foster City,CA)から販売されているGene Scan Softwar
eである。この場合、1つの断片に対する各テーブルの記載事項は、恐らくはG
+C含量パーセントで表わされる平均塩基組成を追加的に含むことができ、また
、実験の定義は、プライマーの平均塩基組成と使用した蛍光組織標識を含むこと
ができる。質量分析法やそれと同様な方法で分離する別な例では、各断片の分子
量、及び、恐らくは典型的な断片化パターンを追加的な情報として含むことがで
きる。他の分離手段及び検出法を利用する場合は、他の適当な補充データの使用
を示唆することができる。
代替的な位相性プライマー、SEQ-QEATM実施態様、または有効な標的サ
ブ配列をもたらす他の手段を用いる場合には、そのような有効な標的サブ配列を
更に同定するため、RE対を利用してコラムを補充する。
この模擬データベースを如何にして作成するのかを説明する前に、先ず、この
データベースを用いてどのようにして実験結果を予測するのかを説明するのが有
用である。第7図に戻り、標識物質は、標的DNAに対するサブ配列認識手段に
より結合反応が生じたことを検出し、長さで断片を分離した後に検出できるよう
にするために使用される。蛍光検出手段を使った実施態様の場合、これらの標識
物質は、先述の如く、アダプターのプライマー鎖に、もしくは、該当する場合、
ハイブリッド形成プローブに共有結合で付着された蛍光色素である。典型的には
、1つの反応で用いられるすべての蛍光色素標識物質は同時に識別することが可
能であり、従って、標的サブ配列のあらゆる可能な組合せを有する断片を蛍光的
に
識別することができる。例えば、テーブル1210の記載事項1217(第8B図)の断
片は、長さ175で生じ、これらは、それぞれ、RE1及びRE2で切断された末端
を認識するアダプターで使用される標識物質であるので、誘発により蛍光シグナ
ル、LABEL1及びLABEL2を同時に発する。別な例では、実験の定義1100
のメジャー列1105(第7図)の反応2で、RE2及びRE3で切断された末端を有
し、プローブPとハイブリダイズする断片は、シグナル、LABEL2、LAB
EL3、及びLABEL4を同時に発する。有効な標的サブ配列が例えばSEQ-
QEATMまたは代替的な位相性プライマーで構成されている場合には、このルッ
クアップ(look up)を適当に修飾する。
他の標識化も本発明の範囲内である。例えば、標的サブ配列の特定の基を全く
同じに標識することもできるし、また、その基を全く標識しないこともできる。
その場合、断片の対応する基を識別することはできない。この場合、もしRE1
とRE3の末端サブ配列をテーブル1210(第8B図)に従って全く同じに標識し
たとすると、配列T163、A01、またはS003、あるいはこれらの配列の組合せに
より、長さ151の断片が発生する。極端な場合、ある実施態様で、分離した断片
を検出するために電気泳動ゲルの銀(Ag)染色を用いたとすると、すべての帯
が全く同じに標識され、1つの電気泳動レーン内で唯一帯長さのみを識別するこ
とができる。
このようにして、模擬データベースを実験の定義と共に利用し、実験結果を予
測することができる。1つの認識反応で1つのシグナルが検出されると、これに
よりRnが明示される。このRnの末端標識化はLABEL1及びLABEL2であ
り、また、その長さの表現が塩基対の物理的長さLに対して補正される。模擬デ
ータベースの長さL列を検索し、観測されたサブ配列を指示するコラムの見出し
と、各サブ配列がどのように標識されているかを指示する実験の定義を利用し、
検出されたサブ配列の標識化を有するRnの記載事項を走査する。もし適合する
ものがない場合は、この断片が、選択したデータベースに存在していない、新し
い遺伝子あるいは配列であることを意味している。一方、適合するものが見つか
った場合には、この断片は、新しい遺伝子あるいは配列である可能性に加え、見
つかったテーブルの記載事項に存在する候補的配列によりもたらされたものであ
る可能性もある。
ここでは、模擬データベースのルックアップは、検出された断片の物理的長さ
を利用するものとして説明する。分離手段及び検出法が真の物理的断片長に対す
る近似値をもたらす場合には、そのような近似を根拠付けるため、ルックアップ
は増大する。例えば、電気泳動法を分離手段として用いた場合には電気泳動長さ
が得られる。電気泳動長さは平均塩基組成と標識化部分に依存しており、典型的
には物理的長さの10%以内である。この場合、データベースのルックアップは、
その物理的長さが報告された電気泳動長さの10%以内の関連するすべての記載事
項を調べ、補正して電気泳動長さを求めた後、検出したシグナルと適合するかど
うかをチェックする。代替的なルックアップの実行も明白であり、例えば、予測
されるすべての断片の電気泳動長さを予め算出しておき、電気泳動長さに対する
代わりのテーブル指数を構築した後、電気泳動長さを直接ルックアップする方法
を用いてもよい。他の分離手段や検出法を用いる場合にも、それらに特有な実験
の偏りや不正確さを補正するため、それに応じたルックアップの増大が必要にな
る。データベースのルックアップを引き続き参照する場合には、単純な物理的ル
ックアップでも、増強したルックアップでも、どちらでも適当に利用できること
が分かる。
適合する候補的データベース配列が見つかると、選択したデータベースを調べ
、例えば、遺伝子名や、組織の由来、染色体の位置、等のこれらの配列に関する
他の情報を決定することができる。もし予測していない断片が見つかった場合に
は、長さ分離手段によりこの断片を随意的に検索し、クローン化または配列決定
し、更には、DNA配列データベースに含まれている同族体を調べるのに使用し
たり、これまで知られていない遺伝子や配列の分離または特徴付けに使用するこ
とができる。本発明を用いることにより、このようにして、新しい遺伝子を迅速
に発見及び同定することができる。
本発明のコンピュータ法は、また、他のフォーマットからなる実験の定義にも
適用することができる。例えば、標的サブ配列認識部分の標識化を、実験反応を
定義しているテーブルとは別のテーブルに記憶させることもできる。
さて、次に、模擬データベースを作成する方法について説明すると、第9図
は、本明細書中で模擬断片化と称する基礎的な方法を示している。この方法は、
1つの配列と、ある実験の1つの反応の定義とを選び、その配列で生じる反応の
予想される結果を作成する。この基礎的な方法を繰り返し実行することにより、
全体的な模擬データベースを作成する。
先ず、模擬断片化について説明すると、この方法はステップ1301から始まり、
ステップ1302で、断片化する配列と、その断片化反応の定義とを以下の表現で入
力する:標的末端サブ配列、RE1、...REn(ここで、nは、典型的には2ま
たは3である)、及びPCR後プローブ、P1、...Pn(ここで、nは典型的に
は0または1である)により認識されるサブ配列。PCR妨害プローブは不安定
化した末端サブ配列として作用し、この方法での入力に際してそのように処理さ
れることに注意を払う必要がある。この方法の運用の仕方が、RE1、RE2、及
びP1の場合について、第10A-F図に例示されている。
この方法は、ステップ1303で、各標的末端サブ配列に対する1つの「末端ベク
ター」を作る。このベクターは、その配列に沿って対を為すヌクレオチドからな
る成分を有しており、これらの各対は対応する末端サブ配列により標識されてい
る。末端サブ配列がハイブリダイズ化オリゴヌクレオチドで認識される実施態様
では、各対の第1のメンバーはある標的末端サブ配列の始点であり、第2のメン
バーはある標的末端サブ配列の終点である。また、標的末端サブ配列が制限エン
ドヌクレアーゼで認識される実施態様では、各対の第1のメンバーはRE認識サ
ブ配列に対応するオーバーハング領域の始点であり、第2のメンバーはそのオー
バーハング領域の終点である。4bpのオーバーハングをもたらすREを使用する
のが好ましい。実際の標的末端サブ配列は、好適には4〜8bpの長さを有するR
E認識配列である。
このベクターは、5’から3’方向の標的末端サブ配列を入力配列と比較し、
ストリングの適合を探索するストリング操作により作成される。ここで、ストリ
ングの適合は、ヌクレオチドが正確に適合しているものでなければならない。有
効な標的サブ配列を、例えば、SEQ-QEATMや代替的な位相性プライマーを
使って形成する場合には、その有効なサブ配列を比較する。これは、一方の端部
から始め、その配列に沿って一度に1つずつ塩基を調べて行くやり方で、末端サ
ブ
配列を入力配列と単純に比較することにより行うことができる。しかし、Knuth
-Morris-PrattアルゴリズムやBoyer-Mooreアルゴリズム等のより効果的なス
トリング適合アルゴリズムを使用するのが望ましい。これらのアルゴリズムが、
サンプル・コード共に、Sedgewick,1990,Algorithms in C,chap.19,Addison
-Wesley,Reading,MAに開示されている。
RE実施態様等、標的サブ配列を正確に認識するQEATM実施態様では、標的
サブ配列と入力配列の比較は正確に行わなければならない。即ち、塩基は1対1
で適合していなければならない。一方、標的サブ配列を低い正確度で認識する実
施態様では、ストリング適合を正確度の低いやり方、即ちファジーなやり方で行
うべきである。例えば、PCR実施態様の場合、長さTのある標的サブ配列は、
T-n塩基のみを正確に適合させることにより、同じく長さTを有する入力配列
を不正確に認識することができる。ここで、nは、典型的には1または2であり
、実験条件に応じて調整することができる。この場合、末端ベクターを作成する
ストリング操作は、正確に適合しているものだけでなく、部分的なT-n適合も
受け入れるようにする必要がある。この場合、ストリング操作は、実験から期待
される偽りの陽性適合をもたらし、これらの断片を同一であるとみなす。しかし
、断片が増えれば増えるほど、全く同一の長さ及び末端標識を有する断片の可能
性が大きくなるので、模擬データベースの曖昧さは増大する。
図10Aは、この例の場合4bpのオーバーハングをもつREであると仮定されるRE1
及びRE2によって生成された3つ及び2つの末端をそれぞれ含む末端ベクター140
1及び1402を例示している。ベクター1401内の第1のオーバーハングは、入力さ
れた配列内のヌクレオチド10と14の間で発生する。
図9の工程1304は、全ての末端配列のための全ての末端ベクターを併合させ、
末端の位置について要素を選別する;図10Bのベクター1404はこの工程の結果、
例えば末端ベクター1401及び1402を例示している。
次に、図9の工程1305は、併合され選別された末端ベクターの中で隣接する末
端により限定されている入力された全配列の一部分を選択することによる反応に
より生成される断片を作り出す。QEATMを実施する上での実験条件は、標的末端
サブ配列認識の完了に至ることができるような形で選択されなくてはならない
ことから、考えられる全ての末端が認識される。制限エンドヌクレアーゼの実施
形態については、切断及びリガーゼ反応は、考えられる全てのRE切断が行われ、
各々の切断末端に対し標識化プライマーが連結されるような形で行われるべきで
ある。これらの条件により、いかなる断片も内部の未認識標的末端サブ配列を含
まず、併合され選別されたベクター内の隣接する末端のみが生成された断片を構
成するということが確実になる。
シュミレートされたデータベースエントリが特定の分離及び検出手段における
不精確さに適合するために付加的な情報が必要である場合には、このような情報
をこの工程において収集することができる。例えば、電気泳動による分離の場合
、断片配列を決定し、G+C含有百分率を計算し、これを断片受入れ番号と共にデ
ータベース内に入力することができる。
PCR実施形態においては、断片長というのは、第2の末端サブ配列の終了位置
と第1の末端サブ配列の開始位置の間の差である。RE実施形態については、断片
長は、第2の末端サブ配列の開始位置と第1の末端サブ配列の開始位置の間の差
に、プライマー長(好ましいプライマー実施形態においては48)の2倍を加えたも
のである。
図10Cは、各々の断片が、2つの末端サブ配列、長さ及びプローブがこの断片
に結合するか否かの指標を含む4メンバ組で表されている、生成された断片の例
を示している。図10Cでは、この指標の位置は「*」により表されている。断片14
08は末端1405及び1406により構成され、断片1409は末端1406及び1407により構成
されている。末端1405及び1407により構成される断片は全く無いが、これは、中
間末端サブ配列が認識されRE実施形態では完全に切断され又PCR実施形態では断
片末端プライミング位置として使用されるからである。単純化を期して、断片長
はプライマー長の付加無しでRE実施形態について例示されている。
図9の工程1306は、実験にハイブリダイゼーションプローブが関与するか否か
をチェックする。関与している場合には、工程1307は、工程1305で定義された断
片の配列を決定する。図10Dは、この例について断片配列が、表示されたヌクレ
オチド位置の間にある入力された配列内のヌクレオチド配列であることを例示し
ている。例えば、第1の断片配列は、位置10と62の間の入力された配列の
一部分である。次に、工程1308は、各断片配列に対し各々のプローブサブ配列を
チェックし、何らかの一致があるか否か(すなわち、プローブが断片配列に対し
その上にハイブリダイズするのに充分なほどの相補性をもつ配列を有しているか
否か)を見極める。一致が見られた場合、断片の4メンバ組内で表示がなされる
。この照合は末端ベクターの生成について記述されたものと類似の要領でストリ
ング探索により行われる。
次に図9の工程1309では、全ての断片は長さについて選別され、選別された断
片の1つのベクターの形に組立てられ、このベクターは工程1310での擬似断片化
方法から出力される。このベクターは、入力された反応が入力された配列から生
成することになるその末端サブ配列及び長さにより定義されるプローブ情報を伴
う全ての断片の完全なリストを含有している。
図10Eは、長さに従って選別された例の断片ベクターを示している。例示を目
的として、プローブP1は、「Y」がマークされている3番目の断片1412に対して
いのみハイブリダイズすることがわかった。その他全ての断片において「N」が
マーキングされており、これはいかなるプローブ結合もないことを表している。
シュミレートされたデータベースは、選択されたデータベースの中の各々の配
列及び実験定義の中の各々の反応について基本的擬似断片化方法を反復的に適用
することによって生成される。図11は、シュミレートされたデータベース生成方
法を例示している。この方法は1501で開始し、1502では、特に反応リストとそれ
に関係するサブ配列と共に、選択された代表的データベース及び実験定義を入力
する。工程1503は、断片長及び標的末端サブ配列の考えられる全ての組合せにつ
いて受入れ番号リストを挿入できるように、ダイジェストデータベーステーブル
を初期化する。工程1504、DOループは、入力される選択されたデータベースの中
の全ての配列について工程1505、1506及び1507の反復的実行をひき起こす。
工程1505は、とり囲むDOループにより選択されるようなデータベース内の次の
配列及び実験の次の反応を取り上げ、これらの入力について図9の擬似断片化方
法を実行する。工程1506は、ベクターから各々の断片を取り出し、断片長及び末
端サブ配列及びプローブ(存在する場合)により指標付けされるデータベース
エントリ内のリストに対し配列受入れ番号を付加することによって、シュミレー
トされたデータベースに対し選別された断片ベクターを付加する。図10Fば、図1
0A〜Eの擬似断片化反応例について結果として得られることになるシュミレート
されたデータベースエントリリストの付加を表している。例えば、両方の末端サ
ブ配列RE2を伴って長さ151においてエントリ1412の中の受入れ番号リストに対し
、受入れ番号A01が付加される。
最後に、工程1507は、この配列対しシュミレートされるべきもう1つの反応が
、入力された実験内に存在するか否かをテストする。存在する場合、工程1505は
、この反応について反復される。存在していない場合には、DOループがくり返さ
れてもう1つのデータベース配列を選択する。全てのデータベース配列が選択さ
れたならば、工程1508は、シュミレートされたデータベースを出力し、方法は15
09で終了する。
5.4.2. QEATM 実験設計方法
実験設計方法の最終目的は、最大量の量的情報を得るべく各実験を最適化する
ことにある。1つの実験は、それ自体認識された標的末端サブ配列、使用される
プローブ(該当する場合/及び割当てられたラベルによって定義されるその成分
認識反応によって定義される。代替的位相性プライマーSEQ-QEATM又はその他の
類似の手段が使用される場合、有効な標的サブ配列が用いられる。得られた情報
量を確かめるために、複数の基準のうちの任意のものを使用することができ、反
応最適化を実施するのに、複数のアルゴリズムのうちの任意のものを使用するこ
とができる。
情報量を確かめるための好ましい基準には、「良好な配列」の概念が用いられ
る。1つの実験のための良好な配列というのは、実験の中にその配列から唯一の
シグナルを生成する少なくとも1つの反応が存在するような配列である。すなわ
ち、長さとラベル付けの唯一の組合せをもつ少なくとも1つの認識反応によって
その良好な配列から1つの断片が生成される。例えば、図8Bに戻ると、受入れ番
号A01を伴う配列は、反応1が、配列A01からのみ、RE1により認識される両方の
標的末端サブ配列及び長さ52を伴うシグナル1215を生成することから、良好な配
列である。しかしながら、配列S003は、S003からのみ生成される唯一の
シグナルが無いことから、良好な配列ではない:反応R2はA01及びS003の両方か
らシグナル1216を生成し、Q012及びS003の両方からシグナル1219を生成する。情
報尺度として良好な配列の量を用いると、実験中の良好な配列の数が大きくなれ
ばなるほど、実験の設計は良くなる。理想的には、1つのサンプル中の考えられ
る全ての配列は良好な配列である。
さらに、良好な配列の発現の量的尺度を、良好な配列からのみ生成された断片
の検出されたシグナル強度から決定することが可能である。異なる良好な配列の
発現の相対的な量的尺度は、良好な配列からのみ生成されたシグナルの相対的強
度を比較することによって得ることができる。良好な配列の発現の絶対的な量的
尺度は、もとのサンプル中に濃度規準を含み入れることによって得られる。特定
の実験についてのこのような規準は、もとのサンプル中に発生しないことがわか
っておりかつ既知の濃度で導入される複数の異なる良好な配列で構成されていて
よい。例えば、外因性の良好な配列1は、モル単位で1:103の濃度で付加され、
外因性の良好な配列2は、モル単位で1:104で添加されるといった具合である。
次に、サンプル中の良好な配列の唯一のシグナルの相対的強度を規準の唯一の信
号の強度と比較することにより、サンプル配列のモル濃度を決定することができ
る。例えば、良好な配列が、良好な配列1及び2の唯一のシグナル強度の間の中
間点に唯一のシグナル強度を有する場合、それは、良好な配列1及び2の濃度の
間の中間点の濃度で存在する。
実験により生成される情報量を確かめるためのもう1つの好ましい尺度は、対
象となる特定の配列セット、例えば特定の組織サンプルの中に存在することがわ
かっているか又は予現されるレセプタセット又は既知の発ガン遺伝子セットに注
意を限定することによって誘導される。良好な配列である対象の配列の数を最大
限にするべくこの尺度に従って1つの実験が設計される。サンプルの中に存在す
る可能性のあるその他の配列が良好な配列であるか否かは考慮されない。これら
のその他の配列は、対象の配列がこれらのその他の配列からの何らかの寄与なく
、一意的に標識化断片を生成するかぎりにおいてのみ、興味の対象となる。
本発明は、一つの実験からの情報を確認するためのその他の尺度に適合可能で
ある。例えば、もう1つの尺度は、各々の検出されたシグナルに寄与する配列の
数を平均して最小限にすることにある。この場合は、各々の配列は、断片のラベ
ル付けにおける共通の出現により、最小の数のその他の配列に結合される。こう
して、対象のシグナルピークの明確化を単純にすることができる(以下参照)。
1つの実験について、良好な配列の数といったような情報尺度を選択した時点
で、最適化方法は、標的サブ配列そして場合によっては選択された尺度を最適化
するプローブを選択する。考えられる1つの最適化方法は、約10より小さい長さ
の全てのサブ配列が、全ての組合せの中で、最適である組合せについてテストさ
れるような、しらみつぶしの探索である。この方法には莫大な計算能力が必要と
され、上界は、利用可能な計算設備及び一定の与えられた長さのサブ配列の出現
の平均的確率により決定される。適切な資源があれば、約0.005〜0.01の出現確
率まで全ての配列を下へ探索することが好ましい。上界は8から11又は12までの
範囲であり得る。
好ましい最適化方法は、シュミレートされたアニーリング法として知られてい
る。Press et al.,1986「科学的計算技術、数値的処法」、第10.9節、Cambridge
University Press,Cambridge,U.K.を参照のこと。シュミレートされたアニー
リング法は、状態の小さな変化を生成し、「より良い」新しい状態を作り出すた
めの確率的要因に従ってこのような変化を受入れることによってシステムの「状
態」の「エネルギー」関数の最小値を見つけようと試みる。方法が進む一方で、
確率的要因を左右しより高いエネルギーの新しい状態の受入れを制限するシュミ
レートされた「温度」はゆっくりと低下する。
本発明の方法への応用にあたり、Sという文字で記される「状態」は、実験の
各々の認識反応における標的末端サブ配列及びハイブリダイゼーションプローブ
(該当する場合)といった実験定義である。Eという文字で記された「エネルギー
」は、情報尺度で1.0を除したものとしてみなされ、かくしてエネルギーが最小
になった時点で情報は最大限となる。代替的には、エネルギーは、情報尺度の単
調に減少する任意の関数であり得る。エネルギーの計算は、状態に対し関数E(
)を適用することによって表される。
既知の実験又は状態から新しい実験又は状態を生成する好ましい方法は、実験
定義に対する移動とも呼ばれる以下の変更を行うことにある;すなわち、(1)無
作為に選ばれた認識反応の中で標的末端サブ配列を無作為に変更する;(2)無作
為に選ばれた反応に対し無作為に選ばれた標的末端サブ配列を添加する;(3)3
つ以上の標的サブ配列との無作為に選択された反応から、無作為に選ばれた標的
末端サブ配列を除去する;(4)2つの無作為に選択された標的末端サブ配列を伴
う新しい反応を加える;そして(5)無作為に選ばれた反応を除去する。QEATMのRE
実施形態が設計されている場合、全ての標的末端サブ配列が、利用可能なRE認識
配列に制限される。代替的位相性プライマーSEQ-QEATM又はその他の手段が、有
効な標的サブ配列を生成するために使用される場合、全てのサブ配列は、利用可
能なREから生成され得るような有効な標準サブ配列の中から選ばれなくてはなら
ない。新しい実験定義を生成するのには、これらの移動の1つを無作為に選択し
、既存の実験定義についてこれを実施する。代替的には、さまざまな移動を等し
くなく重みづけすることができる。特に、反応の数を固定しようとする場合、移
動(4)及び(5)をスキップする。本発明はさらに、新しい実験を生成するため、そ
の他の移動にも適合可能である。好ましい生成方法は、可能な全ての実験を生成
することになる。
シュミレートされたアニーリング法を適用するために、いくつかの付加的な補
助的選択が必要となる。エネルギーが温度と等しくなるように、「ボルツマン定
数」は1.0となるようにとられる。それぞれE0及びT0と記されているエネルギー
及び温度の最小値は、情報尺度の最大値により定義される。例えば、対象である
良好な配列の数がGであり、情報尺度として用いられる場合、T0に等しいE0は1/G
に等しい。T1として記される初期温度は、好ましくは1として選ばれる。初期実
験定義又は状態は、無作為に選ばれるか又は、それまでの実験最適化の従来の知
識を指針として選ばれる。最終的には2つの実行パラメータが選ばれる。これら
のパラメータは、シュミレートされたアニーリング法の実行中の温度の低下の仕
方である「シュミレートされたアニーリング計画」を定義する。これらは、好ま
しくは100とされるNという字で表された1つの時期の中での反復の数、及び好ま
しくは0.95とされるfという字で表される温度減衰率である。Nもfも共に、より
低いエネルギー及びより高い情報尺度で実験定義のより良い最適化を達成するべ
く、ケースバイケースで系統的に変動させることができる。
情報尺度又はエネルギー関数;新しい実験を生成するための移動、及び以上の
ように作成されたパラメータについての選択と共に、実験定義を最適化するため
のシュミレートされたアニーリング法の一般的応用が図13Aに例示されている。
この記述の中で用いられている情報尺度は、対象である良好な配列の数である。
以上で記述したもののような任意の情報尺度も、代替として使用することができ
る。
この方法は、工程1701で始まる。工程1702で、温度は初期温度にセットされ、
状態は、初期段階又は実験定義にセットされ、エネルギーは初期状態のエネルギ
ーにセットされる。工程1703では、偶然の初期選択又はその後の計算工程のいず
れかの結果として、選ばれた情報尺度についての最小値以下であるか否かを決定
するために、温度及びエネルギーがチェックされる。エネルギーが最小エネルギ
ー以下である場合、さらなる最適化は全く不可能であり、最終的実験定義及びそ
のエネルギーが出力される。温度が最低温度以下である場合、最適化は停止され
る。このとき、エネルギーの逆数は、この実験定義についての、対象である良好
な配列の数である。
工程1706は、模擬アニーリングアルゴリズムの一世代またはN反復を行うDO
ループである。各反復は、工程1707〜工程1711から成る。工程1707は、記載した
生成手段に従って、新しい実験的定義または状態、Snewを生じる。工程1708は
、Snewの情報内容またはエネルギーを確かめ、または決定する。工程1709は、
新しい状態のエネルギーを試験し、それが現在の状態のエネルギーより低いなら
ば、工程1711で新しい状態および新しいエネルギーが容認され、現在の状態およ
び現在のエネルギーと交換する。新しい状態のエネルギーが現在の状態のエネル
ギーより高い場合は、工程1710が下記関数の算出を行う。
EXP〔−(E〜Enew)/T〕
この関数は、容認を制御する確率因子を規定する。この関数が0〜1の間で均等
に分布したランダムな選択数値よりも小さい場合は、新しい状態が工程1711で容
認され、そうでない場合、新しく生じた状態は放棄される。これらの工程は、エ
ネルギーの増加が、関数(4)とランダムな数値の選択との組み合わせによって
決定されるよりも多くはない場合、新しい状態の容認と等しい。言い換えると、
新しい情報の程度の減少が関数(4)によって間接的に決定されるよりも多くな
い場合は、新しい状態が容認される。
最後に、一世代のアルゴリズムの後、工程1712で、温度を増倍率fだけ低下さ
せ、その方法を工程1703の試験に戻してループ化する。
ある情報内容を有する最初の実験的定義から出発してこのアルゴリズムを使用
すると、より高い情報内容を有する定義を検索するために実験的定義を繰り返し
ランダムに変えることにより、より高い情報内容またはより低いエネルギーを有
する最終の実験的定義が得られる。
工程1708での実験的定義または状態のエネルギーの算出は、図13Bでより詳
細に説明する。この方法は、工程1720で開始する。工程1721は、現在の実験的定
義を入力する。工程1722は、この定義からの完全なダイジェストデータベースお
よび図11の方法による特定の選択したデータベースを決定する。工程1723は、
ダイジェストデータベース全体を走査し、関与する適切な配列の数をカウントす
る。適切な配列の総数が使用される目安であるならば、適切な配列の総数をカウ
ントすることができる。あるいは、情報の他の目安をダイジェストデータベース
に適用することもできる。工程1724は、エネルギーを情報の目安の逆数として算
出する。あるいは、情報内容の別の減少関数をエネルギーとして使用することも
できる。工程1725はエネルギーをアウトプットし、その方法は工程1726で終わる
。
5.4.3. QEATM曖昧さ分解能
本発明の一つの使用では、2個の関連する組織サンプルを、恐らく一つの認識
反応のみから成る同じ実験にかけて結果を比較することができる。2つの組織サ
ンプルは、一方が正常であり、他方が恐らく感染または過形成もしくは癌などの
増殖過程により病的であることを除いて、同一である可能性がある。1個以上の
シグナルが一方のサンプルで検出され、他方のサンプルでは検出されないかもし
れない。そのようなシグナルは、一方の組織での病的過程の遺伝子的側面を表し
ている可能性がある。これらのシグナルは特に重要である。
関与するシグナルを生じ得る候補の配列は、以前に記載されたように、ダイジ
ェストデータベースでのルックアップにより決定される。そのシグナルは、一つ
の配列のみによって生じるかもしれない。その場合は、明瞭に同定される。しか
し、たとえ実験が最適化されていても、シグナルは、選択されたデータベースか
らのいくつかの候補配列によって生じる可能性があるという点で曖昧であると考
えられる。関与するシグナルは、本明細書に記載のいくつかの方法で曖昧さをな
くすことができる。
曖昧さをなくす第一の方法では、関与するシグナルが、その全てが特定の実験
に対して適切な配列であるいくつかの候補配列によって生じると考える。その場
合、どの配列がその関与するシグナルに存在するかは、適切な配列の定量的存在
をそれらのユニークなシグナルから測定することにより確かめることができる。
例えば、図8Bを参照すると、標識1213を有する長さが175であるシグナル1217
が関与する場合、そのシグナルに実際に存在する配列は、シグナル1215および12
18の存在の定量的測定から決定できる。この場合、このシグナルに寄与する可能
性のあるどちらの配列も、この実験に適切な配列である。
曖昧さをなくす第一の方法は、シグナルに寄与する可能性のある配列の一つが
適切な配列でない場合に拡張することができる。可能性のある適切な配列の全て
の定量的存在は、それらのユニークなシグナルの定量的強度から決定できる。適
切な配列でない残りの配列の存在は、関与するシグナルの定量的存在から適切な
全ての配列の定量的存在を差し引くことにより決定できる。
第一の方法は、適切でない配列が適切な配列を含むさらに別のシグナルにそれ
らの定量的存在の決定を可能にする方法で寄与していると考えられるならば、1
より多くの可能な配列が適切な配列でない場合にもさらに拡張できる。例えば、
シグナル1219が関与するとすると、その場合は、可能などちらの配列も適切な配
列でない。配列Q012の定量的存在は、先に概説した方法で、シグナル1220および
1218から決定できる。配列S003のの定量的存在は、シグナル1216および1215から
決定できる。それにより、シグナル1219に寄与する配列が決定できる。さらに複
雑な組み合わせも同様に明瞭にすることができる。
あるいは、曖昧さをなくす第一の方法は、たとえ最初はそうでなかったとして
も、関与する配列シグナルに寄与する可能な配列が適切な配列である別の実験を
設計することにより拡張される。QEATMのRE実施態様(第6.2節)で使用で
きる約50の適切なREが存在するので、理論上の最大の半分である1,250(50x5
0/2=1,250)が使用できないとして、約600のRE反応対が実行可能である。ほ
とんどのRE対は平均して200の断片を生成し、標準的な電気泳動法は、1レー
ンにつき少なくとも約500の断片長さを解像できるので、RE QEATM実施態
様は、100,000以上(500x200=100,000)のシグナル生成能を有する。可能なシ
グナルの数は、3以上のREとの反応の使用および標識したプローブの使用によ
ってさらに増加する。さらに、平均的なヒトの複雑な組織、例えば脳は、約25,0
00以下の遺伝子を発現すると推定されるので、サンプル中の可能な配列の数に対
して、可能なシグナルは4倍過剰に存在する。すなわち、関与するどのシグナル
に対しても、恐らく、関与するシグナルの可能な全候補が適切な配列であるよう
な実験をさらに設計し、最適化することができる。この設計は、関与するシグナ
ルにおける関与する配列の情報の目安とともに従来の最適化法を使用し、多くの
追加の反応を含む広範囲の初期実験的定義を出発点として行うことができる。そ
のようにして、何らかの関与するシグナルは曖昧でなくさせられうる。
曖昧さをなくす第二の方法は、関与するシグナルに存在する可能性のある配列
が実際に存在する可能性を、残りの実験的反応からの情報を使用して自動的にラ
ンク付けすることによるものである。図14は、好ましいランク付けの方法を示
している。その方法は、工程1801で始まり、工程1802で、関与するシグナルにお
ける可能な受け入れ番号リスト、実験的定義および実際の実験結果を入力する。
DO−ループ1803は、可能な受け入れ番号毎に1回反復する。工程1804は、図1
1に示した方法によって模擬実験を行うが、ここでは、現在の受け入れ番号のみ
に基づいて行われる。出力は、図10Fに示したような単一の配列ダイジェスト
表である。
工程1805は、実験結果に対するこのダイジェスト表の類似点をランク付けする
数値による得点を決定する。一つの可能な得点基準は、全断片シグナルに対して
ダイジェスト表を走査し、該シグナルが実験結果にも見られる場合はその得点に
1を加え、該シグナルが実験結果には見られない場合はその得点から1を差し引
くことを含む。別の得点基準も可能である。例えば、1を引くことは省略しても
よい。
工程1806は、可能な各受け入れ番号が実際にサンプルに存在する可能性の数値
による得点を分類する。工程1807は、分類したリストをアウトプットする。その
方法は、工程1808で終わる。
この方法により、関与するシグナルにおける種々の可能な配列の存在の可能性
推定値が決定できる。
5.5 コロニー呼び出し
コロニー呼び出しの実施態様は、標的サブ配列の存在または非存在を決定する
ことにより、単一の個々の遺伝子またはDNA配列を認識し、分類する。長さの
情報は決定されない。この実施態様は、アレイ化サンプルまたはコロニーの遺伝
子決定および分類に関し、この場合、各サンプルまたはコロニーは、関与するた
だ1個の配列または遺伝子を含み、または発現し、恐らく、組織DNAライブラ
リーから調製される。コロニーにおける標的サブ配列の有無は、その各々が1個
の標的サブ配列にユニークに結合する標識したハイブリダイゼーション認識手段
の使用により決定される。この結合は、特異性および再現性が高いのが好ましい
。各サンプルもしくはコロニー、またはアレイ化サンプルもしくはコロニーは、
プローブのどのセットがサンプル中の標的サブ配列を認識し、従ってハイブリダ
イ
ズするかを決定することにより、含まれる配列に対するアッセイが行われる。そ
して、各サンプルは、ハッシュコードにより特徴付けられ、そのコードの各ビッ
トは、どのプローブが特定サンプル中のサブ配列またはヒットを認識したかを示
す。サンプル中の配列または遺伝子は、コンピューターによる方法によってハッ
シュコードから決定される。
標的サブ配列の選択は重要である。経済的かつ迅速なアッセイのために、認識
手段セットの大きさは、できるだけ小さくするべきであり、好ましくは、50要素
未満、より好ましくは15〜25要素である。さらに、可能な全配列または遺伝子が
認識され、ユニークに決定されるのが最も好ましい。可能な全配列の90〜95%が
認識されるのが好ましく、各配列は、多くても1または2の他の配列に対して区
別できないか、曖昧である。従って、各標的サブ配列は、必要な異なる認識手段
の数を最少にするのに十分頻繁に存在するのが好ましい。例えば、各プローブが
2、3の遺伝子のみを認識し、従って、何千ものプローブを必要としたならば、
迅速な遺伝子の分類を目指す本発明に対して実際的でない。しかし、各標的サブ
配列は、その存在が情報をほとんど伝えないほど頻繁には存在しないのが好まし
い。例えば、どの遺伝子も認識するプローブは、情報を全く伝えない。
各標的サブ配列に対する最適な選択は、遺伝子または配列の全てにおける存在
の確率が約50%のサンプルまたはコロニーで生じるようにすることである。好ま
しい選択は、存在の確率が10〜50%である。ヒトcDNAライブラリーの場合は
、典型的には、長さが4〜6の標的サブ配列がこの条件に合う。より長い配列は
、めったに存在しないので、有用なハッシュコードが作成できない。さらに、一
つの標的サブ配列の存在は、同じ配列または遺伝子における他のどの標的サブ配
列の存在にも無関係であるのが好ましい。これら2つの規準は、どの標的サブ配
列が存在するかの指標から成るサンプルのハッシュコードが、恐らく最大限に、
ユニークな遺伝子またはDNA配列を表すものであり、どの遺伝子も特定しない
不用なコード指示は最少であることを確かめるものである。そのようなハッシュ
コードは、配列または遺伝子の有効な表示である。
ハッシュコードによって表すことのできる遺伝子または配列の最大数は2n(
nは標的サブ配列の数である)である。標的配列が予想される遺伝子ライブラ
リーに十分頻繁に存在するかどうかを決定するための簡単な試験は、存在する、
または存在しない全ての標的サブ配列を有する2個のハッシュコードの実際の確
率を、これらのコードの理想の確率と比較することにより行う。pを、いずれか
の標的サブ配列がライブラリーの所与の配列に存在する確率であるとすると、標
的サブ配列がどれもランダムな遺伝子に存在しない確率は、(1−p)nである
。(1−p)n/2-nの比が1に近づくほど、コードはより有効である。同様に
、最大の情報を伝える理想の確率に対する全ての標的サブ配列が存在する確率の
比であるpn/2-nが1に近づくほど、コードはより有効である。最適なpは2- 1
に近いと考えられる。
存在の確率および独立性の規準に合致する標的サブ配列を選択する好ましい方
法は、分析すべきサンプル中に存在すると一般に予想される配列(例えば、ヒト
組織由来のサンプルについてのヒトのGenBank配列)を含むデータベースを用い
ることである。配列データベースから、好ましくは全て4-mer〜8-merの頻度を含
むオリゴマーの頻度表(frequency tables)を編集する。これらの表から、所望の
存在確率を有する候補サブ配列を選択する。次に、例えば任意の選択した候補対
によるヒットについての条件付き確率が、個々の候補のヒット確率の確率の積に
近いことをチェックすることによって、各候補標的サブ配列を独立した存在につ
いてチェックする。存在および独立性の双方の規準に合致する候補標的サブ配列
は、可能性のある標的サブ配列である。これらのサブ配列のいずれかの十分な数
(典型的には20)をハッシュコードに対する標的サブ配列として選択することが
可能である。
好ましくは(しかし任意ではあるが)、配列データベース中の最初に選択した
標的サブ配列の実際の存在(actual occurrences)に関する情報を用いて、標的サ
ブ配列の最初のセットを最適化して、最小数の配列および最小量の認識アンビギ
ュイティ(曖昧さ)を有する最大数の遺伝子を認識する選択された1セットの標
的サブ配列を得ることが可能である。あるいはまた、この最適化は、生物学的ま
たは医学的に関心のある特定の配列または遺伝子を含むデータベースのサブセッ
ト(例えば、全ての癌遺伝子または増殖因子のセット)について行うことも可能
である。このようにして、特に関心のある1セットの配列または遺伝子の中でよ
り効率的に識別し、かつサンプルの残りの配列からそのセットの遺伝子を識別す
るわずかな標的サブ配列の選択が可能になる。
この組み合わせの最適化(combinatorial optimization)の問題は、まさにコン
ピューターの分野において解決が強く求められているものである。多くの近似法
を用いて有効な最適解に近いものを得ることが可能である。好ましい方法は、模
擬アニーリング(simulated annealing)(Pressら、1986,Numerical Recipes-Th e Art of Scientific Computing,
Sec.10.9,Cambridge University Press,Ca
mbridge,U.K.)を用いることであるが、それに限定されない。実験設計および
最適化については以下の節で詳細に記載する。
実施例6.6は、模擬アニーリング最適化法の結果を説明するものである。模擬
アニーリングは一般に、先述の確率の原理によってのみ誘導される選択よりも約
20%少ない全配列を用いながらも、同じレゾリューション(resolution)を達成す
るサブ配列の選択をもたらす。この最適化のレベルは、長い遺伝子を表す大きく
かつそれほど冗長ではない(less redundant)データベースを用いて改善されやす
い。
単一の標的サブ配列を用いる別法は、全く同じように標識したハイブリダイゼ
ーションプローブのセットにより認識される標的サブ配列のセットを用いて、ハ
ッシュコードについての1つの「存在または不存在」の表示を得ることである。
この別法では、長い標的サブ配列のセットは、該セット中の任意の標的サブ配列
の存在が「存在」の表示となるように選ばれるであろう。「不存在」とは、該セッ
トのエレメントが全く存在しないことを意味する。該セットが単一配列中に存在
する確率がほぼ50%、好ましくは10〜50%であり、かつ1セットの存在または不
存在が他の任意のセットの存在または不存在に無関係であるように該セットが選
ばれる場合、そのようなセットは、単一のサブ配列と同等に良好なコードを構築
するのに用いることができる。単一の標的サブ配列コードにように、得られるコ
ードは効率的であり、模擬アニーリングによってさらに最適化することが可能で
ある。短いサブ配列の実験的認識があまり特異的ではなく再現性も良くない場合
には、長いサブ配列の標的セットが好ましい。このことは、例えば、短いDNA
オリゴマーが認識のためのハイブリダイゼーションプローブとして用いられる場
合に当てはまる。さらに別の方法として、コードは、サブ配列と単一標的サブ配
列との混合標的セットの「存在または不存在」の表示から構成されうる。
標的サブ配列に対するプローブは、好ましくはPNAオリゴマーであり(DN
AオリゴマーじゃPNAオリゴマーより好ましくない)、関心のあるサブ配列に
ハイブリダイズする。縮重DNAオリゴマーのセットを使用して、短いDNAサ
ブ配列にさらに特異的にかつ確実にハイブリダイズすることが、QEA(商標)
法のPCR実験に関連して記載されている。コロニーコーリング(colony callin
g)の実施態様ではPNAを用いることが好ましい。その理由は、PNAオリゴマ
ーは、その好ましいハイブリダイゼーションエネルギー論のために、短い
相補的DNAサブ配列に、DNAオリゴマーよりも特異的かつ確実にハイブリダ
イズするからである。6-mer〜8-mer以上のPNAで確実なハイブリダイゼーショ
ンが起こる。短いサブ配列のプロービングは、DNAオリゴマーの場合のように
、好ましくはPNAオリゴマーの完全縮重セットを用いる。
PNAは、上記別法において、ハッシュコードが長いサブ配列の標的セットの
存在または不存在の表示を含む場合には、さらに好ましいものである。この場合
、一般にPNAプローブよりも多くのDNAプローブが必要となる。PNAの6-
mer〜8-merは確実にハイブリダイズするので、標的セットは長さ6〜8のサブ配
列から構成されうる。この長さのDNAオリゴマーは確実にハイブリダイズしな
い可能性があるので、このセットの各サブ配列は次にDNAオリゴマーのさらな
る縮重セットにより表されなければならなず、そのためさらに1組のセットが必
要になる。
コロニーコーリングの実験方法は3つの主な工程を含む。第1に、フィルター
または他の好適な支持体の上にcDNAライブラリーをアレイ化し;第2に、P
NAハイブリダイゼーションおよび検出(あるいはまた、DNAハイブリダイゼ
ーションを用いることも可能である)を行い;第3に、得られたハッシュコード
を解読して、サンプル中の配列を決定する。
上記第1の工程(アレイ化したcDNAライブラリーが既に利用可能である場
合には省略できる工程である)は、cDNAライブラリーを構築およびアレイ化
する。当業界で公知の如何なる方法を用いることも可能である。例えば、正常ま
たは罹患組織由来のcDNAライブラリーは、実施例6.3.に従って構築すること
ができる。あるいはまた、M.B.Soaresおよびその同僚達によって構築されたヒト
cDNAライブラリーは、フィルター上の高密度のアレイ(arrays)として利用可
能であり、この方法の実施に使用することが可能である。Scaresら、1994,Proc
.Natl.Acad.Sci.USA 91:9228-32を参照。ハイブリダイゼーションに好適な
フィルター上に何千ものcDNAクローンまたはコロニーをスポットできること
は確立した技術である。このサービスは、現在では幾つかの企業によって提供さ
れており、好ましい業者としてはResearch Genetics(Hunstville,AL)が挙げら
れる。実施例6.7のプロトコールを用いて、cDNAライブラリー
からこれらのアレイを作製することが可能である。
上記第2の工程は、プローブ(例えば、PNA)のハイブリダイゼーションお
よび検出である。蛍光標識したPNAオリゴマーは、PerSeptive Biosysmtems(B
edford,MA)から入手可能であるか、あるいは、合成することができる。PNA
は、選んだ標的サブ配列に相補的であり、かつ複数のオリゴマーを用いる同時ハ
イブリダイゼーション用の識別可能な標識を最大数有するように設計される。P
NAハイブリダイゼーションは、製造業者によって開発された実施例6.7.に詳細
に記載されている標準的なプロトコールに従って行われる。PNAシグナルの検
出には、DNA解析装置で用いられるのと類似しているが、線状にアレイ化され
たバンドと対照させてフィルター上のスポットを認識するように適切に改変され
ている、蛍光色素発光を識別するための光学的分光分析手段が用いられる。
上記第3の工程はハッシュコードの解読であり、この工程は、以下の節で記載
するコンピューターを導入した方法によって行う。
別の実施態様では、検出されるハイブリダイゼーションシグナルの強度は、プ
ローブがサンプル配列に結合した回数を示す。このようにして、サンプル中に存
在する認識された標的サブ配列の数が検出できる。この情報は、サンプルをより
正確に分類または同定するのに用いることができる。
5.6.CC分析および設計方法
コロニーコーリング(「CC」)コンピューター導入法は、QEA(商標)コ
ンピューター法と類似している。QEA(商標)のように、実験分析法を記載し
た後で実験設計法を記載する。
5.6.1.CC実験分析法
この分析法は、模擬実験概念(mock experiment concept)を用いる。まず、デ
ータベースを選択し、QEA(商標)について記載されている方法と同じ方法に
よってサンプル中の可能性のある配列を表す。これらを、図6Aを参照しながら
説明および記載する。CCでは、実験的規定(experimental definition)は単
にNp標的サブ配列のリストであり、そこにおいてNpは好ましくは16〜20である
。次に、模擬実験により、選ばれたデータベース中の各配列に対する1つのハッ
シュコードが得られる。各ハッシュコードは、Np個の二進数字のストリングで
あり、そこにおいて、n番目の標的サブ配列が配列とハイブリダイズする(しな
い)場合、n番目の位数は1(0)である。全ての模擬実験の結果は、予想され
るハッシュコードのパターンを決定する。このパターンは可能性のある全てのハ
ッシュコードのコード表にアウトプットされ、そこにおいて、各ハッシュコード
に対して、このコードを有する配列の全ての受け入れ番号のリストがある。
この方法を、図15においてさらに詳細に説明する。この方法は、ステップ1901
からスタートし、ステップ1902において選択したデータベースおよびNp個の標
的サブ配列からなる実験的規定についてインプットする。ステップ1903は、2Np
個のハッシュコードの各々に対して、このハッシュコードを有する可能性のある
受け入れ番号のリストを含みうる表をイニシャライズする。ステップ1904は、全
ての配列を通って繰り返すDOループである。特定の配列では、ステップ1905は
、各標的サブ配列について、そのサブ配列が配列にハイブリダイスするか否かを
チェックする。これは、ストリングマッチング(string matching)により、図9
のステップ1303と同様にして実行される。二進ハッシュコードは、このハイブリ
ダイゼーション情報から構築され、ステップ1906は、この配列の受け入れ番号を
、コード表中のこのハッシュコードに関連する受け入れ番号のリストに加える。
ステップ1907は、このコード表をアウトプットし、この方法はステップ1908で終
わる。
コード表中の模擬ハッシュコードのパターンが作製されているので、実験の分
析は単純な表のルックアップ(照合;look-up)のみを必要とする。コロニーは
、標的サブ配列に対するNp認識手段の各々とハイブリダイズする。このハイブ
リダイゼーションの結果を用いて、結果としてもたらされるハッシュコードを構
築する。次に、このハッシュコードエントリーのこのコード表は、サンプル配列
の可能性のある候補である配列受け入れ番号のリストを含む。このリストが1つ
のエレメントのみを含む場合には、サンプルは独自に同定されている。このリス
トが2つ以上のエレメントを含む場合には、同定はアンビギュアスである。こ
のリストが空である場合には、サンプルは選択したデータベースには存在せず、
おそらく従来では知られていない配列である可能性がある。
あるいはまた、QEA(商標)実験分析と同様に、ごくわずかなハッシュコー
ドをごくわずかな実験から調べる必要がある場合、コード表を無しで済ますこと
が可能である。その場合、関心のあるハッシュコードをもたらす配列について、
DNAデータベースを配列から配列へと次々にスキャンする。多くの実験からの
多くのハッシュコードを分析する必要がある場合には、コード表はさらに効果的
である。コード表を何時作製するのかについての定量的決定は、種々の操作のコ
ストおよびDNAデータベースの大きさに依存し、コンピューターの技術分野に
おいて周知のようにして行うことができる。この記載はコード表の使用について
なされたものであるが、それらに限定されるものではない。
認識手段の各々が標的サブ配列のサブセットを認識できる実施態様では、コー
ド表の構築は、それに応じて変えなければならない。そのような実施態様として
は、例えば、その長さのために、目的の標的サブ配列および該目的の標的と1塩
基対だけ異なるサブ配列とハイブリダイズできるDNAオリゴマープローブが挙
げられる。そのような実施態様において、ステップ1905は、そのような1セット
の標的サブ配列の各メンバーがサンプル配列中に見出されるか否かをチェックす
る。配列中にいずれかのメンバーが見出される場合には、この情報はハッシュコ
ードの構築に用いられる。
5.6.2.CC実験設計法
QEA(商標)と同様に、CC実験設計の最終目的は、CCハイブリダイゼー
ション実験から得られる情報の量を最大にすることである。これは、情報の基準
(information measure)を定め、この基準を最大にする最適化方法を選ぶことに
よっても行われる。
好ましい情報の基準は正味の(occupied)ハッシュコードの数である。これは、
特定のハッシュコードをもたらす受け入れ番号の数を最小にすることに相当する
。事実、約17〜18より大きなNp(すなわち、発現されるヒト遺伝子の数(約100
,000)より大きな2Np)では、正味のハッシュコードの数を最大にすること
により、単一の配列を表す各ハッシュコードが得られる。そのようなユニークな
コードは、最大量の情報を含む。本発明は、他のCC情報基準(information mea
sure)にも適用可能である。例えば、可能性のある配列のサブセットだけに関心
がある場合、およその基準(approximate measure)は、ハッシュコードによって
ユニークに表されるそのような配列の数であろう。QEA(商標)に関しては、
これらは関心のある配列である。
1つの最適化アルゴリズムは全数検索である。全数検索では、約10未満の長さ
のサブ配列の全ては、全ての組み合わせで試されている。これは、選んだ情報基
準に従って最良のハッシュコードをもたらす最適な組み合わせを見つけるためで
ある。この方法は効率的ではない。実験からの情報を最適化するための好ましい
アルゴリズムは、模擬アニーリングである。これは、図13Aに関して説明およ
び記載されている方法によって行われる。CCでは、以下の好ましい選択が行わ
れる。
エネルギーは情報量で割ったとき1.0になるようにする。あるいはまた、情報
量の単調に低下する関数を用いることも可能である。エネルギーは、特定の実験
規定を用いて図15の模擬実験を行い、次いで得られたコード表に該基準(measure
)を当てはめることによって決定される。例えば、正味のハッシュコードの数が
情報基準である場合、この数は、コード表を単にスキャンし、空ではない受け入
れ番号リストを用いて表エントリーの数を計測しすることによって計算できる。
ボルツマン(Boltzman)定数を再度1にして、温度がエネルギーと等しくなるよう
にする。初期温度は、好ましくは1.0である。最小のエネルギーおよび温度(E0
およびT0)は、情報基準によってそれぞれ決定される。例えば、エネルギー関
数および情報基準についての従来の選択を用いると、E0(T0と等しい)は選択
したデータベース中の配列の数で割ったとき1.0である。
既存の規定(definition)から新規な実験的規定をもたらす方法は、1つの標的
サブ配列をランダムに選び出し、以下の移動(moves)の1つを行うことである。
(1)1以上のヌクレオチドをランダムに修飾すること;(2)ランダムヌクレ
オチドを加えること;および(3)ランダムヌクレオチドを除去すること。修飾
は、2つの同一の標的サブ配列を生じる場合には却下(discard)となる。さらに
、
得られるサブ配列がデータベース中の配列に結合する極めて高い確率を有する場
合には、修飾をやめることが望ましい。例えば、修飾したサブ配列が選択したデ
ータベース中の配列に約0.1未満または約0.5より高い確率で結合する場合には却
下するべきである。新規な実験を作成するためには、これらの移動の中の1つを
ランダムに選択し、既存の実験的規定について行う。あるいはまた、種々の移動
を不均等に偏らせることが可能である。本発明はさらに、新規な実験を作成する
他の方法にも適用可能である。好ましくは、用いる作成方法は、可能性のある全
ての実験をランダムに作成する。初期の実験的規定は、Np個のランダムに選ば
れたサブ配列を取ることによって、あるいは従来の最適化からのサブ配列を用い
ることによって選ばれうる。
最後に、「アニーリングスケジュール」(すなわち、模擬アニーリング法を実
施している間に温度が低するようなやり方)を定める2つの排他的パラメーター
は、QEA(商標)のようにして定める。或る一定期間内の繰り返しの回数(N
で表される)は好ましくは100とし、温度低下因子(fで表される)は好ましく
は0.95とする。Nおよびfの双方はケース・バイ・ケースで系統的に変化させて
、低いエネルギーおよび高い情報基準を伴う良好な実験的規定を達成することが
可能である。
これらの選択を用いて、図13Aの模擬アニーリング最適化法を行って、標的サ
ブ配列の最適化されたセットを得ることが可能である。最適なNpを決定するた
めに、異なる初期Npを選択し、従来の設計最適化を行ない、その結果を比較す
ることが可能である。最大の情報基準を有するNpが、選択したデータベースに
は最適である。
5.6.3.CC定量的実施態様
定量的検出情報を使用できるようにするためには、コード表に保存されていた
模擬ハッシュコードのパターンを追加の情報を用いて増大させる。表中の各ハッ
シュコードおよび該ハッシュコードがもたらす各配列では、この追加の情報は、
各標的サブ配列がそのような配列中に見出される回数を記録することを含む。こ
れらの回数は、全配列をスキャンし、各標的サブ配列の存在の回数をカウントす
ることによって単純に決定される。
この拡大した表においてハッシュコードのルックアップを行うための例示的方
法は、まず特定のハッシュコードを二進数としてもたらす配列を見つけ出し、次
に、これらの最も可能性のある配列から、検出した定量的ハイブリダイゼーショ
ンシグナルに最も類似したパターンのサブ配列カウントを有する配列として選ぶ
ことである。そのような類似性を決定するための例示的方法は、検出したシグナ
ルを線形的に正規化して、最も小さいハイブリダイゼーションシグナルが1.0と
なるようにさせ、次いで、n次元のコード空間におけるユークリッドの計量(Euc
lidean metric)を用いることにより、最も近い配列を見つけ出すことである。
CC実験設計では、サブ配列カウントの各パターンは、あるいは、情報基準の
評価のための異なるコードエントリー(distinct code entry)と考えることが可
能である。これは、各ハッシュコード単独を異なるエントリー(distinct entry)
と考える代わりである。
5.7 本発明の方法を実施するための装置
本発明の装置は、好ましい自動化態様(例えば、6.4.3節のプロトコール
による態様)における本発明の認識反応を実施するための手段、並びにコンピュ
ーターによる実験分析及び本発明の方法の設計を実施するための手段を含む。議
論の的は、本発明のQEATM実施態様に関する装置の実施態様にあるが、同様の
装置がCC実施態様に適合することができる。そのような適合には、QEATM実
施態様の対応する構成要素の代わりに、クローンのアレイを作製しハイブリダイ
ズするとともにハイブリダイゼーションの結果を解読するのに適した自動化実験
装置、並びに5.6節に記載されたCC実施態様のコンピューター分析及び方法
設計を装備したプログラムを使用することが含まれる。
図12Aに、本発明のQEATM実施態様及びCC実施態様における所望の適合構
造を有する実験装置を図示する。コンピューター1601は、UNIXをベースとす
るワークステーション型コンピューター、MS-DOS若しくはWindowsをベー
スとするパーソナルコンピューター、Macintoshパーソナルコンピューター、又
はその他の同等のコンピューターであってもよい。好ましい実施態様において、
コンピューター1601は、Macintosh及びMS-DOS/Windowsプログラムの両方
を使用できるソフトウェアーシステムを有するPowerPCTMをベースとするMac
intoshコンピューターである。
図12Bに、好ましい実施態様におけるコンピューター1601のRAMメモリー中
の一般的なソフトウェアー構造を図示する。Macintoshオペレーティングシステ
ム1655は、最も低いソフトウェアーレベルにある。このシステムは、コンピュー
ター1601のUNIXプログラム及びMS-DOS又はWindowsプログラム並びに
Macintoshプログラムを実行できる特徴点1656及び1657を含む。本発明のコンピ
ューター法における好ましい言語は、次に高いソフトウェアーレベルにある。認
識反応並びに断片分離及び検出を実施する1651及び1652に
よって例示される実験装置における制御ルーチン1661を装備する上で、Lab Vi
ew1658(National Instruments,Dallas,TX)が好ましい。5.4節及び5.6節
に記載される実験ルーチン1662を装備する上で、C又はC++言語1659が好ましい
。当該技術分野で公知である種々のスクリプティング(scripting)言語は、高
速プロトタイピング(rapid prototyping)にとってそれほど好ましくはないが
有用である。ルーチン及び方法を装備したコンピューターに対するユーザーのイ
ンターフェースを装備する上で、Power Builder1660(Sybase,Denver,CO
)が好ましい。最後に、上記コンピューター法を装備したプログラムは、最も高
いソフトウェアーレベルにある。これらのプログラムは、装置制御ルーチン1661
並びに実験分析及び設計ルーチン1662に分けられる。制御ルーチン1661は、QE
ATM及びCCプロトコールを物理的に実行する1651及び1652によって例示される
実験装置と相互作用する。実験ルチーン1662は、DNA配列データーベース及び
実験結果を保存する装置1654及び1653によって例示される保存装置と相互作用す
る。
図12Aに戻ると、一つのプロセッサーのみが図示されているが、コンピュータ
ー法及び装置制御インターフェースは、マルチプロセッサーに基づいて、又は別
々であるが連結している幾つかのプロセッサーに基づいて実行できる。例えば、
例えば、装置制御法1661、コンピューター実験法1661、及びグラフィックインタ
ーフェース法が任意のコンビネーション又はサブコンビネーションの種々のプロ
セッサーに基づいて実行できる。
インプット/アウトプット装置には、装置制御情報及び実験結果のアウトプッ
トディスプレイ並びにユーザーの要求及び命令のインプットに対する、キーボー
ド及び標準マウス1603により制御されるカラーディスプレイ装置1620が含まれる
。インプット及びアウトプットデーターは、好ましくは、連結部1606を通してコ
ンピューター1601に連結している1604、1605、1624及び1625のようなディスク装
置
に保存される。データーは、便利であるディスク装置のいかなるコンビネーショ
ン上に保存してもよい。従って、連結部1606は、すべてのディスクがコンピュー
ターキャビネット中にある連結部の一部、データーがその他の部分のサーバーコ
ンピューター上にあるLAN連結部、又はデーターが遠隔のサーバー上にある遠
隔連結部のいずれであってもよい。
装置1630及び1631は、部分的に又は全体的に自動化された、QEATM認識反応
を実施する実験装置の例示である。これらの装置は、例えば、自動化サーマルサ
イクラー、実験ロボット、並びに制御可能な分離及び検出装置であってもよく、
このような装置に関しては、出願人らが1995年5月9日に出願した係属中の米国
特許出願08/438,231を参照できる。連結部1632は、コンピューター1601並びに制
御装置1631及び1632の間の制御及びデーター連結部の例示である。これらは、特
別なバス、標準的なLAN、又は当該技術分野で公知である任意の適当な連結部
であってもよい。これらの連結部は、コンピューターで解読可能な媒体、又は装
置とコンピューター1601との間を交換する単なる手動のインプットであってもよ
い。矢印1634及び1635は、実験1607及び1613を実行するための装置を通したサン
プルの物理的な流れを図示する。サンプルの流れは、自動、手動、又は適当な任
意のコンビネーションのいずれでもよい。他の実施態様においては、実験装置は
より少なくても、より多くてもよく、そのような実験装置は実験自動化技術の現
状において知られている。
この完全な装置に基づいて、QEATM実験が設計され、実施され、分析され、
好ましくは可能な限り自動化によって行われる。第一に、QEATM実験は、コン
ピューター1601の実験ルーチン1662を装備する5.4.2節に説明された方法に
従って設計される。設計ルーチンへのインプットは、DNA配列のデーターベー
スであり、このデーターベースは、典型的には、5.4.1節に記載された、イ
ンプット総合的配列データーベース1604からの選択により得られる代表的な選
択データーベース1605である。また、総合的DNAデーターベース1604は、イン
プットとして使用することもできる。データーベース1604は、コンピューター16
01の一部に又は遠隔に位置してもよい。上記方法により実行されるプロセッサー
1601により実施されるデーターベース選択は、1以上の代表的な選択データーベ
ース1605を発生させる。実験設計方法からのアウトプットは、1609及び1615によ
って例示される表であり、これらにはQEATM実施態様における認識反応及び各
認識反応で使用されるREが記入される。
第2に、この装置はデザインされた実験を遂行する。例示実験1607は、組織サ
ンプル1608によって規定され、これは、正常な又は病的な、実験定義1609、及び
1609により規定される物理的認識反応1610であり得る。機器1630が反応を自動化
するための実験ロボットである場合、コンピューター1601は、ロボット1630を命
令及びコントロールして、組織1608から調製されたcDNAサンプルについて反応16
10を実行する。機器1631が分離及び検出機器である場合、これらの反応の結果は
、次に分離及び検出のために1631に、自動又は手動で移される。コンピューター
1601は、この分離の実行を命令又はコントロールし、そして検出情報を受け取る
。この検出情報は、リンク1632によって、コンピューター1601にインプットされ
、そして保存デバイス1624に、実験デザイン表及びプロセッシング用に、組織サ
ンプル源に関する表及び情報とともに保存される。この実験は、例えば蛍光標識
を用いるため、検出結果は蛍光トレース1611として保存される。
実験1613は、定義1615により規定される、組織1608からのcDNA上の認識反応16
16を実行するロボット1630及び、フラグメントの分離及び検出を実行するデバイ
ス1631を用いて、サンプル経路1633に沿って同様に処理される。フラグメント検
出データは、コンピューター1601によって入力され、そして保存装置1625上に保
存される。この場合、例えば、銀染色が用いられ、検出データは、染色バンドの
画像1617である。
実験遂行の間、機器コントロールルーチンは、機器1630及び1631により必要と
される詳細なコントロール信号を提供する。これらのルーチンはまた、オペレー
ターモニタリングを可能とし、プロセスにおける実験の進行、装置の現状、機器
の例外(exception)又は故障、及び実験オペレーターに対して使用可能なそのよ
うな他のデータを表示することによりコントロールする。
第3に、相互実験分析は、5.4.2.節及び5.4.3.節に記載のように、分析及びデ
ザインルーチンにより生じた刺激された信号のデータベースを用いることにより
実施される。実験1607用に対する刺激されたデータベース1612は、適切な選択さ
れたデータベース1605及び実験定義1609をインプットするように用いることによ
り、プロセッサー1601上で実施される分析方法により生成され、アウト
プットは表1612である。同様に、表1618は、実験1613用の信号の対応する刺激さ
れたデータベースであり、適切な選択されたデータベース1605及び実験定義1615
から生成される。信号は5.4.3.節に記載の方法を実行する実験ルーチン1662によ
り明瞭にされる。
ディスプレイ装置1602は、本発明の方法により生じるデータのための典型的な
ユーザーインターフェースを示す。このユーザーインターフェースは好ましくは
、パワービルダーディスプレイフロントエンド(Powerbuilder display front en
d)を用いることによりプログラムされる。1620には、結果が表示されるべき特定
の実験及びその実験の特定の反応を選択するために使用され得る選択ボタンがあ
る。一旦、実験が選択されたなら、サンプルの組織源の組織学的画像が、ウイン
ドウ1621に選択及び表示用に示される。これらの画像は、代表的には、観察され
、デジタル化され、そしてサンプル調製の一部としてコンピューター1601上に保
存される。選択された実験の選択された反応の結果は、ウインドウ1622上に表示
される。ここで、特定の標識の蛍光トレース出力が利用可能である。ウインドウ
1622は、連続的な完全長のDNAフラグメントの可能性のある位置を表すマーク162
6により指し示さる。
ウインドウ1623は、刺激されたデータベース1612からの内容を表示する。例え
ば、マウス1603を用いて、特定のフラグメント長インデックス1626が選択される
。次いで、プロセッサーは、表示された末端標識を有する長さのピークを生じ得
るアクセッション番号のリストを、刺激されたデータベースから検索する。この
ウインドウはまた、これの配列について、遺伝子名、書誌的データなどのさらな
る情報も含み得る。このさらなる情報は、選択されたデータベース1605中で利用
可能であり得、又は、アクセッション番号に基づく完全配列データベース1604に
対して、質問を提供し得る。このようにユーザーは相互に、特定の結果を生じる
可能性のある配列を質問することができ、次いでこれらの配列の存在のその他の
証拠を捜すためにボタン1620を用いることにより、他の反応の実験を走査するこ
とができる。
この相互インターフェースは、異なる問題及び目的のクラスのユーザー用に特
殊化されたさらなる別の実施態様を有することが明らかである。組織遺伝子発現
を決定することに興味のあるユーザーについては、一つの代替方法において、特
定のアクセッション番号が、マウス1603を用いてウインドウ1623から選択され、
そしてプロセッサー1601はこのアクセッション番号により生じ得る他の全てのフ
ラグメント長及びそれらの認識反応を走査する。さらなるウインドウにおいては
、これらの長さ及び反応が表示され、そしてユーザーに、組織サンプル中のこの
アクセッション番号の存在を確認又は反証するために、さらなる反応を選択させ
る。これらの他のフラグメントの一つが、この配列(「良好な配列」上記を参照
のこと)により唯一的に生成される場合、そのフラグメントは特定の問題のフラ
グメントとして強調され得る。このユニークなフラグメントの生じる反応の結果
を表示することにより、ユーザーは迅速且つ明確にこの特定のアクセッション番
号がそのサンプル中に存在するかどうかを決定することができる。
別のインタフェース代替では、該システムは、2つの組織学的画像1621と2つ
の実験結果1622を表示する2つの実験を並べて表示する。これにより、ユーザー
は、一方のサンプル中に存在するが他方には存在しない検査シグナルによる測定
が可能となる。2つのサンプルが、同一の組織の病変標本及び正常標本であった
場合、このようなシグナルは、おそらく病理学的プロセスの差を反映するものと
して非常に重要なはずである。目的のシグナル(好ましくは反復性で再現性のあ
るシグナル)を有するため、ユーザーは、前述のインタフェース設備(facilitie
s)を利用する(invoke)ことにより、該シグナルを発生する可能性の高い受け入れ
番号(accesion number)を決定することができる。本態様のさらなるエラボレー
ション(elaboration)では、システム1601は、異なる状態にある同一組織のサン
プルから得られるシグナルを統計的に分析し、視覚比較を自動化することにより
、目的のシグナルの測定を補助することができる。まず、同一の状態にある組織
サンプル中に再現性よく存在するシグナルを測定し、次いで、複数の状態から得
られるサンプルより発生するこれらの再現性のあるシグナルの差を比較する。従
って、ディスブレー1602は、該再現性のあるシグナルが状態に応じて変化するこ
とを示し、これによりユーザーが目的のシグナルを選択できるようになる。
本発明の装置については、シグナルサイトインプリメンテーション(signal si
te implementation)に適合した態様のところで既に記載している。該装置では、
図12Aに示した各種接続はリモート装置(remote attachment)を表わすことも
できるが、各種デバイスは図12Aのコンピュータ1601に対して実質的にローカ
ルである。本装置の別の明らかな分散型態様を図12Cに示す。実験機器1670、
DNA配列データベースシステム1684、及びコンピュータシステム1671及び1673
を本図面に示す。これらは全て協同して、上述のごとく本発明の方法を実施する
ものである。
これらのシステムは、各種システムに対して通信媒体1674とそのローカル装置
(local attachment)1675、1676及び1677によって互いに接続している。この媒体
は、当該技術分野で公知の専用もしくは共用またはローカルもしくはリモート通
信媒体のいずれであってもよい。例えば、おそらく数キロメートルに及ぶ「キ
ャンパス」LANネットワーク、専用広域通信システム、またはインターネット等
の共用ネットワークであってもよい。該システムローカル装置は媒体1674の特性
に適合している。
実験機器1670は、認識反応、反応結果の分離、及び得られるシグナルの接続16
72を介する検出と送信の自動化工程を実施するようコンピュータシステム1671に
よって制御される。接続1672は、機器制御に適合したものであれば、当該技術分
野で公知のローカルまたはリモート接続のいずれであってもよく、通信媒体1674
を経由することも可能である。
各種配列データベース1685を備えるDNA配列データベースシステム1684は、
例えば、Bethesda(MD)のGenbankといったデータベースのオリジンサイトに直接
アクセスすることにより、他のシステムからはリモートであってもよい。あるい
は、これらのデータベースの一部または全部を、ローカルアクセス用に、コンピ
ュータシステム1671及び1672によってディスクまたはCD-ROM等の記憶デバイス上
へ定期的にダウンロードすることもできる。
コンピュータ1681、記憶デバイス1682、ディスプレー1683を含むコンピュータ
システム1671は、本発明の各種方法を実施することが可能である。例えば、単に
機器システム1670を制御及び監視するための制御ルーチンを実施することもでき
、実験の設計及び分析はコンピュータシステム1673等の別の場所で行う。この場
合、システム1671は、典型的には実験技術者によって操作されるであろう。ある
いは、システム1671は、サンプル分析情報のリモートユーザーの要件を満たす実
験の設計を行うことも可能である。別の態様では、システム1671は、最終データ
ディスプレーを含む本発明のコンピュータ実装方法(computer implemented meth
od)の全てを行うことが可能であり、この場合には、分析情報の末端ユーザーに
よって操作されるであろう。
コンピュータ1678、記憶デバイス1679、及びディスプレー1680を含むコンピュ
ータシステム1673は、関数(function)の対応範囲を実施することができる。しか
しながら、典型的には、システム1673はリモートの位置にあり、DNAサンプル
情報の末端ユーザーによって使用されるであろう。このようなユーザーには、診
断、病気の度合もしくは期、または誘導療法(guide therapy)を行うため
の情報を必要とする臨床医を含めることができる。他のユーザーとしては、薬剤
の設計または開発に有用な情報を必要とする薬理学者を挙げることができる。さ
らに、他のユーザーとしては、細胞生物学、発生生物学等の基礎研究に有用な情
報を必要とする研究者を挙げることができる。また、適切な実験の実施を計画し
たり実行したりすることによって複数のユーザークラスの分析要求に答えるため
に、複数のコンピュータシステム1673を実験システム1670と制御システム1671に
接続することも可能である。
コンピュータ実装方法の別の機能分散を有する本発明の装置の別の分散型態様
が同様に可能であることは、コンピュータ業界の当業者には容易に理解できるで
あろう。
本発明のコンピュータ実装方法は全て、記憶及び送信のために、当該技術分野
で公知のコンピュータで読み取り可能な任意の記憶デバイス上に記録することが
できる。例えば、限定するわけではないが、これらには半導体メモリー(任意の
技術または構成のROM、PROM、EPROM、EEPROM等)、磁気メモリー(任意の密度また
は大きさのテープ、カード、ディスク等)、光メモリー(光読み込み専用のメモリ
ー、CD-ROM、または光で書き込み可能なメモリー等)、並びにコンピュータで読
み取り可能な任意の他のメモリー技術が含まれる。
また、この装置は、主にヒト組織サンプルのQEATM分析について記載してきた
が、実験機器並びに関連の制御、設計及び分析コンピュータシステムはこれに限
定されるものではない。これらは、本発明のCC態様の実施や他のサンプル(動物
モデルまたはin vitro培養等)の分析にも適合可能である。
以下、実施例を挙げて本発明をより詳細に記載するが、これらの実施例は、決
して本発明の範囲の限定を意図するものではない。
6. 実施例
6.1. サブ配列のヒット(hit)及び長さの情報
本実施例では、PCR態様によって発生したQEATMシグナルを例示する。GenBa
nkデータベース(1994年10月)より、12,000ヒト第一連続コードドメイン配列(「
CDS」)を選択した。この選択によって、配列の選択データベースが得られた
が、該データベースは、短い遺伝子に偏り、1800〜2000bpの典型的なコード配列
長の代わりに選択CDSの平均長が1000bpであり、配列が選択データベース中で繰
り返されない保証のないものであった。このデータベースより、全ての4〜6-mer
配列の存在確率を含む表を作成した。
N=12,000及びL=1,000として方程式1及び2を解き、p=0.17及びM=108
を得た。この存在確率を有する5つの6-mer標的サブ配列を、該6-merの表より選
択し、4つの対(即ち、CAGATA-TCTCAC、CAGATA-GGTCTG、CAGATA-GCTCAA、CAGAT
A-CACACC)に分類した。次いでCDSの選択データベースの模擬消化(5.4.1節を参
照)を含む分析を、これら標的サブ配列の4つの対に対して行なった。
図1のヒストグラムにこれらの分析結果を示す。これらの標的サブ配列を認識
するQEATM反応の増幅断片のゲル分離で観察されるように、軸102に沿って断片の
長さを示す。軸101に沿って所定の長さにある断片の数を示す。例えば、約800塩
基対の長さにあるスパイク103は、同じ長さの3つの断片を表わす。1つの長さ
にある複数の断片はいずれも存在することができ、これは、この長さの間隔が開
いた1つの標的サブ配列対を複数のCDSが有するか、この長さの間隔が開いた複
数の標的サブ配列対を1つのCDSが有するか、選択されたCDSが重複するか、また
はこの長さのシグナルが標的サブ配列の1つ以上の対によって発生したためであ
る。わずかに長い長さにあるスパイク104は、単一断片を表わす。この断片は、
特定の配列より生成し、cDNA混合物においてその存在を示す特定の指標とな
るため、良好な配列である。
6.2. 制限エンドヌクレアーゼ
表1〜4には、パリンドローム4-mer及び6-merの潜在RE認識配列をすべて挙げ
る。各部位を認識する公知のRE酵素も、主な販売元と共に列挙する。存在確率が
広範囲に及ぶ可能な配列の85%以上は、配列中に公知のRE認識部位及び切断部位
を有する。
実施例6.1のように、GenBankデータベース(1994年10月)より選択した12,000ヒ
ト第一連続コードドメイン配列において、これらの配列の頻度を求めた。認識存
在確率を増加させるため、表を整理した。認識配列中の縦棒は、REが切断す
る認識配列の部位を示す。
販売元を示すのに以下の略語を用いた:New England Biolabs(Beverly,MA)(「
NEB」)、Stratagene(La Jolla,CA),Boehringer Mannheim(Indianapolis,IN)(「
BM」)及びGibco BRL Life Technologies事業部(Gaithersburg,MD)(「BRL」)。
6.3. RNA抽出及びcDNA合成
これらのプロトコールでは、組織サンプルからRNAを抽出したり、抽出した
RNAから脱リン酸化cDNAを合成するのに好適な方法を記載する。
6.3.1. RNA抽出
一般的には、RNA抽出は、Life Technologies(Gaithersburg,MD)製のTriaz
ol試薬を用い、Chomszynskiら、1987,Annal.Biochem.162:156-59及びChomszy
nskiら、1993,Biotechniques 15:532-34,536-37のプロトコールに従って行な
う。全RNAをまず組織から抽出し、Pharmacia Biotech(Uppsala,Sweden)製の
Rnaseを含まないDnaseIで処理して混入しているゲノムDNAを除去し、Dynal
Corporation(Oslo,Norway)製のオリゴ(dT)磁気ビーズを用いてメッセンジャー
RNAを精製し、次いでcDNAの合成に用いた。
所望ならば、cDNAを合成する前に、全細胞性RNAをサブプールに分割す
ることも可能である。例えば、小胞体関連RNAのサブプールを、細胞外または
受容体機能を有するタンパク質を産生するRNAについて濃縮する。
より詳細には、組織サンプルからのRNA抽出には以下のプロトコールが好適
である。組織ホモジナイゼーションおよび全RNA抽出:
分析対象となる特定の組織片を示すのに、voxelという名称を用いる。多くの
場合、voxelは、病理学的に特性付けられた組織切片に対応するグリッドパンチ
(grid punches)を指す。
1.組織voxelは、切り出した直後に液体窒素中で素早く凍結し、次の操作まで
−70℃で保存することが重要である。
2.凍結組織voxelの重量を測定し、記録する。
3.組織voxelは、磁製乳鉢および乳棒を用いるか、またはステンレススチール
製微粉砕機若しくは他の手段によって、液体窒素中にて微粉砕し、粉状にする。
この組織は、微粉末にまで粉状化し、液体窒素中で維持する。
4.該組織粉末を、組織100mgあたり1mgのTriazol試薬(Life Technologies
,Gaithersburg,MD)の入った試験管に移し、Brinkman Instruments(Westbu
ry,NY)製のポリトロン(Polytron)ホモジナイザーを用いてTriazol中に分
散させる。100mg未満の小さな組織voxelについては、効率的なホモジナイゼーシ
ョンを行うために最低1mgのTriazolを使用するべきである。
5.0.1容量のBCP(1−ブロモ−3−クロロプロパン)(Molecular Resea
rch,Cincinnati,OH)を添加し、ボルテックスによる混合を30秒間行なう。
該混合物を室温に15分間置く。
6.12,000×g、4℃で15分間遠心分離する。
7.水相を新たな試験管にとり、使用したTriazol試薬の初期量に対して0.5容
量のイソプロパノールを添加し、ボルテックスによる混合を30秒間行なう。該
混合物を室温に10分間置く。
8.12,000×g、室温にて10分間遠心分離する。
9.70%エタノールで洗浄し、12,000×g、室温にて5分間遠心分離する。
10.上清液を除去し、遠心管を逆さに置いて乾燥させる。
11.RNAペレットを水(初期組織重量1mgあたり1μl)に再懸濁させ、完
全に溶解するまで55℃にまで熱する。DNアーゼ処理
:
1.0.2容量の5×逆転写酵素緩衝液(Life Technologies,Gaithersburg,MD
)、0.1容量の0.1M DTT、および初期組織100mgあたり5ユニットのRNAガ
ード(Pharmacia Biotech,Uppsala,Sweden)を添加する。
2.初期組織100mgあたり1ユニットのRNアーゼフリーDNアーゼI(Pharma
cia Biotech)を添加する。37℃で20分間インキュベートする。
以下の追加工程は任意である。
選択肢1.10容量のTriazol試薬を加えることによりRNA抽出を繰り返す。
選択肢2.上記工程5〜11を繰り返す。
3.全RNAを定量する(100倍に希釈してOD260を測定することにより得ら
れるRNA濃度から)。−20℃で保存する。ポリA+メッセンジャーRNAの単離:
ポリ−アデニル化mRNAを、磁気ビーズ媒介オリゴ−dT検出により、全R
NA調製物から単離する。使用可能なキットとしては、Dynabeads mRNA Di
rect Kit(Dynal,Oslc,Norway)またはMPG Direct mRNA Purificat
ion Kit(CPG,Lincoln Park,NJ)が挙げられる。説明書の指示に従って
プロトコールを使用する。
あまり好ましくはないが、以下の手順を用いることができる。Dynalオリゴ(
dT)磁気ビーズは、全RNAの2%がポリ(A+)尾部を有すると仮定すると
、ビーズ100μgあたりポリ(A+)1μg(濃度1mg/ml)の受容力を有する
。
1.5容量のLysis/Binding緩衝液(Dynal)および推定量のポリ(A+)RN
Aを結合させるのに十分な量のビーズを添加する。
2.65℃で2分間インキュベートした後、室温に5分間置く。
3.1mlのWashing緩衝液/LiDS(Dynal)でビーズを洗浄する。
4.1mlのWashing緩衝液(Dynal)によるビーズの洗浄を2回行なう。
5.水1μl/μgビーズによるポリ(A+)RNAの溶出を2回行なう。
どちらの方法においても、ポリ−アデニル化RNAが、少量の水に溶解した形
で回収され、上述のようにして定量され、−20℃にて保存される。典型的には
、ポリ−アデニル化RNAの収率は、投入した全RNAの1%〜4%の範囲であ
る。
6.3.2. cDNA合成
投入したRNAの量が約1μg、または少なくとも200ng若しくはそれ以上の
ときは、ポリ(A)+RNAから脱リン酸化cDNAを合成するための次のプロ
トコールが好ましい。使用する試薬:
・ランダムヘキサマー(50ng/μl)
・5×First strand緩衝液(BRL)
・10mM dNTP混合物
・100mM DTT
・Super ScriptII逆転写酵素(BRL)(200U/μl)
・E.coliDNAリガーゼ(BRL)(10U/μl)
・E.coliDNAポリメラーゼ(BRL)(10U/μl)
・T4DNAポリメラーゼ(2.5U/μl)
・E.coliRNアーゼH(BRL)(3.5U/μl)
・Arctic Shrimp Alkaline Phosphatase、(SAP;USB)、および10×
SAP緩衝液(USB)
・5×Second strand緩衝液(BRL)
・3M Na−アセテート
・フェノール:クロロホルム(フェノール:クロロホルム:イソアミルアルコー
ル25:24:1)
・クロロホルム:イソアミルアルコール(24:1)
・純エタノールおよび75%エタノール
・20μg/μlグリコーゲン(BM)cDNA合成プロトコール:
1.0.25〜1.0μgのポリA+RNAと50ngのランダムヘキサマーとを、10μ
lの水中で混合する。該混合物を10分間70℃に加熱し、そして氷−水スラリ
ー中で素早く冷やす。氷上に1〜2分間置く。マイクロヒュージ(microfuge)
中で10秒間スピンして凝縮物を回収する。
2.4μlの5×First strand緩衝液、2μlの100mM DTT、1μl
の10mM dNTP混合物および2μlの水により、ファーストストランド反
応混合物を調製する。該混合物を、工程1で得られるプライマー−アニールした
RNAに添加する。混合物を37℃に2分間置く。1μlのSuper ScriptII(
BRL)(製造者の指示に従う)を添加する。37℃で1時間インキュベートす
る。
3.試験管を氷上に配置し、30μlの5×Second strand緩衝液、90μlの
冷水、3μlの10mM dNTP、1μl(10ユニット)のE.coliDNA
リガーゼ、4μl(40ユニット)のE.coliDNAポリメラーゼ、および1μ
l(3.5ユニット)のE.coliRNアーゼHを添加する。16℃で2時間インキュ
ベートする。
4.2μlのT4DNAポリメラーゼ(5ユニット)を添加して、16℃で5分
間インキュベートする。
5.20μlの10×SAP緩衝液、25μlの水、および5μl(5ユニット
)のSAPを添加する。37℃で30分間インキュベートする。
6.フェノール−クロロホルム、クロロホルム−イソアミルアルコールを用いて
cDNAを抽出する。水層に、Na−アセテート(0.3Mとなるまで)、20μgの
グリコーゲン、および2容量のエタノールを添加する。−20℃で10分間イン
キュベートし、14,000×gで10分間スピンする。75%エタノールでペレット
を洗浄する。ペレットを50μlのTEに溶解させる。
7.フルオロメーターを使用して、cDNAの収率を推定する。
8.次に行なうQEATM操作のために、75ngのcDNAを別の試験管に移し、
TEを加えて濃度を600ng/mlとし、その試験管を−20℃に指定した箱に入
れる。保存用に、Na−アセテート(0.3Mとなるまで)および2容量のエタノー
ルを残りのcDNAに添加し、−80℃にて保存する。
当技術分野で公知の他のファーストストランド合成用プライマーもまた、ファ
ーストストランド合成に使用することができる。このようなプライマーとしては
、オリゴ(dT)プライマー、ファージングプライマー等が挙げられる。
6.3.3. 少量のRNAについてのcDNA合成
前掲のcDNA合成プロトコールは、主にGublerとHoffmanの方法(Gubler
ら,1983,"cDNAライブラリーの作製のための簡便かつ高効率な方法(A simpl
e and very efficient method for generating cDNA libraries)",Gene 25:
263-9)に基づいている。該プロトコールは、1μg範囲(200ngおよびそれ以
上)の量のRNAについては確固としており、よく実証されている。200ng未
満の量のRNAについてより好ましいプロトコールは、RNAの5’CAP構造
を利用するものである(Ederyら,1995,"mRNAcap保持手順に基づく完全長c
DNAの効率的な単離法(An efficient strategy to isolate full-length cD
NAs based on an mRNA cap retention procedure(CAPture))",Mol.Ce
ll Biol.15:3363-71;Katoら,1994,"ヒト完全長cDNAバンクの構築(Constr
uction of a human full-length cDNA bank)',Gene 150:243-50)。このプロ
トコールは、次のような多くの利点を有する。
・投入するRNA量を広くスケーリングできる。これにより、RNA量をバイオ
プシーに、並びに他の小さなおよび様々なサイズのサンプルに理想的なものとす
ることができる。
・利用できるcDNAが非常に少量であるときに、cDNAの前QEATM増幅を
行なうことができる。
・cDNA合成が、完全長RNAに偏っている。
・完全長cDNAの両端に、特異的プライマー部位を導入することができる。
・任意で、ポリ(A)+RNA精製工程をせずに、全RNAを使用することがで
きる。cDNA合成プロトコール
1.ポリ(A)+RNAまたは全RNA(10μg)を、細菌性アルカリホスフ
ァターゼ(20μlのrxn;100mMのTris-HCl(pH7.5)、2mMのDTT
;0.2Uの細菌性アルカリホスファターゼ、20UのRNアーゼ阻害剤;37℃
で30分間)を用いて脱リン酸化する。
2.フェノール抽出およびエタノール沈殿の後に、RNAをタバコ酸性ピロホス
ファターゼで処理する(20μlのrxn;50mMのNa-OAc(pH6.0)、1mM
のEDTA、2mMのDTT;0.1Uのタバコ酸性ピロホスファターゼ、20U
のRNアーゼ阻害剤;37℃で30分間)。
3.フェノールにより抽出され、そしてエタノールにより沈殿されるのは、脱キ
ャップされた(decapped)RNAである。MA24Rと称する以下のDNA−RN
Aプライマー(3nm)を、T4RNAリガーゼ(20μlのrxn;Tris-HCl(pH7.
5)、5mMのMgCl2、0.5mMのATP、2mMのDTT、25%エチレングリ
コール;100UのT4RNAリガーゼ、20UのRNアーゼ阻害剤;20℃で12
時間)を用いて、5−プライム末端に連結する。
4.ファーストストランド合成は、第6.3.2節に記載したプロトコールの工程1
および工程2と同様に行なう。ただし、cDNAをプライムするために、以下の
ビオチン化プライマーを使用する。 これらの反応は、別々の試験管中でまたは一つの試験管中で行なうことができ
る。この反応を別々の試験管中で行なう場合の相効果(phasing effect)は、c
DNAを3つの別々のプールに分割できるという利点を有する。各プライマー0.
2μgをこの反応で使用する。
5.セカンドストランド合成は、プライム合成に使用されるDNA−RNAキメ
ラのDNAのみのものを使用して、第6.3.2節に記載したプロトコールの工程3
および工程4と同様に行なう。
両方の5’末端におけるプライマーはリン酸基が欠如しているので、例えばエ
ビアルカリホスファターゼによる、得られるcDNAの脱リン酸化はもはや必要
ではない。非常に少量のcDNA(収量1〜10ng)を合成する場合には、サン
プルは以下のプライマーペアを使用して増幅することができる。
量が1ngの場合には、8〜10サイクルのPCR(96℃で30秒間、57℃
で1分間、72℃で3分間)による500倍増幅により、総合的な分析に適した
cDNAを得ることができる。
6.3.4. 他のcDNA合成 cDNA合成
あるいは、SuperscriptTMChoiceシステム(Life Technologies,Inc.,Gai
thersburg,MD)を用いて、cDNAを合成することができる。組織voxelがR
NAの供給源であれば、ポリアデニル化RNAを定量せずに、ポリアデニル化R
NAの全収量をエタノール沈殿により濃縮する。ポリアデニル化RNAを1
0μlの水に再懸濁させ、5〜10μlをcDNA合成に使用する。1μgに満
たない量のRNAについては製造者のプロトコールに従い、プライマーとしては
100ngのランダムヘキサマーを使用する。1μg以上のポリアデニル化RNA
を使用する場合には、製造者のプロトコールに従い、ポリアデニル化RNA1μ
gあたり50ngのランダムヘキサマープライマーを使用する。得られるcDNA
溶液の容量は150μlである。その量を測定しないときは、次に行なうQEATM
反応での使用に適したcDNA量を決定するために、1μlまたは0.1μlの
cDNA溶液を用いてQEATM試験反応を行なうことができる。cDNA脱リン酸化
cDNA合成に末端ホスフェートを用いる場合には、これら末端ホスフェート
を、RE/リガーゼ反応を行なう前に除去することが好ましい。cDNAからの
末端ホスフェートの除去は、バレンツ海エビアルカリホスファターゼ("SAP"
)(U.S.Biochemical Corp.)および2.5μgのcDNAを用いて説明される
。酵素量の割合を調整することにより、実質的により少量(10ng未満)または
より多量(20μgより多い)のcDNAを一度に調製することができる。容量
は、扱い易いように維持する。必要となる量は、正常または罹患スペシメン由来
の少量の組織サンプルを分析する方法を使用することができる量である。
1.以下の試薬を混合する。
2.5μl 200mM Tris-HCl
23μl cDNA
2μl 2ユニット/μlエビアルカリホスファターゼ
最終的に得られるcDNA濃度は100ng/μlである。
2.37℃で1時間インキュベートする。
3.80℃で15分間インキュベートして、SAPを失活させる。
6.4. QEATMに好適なRE法
REの態様のプロトコールは、個々の操作の数が最少となり、それによってQ
EATM手順の再現性を最大とするように設計する。好ましいプロトコールにおい
ては、緩衝液の変換、沈殿、または有機(フェノール/クロロホルム)抽出を使
用しない。これらの操作は全て、その方法の全体的な有効性を低下させ、普遍的
な使用についてのその有用性および、より特異的には自動手順若しくはロボット
を用いる手順(robotic procedures)におけるその使用についてのその有用性を
減少させる。
いったんcDNAを調製すると(末端ホスフェートの除去を含めて)、分析する
必要のある個々のサンプルの望ましい数と同じ数の、それぞれ1ngから少なくと
も50ngのcDNAを含むバッチに分ける。例えば、6つのRE/リガーゼ反応
および6つの分析が、全ての必要なシグナルを生成させるのに必要であれば、6
つのバッチを作る。結果の精密性および信頼性を増加させるためには、有利には
、QEATM反応を二重または三重にする(2回または3回行なう)ことができる
。
RE/リガーゼ反応は、好ましくは、1ペアのREによる消化として行なう;
あるいは、それぞれのREにより生成される4塩基対のオーバーハングが相違し
、それぞれユニークなアダプターに連結できること、および十分に展開された鎖
長分布が得られることを条件として、1若しくは3またはより多くのREを使用
することができる。プロトコール中で特定するRE酵素の好ましい量は、完全な
消化を行なうのに十分である一方で、その酵素に存在する可能性のある他のエキ
ソ−またはエンド−ヌクレアーゼ活性を最少にする量である。他の好ましいRE
の組み合わせは、表11〜14に示す。
アダプターは、一つの反応において、それぞれのREにユニークなものを選択
する。これらのアダプターは、ユニークREスティッキーオーバーハングそれぞ
れに相補なリンカーおよびそのリンカーにユニークにハイブリダイズするプライ
マーを含む。ハイブリダイズしたプライマー/リンカーの組み合わせをアダプタ
ーと呼ぶ。
あるREについてのプライマー/リンカーの組み合わせは、選択したQEATM
反応のいくつかの態様に従って選ばれる。一般には、サンプルプライマー/リン
カーの組み合わせは、いずれの特定のREについても、表10に示す組み合わせ
に従って選ばれる。検出に必要であれば、プライマーを標識することができる。
1以上の、好ましくは全ての、プライマーが標識部分を有する場合においては、
これらの部分は、好ましくは識別可能であり、有利には第6.11.節に記載の蛍光
標識から選ぶことができる。ポストPCRクリーンアップ(post-PCR cleanu
p)を使用するQEATMの態様では、一つのプライマーはキャプチャー部分、例
えばビオチン、を有する。該キャプチャー部分は、好ましくは一連のRプライマ
ーの一つ、RA24またはRC24に結合しており、他方のプライマーは、好ましく
は標識されている。標識プライマーとビオチン化プライマーのペアは、好ましく
は表11(そこに列記されているREペアについて)に従って選ばれる。最後に
、SEQ−QEATMの態様では、プライマーおよびリンカーは、好ましくは第6.
10.1.節に従って選ばれる。
6.4.1. 好ましいRE/リガーゼおよび増幅反応
本節では、中間操作(intervention)を最小限にしてRE/リガーゼおよびPC
R増幅反応を行なうための、好ましいプロトコールについて記載する。プライマー−過剰アダプターセットアニーリング
好ましいプロトコールでは、それぞれのREに特異的なアダプターセットの形
のプライマー/リンカーの組み合わせは、上述のように選ばれる。該アダプター
セットは、RE/リガーゼ反応に十分な量のアダプター(すなわち、ハイブリダ
イズしたプライマー/リンカー)、および次に行なうPCR増幅のための十分に
過剰量のプライマーを含む。従って、プライマーは、別々にPCR反応混合物に
添加する必要はない。アダプターセットは、以下のプロトコールに従って、リン
カーとプライマーから構築される。
1.リンカーおよびプライマーを、濃度比1:20(12量体:24量体)で、
プライマーの総濃度が50pm/μlとなるように、水に添加する。
2.50℃で10分間インキュベートする。
3.ゆっくりと冷却して室温とし、−20℃で保存する。RE/リガーゼおよび増幅プロトコール
1.QPCR混合物用の以下の成分を、以下のように組み合わせる。
2.90:10パラフィン:ChilloutTM14ワックスを融解し、融解したワックスを
PCR用試験管に、該試験管の上側半分の表面でワックスが固まるように添加す
ることにより、該試験管を前ワックス処理する。
3.試験管を軽く叩くおよび/または逆さにする(ボルテックスは使用しない)
ことにより、溶液を混合する。40μlのQPCR混合物を、前ワックス処理し
たPCR用試験管に添加する。前記溶液を、該試験管中の側面およびワックスに
触れないように注意して、一つの試験管に一度に添加する。注意すべきことは、
QPCR混合物とQlig混合物とを別々にし、ライゲーション中および反応中に
QPCR混合物が作用しないようにすることが重要であるということである。
4.該試験管を、蓋の無いサーマルサイクラー中に配置し、75℃で2分間イン
キュベートすることによってワックスを水相に融解させる。その後、25℃とな
るまで、2分間あたり5℃ずつ低下させる。
5.Qlig混合物用の以下の成分を、以下のように組み合わせる。 24rxnの場合の量は、三連で行う8cDNA反応にとって有利である。
6.各酵素セットに対するQlig混合物(Qlig mix)が完成した後、その混合物を
チューブに分けてからcDNAを添加してもよい。24反応を、3反応容量(約27μl
)を含む8チューブに分けてもよい。
7.cDNAを上記チューブ及び混合物に添加した。
cDNAは、予め適当な濃度(1ng/μl)に希釈した。
8.Qlig混合物10μlを、ワックスを乱さないように注意しながら、ワックスの
上部に添加した。24Qlig反応を3連で行う場合には、その産物を24の個々のQPCR
反応物に分けてもよい。
9.キャッブをチューブに静かに加えた。過剰に圧力をかけると、ワックスが乱
れる可能性がある。
10.チューブをサーマルサイクラーに配置し、以下のサーマルプロトコールを実
施した。 プログラムが終了した後、チューブを5分間で75℃まで加熱した。チューブを
取り出し、すぐにひっくり返してワックスを硬化させた。
反応の終了した反応物をフリーザーに配置するか、又は直接次の工程に進んだ
。
以下の表は、このプロトコールで使用する種々の試薬に関する好ましい販売元
を示す。6.4.2 増幅後のクリーンアッププロトコール及びその他の工程
種々の増幅後工程が、QEATM/RE実施態様の様々な実施態様に関して適してい
る。その一例としては、QEATM反応を、結合した捕獲部分を有しない標識化プラ
イマーを用いて実施する場合が挙げられる。この場合、QEATM反応産物は、長さ
により簡単に分離された。電気泳動により分離する場合には、反応産物を添加用
緩衝液(loading buffer)中に懸濁させ、これを電気泳動ゲルに添加する。好
ましい電気泳動装置は、分析用Gene Scan software(ABI)を使用したABI377(A
pplied Biosystems,Inc.)自動シクエンサーである。電気泳動は、非変性条件下
で行うことができる。非変性条件においては、dsDNAは一ヶ所に存在し、両プラ
イマーの複数の標識(存在する場合には)を担持する。また、電気泳動は変性条
件下でも行うことができる。変性条件においては、各々のssDNAは別々に標識化
されているが、典型的には一ヶ所に移動することが期待される。
別の例としては、分離の前に行う増幅後のクリーンアップのために、又はSEQ-
QEATM実施態様の一部分として、プライマーの一つが、結合した捕獲部分(例え
ば、ビオチン)を有している場合が挙げられる。この場合には、まずQEATM反応
産物がクリーンアッププロトコールに供され、過剰の試薬及び一定の反応産物が
除去される。
以下の緩衝液を、PCR後のクリーンアッププロトコールに使用した。
結合用緩衝液(水溶液)
I. 5M NaCl
II. 10mM Tris,pH 8.0
III. 1mM EDTA
洗浄用緩衝液(水溶液)
I. 10mM Tris,pH 8.0
II. 10mM EDTA
添加用緩衝液(変性用)
I. 80% 脱イオン化ホルムアミド
II. 20% 25mM EDTA(pH 8.0),50mg/mL ブルーデキストラン
はしご状添加用緩衝液(Ladder Loading Buffer)
I.900μlの添加用緩衝液を含有する100μlのGene Scan 500 ROX
PCR後のクリーンアッププロトコール:
1.QEATM産物を精製するために、十分な量のストレプトアビジンマグネティッ
クビーズを調製する(CPG,Lincoln Park,N.J. カタログ番号 MSTRO510)。各
5μLのQEATM反応産物ごとに3μLのビーズを使用する。結合用緩衝液を含有す
る最終懸濁液容量中のビーズを前洗浄する。2.処理された各QEATMサンブルごとに10μLの洗浄ビーズを施す。96ウェルFalc
on TCプレートにおいて精製を行う。
3.QEATM産物をビーズに加える。十分に混合し、50℃で30分間インキュペーシ
ョンする。
4.結合用緩衝液を使用してサンプルの容量を100μlまで増量させる。プレート
を96ウェルマグネティックパーティクルコンセントレーター(magnetic particl
e concentrator)上に置く。ビーズを5分間移動させる。
5.液体を除去し、200μLの洗浄用緩衝液(TE pH7.4)を加える。
6.洗浄工程5を繰り返す。
7.SEQ-QEATM実施態様の場合には、洗浄ビーズは6.5節に記載の実施態様の次の
工程へ進む。増幅後のクリーンアップのみを使用するその他の実施態様の場合に
は、洗浄ビーズは分析工程9に進む。必要に応じて、ビーズを工程10へ進めるま
で保存しておいてもよい。
8.分析用として、ビーズを添加用緩衝液(5μlのビーズに対して5μl)中に
再懸濁させる。Gene Scan 500 ROX ladderを混合して、1/10倍希釈する。その
上清を変性条件下で電気泳動により分析する。
9.ビーズを保存した場合には、液体及び空気を除去してビーズを乾燥させる。
10.プレートを乾燥させ、-20℃で保存する。
プライマーの一つが、結合したビオチン部分を有している場合には、QEATM反
応産物は、以下の3種類のカテゴリーに分類される。
a)いずれの鎖もビオチン部分を有していないdsDNA分子;
b)一方の鎖のみが結合したビオチン部分を有しているdsDNA分子;
c)いずれの鎖にも結合したビオチン部分を有しているdsDNA分子
カテゴリー「a」産物は、ビーズには結合せず、上記プロトコールの洗浄工程
5及び6の後、ビーズにより洗浄された。カテゴリー「b」及び「c」産物のみ
がビーズに結合した状態にあった。ビーズを変性用添加用緩衝液中に再懸濁する
工程9の後、カテゴリー「b」産物に対して、ビオチン部分を有していない鎖を
分離させた。一方、ビオチン部分を有しているもう一方の鎖をビーズにより保持
させた。カテゴリー「c」産物に対しては、両方の鎖を保持させた。その結果、
工程9の電気泳動により、一方の鎖のみが結合したビオチン部分を有する反応産
物に由来する一本鎖が分離された。
6.4.3 5'−QEATM実施態様
このサブセクションでは、由来するmRNAの5'キャップに対して5'末端を固定
化し、選択したREによって別々に3'末端を切断したcDNA断片を生成するQEATM実
施態様に関する実験プロトコールについて説明する。
まず、インプットcDNAを6.3.3節のプロトコール又はそれと同様のプロトコー
ルに従って合成した。次に、Qlig混合物の組成が異なる点を除いては、上記の6.
4.1節及び6.4.2節のプロトコールと同様に実施した。
1.cDNAを6.3.3節のプロトコールに従って合成する。
2.QPCR混合物を6.4.1節のプロトコールの工程1〜4に従って調製する。
3.Qlig混合物に関する以下の成分を混合する。
24反応の場合の量は、三連で実施する★反応にとって有利である。
RE/リガーゼ及びPCR増幅を、6.4.1節のプロトコールの工程6〜12に従って行
った。
反応産物を6.4.2節のクリーンアッププロトコールの工程1〜6及び8〜10に
従って処理した。
クリンアッププロトコールの洗浄工程、工程6の後、3'末端が別々に切断さ
れ、5'末端がビオチン標識化プライマーで終結する産物のみをストレプトアビ
ジンビーズに結合させた。ビオチン標識化プライマーは、由来するmRNAの5'キ
ャップに固定した位置でライゲートした。従って、変性電気泳動、クリンアップ
プロトコールの工程9に基づくその後の検出により、末端が別々に切断された一
定の長さの所望の断片に由来するシグナルのみが検出された。
6.4.4 第一に選択されるRE/リガーゼ及び増幅反応
この節では、2つのチューブ中で行う手動又は自動のいずれの方法にも適し、
かつ、結合した捕獲部分を有しない標識化プライマーにも適した、それほど好ま
しくはないプロトコールに関して説明する。それ以外の点において、RE及びプラ
イマー/リンカー成分は、上記のように選択した。アダプターアニーリング
以下のプロトコールに従い、12merリンカー及び24merプライマーを過剰のリン
カーとアニーリングすることによって、アダプターを形成した。
1.プライマーの総濃度が5pM/μlとなるように、リンカー及びプライマーを
2:1の濃度比(12mer:24mer)で水に加える。
2.50℃で10分間インキュベーションする。
3.室温までゆっくりと冷却し、-20℃で保存する。
過剰のプライマーが存在しないために、プライマーはPCR反応混合物に別々に
加えなければならない。手動のRE/リガーゼ及び増幅反応
このプロトコールは、手動で行うRE/リガーゼ及び増幅反応を区別するため
に有利に適用される。まず、96ウェルサーマルサイクラーで使用するために、RE
/リガーゼ反応物を調製した。各反応物に以下のものを加えた。
1.選択したRE 1U(New England Biolabs,Beverly,MA)(好ましいREの組は
6.10節に挙げられる)
2.上記のように調製し、選択されたREに適する予めアニーリングしたアダプタ
ー 1μl
3.リガーゼ/ATP 1μl(T4 DNA リガーゼ 0.2μl(1U/μl)/10mM ATP
0.8μl(Life Technologies,Gaithersburg,MD))
4.50mM MgCl2 0.5μl
5.目的の調製cDNA 10ng
6.10X NEB 2緩衝液 1μl(New England Biolabs,Beverly,MA)
7.総容量を10μlとするための水
その後、PTC-100サーマルサイクラー(MJ Research,Watertown,MA)を使用
した図16Aに示す温度履歴によるRE/ライゲーション反応を実施した。
次に、以下に示すものを混合することによりPCR増幅反応混合物を調製した。
1.5X E-Mg 10μl(300mM Tris-HCl(pH 9.0),75mM(NH4)2SO4,Mgイオンは
含まない)
2.適当な蛍光標識24merプライマー 100pm
3.10mM dNTP混合物 1μl(Life Technologies,Gaithersburg,MD)
4.50:1 Taqポリメラーゼ(Life Technologies,Gaithersburg,MD):Pfu
ポリメラーゼ(Stratagene,La Jolla,CA) 2.5U
5.各PCR反応物を40μlの容量にするための水
その後、以下の工程を実施した。
1.各RE/ライゲーション反応物にPCR反応混合物40μlを加える。
2.PTC-100サーマルサイクラー(MJ Research,Watertown,MA)を使用した図1
6Bに示すPCR温度履歴を実施する。
自動化RE/リガーゼ及び増幅反応
上記プロトコールは、中間添加剤を必要とするこのプロトコールに従って有利
に自動化できる。反応は、Beckman Biomek 2000 robot(Beckman,Sunnyvale,C
A)を使用した標準96ウェルサーマルサイクラーフォーマット中で実施した。典
型的には、12の異なるREの組を使用して、計96反応について4cDNAサンプルを2
連で分析する。ユーザーが提供したストック試薬を用いて溶液を混合する工程、
及び温度履歴をコントロールする工程を含むすべての工程を、上記robotにより
実施した。
予めアニーリングしたアダプターを上記節のように調製した。各RE/リガーゼ
反応ごとに以下のものを混合した。
1.適当なRE(New England Biolabs,Beverly,MA) 1U
2.上記のように調製した、アニーリングした適当なアダプター 1μl(10p
m)
3.T4 DNAリガーゼ(Life Technologies,Gaithersburg,MD) 0.1μl(1U
/μl)
4.ATP(Life Technologies,Gaithersburg,MD) 1μl
5.目的の調製cDNA 5ng
6.10X NEB 2緩衝液(New England Biolabs,Beverly,MA) 1.5μl
7.50mM MgCl2 0.5μl
8.総量を10μlにしてサーマルサイクラーへ移すための水
上記robotは、反応を設定するために計23分の時間が必要であった。その後、
機械化蓋(mechanized lid)(MJ Research,Watertown,MA)を備えたPCT-100
サーマルサイクラーを使用した図16Cに示す温度履歴によってRE/ライゲーショ
ン反応を実施した。
次に、以下のものを混合することによってPCR反応混合物を調製した。
1.5X E-Mg 10μl(300mM Tris-HCl(pH9.0),75mM (NH4)2SO4)
2.蛍光標識した適当な24merプライマー 100pm
3.10mM dNTP混合物(Life Technologies,Gaithersburg,MD) 1μl
4.50:1 Taqポリメラーゼ(Life Technologies,Gaithersburg,MD):Pf
uポリメラーゼ(Stratagene,La Jolla,CA) 2.5U
5.各PCR反応物を35μlの容量にするための水
PCR混合物を予め72℃に加熱し、PCR混合物35μlを各消化/ライゲーション反
応物及び混合物に移した。上記robotは、移入及び混合に6分を必要とした。機
械化蓋(MJ Research,Watertown,MA)を備えたPCT-100サーマルサイクラーを
使用した図16Bに示す温度履歴によってRE/リガーゼ及びPCR増幅反応を実施した
。
消化/ライゲーション及びPCR増幅反応に費やした総時間は179分であった。最
初の実験設計及び試薬配置の後には、ユーザーの介入は必要なかった。
6.4.5 第二に選択されるRE/リガーゼ及び増幅反応
この節では、RE、ライゲーション及びPCR増幅反応のすべてが3つのチューブ
で別々に実施されるあまり好ましくない手動のプロトコールに関して説明する。
このプロトコールは、結合した捕獲部分を有しない標識化プライマーの場合に適
している。それ以外の点において、RE及びプライマー/リンカー成分は上記のよ
うにして選択される。このプロトコールはあまり好ましくないプロトコールであ
る。RE 消化反応
1.以下の試薬を混合する。
調製cDNA(100ng/μl)混合物(計50ngのcDNA) 0.5μl
New England Biolabs Buffer No.2 10μl
RE酵素 3ユニット
2.37℃で2時間インキュベーションする。
より高濃度のcDNAを使用して得られた大きなサイズの消化物を使用してもよい
し、その消化物の画分を次の実験のために保存しておいてもよい。アダプターライゲーション
例えば、RE付着末端のハイブリダイゼーションの結果生じる種々のcDNAに由来
する断片のコンカテマーのような、意図しないライゲーション産物を除去するこ
とが重要であるから、ライゲーションの間、制限酵素の活性を維持した。これに
より、意図しないコンカテマーの切断、及び所望の末端アダプターの末端ライゲ
ーションを継続することができた。制限酵素の大部分は16℃のライゲーショ
ン温度において活性であった。また、最適消化条件を散在させた最適ライゲーシ
ョン条件からなるライゲーションプロフィールによっても、この工程の効率を増
加させることができた。実験プロフィールは、37℃で2時間と16℃で2時間との
間を1℃/分の割合で定期的にサイクルさせることを含んでなる。
各REによって発生する各5分の突出部と相補的な一つのリンカーが必要である
。100ピコモル(「pm」)は、上記プロトコールにとって十分に過剰な量である。
各リンカーに対して、相補的な特有の標識化プライマーをcDNAの切断末端に加え
、ライゲーションした。100pmは、上記プロトコールにとって十分に過剰な量で
ある。REcDNAの量を変化させる場合には、リンカー及びプライマーの量を比例し
て変化させる必要がある。ライゲーション反応
(10μl及び50ng cDNAあたり)
1.以下の試薬を混合する
成分 容量
RE消化cDNA混合物 10μl
各プライマー 100pM/μl 1μl
各リンカー 100pM/μl 1μl
2.50℃(プライマー及びリンカーがハイブリダイズする温度)から10℃(-1/
分)までの温度サイクルを行い、その後16℃に戻す。
3.10mM ATP 2μlを、T4 DNAリガーゼ 0.2μl(ATP 1μl当たり1U/μl
のリガーゼ 0.1μlを予め混合する)(大腸菌リガーゼは、あまり好ましくない代
替リガーゼである)とともに加える。
4.16℃で12時間インキュベーションする。リガーゼが高濃度になるのに比例し
て、この工程を2時間未満まで短縮することができる。また、上記サーマルサイ
クルプロトコールをここで利用することもできる。
5.37℃で2時間インキュベーションする。
6.65℃で20分間インキュベーションし、リガーゼを加熱して失活させる(最後
の工程では、REを切断する必要がある)
7.4℃に維持する。ライゲーションしたアダプターを使用した断片の増幅
この工程により、2回切断され、各RE切断末端に特異的なアダプターでライゲ
ーションした断片を増幅した。この工程は、高い増幅特異性が得られるように設
計した。増幅サイクルの数を増加して、多重増幅を実施した。所望のシグナルが
得られるように、最小限の数のサイクルを使用するのが好ましい。20サイクルを
超える増幅は、一般的に量的な確実性がない。
以下のものを混合してライゲーション混合物を調製した。
成分 容量
RE/リガーゼcDNA混合物 5μl
10X PCR緩衝液 5μl
25mM MgCl2 3μl
10mM dNTPs 1μl
各プライマー 100pM/μl 1μl
以下のものを混合してPCR-前混合物(Premix)を調製した。
成分 容量
緩衝液E 30μl
(ライゲーション混合物により0.3mM MgCl2が与えられるであろう)
24merプライマー鎖(300pm/μl Rbuni24 Flour) 1μl
(50pm/μl NBuni24 Tamra)
Taqポリメラーゼ(150μl当たり) 0.6μl
dNTP(10mM) 3μl
H2O 106μl
増幅前のライゲーションしたプライマー−cDNA複合体から小さなリンカーが分
離する場合には、断片の増幅はより特異的である。次の方法は、6RE/リガーゼ
反応の結果物を増幅する方法の例示である。
1.10.15及び20サイクルとマークされた6PCRチューブの3片を、以下に示す
ように氷上に3列に置く。
20サイクル 1 2 3 4 5 6 PCR前混合物 140μlを添加する
15サイクル 1 2 3 4 5 6
10サイクル 1 2 3 4 5 6 ライゲーション混合物10μlを添加する
2.10サイクル列の各チューブ中にライゲーション混合物10μlを置く。
3.20サイクル列の各チューブ中にPCR前混合物140μlを置く。
4.サイクラー中に置き、72℃で5分間インキュベーションする。cDNA断片の第
二鎖に共有結合していないリンカーをこれに溶解し、PCR前混合物を常温にする
。
5.PCR前混合物140μlをライゲーション混合物10μlを含有する10サイクル列中
のチューブ中に移し、得られた結果物50μlを他の列の対応するチューブに置く
。
6.72℃で5分間インキュベーションする。上部プライマーを鋳型として使用し
て第二鎖を完成させ、不完全な二本鎖cDNA末端を完全なdscDNAとする。
上記増幅サイクルは、反応の特異性及び再現性を向上させるために設計された
。高温及び長い融解温度を用いることにより、高G+C含量による増幅の偏り(
bias)を修正することができた。長い伸長時間を用いることにより、より小さい
断片のために偏りを修正することができた。長い変性時間を用いることにより、
断片の融解率によるPCRの偏りを修正することができ、長い伸長時間を用いるこ
とにより、断片長に基づくPCRの偏りを修正することができた。
1.95℃で1分、68℃で3分の温度サイクルを行う。
2.反応の最後に72℃で10分間インキュベーションする。
6.4.6 任意に選択できる増幅後工程
幾つかの任意の工程により、検出したバンドからのシグナルを改善することが
できる。
第一に、別々に切断した断片由来の線形増幅の結果物として産生された一本鎖
を、一本鎖に特異的なエキソヌクレアーゼを使用して除去する。エキソIが、一
本鎖特異的ヌクレアーゼとして好ましく、各PCR反応産物とヌクレアーゼ2ユニ
ットとを37℃で60分間インキュベーションすることができる。
第二に、エタノール沈殿又はハイドロキシアパタイトカラムを使用したカラム
分離による検出の前に、増幅産物を濃縮することができる。
幾つかの標識化方法が有用であり、標識化方法としては、例えば、上記の蛍光
標識、銀染色、放射性同位元素による末端標識プライマー、及び挿入染料が挙げ
られる。個々のバンドが次の工程(例えば、配列決定)のためにゲルから除去さ
れる場合、好ましくは銀染色が行われる高処理量分析(high throughput analys
is)においては、蛍光末端標識が好ましい。
最後すなわち第四として、2つのプライマーの使用により、標準的な手法によ
り分離された鎖の塩基配列を直接決定することができる。また、分離された鎖を
、in situ分析のようなRNAアッセイに使用できるベクターに直接クローニングす
ることができる。この場合、T7を含有するプライマー又はその他のポリメラーゼ
シグナルを使用することが好ましい。
6.5. 好ましいSEQ-QEATM法
SEQ-QEATM態様は特別なSEQ-QEATMプライマーを用いて実施される。反応に用い
る一つのSEQ-QEATMプライマーはIIS型制限酵素(例えばFokI)認識部位、および
5’−末端に付着した蛍光タグ(例えばFAM(カルボキシ−フルオロセイン(ABI))
を有する。使用する他のプライマーはビオチン捕捉部位(“Bio”)を有し、ウ
ラシル残基またはAscIのような希少−切断制限酵素に対する部位のいずれかを含
む。第6.10.1節および表18にはSEQ-QEATM法に用いる例示的なプライマーおよび
リンカーのリストが含まれる。
これらのプライマーを対応するリンカーおよび適当な制限酵素と共に用いて、
第6.4.1節の好ましいQEATMプロトコルが行われ、ステップ6の洗浄を経て第6.4.
2節のポスト−PCRクリーンアッププロトコルが続いて行われる。ステップ7
に記載されるように、ステップ6の産物はSEQ-QEATM態様のさらなるステップに
インプットされる。
以下はBgIIIのRE1およびEspHIのRE2と一緒に用いるべき好ましいプライマーと
リンカーである。 上記の制限酵素とプライマー対を用いると、得られるQEATM法反応産物は以下
の3つのカテゴリーにあてはまる;
a)一方の鎖上にFokIまたはBbvIに対する認識部位を含む配列が隣接する5
’FAM標識、および他方の鎖上にウラシル残基またはAscI認識部位を含む配列
が隣接する3’ビオチン標識を有する二重鎖DNA(異なる制限酵素が各末端で
切断する場合)
b)一方の鎖上にウラシル残基またはAscI認識部位を含む配列が隣接する5
’ビオチン標識、および他方の鎖上にウラシル残基またはAscI認識部位を含む配
列が隣接する3’ビオチン標識(同じ制限酵素が両末端で切断する場合)
c)一方の鎖上にFokIまたはBbvIに対する認識部位を含む配列が隣接する5
’FAM標識、および他方の鎖上にFokIまたはBbvIに対する認識部位を含む配列
が隣接する3’FAM標識(同じ制限酵素が両末端で切断する場合)
典型的には、第6.4.1節のプロトコルに従ったQEATM反応が完了した後、50μl
のうち45μlを処理する(残りは保存しておく)。第6.4.2節のプロトコルに従っ
たポスト-PCRクリーンアップ中に、これらの反応産物の45μlを磁性ステレプト
アビジンビーズに結合させ、このプロトコルの段階6で洗浄する。このステップ
の後、カテゴリー“c”産物はビオチン部分を有さず、カテゴリー“a”および
“b”産物のみが磁性ストレプトアビジンビーズによって保持される。続いて、
ビーズに結合したDNAを100μlの適当な1×REバッファー、例えばFokIにはNE
B4中で、約10ユニットのIIS型制限酵素にて3時間、37℃で消化する。IIS型制限
酵素消化および洗浄の後、カテゴリー“b”産物は両末端で切断されており、カ
テゴリー“a”産物のみがビーズに保持され、そして該ビーズから遊離される。
II型制限酵素はDNAをその認識部位の外側の位置で切断するので、未知配列の
オーバーハングができる(Szybalski et al,1991,Gene 100:13-26)。よって、
IIS型消化はカテゴリー“a”産物のFAM標識を遊離し、配列決定のための鋳型と
して機能する断片特異的なオーバーハングを新しく生み出す。完全なII型消化は
FAM標識の不存在によって確認されうる。
末端−配列決定反応は、本質的にはIIS型制限酵素によって作りだしたオーバ
ーハングを鋳型として用いるチェーンフィル−イン反応である。高頻度な取り込
みを確認するために異なるABI蛍光染料で標識したジデオキシ鎖ターミネーター
をdNTPsに高割合で混合し、そして用いられるDNAポリメラーゼ(例えば、Sequ
enase(T4 DNA ポリメラーゼ),Taquenase(Taqポリメラーゼ))は標識されたジデ
オキシヌクレオチドと高親和性を有する。適当な1×バッファー、ストック(3mM
dATP,1.2mM dCTP,4.5mM dGTP,1.2mM dTTP)から得た1/200に希釈された1μl
のdNTPs、0.5μlの各ABIS染料−標識ターミネーター溶液(ddATP,ddCTP,ddGTPお
よびddTTPをそれぞれ含む)、(および配列決定のための1μlの0.1M DTT)を含
む総量が20μlの配列決定用混合物を調製する。ビーズを配列決定用混合物に再
懸濁し、0.1μlのTaquenaseを添加し、65℃で15分間
インキュベートする。Sequenaseを用いた場合は、0.1μlのSequenaseをTaquenas
eの代わりに添加し、37℃で15分間インキュベートする。この後、反応混合物を
マグネットに移し、上清を除去する。ビーズを洗浄用バッファーTで2度洗浄す
る。
上記の末端−配列決定反応は染料標識されたヌクレオチドをビオチンを含む鎖
に取り込ませる。ビオチン−ストレプトアビジン結合がほとんど不可逆であるの
で、標識された鎖は電気泳動による分析のために切断されなければならない。こ
れはUMP−含有−断片をウラシルDNAグリコシラーゼ(UDG)で処理し、またはAs
cI-部位含有断片をAscIで処理することによって行われる。UDGはdsDNAからウラ
シル残基を除去し;続いてホスフェート骨格を室温以上の温度およびpH>8.3で加
水分解する。
UDG処理のために、ビーズを20μlのUDGバッファー(30mM Tris-HCl pH7.5,50mM
KCl,5mM MgCl2)に再懸濁し、0.2ユニットのUDGを加えて反応物を室温で30分間
インキュベートする。その後、反応物をマグネットに移し、上清を除去する。ビ
オチニル化鎖は末端配列決定の間にフィルされる鎖であり、UDGは骨格を破壊し
ないが、加水分解を非常に受けやすくするのでビーズに依然として付着する。
ビーズを5μlのホルムアミドローディングバッファーに再懸濁する。これら
を各々2.5μlの2つのチューブに分ける。さらに2.5μlホルムアミドローディン
グバッファーを一方に加え、20%GS500ROX ladder(ABI)を有する2.5μlホルムア
ミドローディングバッファーを他方に加える。これらを加水分解と変性を効果的
に行うために95℃で5分間熱する。それから、それらを電気泳動にて分離する。
AscIを有するビオチニル化プライマーの場合、以下のように実施する。ビーズ
を20μl AscIバッファー(l5mM KOAc,20mM Tris,10mMMgOAc,1mM DTT,pH7.9)
に再懸濁し、5ユニットのAscIを加え37℃で1時間インキュベートする。ビーズ
をマグネット上で分離し、消化産物を含む上清を5μgのグリコーゲンを加えた
後、3倍量のエタノールで沈殿させる。ペレットを5μlのホルムアルデヒドロ
ーディングバッファーに再懸濁し、各2.5μlずつ2つのチューブに分ける。
さらに2.5μlホルムアミドローディングバッファーを一方に加え、20%GS500ROX
ladderを有する2.5μlホルムアミドローディングバッファーを他方に加える。こ
れらを95℃で5分間熱し、電気泳動分離によって分析する。
遊離され、配列決定された鎖をゲル電気泳動分離することによって配列決定が
終了される。オーバーハング配列は観察される断片に部分的にフィルされる順番
によって与えられる。
6.6 PCR 態様によるQEATM
これは、PCRプライマーまたはPCRプライマーセットによって認識される標的サ
ブ配列間にある断片のPCR増幅に基づいた代替的なQEATM態様である。それは図5
に参照して記載される好ましいプライマーに向けられている。縮重オリゴヌクレ
オチドの単一のセットのような、他のプライマーを用いる場合は、最初の低スト
リンジェンシーなPCRサイクルであるステップ5を省略する。
第1鎖cDNA合成を第6.3.節に従って行う。決められたプライマーセットを用い
たPCR増幅を以下のプロトコルに従って行う。
1.第一鎖混合物をAmbion,Inc(Austin,TX)製のRNase Cocktail 1μlにて37
℃で30分Rnase処理する。
2.該混合物をフェノール/CHCl3で2回抽出し、Milipore Corporation(Bedfor
d,MA)製Centricon 100上で水を用いて精製し濾過物として得る。
3.(10ng RNA/μlで開始した)cDNAの最終容量を50μlとする。
4.以下のPCR反応をセットアップ:
成分 量
cDNA (10ng/μl) 1 μl
10×PCRバッファー 2.5 μl
25mM MgCl2 1.5 μl
10mM dNTPs 0.5 μl
20pM/μlプライマー1 2.5 μl
20pM/μlプライマー2 2.5 μl
Taq Poly.(5U/μl) 0.2 μl
水 14.3 μl
5.以下のプロフィールを有する一つの低ストリンジェンシーサイクル:
40℃3分(アニーリング)
72℃1分(延長)
6.以下のプロフィールを用いるサイクル:
95℃1分
15-30回:
95℃30秒
50℃1分
72℃1分
72℃5分
7.4℃ 保持。
8.試料を沈殿させ、変性ローディングバッファーに再懸濁させ、そして電気泳
動によって(変性または非−変性条件のいずれかで)分析する。
6.7.シミュレーション化したアニーリング例
ヒトのコード配列を含有するGenbankデータベース(1994、10月)より、12,000
の第一連続コードドメイン配列(「CDS」)を第6.1.節のようにして選択した
。この選択により、選択した配列のデータベースは短い配列に偏りを生じた。次
にこの選択されたデータベースにおいて、長さ4、5、6、7および8の各ヌク
レオチド配列の存在頻度を記載した頻度表を作成した。その存在確率が50%近
い試験用の標的サブ配列を最初に選択した。この配列は比較的頻繁に結合するが
その存在確率は長さに比して減少するため4−merに適しており、より長い配列
に関しては存在確率は実質的にしばしば50%より低かった。次にシミュレーシ
ョン化したアニーリングCC実験計画法を使用して、これらの最初に選択した標
的サブ配列を最適化し、最良の16配列を選び出した。
表5、6および7はそれぞれ配列の長さ4、5および6の標的サブ配列につい
ての結果を示している。表8は長さ4から6の標的サブ配列の最適化の結果につ
いて一緒に示す。一般にシミュレーション化したアニーリングにより存在および
独立性の確率基準によってのみ行われる標的サブ配列の選択において約20%の
改善がみられた。この最適化レベルはより長い遺伝子を示すより大きなあるいは
小さな冗長データベースを改善するだろう。このデータベースにおいては、より
長い配列は頻繁に結合しすぎて有用な細切れの(hash)コードを作製できない。
表5の標的サブ配列は全ての考えられうる256の4−merから選んだ。平均して
細切れコード当たり2.41 CDSが存在する。これらのサブ配列のいずれにも相
補性を示さない692のCDS(12000以上)が存在していた。 表6の標的サブ配列は300の最も頻繁に生じる5−merから選んだ。平均して細
切れコード当たり2.33 CDSが存在する。これらのサブ配列のいずれにも相補
性を示さない829のCDS(12000以上)が存在していた。
表7の標的サブ配列は200の最も頻繁に生じる6−merから選んだ。平均して細
切れコード当たり2.63 CDSが存在する。これらのサブ配列のいずれにも相補
性を示さない1530のCDS(12000以上)が存在していた。
表8の標的サブ配列は表1〜3のセットから選んだ。平均して細切れコード当
たり2.22 CDSが存在する。これらのサブ配列のいずれにも相補性を示さない7
15のCDS(12000以上)が存在していた。
短い配列(平均して典型的な遺伝子の長さよりも短いもの)に対して選択された
CDSのバイアスは、選択された標的サブ配列のいずれにも相補性を示さなかっ
た5−10%のCDSを部分的に説明する。より長い配列はより多様性を有するた
め、よりヒットを有すると予想される。また、適用範囲を改善するために、さら
に標的サブ配列を選択することができる。個々の細切れコードにつき存在する2.
2〜2.6のCDSは、選択されたデータベースでの複製により部分的に説明される
。選択されたデータベースに特有の各々のCDSを保証するための試みはなされ
なかった。
6.8.QEA(商標)の結果
この小節では主に疑問(query)と組織モードに対するQEA(商標)実験からの
結果を示す。
6.8.1.疑問モードQEA(商標)の結果
遺伝子の発現パターンは組織ごとに異なり、正常な発生の間および癌を含む多
くの疾患が進行する間の両方でモジュレートされる。正常な腺組織、過形成(hyp
erplastic)性腺組織、および腺癌性の腺組織間での遺伝子発現における差異を研
究するために、疑問モードQEA(商標)実験を使用した。本発明者らは前記3タ
イプ全ての組織を含有するボクセル(voxel)を手元に有し、隣接した組織切片を
後のin situハイブリダイゼーションで使用できるようにして保存した。以下の
実験はそれぞれ特定の腺の正常な組織、過形成の組織、および腺癌性の組織を用
いて行なった。RNAの抽出とcDNAの合成
第6.3.1.節に記載したようにして、ホモジナイズした腺組織ボクセルか
らの全RNAおよびポリ(A)+RNAの単離を実質的に行なった。cDNAは第
6.3.4.節に記載したようにして実質的に調製した。定量的発現分析
第6.4.4.節に記載されたようにして、好ましい制限酵素態様により実質
的にQEA(商標)反応を行なった。これには以下の操作を含む。アダプターのアニーリング
12塩基と24塩基のプライマー対を1×NEB 2バッファー中1μlあたり5
ピコモルの24merの濃度で比率2:1(12mer:24mer)でプレアニールした。リン
カー/プライマーハイブリダイゼーションのために、前記オリゴヌクレオチド
混合物を10分間50℃まで熱し、ゆっくりと室温まで冷却させた。この実験のため
に、10ピコモルのJC3と5ピコモルのJC24、および10ピコモルのRC6と5ピ
コモルのRC24とを別々にプレアニールした。JC3、JC24、RC6、およびR
C24の配列は後述第6.10.節の表10に挙げた。制限−消化/連結反応
8ウェルサーマルサイクラーフォーマットで使用するために、反応を調整した
。組織の別々の10ボクセルから単離した腺cDNAをHindIIIおよびNgo
MIで切断し、プレアニールしたリンカーをこれらの酵素が産生した4塩基の5
’側の突出部上に連結した。各QEA(商標)反応ごとに以下のものを加えた:
1ユニットのHindIII(New England Biolabs,Beverly MA)
1ユニットのNgoMI(New England Biolabs,Beverly MA)
1μlのプレアニールしたJC3/JC24
1μlのプレアニールしたRC6/RC24
1μlのリガーゼ/ATP(0.2μlのT4 DNAリガーゼ(1ユニット/μl)
および0.8μlの10mM ATP−Life Technologies,Gaithersburg
MD)
0.5μlの50mM MgCl2
10ngの腺cDNA
1μlの10×NEB 2バッファー(New England Biolabs,Beverly MA)
H2Oにより全容量を10μlとする。
図16Aの温度プロファイルをPTC−100サーマルサイクラー(MJ Reserch,
Watertown MA)を使用して実行した。増幅反応
次に制限酵素/連結反応の産生物をRC24およびJC24プライマーを使用して
増幅した。PCR反応混合物には、
10μlの5×E-Mg(300mM トリス−HCl pH9.0、75mM(NH4)2SO2)
100pmのRC24
100pmのJC24
1μl 10mM dNTP混合物(Life Technologies,Gaithersburg MD)
2.5ユニット50:1 Taqポリメラーゼ(Life Technologies,Gaithersburg
MD):Pfuポリメラーゼ(Stratagene,La JollaCA)混合物
H2Oにより全容量を40μlとしたもの。
を含む。
40μlの予熱した反応混合物を各制限−消化/連結反応に加えた。図16Bの温
度プロファイルをPTC−100サーマルサイクラー(MJ Reserch,Watertown
MA)を使用して実行した。QEA(商標)分析
反応生成物を5%アクリルアミド配列決定ゲルで分離し、銀染色により検出し
た。ゲルの目視観察により、および標準的なコンピュータ走査装置を使用してゲ
ルを走査することにより得られるコンピュータ増幅(enhanced)画像を比較するこ
とにより、レーン同士の比較を行なった。長さX bpの特定のバンドが特異に発
現され、これは幾つかのサンプルで顕著であったが、その他のサンプルではみら
れなかった。このバンドをゲルから回収し、PCRで再び増幅して配列決定した
。
第6.1節で記載されているようにして構築したCDSデータベースを使用し
て、第5.4.1節で記載されているようにして実質的にQEA(商標)分析を行
なった。そのデータベース中の4つの可能な配列、配列A,B,C,およびDが
Y bpの断片の一因となり得ることがわかった(Y bp=X−46 bp、ここでPCR
プライマーにより断片長に46 bp加えられていることに注意されたい)。回収した
バンドの配列決定分析により、このDNA断片は配列C(現在Genbankに登録)に
より産生されることが確認された。この結果は統合した実験方法および分析方法
の修正機能を確認するものである。
さらに、配列Cの分析から、制限酵素BspHIとBstYIとを用いる第2の二
重消化により長さにしてZ bpの第2非重複制限断片が生じるだろうということ
が予測された。第2のQEA(商標)反応は腺cDNAを使用して行なった。制限
酵素/連結反応時はBspHI、BstYI、RA5/RA24およびJC9/JC24の
代わりにHindIII、NgoMI、JC3/JC24およびRC6/RC24を使用し
、また増幅反応時はRA24およびJC24を変更したことを除いては以前に記載し
た実験条件を使用した。上記のようにして、銀染色したアクリルアミドゲル上で
この第2の
QEA(商標)実験の結果を分析すると、予想された大きさ(Z+46 bp)のバンド
の存在が明らかとなり、このバンドはまた同じ組織サンプル内でX bp断片とし
て特異的に発現していた。この結果により、配列の実際の実験的な消化と組み合
わせた擬似(mock)消化予想法の修正機能が確認された。
QEA(商標)生成物の直接の配列決定を容易にするために、またそれが得られ
た組織サンブルにin situでハイブリダイズさせるためのRNAプロープの直接
の生成を容易にするために、さらなる混合(hybrid)プライマーを設計した。M13
−21プライマーまたはM13逆プライマー(イタリック体)をそれぞれJC24および
RC24の最初の23ヌクレオチド(太字)に融合し、二重消化したQEA(商標)生成
物を直接配列決定した。
in situハイブリダイゼーションのためのアンチセンスRNAプロープを直接
生成できるようにするために、ファージT7プロモーター(イタリック体)をJA
24/JC24およびRA24/RC24の最初の23ヌクレオチド(太字)に融合した。
6.8.2.組織モードQEA(商標)結果 QEA(商標)を使用したヒト胎盤ラクトゲンの単離
ラクトゲンはヒト胎盤中で最も多く発現される遺伝子の一つであり、既知の配
列を有する。ラクトゲンの配列はGenbankから入手し、可能な限りの制限酵素対
を広範に選択して第5.4.1節に記載されているようにして実質的に擬似消化
反応を行なった。これらの擬似消化により、制限酵素BssHIIIおよびXbaI
を
有する胎盤cDNAを消化すると、長さ166 bpのラクトゲン断片が得られること
が示された。RNAの抽出とcDNAの合成
第6.3.1.節に記載したようにして、ホモジナイズしたヒト胎盤組織から
の全RNAおよびポリ(A)+RNAの単離を実質的に行なった。cDNAは第6
.3.4.節に記載したようにして実質的に調製した。定量的発現分析
実質的に第6.4.3.節に記載されたようにして、好ましい制限酵素態様に
よりQEA(商標)反応を行なった。これには以下の操作を含む。アダプターのアニーリング
12塩基と24塩基のプライマー対を1×NEB 2バッファー中1μlあたり5ピ
コモルの24merの濃度で比率2:1(12mer:24mer)でプレアニールした。前記オ
リゴヌクレオチド混合物を10分間50℃まで熱し、ゆっくりと室温まで冷却させた
。この実験のために、10ピコモルのRC8と5ピコモルのRC24、および10ピコ
モルのJC7と5ピコモルのJC24を別々にプレアニールした。RC8、RC24、
JC7、およびJC24の配列は後述第6.10.節の表10に挙げた。制限−消化/連結反応
8ウェルサーマルサイクラーフォーマットで使用するために、反応の用意をし
た。胎盤cDNAをBssHIIおよびXbaIで切断し、プレアニールしたアダプ
ターをこれらの酵素が産生した4塩基の5’側の突出部上に連結した。反応ごと
に以下のものを加えた:
1ユニットのBssHII(New England Biolabs,Beverly MA)
1ユニットのXbaI(New England Biolabs,Beverly MA)
1μlのプレアニールしたRC8/RC24
1μlのプレアニールしたJC7/JC24
1μlのリガーゼ/ATP(0.2μl T4 DNAリガーゼ(1ユニット/μl)お
よび0.8μlの10mM ATP−Life Technologies,Gaithersburg M
D)
0.5μlの50mM MgCl2
10ngの胎盤cDNA
1μlの10×NEB 2バッファー(New England Biolabs,Beverly MA)
H2Oにより全容量を10μlとした。
図16Aの温度プロファイルをPTC−100サーマルサイクラー(MJ Reserch,
Watertown MA)を使用して実行した。増幅反応
次に制限酵素/連結反応の生成物をRC24およびJC24プライマー(後述、表1
0参照)を使用して増幅した。PCR反応混合物には、
10μlの5×E-Mg(300mM トリス−HCl pH9.0、75mM(NH4)2SO2)
100pmのRC24
100pmのJC24
1μlの10mM dNTP混合物(Life Technologies,Gaithersburg MD)
2.5ユニットの50:1 Taqポリメラーゼ(Life Technologies,Gaithersbu
rg MD):Pfuポリメラーゼ(Stratagene,La Jolla CA)混合物
H2Oにより全容量を40μlとしたもの。
が含まれる。
40μlの予熱したPCR反応混合物を各制限−消化/連結反応に加えた。図16
Bの温度プロファイルをPTC−100サーマルサイクラー(MJ Reserch,Wate
rtown MA)を使用して実行した。QEA(商標)分析
反応生成物を5%アクリルアミド配列決定ゲルで分離し、銀染色により検出し
た。212 bpの大きさの顕著なバンドが見られた。これはBssHII部位に連結さ
れたJC24、およびXbaIに連結されたRC24を有する166 bpのラクトゲンBss
HII−XbaI断片に対応するものと予想された。このバンドが実際にラクトゲ
ンに対応していることを確認するために、該212 bpのバンドをゲルから取り出し
、JC24とRC24を使用して再び増幅し、得られた断片の配列決定を行なった。
これらの配列決定した結果を分析したところ、この断片がラクトゲンからのもの
であることがわかった。さらに、このラクトゲン配列は制限部位の予想された4
塩基部分(4 base remnant)で終結しており、そのすぐ後ろにJC24(BssHII
末端)かまたはRC24(XbaI末端)のいずれかが続いていた。
この結果により、組織cDNAサンプル中の対象の特定の配列(この場合はヒ
ト胎盤性ラクトゲン配列)を同定するためのQEA(商標)実験の選択に適用した
第5.4.2節の実験計画法を確認した。これらの計画法により、うまく目的と
する遺伝子を同定する実験を選択することができる。
本節のプロトコルに従い、異なる酵素の組み合わせを用いて、ヒト胎盤由来の
cDNAについてさらなるQEA(商標)実験を行なった。表9の第1列に挙げた
酵素のセットの各酵素1ユニットを制限−消化/連結反応プロトコルに使用した
。各制限酵素のプライマーとリンカーは、各反応に使用された一つの適切な「J
」シリーズのリンカーとプライマーおよび一つの適切な「R」シリーズのリンカ
ーとプライマーを記載した表10より選択した。反応生成物を5%アクリルアミド
ゲル電気泳動で分離し、そのバンドを銀染色で検出した。表9の第2列に挙げた
長さを有するバンドからの断片をゲルから取り出して配列決定した。配列決定に
より断片末端上のサブ配列と各断片の正確な長さを同定した。各サブ配列は使用
した制限酵素の一つに特徴的であり、連結および増幅のプロトコルの正確な実施
を示していた。表9の第3列には末端配列が記載されており、「1」は制限酵素
「酵素1」の認識サブ配列を示し、また「2」は制限酵素「酵素2」の認識サブ
配列を示している。同じ長さだが異なる認識サブ配列を有する多くの断片を表9
の別の列(separate sub-rows)に記載した。
第5.4.1節に記載されているように、第6.1節に従って選択したCDS
データベースを使用して擬似消化反応を行なった。これらの擬似消化反応ではこ
の制限酵素に対する認識サブ配列を有する配列についてのCDSデータベースを
検索し、そのためこの認識サブ配列を、記載した長さを有する断片を産生させる
ために間隔をあけて配置した。この検索により表9の第4列に挙げたデータベー
ス受け入れ番号を割り出した。各受け入れ番号に対応する(responsible for)遺
伝子をGenBank照合(lookup)から決定し、表9の第5列に挙げた。このような
遺伝子とその受け入れ番号各々をさらに細かく分けて記載した。一つの遺伝子に
大して複数の受け入れ番号があるのは、現在のCDS DNA配列データベース
では重複(redundancy)があることを反映している。
ゲルから回収した断片のうち、1つを除いた残りの全てについては、この断片
の配列はその断片を生じる擬似消化反応により同定された遺伝子の一つに対応し
ていた。この特定の遺伝子は、表9の第5列中に下線を付した太字表記の遺伝子
名を記載することにより示してある。別々の断片を配列決定することにより決定
された遺伝子がデータベース検索の予測とマッチしているということは、実験プ
ロトコルと第5.4.1節および第5.4.3節の組織モードQEA(商標)につ
いての実験分析およびアンビギュイティ・レゾルーション(ambiguity resolutio
n)法を実装したコンピュータの効力を確認するものである。実際に、擬似消化反
応はDNA配列データベースにおける可能なアンビギュイティを同定する簡単な
方法を提供する。
6.9.コロニー・コーリング(colony calling)
コロニー・コーリングの実施態様はcDNAライブラリーフィルターの構築、
PNAハイブリダイゼーション、およびハイブリダイゼーションの検出からなる
主な工程を含む。サンプル中の配列の決定は以前に記載したコンピュータ実装C
C実験分析法によりなされた。cDNAライブラリーフィルターの構築
このプロトコルは3つのステップを含む。:まず最初に機械的にコロニーを選
んでマイクロタイタープレートにおき、2番目にインサートのPCR増幅を行な
い、3番目に増幅したcDNAインサートをフィルター上にスポットする。
1.コロニーの選別
a)ライブラリーを100mmペトリ皿一枚あたり1,000〜10,000コロニーの密度で
プレートにまき、ロボットを使用して適切な抗生物質を含む50μlのTB培地を
含有する384ウェルマイクロタイタープレートにいれた。この作業をするロボッ
トがいくつか市販されている。好ましいロボットはWashington University H
uman Genome Sequencing Center(St.Louis,MO)のものである。
b)選んだコロニーを37℃で8時間増殖させ、保存のために凍結した。
2.PCR増幅
インサートの増幅のために設計されたPCRプライマー対を標準的な25μ
lのPCR混合物を用いて96ウェルマイクロタイタープレートに分け入れた。96
プロング(prong)移動器具で384ウェルコロニーからサンプルを選んで96ウェルP
CR混合物へ移し、増幅鋳型を作製した。標準的な25サイクルの増幅プロトコル
で100〜500ngの挿入DNAが得られた。
3.フィルター上へのスポット
前記PCR産物を上記コロニープレートと同一の384ウェルフォーマット
マイクロタイタープレートに戻してプールした。フィルターへのスポットはRes
earch Genetics(Huntsville,AL)により行われるサービスである。
また、cDNAライブラリーフィルターは特定の場合には市販の供給源から得
ることができる。PNAハイブリダイゼーションおよび検出
PNAはPerseptive Biosystems(Bedford,MA)から市販されており入手可
能である。以下のプロトコルでは共通サブ配列として表7の最適化した6−mer
サブ配列を含有するPNA8−merの16の異なる重複セットに8種の染料を使用
した。従って、ヒト組織で発現された遺伝子の完全な分類と決定は長さ32のコー
ドを生成するたった4つのハイブリダイゼーションによりなされる。ストリンジ
ェンシーに対する実際の条件は使用したPNAのセットにより変化しうる。
1.ハイブリダイゼーション
10mMのリン酸バッファー、pH7.0、1×Denhardt's溶液(20mg/ml Fic
oll 400、ポリビニルピロリドン、およびBSA)中0.1μg/mlの濃度で作製し
た8種の異なる蛍光色素で標識した8つのPNAのプールを使用した。アレイ化
したフィルターを25℃で16時間ハイブリダイズし、シグナル/ノイズを最大化す
る温度で上記のバッファー(PNA無し)中で3回洗浄した。
2.可視化
DNA分析に使用するような蛍光検出システムを各フィルターのハイブリ
ダイゼーション位置に存在する染料、つまりはPNAを区別するために使用
することができる。PNAが存在するかしないかでフィルター上の各ハイブリダ
イゼーション位置に対するコードが定義される。
6.10.好ましいQEA(商標)アダプターと制限酵素対
表10にはQEA(商標)の好ましい制限酵素の実施態様のためのアダプターとし
て使用されうる好ましいプライマー−リンカー対を挙げた。記載したプライマー
は5’4 bp突出部を生成する約56の利用可能な制限酵素を含む可能な二重消化
制限酵素の組み合わせを網羅している。40のそうした制限酵素がNew England
Biolabsから入手可能である。各QEA(商標)二重消化反応のために、制限酵素
対の一つに対応する「R」シリーズからの一つのプライマーと一つのリンカーお
よび他の制限酵素対の一つに対応する「J」シリーズからの一つのプライマーと
一つのリンカーを併用した。この選択は以前に記載したアダプターの特性を満足
させるものであった。同じシリーズからの2対は増幅中に適合性を示さなかった
。
このプライマーの1つを捕獲部分に結合する場合における、表11のREペア及び
それに対応するプライマー/リンカーを試験した。この表は、表10の追加部分で
ある。ビオチンは標準的なホスホルアミダイト化学を用いることによりプライマ
ーに結合させることができる。 表12及び13に、ヒト胎盤及び腺cDNAサンプルのQEATM実験において試験したRE
の組み合わせを列挙する。好ましい二重消化は、100〜700bpの範囲に約50
より多いバンドを生じさせるものである。表12に、ヒトcDNA分析用の好ましいRE
組み合わせを列挙する。 表13に、試験し、ヒトcDNA分析に使用することが可能なその他のRE組み合わせ
を列挙する。
表14及び15に、マウスcDNAサンプルのQEATM実験において試験したREの組み合
わせを列挙する。好ましい二重消化は、100〜700bpの範囲に約50より多いバンド
を生じさせるものである。表14に、マウスcDNA分析用の好ましいRE組み合わせを
列挙する。
表15に、試験し、マウスcDNA分析に使用することが可能なその他のRE組み合わ
せを列挙する。
表16にマウスcDNAサンプルを用いて種々のRE組み合わせから得られたデータを
列挙する。バンドの数は、銀染色したアクリルアミドゲル分離ゲルから観察した
。 6bpの認識配列を認識し、4bpの5'突出を生じる31の利用可能なREは、Acc65
I、AflII、AgeI、ApaLI、ApoI、AscI、AvrI、BamHI、BclI、BglII、BsiWI、Bsp1
20I、BspEI、BspHI、BsrGI、BssHII、BstYI、EagI、EcoRI、HidIII、MfeI、MluI
、NcoI、NgoMI、NheI、NotI、Ppu10I、SalI、SpeI、XbaI、及びXhoIである。
これらの酵素は全て、AflIIを除いて、6.4.4.節に従い、QEATMプロトコルで試
験した。MfeI、Ppu10I、SalI及びXhoIを除いて全て使用可能であった。他の26の
酵素全てを試験したところ、QEATMのRE実施(RE implemantation)に使用可能であ
った。
しかし、これらの酵素の特定のペアは、同じ突出を生じ、そのためその認識配
列がQEATMアダプターによって区別することができないため、有益性に劣ってい
る。これらのペアは、Acc65I及び(BsiWI又はBsrGI);AgeI及び(BspEI又はNcoMI);
ApoI及びEcoRI;AscI及び(BssHII又はMluI);AvrI及び(NheI、SpeI、又はXbaI);Ba
mHI及び(BclI、BglII、又はBstYI);BcII及び(BglII又はBstYI);BglII及びBstYI;
BsiWI及びBsrGI;Bsp120I及びEagI;BspEI及びNcoMI;BspHI及びNcoI;BssHII及びMl
uI;NheI及び(SpeI又はXbaI);ならびにSpeI及びXbaIである。
このように301のREペアを試験し、それらはQEATMのRE実施に使用可能であった
。
6.10.1. 好適なSEQ-QEATM酵素及びアダプター
表17に、SEQ-QEATM実施に適用可能なタイプIIS REの例及びそれらの重要な特
性を列挙する。各REに関して、表はdsDNA分子の各鎖上の認識配列及びその認識
配列から鎖切断位置までの距離をbpで列挙する。また、生じる正味の突出を列挙
する。
表18は、SEQ-QEATM法に適用可能なプライマー及びリンカーの例を列挙してい
る。これらは、プライマー及びリンカーに関する前記の要件を満たしている。示
した違いを除いて、それらは、表10中の同様な名のプライマー及びリンカーと同
じである。RA-24U及びRC24-Uは、示したような5'ビオチン捕獲部分及びウラシ
ル放出手段を有し、且つ表10のRA24及びRC24と同じリンカー及びREに適合可能で
ある。RA24-S及びRC24-Sはまた、太字及び下線で示したAscI認識部位放出手段と
ともに5'ビオチン捕獲部位も有している。Ja24-Kは、示した内部kI認識部位及
び5'FAM標識部位を有している(表19を参照のこと)。このFokI認識部位は、必要
に応じて4bp突出を生じるREとともに用いられるように配置させる。示したREに
対応するリンカーKA5、KA6、及びKA9はこのプライマーとともに機能する。JC24-
Bは内部BbvI認識部位、5'FAM標識を有し、且つリンカーBA5及びBA9とともに機
能する。BbvI認識部位はまた必要に応じて、4bp突出を生じるREとともに用いら
れるように配置させる。
6.11. 蛍光標識
本発明の方法に使用することができる蛍光色素標識として、標準的な蛍光色素
ならびにより特殊な蛍光色素が挙げられる。標準的な蛍光色素として、ビマン(b
imane)、エチジウム、クエン酸ユーロピウム(III)、フルオレセイン、ラホヤブ
ルー(La Jolla blue)、メチルクマリン、ニトロベンゾフラン、ピレンブチレー
ト、ローダミン、テルビウムキレート、及びテトラメチルローダミンが挙げられ
る。より特殊な蛍光色素をその提供者とともに表19に列挙する。
表19に列挙した提供者は、Molecular Probes(Eugene,OR)、Biological Detect
ion Systems(「BDS」)(Pittsburgh,PA)、及びPerkin-Elmer(Norwalk,CT)である
。
それらを特定のヌクレオチド基に結合させることによる、これらの蛍光色素の
利用方法は、Krickaら,1995,分子プローブ化、ブロッティング、及び配列決定(M
olecular Probing,Blotting,and Sequecing),第1章,Academic Press,New
Yorkに記載されている。結合の好ましい方法は、アミノリンカー又はホスホルア
ミダイト化学によるものである。
7.特定の実施態様、参考文献の引用
本発明は、本明細書中に記載の特定の実施態様により、その範囲に限定されな
い。実際、本明細書中に記載のものに付加させて種々の改変が先の記載及び添付
の図面から当業者に明らかになるであろう。そのような改変は添付の請求範囲の
範囲内になることが意図される。
本明細書中には、種々の刊行物が引用され、その開示は、その全体が参考とし
て引用される。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FI,FR,GB,GR,IE,IT,L
U,MC,NL,PT,SE),OA(BF,BJ,CF
,CG,CI,CM,GA,GN,ML,MR,NE,
SN,TD,TG),AP(KE,LS,MW,SD,S
Z,UG),UA(AM,AZ,BY,KG,KZ,MD
,RU,TJ,TM),AL,AM,AU,AZ,BA
,BB,BG,BR,BY,CA,CN,CU,CZ,
EE,FI,GE,HU,IL,IS,JP,KG,K
P,KR,KZ,LC,LK,LR,LS,LT,LV
,MD,MG,MK,MN,MX,NO,NZ,PL,
RO,RU,SG,SI,SK,TJ,TM,TR,T
T,UA,UZ,VN
(72)発明者 シンプソン,ジョン,ダブル.
アメリカ合衆国 06443 コネチカット州,
マディソン,ウッドランド ロード 23,
アパートメント ビー4