JP4947573B2 - Microarray data analysis method and analyzer - Google Patents
Microarray data analysis method and analyzer Download PDFInfo
- Publication number
- JP4947573B2 JP4947573B2 JP2006211110A JP2006211110A JP4947573B2 JP 4947573 B2 JP4947573 B2 JP 4947573B2 JP 2006211110 A JP2006211110 A JP 2006211110A JP 2006211110 A JP2006211110 A JP 2006211110A JP 4947573 B2 JP4947573 B2 JP 4947573B2
- Authority
- JP
- Japan
- Prior art keywords
- probe
- target
- microarray
- fluorescence intensity
- hybridization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000010208 microarray analysis Methods 0.000 title claims description 36
- 239000000523 sample Substances 0.000 claims description 313
- 238000009396 hybridization Methods 0.000 claims description 79
- 238000005259 measurement Methods 0.000 claims description 65
- 238000002493 microarray Methods 0.000 claims description 61
- 238000004458 analytical method Methods 0.000 claims description 35
- 230000027455 binding Effects 0.000 claims description 28
- 238000009739 binding Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 17
- 238000013500 data storage Methods 0.000 claims description 12
- 239000012488 sample solution Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 2
- 239000000243 solution Substances 0.000 claims 9
- 239000011259 mixed solution Substances 0.000 claims 1
- 238000002474 experimental method Methods 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 20
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 6
- 239000013068 control sample Substances 0.000 description 6
- 230000009871 nonspecific binding Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 4
- 238000010195 expression analysis Methods 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000007876 drug discovery Methods 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 231100000622 toxicogenomics Toxicity 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 108010064177 glutamine synthetase I Proteins 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本発明はマイクロアレイ実験により得られたデータの解析方法及び解析装置に関する。 The present invention relates to a method and an apparatus for analyzing data obtained by a microarray experiment.
Affymetrix社のGeneChip型をはじめとするマイクロアレイは、DNAチップとも呼ばれ、数千種のDNA/RNAの濃度を同時に、かつ定量的に計測することを可能とするものであり、ガラスやシリコン製の小基盤上にDNA分子(プローブ)を高密度に配置して形成される。 Affymetrix's GeneChip type microarrays, also called DNA chips, are capable of simultaneously and quantitatively measuring the concentration of thousands of DNA / RNA. It is formed by arranging DNA molecules (probes) at high density on a small substrate.
マイクロアレイ上のプローブと、解析対象とするターゲットとをハイブリダイゼーションさせ、各プローブから得られるシグナルを測定し、数値化して解析することで、ターゲットの濃度を知ることができる。従来より、マイクロアレイ実験におけるデータ解析技術として種々の装置及び方法が研究、開発されている(特許文献1〜3等参照)。
The concentration of the target can be known by hybridizing the probe on the microarray and the target to be analyzed, measuring the signal obtained from each probe, digitizing it, and analyzing it. Conventionally, various apparatuses and methods have been researched and developed as data analysis techniques in microarray experiments (see
マイクロアレイを用いてトランスクリプトームのような非常に多種類のDNAの断片を測定する場合、プローブの配列に対応する相補的なターゲットではなく、その配列と部分的にマッチするさまざまなターゲットが結合(非特異的な結合、以下「クロスハイブリダイゼーション」という。)してしまうことがある。 When microarrays are used to measure very many types of DNA fragments, such as transcriptomes, various targets that partially match the sequence bind, not the complementary target corresponding to the probe sequence ( Non-specific binding, hereinafter referred to as “cross-hybridization”).
このクロスハイブリダイゼーションにより、目的のターゲットがプローブに結合した真のシグナル値に加算されるため、測定値においてノイズ成分として扱われる。特にサンプル中の目的のターゲットの濃度が低い場合には、真のターゲットに起因するシグナル成分と、クロスハイブリダイゼーションの影響によるシグナル成分とを区別することが困難であり、測定結果の信頼度を下げる大きな要因となっている。 This cross-hybridization adds the target target to the true signal value bound to the probe, so that it is treated as a noise component in the measurement value. In particular, when the concentration of the target of interest in the sample is low, it is difficult to distinguish between the signal component due to the true target and the signal component due to the effect of cross-hybridization, reducing the reliability of the measurement results. It is a big factor.
このような問題を解決する方法として、Affymetrix社の解析ソフトウェアに実装されている、ミスマッチプローブを用いたアルゴリズムがある。 As a method for solving such a problem, there is an algorithm using a mismatch probe implemented in analysis software of Affymetrix.
Affymetrix社のGeneChip(登録商標)マイクロアレイには、目的のターゲットと相補的な配列を持つプローブ(Perfect Match (PM)プローブ)に加えて、PMプローブの配列と一塩基だけ異なる配列を持ったミスマッチ(MisMatch (MM))プローブが合成されている。このアルゴリズムでは、PMプローブとMMプローブの間ではクロスハイブリダイゼーションの効果にあまり差がないと見なし、PMプローブのシグナル値からMMプローブのシグナル値を減算することで、クロスハイブリダイゼーションの影響をキャンセルできるという考えに基いている。 The Affymetrix GeneChip (registered trademark) microarray has a mismatch that has a sequence that differs from the PM probe sequence by one base in addition to a probe that has a sequence complementary to the target of interest (Perfect Match (PM) probe). MisMatch (MM)) probe is synthesized. This algorithm assumes that there is not much difference in the effect of cross-hybridization between the PM probe and MM probe, and the effect of cross-hybridization can be canceled by subtracting the signal value of the MM probe from the signal value of the PM probe. Based on the idea.
しかし、実際には、クロスハイブリダイゼーションの影響はPMプローブとMMプローブとでは大きく異なる場合が多いため、上記のアルゴリズムで求めた値は、必ずしもクロスハイブリダイゼーションの影響を除いたシグナルの値を適切に反映しているわけではない。その結果、その誤差が大きなノイズとして現れてしまい、データの信頼性を低下させる要因となっている。特に、濃度の低いターゲットは、測定されるシグナルがノイズに埋もれてしまうことから、従来、測定が困難であった。 However, in practice, the effects of cross-hybridization often differ greatly between PM probes and MM probes, so the values obtained by the above algorithm are not necessarily signal values that exclude the effects of cross-hybridization. It does not reflect. As a result, the error appears as large noise, which is a factor of reducing the reliability of data. In particular, a target having a low concentration has been conventionally difficult to measure because a signal to be measured is buried in noise.
本発明では、上記課題を解決すべくなされたものであり、その目的とするところは、マイクロアレイ実験におけるシグナル値からノイズの影響を除去することで遺伝子発現量の解析の精度を向上させる解析方法および解析装置を提供することにある。 The present invention has been made to solve the above-mentioned problems, and the object of the present invention is an analysis method for improving the accuracy of gene expression level analysis by removing the influence of noise from the signal value in a microarray experiment, and To provide an analysis device.
本発明の第1の態様において、複数のプローブが配置されたマイクロアレイを用いて溶液中に含まれるターゲットの濃度を求めるマイクロアレイの解析方法が提供される。 In a first aspect of the present invention, there is provided a microarray analysis method for obtaining a concentration of a target contained in a solution using a microarray in which a plurality of probes are arranged.
その解析方法においてマイクロアレイは、解析対象とするターゲットの塩基配列に対応した塩基配列を有する複数の計測プローブと、解析対象とするターゲットの塩基配列に対応しない塩基配列を有する複数のランダムプローブとを含む。 In the analysis method, the microarray includes a plurality of measurement probes having a base sequence corresponding to the base sequence of the target to be analyzed, and a plurality of random probes having a base sequence not corresponding to the base sequence of the target to be analyzed. .
マイクロアレイの解析方法は以下のステップを含む:
1)ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせるステップ、
2)各プローブの蛍光強度を測定するステップと、ランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求めるステップ、
3)バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測するステップ、
4)計測プローブの蛍光強度の測定値(Im i)からクロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求めるステップ。
The microarray analysis method includes the following steps:
1) a step of hybridizing a solution containing the target and each probe of the microarray,
2) a step of measuring the fluorescence intensity of each probe, and a step of determining the amount (t ns ) of a background target that is a target non-specifically bound to the probe from the measurement value of the fluorescence intensity of the random probe;
3) predicting the degree of influence (NS i ) of cross-hybridization on the measurement value of the fluorescence intensity of the measurement probe based on the amount of the background target and the binding energy of each probe;
4) A step of obtaining the amount (t t i ) of the target to be analyzed by excluding the degree of influence of cross hybridization from the measured value (I m i ) of the fluorescence intensity of the measurement probe.
上記マイクロアレイの解析方法において、プローブの取り得る状態間の平衡を示すモデルを定義し、そのモデルを用いてバックグラウンドターゲットの量(tns)が求められてもよい。モデルにおけるプローブの状態には、プローブが溶液中でフリーである状態、プローブとバックグラウンドターゲットとが非特異的に結合した状態、及びプローブが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態が含まれてもよい。この場合、マイクロアレイの解析方法はさらに、解析対象のゲノムを断片化したサンプルのみをマイクロアレイ上のプローブとハイブリダイゼーションさせるステップと、ハイブリダイゼーションによるランダムプローブの蛍光強度を測定するステップと、その測定値に基づき、前記モデルの平衡定数を求めるためのパラメータ(wpf、εns)を決定するステップとを含んでもよい。 In the microarray analysis method, a model indicating an equilibrium between possible states of the probe may be defined, and the amount (t ns ) of the background target may be obtained using the model. The state of the probe in the model includes a state where the probe is free in solution, a state where the probe and the background target are non-specifically bound, and a state where the probe is folded by self-hybridization and has a secondary structure. May be included. In this case, the microarray analysis method further includes a step of hybridizing only a sample obtained by fragmenting the genome to be analyzed with a probe on the microarray, a step of measuring the fluorescence intensity of the random probe by the hybridization, and a measurement value thereof. And determining parameters (w pf , ε ns ) for determining the equilibrium constant of the model.
または、プローブの状態には、さらに、ターゲットが溶液中でフリーである状態、ターゲットが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態、及びプローブとバックグラウンドターゲットとが特異的に結合した状態が含まれてもよい。このとき、結合エネルギーはモデルの平衡定数を求めるためのパラメータである。この場合、マイクロアレイの解析方法はさらに、解析対象のゲノムを断片化したサンプルと、濃度の確定したDNAとの混合液をマイクロアレイ上のプローブとハイブリダイゼーションさせるステップと、ハイブリダイゼーションによる計測プローブの蛍光強度を測定するステップと、その測定値に基づき、結合エネルギーを求めるためのパラメータ(wtf、εs)を求めるステップと含んでもよい。 Or, the probe is further in a state where the target is free in solution, the target is folded by self-hybridization and has a secondary structure, and the probe and the background target are specifically bound. A state may be included. At this time, the binding energy is a parameter for obtaining the equilibrium constant of the model. In this case, the microarray analysis method further comprises a step of hybridizing a mixture of a sample obtained by fragmenting the genome to be analyzed and a DNA whose concentration has been determined with a probe on the microarray, and the fluorescence intensity of the measurement probe by hybridization. And a step of obtaining parameters (w tf , ε s ) for obtaining the binding energy based on the measured value.
上記マイクロアレイの解析方法において、複数のランダムプローブの一部のプローブと、一部のプローブの塩基配列に対応した塩基配列を持ち、濃度の確定したDNAとをハイブリダイゼーションさせるステップと、一部のプローブの蛍光強度を測定するステップと、一部のプローブの蛍光強度の測定値と、DNAの濃度の確定した値とに基づき、プローブの蛍光強度とターゲット濃度間の比例定数を決定するステップとをさらに含んでもよい。 In the microarray analysis method described above, a step of hybridizing a part of a plurality of random probes with a DNA having a base sequence corresponding to the base sequence of the part of the probe and having a determined concentration; Measuring the fluorescence intensity of the probe, and determining a proportionality constant between the fluorescence intensity of the probe and the target concentration based on the measured value of the fluorescence intensity of some probes and the determined value of the DNA concentration. May be included.
本発明の第2の態様において、複数のプローブが配置されたマイクロアレイからのシグナルを解析し、サンプル溶液中のターゲットの濃度を求めるマイクロアレイの解析装置が提供される。 In a second aspect of the present invention, there is provided a microarray analyzer for analyzing a signal from a microarray in which a plurality of probes are arranged to determine the concentration of a target in a sample solution.
解析装置は、解析に用いるモデルに関する情報を格納するデータ格納手段と、ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせた結果得られる各プローブの蛍光強度の測定値を入力する入力手段と、モデルに関する情報を用いて、前記入力した蛍光強度の測定値からターゲット濃度(tt i)を算出する処理手段とを備える。処理手段は、入力したランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求め、バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測し、計測プローブの蛍光強度の測定値(Im i)からクロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求める。 The analysis apparatus includes data storage means for storing information on a model used for analysis, and input means for inputting a measurement value of the fluorescence intensity of each probe obtained as a result of hybridization of a solution containing the target and each probe of the microarray. And processing means for calculating a target concentration (t t i ) from the inputted measurement value of the fluorescence intensity using information on the model. The processing means obtains the amount (t ns ) of the background target, which is a target that non-specifically binds to the probe, from the measurement value of the fluorescence intensity of the input random probe, and the amount of the background target and the binding energy of each probe. Based on the above, the degree of influence of cross-hybridization (NS i ) on the measurement value of fluorescence intensity of the measurement probe is predicted, and the degree of influence of cross-hybridization is excluded from the measurement value of fluorescence intensity (I m i ) of the measurement probe. Thus, the amount (t t i ) of the target to be analyzed is obtained.
本発明の第3の態様において、複数のプローブが配置されたマイクロアレイからのシグナルを解析し、サンプル溶液中のターゲットの濃度を求める処理をコンピュータに実行させるための解析プログラムが提供される。 In a third aspect of the present invention, there is provided an analysis program for causing a computer to execute a process of analyzing a signal from a microarray in which a plurality of probes are arranged and obtaining a target concentration in a sample solution.
解析プログラムは、ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせた結果得られる各プローブの蛍光強度の測定値を入力するステップと、入力したランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求めるステップと、バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測するステップと、計測プローブの蛍光強度の測定値(Im i)からクロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求めるステップとをコンピュータに実行させる。 The analysis program inputs a measurement value of the fluorescence intensity of each probe obtained as a result of hybridization of the solution containing the target and each probe of the microarray and the measurement value of the fluorescence intensity of the input random probe to the probe. Cross-hybridization in the measurement value of the fluorescence intensity of the measurement probe based on the step of obtaining the amount (t ns ) of the background target that is a non-specific binding target and the amount of the background target and the binding energy of each probe the impact and the step of predicting (NS i), the measurement value of the fluorescence intensity of the measuring probe (I m i) to exclude the influence of cross-hybridization of the amount of target to be analyzed (t t i) And causing the computer to execute
本発明によれば、解析対象のターゲットに対応しない塩基配列を持つプローブ(ランダムプローブ)の蛍光強度から、クロスハイブリダイゼーションを生じるターゲット(バックグラウンドターゲット)の量を算出し、算出したバックグラウンドターゲット量と、各プローブの結合エネルギーとに基づいて、蛍光強度におけるバックグラウンドターゲットの影響を評価し、この影響を排除した形で解析対象のターゲットの濃度を求める。この方法によれば、蛍光強度の測定値においてバックグラウンドターゲットによる影響(ノイズ)を排除できるため、真のターゲット濃度を精度よく求めることができる。特に、従来クロスハイブリダイゼーションによるノイズに埋もれて測定不能であった低い濃度のターゲットに対して、適切に評価することが可能になる。 According to the present invention, the amount of a target (background target) that causes cross-hybridization is calculated from the fluorescence intensity of a probe (random probe) having a base sequence that does not correspond to the target to be analyzed. Then, based on the binding energy of each probe, the influence of the background target on the fluorescence intensity is evaluated, and the concentration of the target to be analyzed is obtained in a form that excludes this influence. According to this method, since the influence (noise) due to the background target can be eliminated in the measured value of the fluorescence intensity, the true target concentration can be accurately obtained. In particular, it is possible to appropriately evaluate a low concentration target that has been buried in noise due to cross hybridization and cannot be measured.
以下、添付の図面を参照して本発明のマイクロアレイの解析方法及び解析装置の実施の形態を説明する。 Embodiments of a microarray analysis method and an analysis apparatus according to the present invention will be described below with reference to the accompanying drawings.
本発明のマイクロアレイの解析方法及び解析装置は、マイクロアレイのプローブの塩基配列の結合エネルギーに基づいてクロスハイブリダイゼーション(非特異的な結合)の影響の大きさを予測し、実際の蛍光強度のシグナル値から除外することで、精度よく解析対象とするターゲットの濃度を得ることを可能とする。なお、以下の説明では、目的のターゲットの塩基配列と関係なくランダムにプローブに結合してくるようなサンプル内のRNA/DNA断片を「バックグラウンドターゲット」と呼ぶ。 The microarray analysis method and analysis apparatus of the present invention predict the magnitude of the effect of cross-hybridization (non-specific binding) based on the binding energy of the base sequence of the probe of the microarray, and the actual fluorescence intensity signal value. It is possible to obtain the concentration of the target to be analyzed with high accuracy. In the following description, an RNA / DNA fragment in a sample that binds to a probe randomly regardless of the base sequence of the target of interest is referred to as a “background target”.
1.マイクロアレイ
図1に、本発明のマイクロアレイ解析方法で使用するマイクロアレイのプローブ構成を示す。マイクロアレイ10は、計測プローブ11、ランダムプローブ13及びコントロールプローブ15の3種類のプローブが含まれるよう設計されている。
1. Microarray FIG. 1 shows a probe configuration of a microarray used in the microarray analysis method of the present invention. The
計測プローブ11は、本来の計測に用いるための、対象となる細胞のゲノムと相補的な塩基配列をもったプローブであり、基本的に従来のマイクロアレイのプローブと同じものを用いることができる。
The
ランダムプローブ13は、クロスハイブリダイゼーションの影響を評価するためのプローブである。ランダムプローブは、対象となる細胞のゲノム上に対応する塩基配列が含まれないように、乱数をもとに人工的に作られた配列を持つプローブである。「対象となる細胞のゲノム上に対応する配列が含まれない」ことの指標として、各ランダムプローブと、対象となる細胞のゲノムとのアライメントをとり、連続してマッチした部分配列の平均の長さがプローブ長の1/2以下となるものとする。計測するサンプル中に対応するDNA/RNAが含まれないため、このランダムプローブ13の示す蛍光強度は完全にクロスハイブリダイゼーションの影響のみによるものと考えられる。
The
ランダムプローブ13の一部がコントロールプローブ15として割り当てられる。コントロールプローブ15はシグナルの強度とターゲット濃度の絶対量とを比較するために使用される。すなわち、コントロールプローブに対して、対応する配列を持ったオリゴヌクレオチドを人工的に合成し、これを一定の濃度でサンプルに加えてコントロールプローブと結合させる。このときにコントロールプローブから得られるシグナルの強度と、対応する配列を持ったオリゴヌクレオチドの濃度の絶対量とを比較することで、シグナル強度とターゲット濃度の絶対量の相関を得る。
A part of the
2.マイクロアレイ解析方法
以下、本発明のマイクロアレイ解析方法の詳細を説明する。
2. Microarray Analysis Method Hereinafter, details of the microarray analysis method of the present invention will be described.
2.1 クロスハイブリダイゼーションの影響の評価
本発明では、まず、クロスハイブリダイゼーションによって結合するターゲットの量を予測する。具体的には、一種類のプローブに対して不特定多数のターゲットが部分的に結合する際の、結合量の総和を、それら不特定多数のターゲットの平均的な結合エネルギーの形でモデル化する。その上で、予備実験を行い、予備実験による実測値とモデルによる予測値との誤差を最小化するようにモデルの各種のパラメータを数値解析的手法で最適化して求める。そのパラメータをもとに各プローブへのクロスハイブリダイゼーションの影響を評価しながら、実際の測定値を補正する。
2.1 Evaluation of Cross-Hybridization Effect In the present invention, first, the amount of target bound by cross-hybridization is predicted. Specifically, the total amount of binding when an unspecified number of targets partially bind to one type of probe is modeled in the form of an average binding energy of the unspecified number of targets. . After that, a preliminary experiment is performed, and various parameters of the model are optimized by a numerical analysis method so as to minimize an error between the actually measured value of the preliminary experiment and the predicted value of the model. Based on the parameters, the actual measurement values are corrected while evaluating the influence of cross-hybridization on each probe.
2.1.1 モデル
最初に、クロスハイブリダイゼーションによる影響を評価するためのモデルについて説明する。
2.1.1 Model First, a model for evaluating the influence of cross hybridization will be described.
プローブi(i番目のプローブ)の塩基配列が与えられたとき、プローブiの蛍光強度を予測するためのモデルを説明する。ここでは、クロスハイブリダイゼーションの影響によるランダムプローブ13の蛍光強度のモデルを考え、ランダムプローブ13の塩基配列に対応する塩基配列を持つターゲットはサンプル溶液中に含まれないものとする。
A model for predicting the fluorescence intensity of the probe i when the base sequence of the probe i (i-th probe) is given will be described. Here, a model of the fluorescence intensity of the
本実施形態では、プローブの取り得る状態として、図2に示すように、溶液中でフリーな状態Pfr i(図2の(a))、クロスハイブリダイゼーションによってバックグラウンドターゲット(非特異的なターゲット)と非特異的に結合した状態PTns i(図2の(c))、及び自己ハイブリダイゼーションによって折り畳まれた二次構造をとっている状態Pfo i(図2の(b))の三つの状態を考える。そして、モデルにおいて以下の3つの平衡を考える。 In this embodiment, as shown in FIG. 2, the probe can be in a free state P fr i (FIG. 2 (a)), a background target (non-specific target) by cross-hybridization. ) In a non-specifically bound state PT ns i (FIG. 2 (c)) and a state P fo i (FIG. 2 (b)) in a secondary structure folded by self-hybridization. Think about two states. Then, consider the following three equilibria in the model.
−プローブの自己ハイブリダイゼーションによる直鎖/折り畳み状態の間の平衡(式(1)参照)
−プローブとターゲットとのクロスハイブリダイゼーションによる一本鎖/二本鎖の間の平衡(式(2)参照)。
-Equilibrium between single strands / double strands by cross-hybridization between probe and target (see equation (2)).
上式の関係から次式が得られる。
平衡定数Kpf i、Kns iは、それぞれの反応の自由エネルギーΔGが与えられれば、次式で求められる。
マイクロアレイ10上でサンプルとプローブが相互作用する実効的な空間の体積をvとする。プローブiの総量はptvで表せる。ptvはプローブの種類によらない定数であると考える。空間vの中でのフリー状態のプローブの実効的な濃度[Pfr i]をpiとし、プローブiと非特異的に相互作用するターゲット全体の実効的な濃度[Tns]をtnsとおく。バックグラウンドターゲットの総量tnsvはプローブiの総量ptvより十分に多いと考えられるので、tnsは一定と見なすと、式(3)、(4)及び質量保存則より次式が得られる。
プローブの蛍光強度が、結合したターゲットの量[PTns i]vに比例すると仮定すると、式(4)、(6)から、クロスハイブリダイゼーションによるプローブiの蛍光強度は次式で得られる。
C、pt、bgは実験に依存しない定数と考えることができる。bgの値は単純に全シグナル値の最小値であたえられ、また積C・ptはターゲットが過剰に存在し、プローブが飽和している場合の最大の蛍光強度に相当する。よって、バックグラウンドターゲットの量tnsと、プローブiのKpf i、Kns iが分かれば、予想される蛍光強度Ins iを算出することができる。 C, p t , and bg can be considered as constants independent of experiments. The value of bg simply given by the minimum value of all signal values, also the product C · p t the target is present in excess, the probe corresponds to the maximum fluorescence intensity when saturated. Therefore, if the background target amount t ns and the K pf i and K ns i of the probe i are known, the expected fluorescence intensity I ns i can be calculated.
2.1.2 折り畳み状態の自由エネルギーの評価
折り畳み状態にあるプローブの量を評価するための平衡定数Kpf iを計算するため、プローブの二次構造の自由エネルギーΔGpf iを求める。先行研究により、RNAやDNAの二次構造の自由エネルギーは、与えられた塩基配列からダイナミカルプログラミングの手法を用いて予測できることが示されており(D. Mathews, J. Sabina, M. Zuker, and D. Turner. Expanded sequence dependence of thermodynamic parameters improves prediction of rna secondary structure. J. Mol. Biol., 288(5):91140, 1999.参照)、そのアルゴリズムをもとにした予測プログラムMFOLD1が公開されている。本発明ではこのプログラムを用いて各プローブのDNAの二次構造を予想し、その自由エネルギーから求めた平衡定数をプローブの二次構造の影響の評価に用いるものとする。ただし、MFOLD1で用いられるモデルは、溶液中で自由なDNA分子を対象とした実験に基づいており、マイクロアレイのプローブのような固体表面上に固定された分子とは条件が異なる、このため、本発明では、MFOLD1で求めた自由エネルギーに、重み付けの係数wpfを乗じた値を実際の評価に用いている。
評価に用いる自由エネルギーΔGpf i
=(MFOLD1で求めたプローブの二次構造の自由エネルギー)×wpf
2.1.2 Evaluation of the free energy in the folded state In order to calculate the equilibrium constant K pf i for evaluating the amount of the probe in the folded state, the free energy ΔG pf i of the secondary structure of the probe is obtained. Previous studies have shown that the free energy of RNA and DNA secondary structures can be predicted from a given base sequence using a dynamic programming technique (D. Mathews, J. Sabina, M. Zuker, and D. Turner. Expanded sequence dependence of thermodynamic parameters improves prediction of rna secondary structure. J. Mol. Biol., 288 (5): 91140, 1999.), a prediction program MFOLD1 based on that algorithm was released Yes. In the present invention, this program is used to predict the secondary structure of the DNA of each probe, and the equilibrium constant obtained from the free energy is used to evaluate the influence of the secondary structure of the probe. However, the model used in MFOLD1 is based on experiments with free DNA molecules in solution, and the conditions differ from molecules immobilized on solid surfaces such as microarray probes. In the present invention, a value obtained by multiplying the free energy obtained by MFOLD1 by a weighting coefficient w pf is used for actual evaluation.
Free energy ΔG pf i used for evaluation
= (Free energy of the secondary structure of the probe determined by MFOLD1) × w pf
2.1.3 非特異的Nearest Neighbor モデル
非特異的に結合するプローブの量を評価するための平衡定数Kns iを計算するため、プローブ/バックグラウンドターゲット間のクロスハイブリダイゼーションの結合エネルギーΔGns iを求める。
2.1.3 Nonspecific Nearest Neighbor Model In order to calculate the equilibrium constant K ns i for assessing the amount of non-specifically bound probe, the binding energy ΔG ns of the probe / background target cross-hybridization Find i .
先行研究により、プローブ/ターゲット間のハイブリダイゼーションの結合エネルギーは、プローブの塩基配列からNearest Neighbor(NN) モデルと呼ばれる計算法により予測できることが知られている(J. SantaLucia. A unified view of polymer, dumbbell, and oligonucleotide dna nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA, 95(4):14605, 1998. 参照)。本発明ではこのモデルの考え方を拡張し、プローブと不特定多数のターゲットとが部分的に結合するその総量を、それらの平均的な結合エネルギーの形で近似的に求める。 According to previous studies, it is known that the binding energy of hybridization between a probe and a target can be predicted from a probe base sequence by a calculation method called a Nearest Neighbor (NN) model (J. SantaLucia. A unified view of polymer, Dumbbell, and oligonucleotide dna nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA, 95 (4): 14605, 1998.). In the present invention, the concept of this model is expanded, and the total amount of partial binding between the probe and an unspecified number of targets is approximately obtained in the form of their average binding energy.
本実施形態ではプローブの各塩基毎の非特異的結合エネルギーεnsをその塩基及びその前後の塩基の組み合わせに依存した量として考え、その総和で全体の結合エネルギーΔGが求められるものとして計算する。プローブにおけるk番目の塩基の種類がbkで与えられているとすると、結合エネルギーΔGnsは次式で得られる。
例えば塩基配列"ATGCTTCG"が与えられた場合、そのプローブの平均的結合エネルギーは次式のように計算する。
三つの塩基組み合わせは、全ての組み合わせ64通りのうち"ATG"と"CAT"のように反転させることで同じ組み合わせと見なせる配列を同一とすると32通りとなる。これに加えて"AT"のように配列の末端が含まれる場合を別の組み合わせとして考えると、必要なパラメータεnsは48個となる。 There are 32 combinations of the three base combinations when the sequences that can be regarded as the same combination are inverted by reversing the combinations such as “ATG” and “CAT” out of all 64 combinations. In addition to this, when considering the case where the end of the sequence is included as in “AT” as another combination, the required parameter ε ns is 48.
2.2 クロスハイブリダイゼーションの影響を排除したシグナルの評価
次に、前述のクロスハイブリダイゼーションの評価モデルをもとに、実際の測定における蛍光強度からクロスハイブリダイゼーションの影響を排除したシグナル(ターゲットのハイブリダイゼーションによる蛍光強度の測定値)を求めるためのモデルを説明する。
2.2 Evaluation of Signal Excluding Cross-Hybridization Effect Next, based on the above-described cross-hybridization evaluation model, a signal (target high-frequency signal) excluding the influence of cross-hybridization from the fluorescence intensity in the actual measurement. A model for obtaining a fluorescence intensity measurement value by hybridization will be described.
2.2.1 モデル
プローブiの配列に対応するターゲットがサンプル中に含まれるとき、その蛍光強度をクロスハイブリダイゼーションの影響を含めて予測するモデルを構成する。モデルにおいて以下の4つの平衡を考える。
2.2.1 When a target corresponding to the sequence of the model probe i is included in the sample, a model that predicts the fluorescence intensity including the influence of cross-hybridization is constructed. Consider the following four equilibria in the model:
−プローブの自己ハイブリダイゼーションによる、直鎖(図2の(a))/折り畳み状態(図2の(b))の間の平衡(式(10)参照)
−ターゲットの自己ハイブリダイゼーションによる、直鎖(図2の(f))/折り畳み状態(図2の(e))の間の平衡(式(11)参照)
−プローブと目的のターゲットとの特異的ハイブリダイゼーションによる、一本鎖(図2の(a)、(f))/二本鎖(図2の(d))の間の平衡(式(12)参照)
−プローブとバックグラウンドターゲットとのクロスハイブリダイゼーションによる、一本鎖(図2の(a)、(g))/二本鎖(図2の(c))の間の平衡(式(13)参照)
-Equilibrium between linear (figure 2 (f)) / folded state (figure 2 (e)) by target self-hybridization (see equation (11))
-Equilibrium between single-stranded (Fig. 2 (a), (f)) / double-stranded (Fig. 2 (d)) by specific hybridization of the probe with the target of interest (formula (12) reference)
-Equilibrium between single strand (Fig. 2 (a), (g)) / double strand (Fig. 2 (c)) by cross-hybridization between probe and background target (see formula (13)) )
これらの状態遷移のモデルより次の関係が得られる。
2.1節と同様、マイクロアレイ10上でサンプルとプローブが相互作用する実効的な空間の体積をv、プローブiの総量をptvで表せるとし、ptvはプローブの種類によらない定数であると考える。空間vの中でのフリー状態のプローブの実効的な濃度[Pfr i]をpiとおき、プローブiと非特異的に相互作用するターゲット全体の実効的な濃度[Tns]をtnsとおく。投入したサンプル中のプローブiと特異的に相互作用するターゲットの濃度をtt iとし、溶液中でフリーなターゲットの濃度をtfr iで表すとすると、式(14)〜(17)と質量保存則より次の関係が成り立つ。
よって、バックグラウンドターゲットの量tns、計測の目的となるプローブと相補的なターゲットの量tt i、とプローブiのKpf i、Ktf i、Kns i、Ks iが分かれば、特異的ハイブリダイゼーションとクロスハイブリダイゼーションを合わせた蛍光強度Is iを予想することができる。逆に、tt i以外のパラメータの値と実際の蛍光強度Is iが与えられれば、ターゲットの量tt i、すなわち、サンプル中のターゲットの濃度を求めることができる。 Therefore, the amount t ns background target amount t t i complementary target and probe are the object of measurement, and K pf i probe i, K tf i, K ns i, if K s i are known, it is possible to expect the fluorescence intensity I s i tailored specific hybridization and cross-hybridization. Conversely, given the t t i other than the value of the parameter and the actual fluorescence intensity I s i, the amount of target t t i, i.e., it is possible to determine the concentration of target in the sample.
そこで、本発明では、予備実験を行ってtt i以外のパラメータの値を事前に決定しておき、その後、蛍光強度の実測値Is iから、決定したパラメータを用いてサンプル中のターゲットの濃度を求める。このようにして求めたターゲットの濃度はクロスハイブリダイゼーションの影響を排除して求められるため、精度のよい値となる。 Therefore, in the present invention, in advance to determine the values of the parameters other than t t i in advance by performing a preliminary experiment, then, from the measured value I s i of the fluorescence intensity of the target in the sample by using the determined parameter Determine the concentration. Since the target concentration thus determined is determined by eliminating the influence of cross hybridization, it is a highly accurate value.
2.2.2 折り畳みの自由エネルギーの評価
平衡定数Ktf i、を計算するため、ターゲットの二次構造の自由エネルギーΔGtf iを求める。ターゲットとなるDNA分子は配列がプローブと相補的であるため、その二次構造は基本的にプローブの二次構造の取り方とほぼ同じとなることが予想される。ただし、実際のターゲットは長さが様々に異なる塩基配列の断片である点、溶液中で自由に運動できる点、などの条件がプローブとは異なる。そのため推定の元となるデータとしては前節と同じくプローブの配列からMFOLD1を用いて計算した二次構造の自由エネルギーの値を用いるが、重み付けの係数をwpfの代わりにwtfとしたものをターゲットの二次構造の自由エネルギーとする。
評価に用いる自由エネルギーΔGtf i
=(MFOLD1で求めたターゲットの二次構造の自由エネルギー)×wtf
Evaluation equilibrium constant 2.2.2 folding free energy K tf i, to calculate the obtained free energy .DELTA.G tf i of the secondary structure of the target. Since the target DNA molecule is complementary in sequence to the probe, its secondary structure is expected to be essentially the same as the secondary structure of the probe. However, the actual target is different from the probe in that the target is a fragment of a base sequence with different lengths and that it can move freely in solution. Therefore, as the data for estimation, the free energy value of the secondary structure calculated using MFOLD1 from the probe array is used as in the previous section, but the weighting coefficient is set to w tf instead of w pf as the target. The free energy of the secondary structure of
Free energy ΔG tf i used for evaluation
= (Free energy of secondary structure of target obtained by MFOLD1) × w tf
2.2.3 Nearest Neighbor モデル
非特異的結合の場合と同様、特異的結合によるハイブリダイゼーションの自由エネルギーは配列の組み合わせから近似的に求められるものと考える。前節でのεnsとは別にもう1組、48個のパラメータεsを用意し、前節と同じように各塩基対からの寄与の総和として計算する。
2.3 パラメータの決定手法
以上のモデルにおけるパラメータのうちtnsを除いたwpf、wtf、εs及びεnsの値は実験に依存しない定数と考えられる。このため、予備実験として以下の実験1、2を行うことによりこれらのパラメータの値を事前に決定する。以下パラメータの決定手法について説明する。
2.3 Parameter Determination Method Of the parameters in the above model, the values of w pf , w tf , ε s and ε ns excluding t ns are considered to be constants independent of experiments. For this reason, the values of these parameters are determined in advance by performing the following
<実験1>
最初に、マイクロアレイ10を用いて目的の細胞のゲノムを断片化したサンプルのみをハイブリダイゼーションさせ、その結果得られるランダムプローブ13の蛍光強度に基づき、クロスハイブリダイゼーションのモデルにおけるパラメータ(wpf、εns)を決定する。
<
First, only a sample obtained by fragmenting the genome of a target cell using the
実験に用いるマイクロアレイ10に含まれるランダムプローブ13の本数をNrとする。ランダムプローブ13を含むマイクロアレイ10を用いて目的となる細胞のサンプルを測定し、その測定で得られたランダムプローブ13の蛍光強度をIr i (1 ≦ i ≦ Nr)とする。このIr iと、モデルによる予想値Ins i(式(7)参照)との誤差Rrを考える。なお、モデルによる予想値Ins iは式(7)で得られるが、式(7)において比例定数Cには仮の値を設定する。
そして、誤差Rrが最小となるような、tns、wpf、及び48個のεnsの値をニュートン法、準ニュートン法、Nelder-Mead法等の数値的最適化の手法を用いて決定する。具体的には以下のプロセスを行う。
(1)tns、wpf及びεnsに適当な初期値を与え、Rrを計算する。
(2)そして、Rrが減少するようにそれぞれのパラメータの値を変更する。
(3)再びRrを計算する。
パラメータを変更しながら、誤差Rrが0に近い所定値以下になるまで(2)、(3)のプロセスをくり返し、最終的に収束した値を各パラメータの値とする。
Then, t ns , w pf , and 48 values of ε ns that minimize the error R r are determined using numerical optimization techniques such as Newton's method, quasi-Newton's method, and Nelder-Mead's method. To do. Specifically, the following process is performed.
(1) Appropriate initial values are given to t ns , w pf and ε ns , and R r is calculated.
(2) Then, the value of each parameter is changed so that R r decreases.
(3) Calculate R r again.
While changing the parameters, the processes (2) and (3) are repeated until the error R r becomes equal to or less than a predetermined value close to 0, and finally converged values are used as the values of the respective parameters.
以上により、パラメータwpf、及びεnsが求まる。 Thus, the parameters w pf and ε ns are obtained.
<実験2>
次に、マイクロアレイに目的の細胞のゲノムを断片化したサンプルと、コントロールプローブ15に対する濃度の確定したDNA(以下「コントロール用サンプル」という。)とを混合した溶液をハイブリダイゼーションさせ、パラメータwtfとεsの値を最適化する。
<
Next, a solution in which a sample obtained by fragmenting the genome of a target cell in a microarray and a DNA whose concentration with respect to the
(1)まず、実験2の結果得られるランダムプローブ13の蛍光強度の実測値に基づきバックグランドターゲットの濃度を見積る。具体的には、実験1で求めたパラメータwpf、及びεnsをもとに各プローブのKpf i、Kns iを計算し、さらに、式(25)から求まるRrが最小になるように、tnsの値を数値的最適化によって求める。このようにして求めたtnsの値をバックグラウンドダーゲットの実効的な総量とする。
(1) First, the concentration of the background target is estimated based on the measured value of the fluorescence intensity of the
(2)細胞のゲノムを断片化したものの濃度を測定しているため、すべての測定プローブに対応するターゲットの濃度tt iは一定であると仮定することができる。実験1及び実験2の(1)で求めたパラメータの値を用いて最適なtt i、wtf、εsの値を求める。具体的には、次式(26)を用いて、蛍光強度の実測値Iiと予想値Is iとの誤差Rsが最小となるようにtt i、wtf、εsの値を最適化する。なお、予想値Is iは式(23)により与えられる。
以上により、バックグラウンドダーゲットの量tns、並びにパラメータwtf、及びεsが求まる。 As described above, the amount t ns of the background target and the parameters w tf and ε s are obtained.
(3)最後に、最適化により求めたパラメータwtf、εsと、コントロールプローブ15の蛍光強度の測定値とから、コントロール用サンプルの濃度を計算する。計算した濃度と、実際に投入したコントロール用サンプルの濃度とが等しくなるように、スケーリングの比例定数Cの値を決定する。
(3) Finally, the concentration of the control sample is calculated from the parameters w tf and ε s obtained by optimization and the measured fluorescence intensity of the
2.4 ターゲット濃度の評価
以上のようにしてパラメータを決定した後、実際にマイクロアレイの蛍光強度を測定し、その実測値Im iから上記パラメータを用いて、解析対象とするターゲットの量tt iすなわちサンプル中のターゲットの濃度を求める。具体的には以下のとおりである。
2.4 Evaluation of Target Concentration After the parameters are determined as described above, the fluorescence intensity of the microarray is actually measured, and the target amount t t to be analyzed using the above parameters from the actually measured value I m i. i, ie, the concentration of the target in the sample. Specifically, it is as follows.
(1)既に求めたパラメータwpf、εns等に基づき各プローブの結合エネルギーΔGpf i、ΔGns i、ΔGtf i、ΔGs iを計算する。それらの結合エネルギーから平衡定数Kpf i、Kns i、Ktf i、Ks iを求める。 (1) already determined parameters w pf, binding energy .DELTA.G pf i of each probe based on the epsilon ns like, ΔG ns i, ΔG tf i , computes the .DELTA.G s i. Equilibrium constants K pf i , K ns i , K tf i , and K s i are obtained from their binding energies.
(2)サンプル中に対応する配列を持たないランダムプローブ13の蛍光強度の測定値から、式(7)を用いて、バックグラウンドとして非特異的に各プローブに結合してくるバックグラウンドターゲットの量tnsを求める。
(2) The amount of the background target that binds to each probe nonspecifically as a background from the measured value of the fluorescence intensity of the
(3)各計測プローブ11の蛍光強度の測定値Im iから、バックグラウンドターゲットの量tnsと上記で算出した各値とを用いて、ターゲットの濃度tt iの値を求める。具体的には、式(26)において、各計測プローブ11の蛍光強度の測定値Im iと、目的のターゲットによる蛍光強度の理論値Is iとの差が最小となるように、ターゲットの濃度tt iの値を数値解析的に求める。目的のターゲットによる蛍光強度の理論値Is iは、バックグラウンドのターゲット量tns、ステップS32で求めた平衡定数、及びその他の既知の値(比例定数C等)とを用いて式(20)〜(23)から算出する。
(3) From the measured value I m i of the fluorescence intensity of each
このようにして求めたターゲットの濃度tt iの値は、計測プローブ11のシグナルIm iから、バックグラウンドターゲットの影響(NSi)すなわちノイズ成分を排除したものとなり、目的のターゲットと計測プローブ11の特異的な結合のみに依存する精度のよい値となる。
The target concentration t t i obtained in this way is obtained by eliminating the influence (NS i ) of the background target, that is, the noise component, from the signal I m i of the
3.マイクロアレイ解析システム
3.1 システム構成
上記のマイクロアレイ解析方法を適用したマイクロアレイ解析システムについて説明する。図1に本発明のマイクロアレイ解析システムの構成例を示す。マイクロアレイ解析システム100は、マイクロアレイ10の各プローブの蛍光状態を読み取り、その画像情報を電気信号(シグナル)として出力するスキャナ20と、スキャナ20からの画像情報を処理する解析装置50とを含む。
3. Microarray analysis system
3.1 System Configuration A microarray analysis system to which the above microarray analysis method is applied will be described. FIG. 1 shows a configuration example of the microarray analysis system of the present invention. The
解析装置50は、測定データや解析結果等を画面に表示する表示部51と、所定のデータを格納するデータ格納部53と、制御プログラムにしたがい解析処理を実行するプロセッサ55と、使用者が解析装置の操作を行うための操作部57と、スキャナ20から画像情報を入力するスキャナインタフェース58と、外部機器等とデータのやりとりを行う外部インタフェース59とを含む。
The analysis device 50 includes a
表示部51は液晶表示装置(LCD)等で構成され、入力データや解析結果の表示が可能である。プロセッサ55は例えばMPUやCPUであり、所定のプログラムを実行することで解析装置50全体の動作を制御する。操作部57は、操作ボタン、スイッチ、キーボート、マウス等で構成され、使用者は操作部57を介して解析装置50の操作を行う。外部インタフェース59は、解析装置と、ネットワークやプリンタ等の外部機器との間でデータの送受信を可能とするインタフェースである。解析装置50は例えばパーソナルコンピュータで構成される。スキャナ20と解析装置50は一体化されて構成されてもよい。
The
データ格納部53はハードディスク、フラッシュメモリ等の半導体記憶装置、CD、DVD等の記録媒体で構成され、測定データ、解析結果、制御プログラム等、解析装置50の処理に必要なデータを格納する。また、データ格納部53は、モデル情報として前述の解析に使用するモデルに関する数式の情報やパラメータを格納する。
The
3.2 処理フロー
マイクロアレイ解析システム100の具体的な動作について説明する。
3.2 Processing Flow A specific operation of the
3.2.1 パラメータ決定処理
図4のフローチャートを参照し、マイクロアレイ解析システム100のパラメータ決定処理を説明する。
3.2.1 Parameter Determination Processing Parameter determination processing of the
まず、目的の細胞のゲノムを断片化したサンプルのみを、マイクロアレイ10のプローブとハイブリダイゼーションさせる(実験1)。 First, only the sample obtained by fragmenting the genome of the target cell is hybridized with the probe of the microarray 10 (Experiment 1).
スキャナ20によりその実験1によるランダムプローブ13の蛍光強度が読み込まれる。プロセッサ50は、蛍光強度の測定値を電気信号としてスキャナ20から入力する(S11)。入力した蛍光強度の測定値はデータ格納部53に格納される。
The fluorescence intensity of the
プロセッサ50は、入力したランダムプローブ13の蛍光強度の測定値に基づき、式(25)を用いた数値的最適化の手法によりパラメータ(wpf、εns)を決定する(S12)。 The processor 50 determines parameters (w pf , ε ns ) by a numerical optimization technique using the equation (25) based on the input measurement value of the fluorescence intensity of the random probe 13 (S12).
次に、目的の細胞のゲノムを断片化したサンプルと、コントロールプローブ15に対する、濃度の確定したDNA(コントロール用サンプル)とを混合した溶液を、マイクロアレイ10のプローブとハイブリダイゼーションさせる(実験2)。
Next, a solution in which a sample obtained by fragmenting the genome of a target cell and a DNA (control sample) whose concentration is determined with respect to the
プロセッサ55はその実験2による蛍光強度の測定値をスキャナ20から入力し(S13)、入力したランダムプローブ13の蛍光強度の測定値と既に求めたパラメータに基づき、式(25)を用いてバックグラウンドターゲットの濃度tnsを求める(S14)。
The
プロセッサ55は、測定した計測プローブ11の蛍光強度と既に求めたパラメータに基づき、式(25)を用いてパラメータ(wtf、εs)を決定する(S15)。最後に、コントロールプローブ15の蛍光強度の測定値と、コントロール用サンプルの濃度の測定値と理論値とに基づき比例定数Cを決定する(S16)。以上のようにしてモデルに使用する各パラメータが決定され、データ格納部53に格納される。
The
3.2.2 濃度解析処理
図5のフローチャートを参照し、マイクロアレイ解析システム100の濃度解析処理を説明する。
3.2.2 Concentration Analysis Processing The concentration analysis processing of the
目的の細胞のゲノムを断片化したサンプルをマイクロアレイ10のプローブとハイブリダイゼーションさせる。
A sample obtained by fragmenting the genome of a target cell is hybridized with a probe of the
プロセッサ55は、そのハイブリダイゼーションによるプローブの蛍光強度の測定値をスキャナ20から入力する(S31)。プロセッサ55は、データ格納部53に格納されたパラメータ(wpf、εns等)に基づき各プローブの結合エネルギーΔGpf i、ΔGns i、ΔGtf i、ΔGs iを計算する(S32)。このとき、それらの結合エネルギーから平衡定数Kpf i、Kns i、Ktf i、Ks iを求め、データ格納部53に格納しておく。
The
続いて、プロセッサ55は、式(7)を用いて、サンプル中に対応する配列を持たないランダムプローブ13の蛍光強度の測定値Ir iから、バックグラウンドとして非特異的に各プローブに結合してくるバックグラウンドターゲットの量tnsを求める(S33)。
Subsequently, the
プロセッサ55は、各計測プローブ11の蛍光強度の測定値Im iと、上記で算出した各値とに基づきターゲットの濃度tt iの値を求める。(S34)。具体的には、式(26)において、各計測プローブ11の蛍光強度の測定値Im iと、目的のターゲットによる蛍光強度の理論値Is iとの差が最小となるように、ターゲットの濃度tt iの値を数値解析的に求める。目的のターゲットによる蛍光強度の理論値Is iは、バックグラウンドのターゲット量tns、ステップS32で求めた平衡定数及びその他の既知の値(比例定数C等)とを用いて式(20)〜(23)から算出する。
The
求められたターゲットの濃度は表示部51上に表示されたり、外部インタフェース59を介してデータとして出力されたりすることができる。
The obtained target concentration can be displayed on the
以下、本発明のマイクロアレイ解析方法を用いた具体的な実施例を説明する。 Specific examples using the microarray analysis method of the present invention will be described below.
4.1 マイクロアレイの設計
本実施例では、大腸菌(Escherichia coli)のゲノムをもとに設計されたカスタムアレイを用いた。このマイクロアレイには大きく分けて次の2種類のプローブが載せられている。
1)大腸菌の遺伝子(glnA, 1410bp)を14merステップでカバーした計測プローブ
2)人工的に合成した塩基配列をもとにしたランダムプローブ
4.1 Design of Microarray In this example, a custom array designed based on the genome of Escherichia coli was used. This microarray is roughly divided into the following two types of probes.
1) Measurement probe covering E. coli gene (glnA, 1410bp) with 14mer step 2) Random probe based on artificially synthesized base sequence
4.2 ランダムプローブの作成
このマイクロアレイに用いたランダムプローブの設計の手順を説明する。
1)A、T、G、Cのそれぞれのアルファベットが確率1/4で現れるような長さ25の文字列を1000種類、乱数を用いて生成する。
4.2 Creation of Random Probe The procedure for designing the random probe used in this microarray will be described.
1) Generate a character string of length 25 such that each alphabet of A, T, G, and C appears with a probability of ¼ using random numbers.
2)先行研究(J. SantaLucia. A unified view of polymer, dumbbell, and oligonucleotide dna nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA, 95(4):14605, 1998. 参照)のNearest Neighborモデルを用いて、各配列のハイブリダイゼーションの自由エネルギーを計算する。 2) Nearest Neighbor model of previous research (see J. SantaLucia. A unified view of polymer, dumbbell, and oligonucleotide dna nearest-neighbor thermodynamics. Proc. Natl. Acad. Sci. USA, 95 (4): 14605, 1998.) Is used to calculate the free energy of hybridization of each sequence.
3)1)で生成した配列の中から、2)で計算した自由エネルギーが、-28±0.5 kcal/mol, -32±0.5 kcal/mol, -36±0.5 kcal/molの三つの範囲に含まれるものをそれぞれ50本ずつ、計150本選び出す。もし、1つの範囲において、選び出した配列が50本に満たなければ、1)に戻って配列を追加する。 3) From the sequence generated in 1), the free energy calculated in 2) is included in the three ranges of -28 ± 0.5 kcal / mol, -32 ± 0.5 kcal / mol, -36 ± 0.5 kcal / mol. Select 50 items each, 150 in total. If there are less than 50 selected arrays in one range, go back to 1) and add the arrays.
4)3)で得られた150本の配列をもとに、文字を左端から1文字削除したもの、2文字削除したもの・・・のように、11文字目まで削除した長さ14の配列まで、もとの配列と合わせて合計1800本の配列を生成する。 4) Based on the array of 150 obtained in 3), an array with a length of 14 that has been deleted up to the 11th character, such as a character deleted from the left end, a character deleted from the left, etc. Up to 1800 sequences are generated together with the original sequence.
5)4)で作成した1800本の配列それぞれに対して、3’末端から5’までの各塩基に一塩基ずつ置換した、ミスマッチ配列を合成し、計110700本のプローブとする。 5) For each of the 1800 sequences prepared in 4), a mismatch sequence is synthesized by substituting one base at each base from the 3 'end to 5' to obtain a total of 110700 probes.
また、この実験では3)で生成した150本の各配列に相補的な25merのオリゴヌクレオチドを合成し、コントロールプローブ15として利用できるようにした。
In this experiment, a 25-mer oligonucleotide complementary to each of the 150 sequences generated in 3) was synthesized and used as the
資料の調整、ハイブリダイゼーション、洗浄、スキャンの各過程はAffymetrix社のExpression Analysis Technical Manualに従った。ハイブリダイゼーションにはAffymetrix Hybridization Oven 640を用い、45Cで16時間、60rpmの条件で行った。洗浄にはAffymetrix Fluidics Station 450を用い、ProkGE_WS2_450スクリプトを用いた。マイクロアレイのスキャンにはAffymetrix GeneChip Scanner 3000 を用いて計測し、Microarray Suite 5.0 によってシグナル強度の値を求めた。 The document adjustment, hybridization, washing, and scanning processes followed Affymetrix's Expression Analysis Technical Manual. Hybridization was performed using Affymetrix Hybridization Oven 640 at 45C for 16 hours at 60 rpm. Affymetrix Fluidics Station 450 was used for cleaning, and ProkGE_WS2_450 script was used. The microarray scan was measured using an Affymetrix GeneChip Scanner 3000, and the signal intensity value was obtained using Microarray Suite 5.0.
データの解析には統計計算言語R(R. Ihaka and R. Gentleman. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5:299314, 1996 参照)を用い、オリジナルのスクリプトを作成して計算を行った。解析では特に断らない限り、各実験の蛍光強度は対数(log10)で扱うものとする。 For the analysis of data, use the statistical calculation language R (see R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5: 299314, 1996) and create an original script. And calculated. Unless otherwise specified in the analysis, the fluorescence intensity of each experiment is handled in logarithm (log 10).
4.3 実験
実験1:大腸菌の総ゲノムDNAを抽出、断片化したものを計測した。
実験2:大腸菌の総ゲノムDNAに、コントロール用サンプルとしてオリゴヌクレオチドを加えたサンプルを計測した。オリゴヌクレオチドの最終濃度が1.4fMから1.4nMまで10倍ずつ7段階に異なるサンプルを用意し、それぞれで2回ずつ、合計で14回の計測を行った。
4.3 Experimental Experiment 1: Extracted and fragmented total genomic DNA of E. coli was measured.
Experiment 2: A sample obtained by adding an oligonucleotide as a control sample to total genomic DNA of E. coli was measured. Different samples were prepared in 7 stages from the final oligonucleotide concentration of 1.4 fM to 1.4 nM in 10 stages, and measurement was performed 14 times in total, twice each.
4.4 パラメータの決定
まず、ゲノムのみを計測した実験1により、クロスハイブリダイゼーションに関するパラメータを決定した。オリゴヌクレオチドは加えられていないため、ランダムプローブ13のシグナルは全てクロスハイブリダイゼーションによるものと見なすことができる。測定に使用したデータ点数は110,700である。すなわち、110,700個のランダムプローブ13を用いた。
4.4 Determination of parameters First, parameters related to cross-hybridization were determined by
Rの最適化関数を用いたフィッティングにより、バックグラウンドターゲット量tns、パラメータwpf及び48個のεnsの値を決定した。最適化されたモデルによる予測値と実測値との散布図を図6に示す。このときの予測値の誤差Rnsは0.044であり、高い精度でクロスハイブリダイゼーションの量を予想できていると言える。 A background target amount t ns , a parameter w pf, and 48 values of ε ns were determined by fitting using an R optimization function. FIG. 6 shows a scatter diagram of predicted values and measured values based on the optimized model. The error R ns of the predicted value at this time is 0.044, and it can be said that the amount of cross hybridization can be predicted with high accuracy.
4.5 フィッティングの収束
パラメータ決定時のフィッティングに用いるデータ点数を変化させ、定量的なモデルを構築するために最低限必要なランダムプローブ13の本数を見積もった。ランダムプローブ13の中から乱数によって、50、100、200、400、800、1600、3200本のプローブをサンプリングする。それぞれのサンプルデータをもとにモデルのパラメータを決定し、そのパラメータを用いて残りの全ランダムプローブの蛍光強度を予測した場合の予測誤差を求める。図7に、予測誤差を、使用した本数に対してプロットした結果を示す。サンプルの取り方を変えた2回の検証の結果を重ねて表示してある。サンプルデータが少なすぎる場合はオーバーフィッティングにより予測誤差が大きくなっているが、十分に多くのサンプルがあれば誤差は収束していることが分かる。実験のばらつき等も考慮に入れると、定量的な解析のためには、およそ1000本以上のプローブを使用することが好ましい。
4.5 The number of data points used for fitting at the time of determining the fitting convergence parameter was changed, and the minimum number of
4.6 コントロールプローブによる検量
次に実験2のデータを用いて、コントロールプローブ15のシグナル値から本発明の方法を用いて元の濃度を計算し、サンプルに加えたオリゴヌクレオチドの実際の濃度との比較を行う。前節で求めたパラメータをもとに、オリゴヌクレオチドの濃度の異なる7組の実験それぞれに対して独立に濃度の値を求めた。計算には長さ25merのプローブ150本を用いた。実際の遺伝子発現の解析では同一の遺伝子の異なる箇所に複数のプローブがマッチするように設計されていることが通常であるので、便宜上150本のプローブを、5本ずつ30組のプローブセットとして扱う。
4.6 Calibration by Control Probe Next, using the data of
各セットに含まれる5本のプローブは同じ量のターゲットに対応すると仮定し、その共通のターゲットの濃度tt iを求める。必要なパラメータは既に求められているので、式(26)で示した誤差が最小となるようにtt iを最適化して求める。それぞれのセットに対し7段階の投入量に対して計算されたモデルからの推定濃度を独立に計算した。その推定量と、実際の投入量との関係を比較した結果が図8に示す。 Five probes in each set is assumed to correspond to the same amount of the target, determine the concentration t t i of the common target. Since the necessary parameters have already been obtained, t t i is obtained by optimizing so that the error shown in equation (26) is minimized. Estimated concentrations from the model calculated for 7 inputs for each set were calculated independently. The result of comparing the relationship between the estimated amount and the actual input amount is shown in FIG.
図8(a)に、既存の手法としてAffymetrix社のアルゴリズムをもとにした解析結果を示す。計算には上記の150本のプローブ、及び対応するミスマッチプローブのデータを用い、プローブセットとしては上記の5本ずつのセットを用いている。既存の手法ではデータのばらつきが大きく、低濃度側では特に分散が広くなっている。またAffymetrix 社のアルゴリズムではPMプローブよりMMプローブのシグナルが大きいデータは除かれるため、クロスハイブリダイゼーションの影響が大きいと、プローブセットのデータの信頼性が落ちる。 FIG. 8A shows an analysis result based on the Affymetrix algorithm as an existing method. For the calculation, the above 150 probes and the corresponding mismatch probe data are used, and the above 5 sets are used as the probe set. In the existing method, the variation in data is large, and the dispersion is particularly wide on the low concentration side. In addition, the Affymetrix algorithm excludes data with a larger MM probe signal than the PM probe. Therefore, if the influence of cross-hybridization is large, the reliability of the probe set data decreases.
特に最も濃度が低いところでは、除かれる点がプローブの半数近くにのぼっている。一方、図8(b)に示すように、本発明では低濃度側から高濃度側まで、プロットした点がほぼ直線上に位置すると言え、投入量と推定量の間に高い一致をみせている(相関係数0.989)。また、プローブセット間での分散も少ないので信頼性が高いと言える。より少ないプローブの本数でより精度の高い測定が可能なため、この手法を用いて発現解析の解像度を上げることが可能になる。 In particular, at the lowest concentration, nearly half of the probes are excluded. On the other hand, as shown in FIG. 8 (b), in the present invention, it can be said that the plotted points are located almost on a straight line from the low concentration side to the high concentration side, and shows high agreement between the input amount and the estimated amount. (Correlation coefficient 0.989). Further, it can be said that the reliability is high because there is little dispersion between the probe sets. Since more accurate measurement is possible with a smaller number of probes, it is possible to increase the resolution of expression analysis using this method.
5.まとめ
本発明によれば、解析対象のターゲットと非特異的に結合するランダムプローブの蛍光強度からクロスハイブリダイゼーションを生じるターゲット(バックグラウンドターゲット)の量を算出し、算出したバックグラウンドターゲット量と、各プローブの結合エネルギーとに基づいて、バックグラウンドターゲットによる蛍光強度に対する影響を評価し、この影響を排除した形で目的のターゲットの濃度を求める。このようにバックグラウンドターゲットによる影響を排除できることから、真のターゲット濃度を精度よく求めることができる。特に、従来クロスハイブリダイゼーションによるノイズに埋もれて測定不能であった低い濃度のターゲットに対して、適切に評価することが可能になる。
5. Summary According to the present invention, the amount of a target (background target) that causes cross-hybridization is calculated from the fluorescence intensity of a random probe that binds nonspecifically to the target to be analyzed, Based on the binding energy of the probe, the influence of the background target on the fluorescence intensity is evaluated, and the concentration of the target target is obtained in a form that eliminates this influence. Since the influence of the background target can be eliminated in this way, the true target concentration can be obtained with high accuracy. In particular, it is possible to appropriately evaluate a low concentration target that has been buried in noise due to cross hybridization and cannot be measured.
なお、上記モデルにおいて、プローブ及びターゲットの取り得る状態として他の状態を考慮してもよい。例えば、プローブ同士が結合した状態や、解析対象のターゲットとバックグラウンドターゲットとが結合した状態を考慮してもよい。 In the above model, other states may be considered as possible states of the probe and the target. For example, a state in which probes are combined or a state in which a target to be analyzed and a background target are combined may be considered.
また、上記モデルにおいて、特異的、及び、非特異的結合エネルギーを求めるために48個のパラメータを用いたNearest Neighborモデルを用いたが、このモデルには他のパラメータを考慮する、あるいは一部のパラメータを無視するなどしてもよい。たとえば、塩基の位置に依存した効果を加える、反転させた配列を同じものと見なさない、4塩基以上の組み合わせを考慮するなどの方法が考えられる。 In the above model, the Nearest Neighbor model using 48 parameters was used to obtain specific and nonspecific binding energies. The parameter may be ignored. For example, a method of adding an effect depending on the position of the base, or considering a combination of four or more bases in which the inverted sequences are not regarded as the same can be considered.
また、上記モデルにおいて、折りたたみの自由エネルギーを求めるためにMFOLDによる計算値を用いたが、この計算には他の方法を用いても良い。 In the above model, the calculated value by MFOLD is used to obtain the free energy of folding, but other methods may be used for this calculation.
本実施形態では、ランダムプローブの設計に乱数を用いて人工的に作成した配列を用いたが、このランダムプローブには計測の対象となる細胞のゲノムに含まれなければ、異なる生物のゲノムに含まれる配列を用いてもよい。 In this embodiment, an artificially generated sequence using random numbers was used for the design of a random probe, but this random probe is included in the genome of a different organism if it is not included in the genome of the cell to be measured. May be used.
本実施形態では、細胞のゲノムをサンプルとしてハイブリダイゼーションさせたが、細胞から抽出したRNAを逆転写し、クローンDNAとしたもの、あるいはそこからさらにRNAを転写させることで増幅したものをサンプルとしてハイブリダイゼーションさせて測定することにより、もともとのRNAの細胞内の濃度、すなわち各遺伝子の発現量を解析することが可能である。 In this embodiment, hybridization was performed using the cell genome as a sample, but hybridization was performed using a sample obtained by reverse transcription of RNA extracted from the cell to obtain cloned DNA, or amplification by further RNA transcription therefrom. Thus, it is possible to analyze the intracellular concentration of the original RNA, that is, the expression level of each gene.
また、本発明は、GeneChip型アレイに限らず、オリゴヌクレオチドプローブと、ターゲットのRNA/DNAとの間のハイブリダイゼーションに基づいた計測システム一般に応用可能である。 The present invention is not limited to GeneChip type arrays, and can be applied to general measurement systems based on hybridization between oligonucleotide probes and target RNA / DNA.
本発明はマイクロアレイを用いた遺伝子発現の解析精度を向上でき、測定データの信頼性を上げることが可能である。
その効果として、
1)より少ないプローブ数のセットを用いて信頼できるデータを得られる。
2)低い濃度のターゲットもより正確に測定できるため、発現量の低い遺伝子の定量的な解析に有用である。
などのメリットがある。
The present invention can improve the analysis accuracy of gene expression using a microarray, and can increase the reliability of measurement data.
As an effect,
1) Reliable data can be obtained using a set of fewer probes.
2) Since a target with a low concentration can be measured more accurately, it is useful for quantitative analysis of a gene with a low expression level.
There are merits such as.
プローブセットに必要なプローブ数を少なくすることは、ひとつのマイクロアレイで解析できる遺伝子の種類を増やせるため、解析効率の向上が期待できる。また、少数のプローブから定量的に発現量を測定可能であることから、siRNA,miRNAなどの短いノンコーディングRNAの働きを解明するためにも有効であると言え、RNA干渉を利用した遺伝子操作、遺伝子治療への応用が考えられる。また、発現量の低い遺伝子の振る舞いを詳しく調べることが可能になるということは遺伝子制御のネットワークにおける転写因子の働きを解明するために大きな意味を持つ。たとえば、製薬産業ではゲノム創薬に多大な注目が寄せられており、中でも毒物または薬剤の作用機序を遺伝子発現レベルで網羅的に解析するトキシコゲノミクスの発展は非常に重要であるといえる。転写因子の発現解析およびそれに付随するゲノムネットワーク解析のためのツールとしてマイクロアレイによる解析が有望視されている。しかし、現状では転写因子など発現量の低い遺伝子群の解析を正確に行うことが困難であるため、データの質の低さにより様々な制約を受けている。本発明の解析手法を用いることにより詳細な発現解析がなされれば、トキシコゲノミクスの発展およびそれに付随するゲノム創薬産業の隆盛に大いに貢献できると考えられる。 By reducing the number of probes required for the probe set, the number of types of genes that can be analyzed with one microarray can be increased, so that improvement in analysis efficiency can be expected. In addition, since the expression level can be measured quantitatively from a small number of probes, it can be said that it is also effective for elucidating the action of short non-coding RNAs such as siRNA and miRNA. Application to gene therapy can be considered. In addition, being able to examine the behavior of genes with low expression levels in detail has great implications for elucidating the role of transcription factors in gene regulatory networks. For example, in the pharmaceutical industry, much attention has been paid to genomic drug discovery. In particular, it can be said that the development of toxicogenomics that comprehensively analyzes the mechanism of action of toxins or drugs at the gene expression level is very important. Microarray analysis is promising as a tool for analysis of transcription factor expression and accompanying genome network analysis. However, at present, it is difficult to accurately analyze a gene group having a low expression level such as a transcription factor, and therefore, there are various restrictions due to the low quality of data. If a detailed expression analysis is performed by using the analysis method of the present invention, it is considered that it can greatly contribute to the development of toxicogenomics and the accompanying prosperity of the genome drug discovery industry.
10 マイクロアレイ
11 計測プローブ
13 ランダムプローブ
15 ターゲットプローブ
20 スキャナ
50 解析装置
51 表示部
53 データ格納部
55 プロセッサ
57 操作部
58 スキャナインタフェース
59 外部インタフェース
DESCRIPTION OF
Claims (13)
a)前記マイクロアレイは、解析対象とするターゲットの塩基配列に対応した塩基配列を有する複数の計測プローブと、解析対象とするターゲットの塩基配列に対応しない塩基配列を有する複数のランダムプローブとを含み、
b)前記マイクロアレイの解析方法は、
ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせるステップと、
各プローブの蛍光強度を測定するステップと、
前記ランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求めるステップと、
前記バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、前記計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測するステップと、
前記計測プローブの蛍光強度の測定値(Im i)から前記クロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求めるステップとを含む
ことを特徴とするマイクロアレイの解析方法。 A microarray analysis method for obtaining a concentration of a target contained in a sample solution using a microarray in which a plurality of probes are arranged,
a) The microarray includes a plurality of measurement probes having a base sequence corresponding to the base sequence of the target to be analyzed, and a plurality of random probes having a base sequence not corresponding to the base sequence of the target to be analyzed,
b) The microarray analysis method is as follows:
Hybridizing a solution containing the target and each probe of the microarray;
Measuring the fluorescence intensity of each probe;
Determining the amount (t ns ) of a background target that is a target non-specifically bound to the probe from the measurement value of the fluorescence intensity of the random probe;
Predicting the degree of influence of cross hybridization (NS i ) on the measured fluorescence intensity of the measurement probe based on the amount of the background target and the binding energy of each probe;
And excluding the influence of the cross hybridization from the measured value (I m i ) of the fluorescence intensity of the measurement probe to obtain the target amount (t t i ) to be analyzed. Microarray analysis method.
前記モデルにおけるプローブの状態には、プローブが溶液中でフリーである状態、プローブとバックグラウンドターゲットとが非特異的に結合した状態、及びプローブが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態が含まれる、
ことを特徴とする請求項1記載のマイクロアレイの解析方法。 Define a model that shows the equilibrium between possible states of the probe, and use the model to determine the amount of the background target (t ns ),
The state of the probe in the model includes a state in which the probe is free in a solution, a state in which the probe and the background target are nonspecifically bound, and a probe that is folded by self-hybridization to have a secondary structure. State included,
The microarray analysis method according to claim 1, wherein:
前記ハイブリダイゼーションによるランダムプローブの蛍光強度を測定するステップと、
その測定値に基づき、前記モデルの平衡定数を求めるためのパラメータ(wpf、εns)を決定するステップと
をさらに含むことを特徴とする請求項2記載のマイクロアレイの解析方法。 Hybridizing only a sample fragmented from the genome to be analyzed with probes on the microarray;
Measuring the fluorescence intensity of the random probe by the hybridization;
The method for analyzing a microarray according to claim 2, further comprising a step of determining parameters (w pf , ε ns ) for obtaining an equilibrium constant of the model based on the measured value.
前記プローブの状態には、プローブが溶液中でフリーである状態、プローブが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態、ターゲットが溶液中でフリーである状態、ターゲットが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態、プローブとバックグラウンドターゲットとが非特異的に結合した状態、及びプローブとバックグラウンドターゲットとが特異的に結合した状態が含まれ、
前記結合エネルギーは前記モデルの平衡定数を求めるためのパラメータである
ことを特徴とする請求項1記載のマイクロアレイの解析方法。 Define a model that shows the equilibrium between the possible states of the probe and target,
The state of the probe includes a state where the probe is free in a solution, a state where the probe is folded by self-hybridization and has a secondary structure, a state where the target is free in the solution, and a state where the target is self-hybridized. Includes a folded and secondary structure, a probe and background target non-specifically bound, and a probe and background target specifically bound,
2. The microarray analysis method according to claim 1, wherein the binding energy is a parameter for obtaining an equilibrium constant of the model.
前記ハイブリダイゼーションによる計測プローブの蛍光強度を測定するステップと、
その測定値に基づき、前記結合エネルギーを求めるためのパラメータ(wtf、εs)を求めるステップと
をさらに含むことを特徴とする請求項4記載のマイクロアレイの解析方法。 Hybridizing a mixture of a sample obtained by fragmenting the genome to be analyzed and a DNA having a determined concentration with a probe on the microarray;
Measuring the fluorescence intensity of the measurement probe by the hybridization;
5. The method of analyzing a microarray according to claim 4, further comprising a step of obtaining a parameter (w tf , ε s ) for obtaining the binding energy based on the measured value.
前記一部のプローブの蛍光強度を測定するステップと、
前記一部のプローブの蛍光強度の測定値と、前記DNAの濃度の確定した値とに基づき、プローブの蛍光強度とターゲット濃度間の比例定数を決定するステップと
をさらに含むことを特徴とする請求項1記載のマイクロアレイの解析方法。 Hybridizing a part of the plurality of random probes with a DNA having a base sequence corresponding to the base sequence of the part of the probe and having a determined concentration;
Measuring the fluorescence intensity of the partial probe;
The method further comprises the step of determining a proportionality constant between the fluorescence intensity of the probe and the target concentration based on the measured value of the fluorescence intensity of the partial probe and the determined value of the concentration of the DNA. Item 4. A microarray analysis method according to Item 1.
a)前記マイクロアレイは、解析対象とするターゲットの塩基配列に対応した塩基配列を有する複数の計測プローブと、解析対象とするターゲットの塩基配列に対応しない塩基配列を有する複数のランダムプローブとを含み、
b)前記解析装置は、
解析に用いるモデルに関する情報を格納するデータ格納手段と、
ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせた結果得られる各プローブの蛍光強度の測定値を入力する入力手段と、
前記モデルに関する情報を用いて、前記入力した蛍光強度の測定値からターゲット濃度(tt i)を算出する処理手段とを備え、
c)前記処理手段は、
入力したランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求め、
前記バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、前記計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測し、
前記計測プローブの蛍光強度の測定値(Im i)から前記クロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求める
ことを特徴とするマイクロアレイの解析装置。 A microarray analyzer that analyzes a signal from a microarray in which a plurality of probes are arranged to determine a target concentration in a sample solution,
a) The microarray includes a plurality of measurement probes having a base sequence corresponding to the base sequence of the target to be analyzed, and a plurality of random probes having a base sequence not corresponding to the base sequence of the target to be analyzed,
b) The analysis device
Data storage means for storing information about the model used for analysis;
An input means for inputting a measured value of the fluorescence intensity of each probe obtained as a result of hybridizing the solution containing the target and each probe of the microarray;
Processing means for calculating a target concentration (t t i ) from the measured value of the input fluorescence intensity using information on the model,
c) The processing means includes:
From the measurement value of the fluorescence intensity of the input random probe, the amount (t ns ) of the background target that is a target non-specifically bound to the probe is determined.
Based on the amount of the background target and the binding energy of each probe, the degree of influence of cross-hybridization (NS i ) on the measured fluorescence intensity of the measurement probe is predicted,
A microarray analyzer characterized in that the amount of target (t t i ) to be analyzed is obtained by excluding the influence of the cross hybridization from the measured value (I m i ) of the fluorescence intensity of the measurement probe. .
前記モデルにおけるプローブの状態には、プローブが溶液中でフリーである状態、プローブとバックグラウンドターゲットとが非特異的に結合した状態、及びプローブが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態が含まれ、
前記処理手段は、前記モデルを用いて前記バックグラウンドターゲットの量(tns)を求める、
ことを特徴とする請求項7記載のマイクロアレイの解析装置。 The data storage means stores information about a model indicating an equilibrium between possible states of the probe,
The state of the probe in the model includes a state in which the probe is free in a solution, a state in which the probe and the background target are nonspecifically bound, and a probe that is folded by self-hybridization to have a secondary structure. State included,
The processing means obtains the amount (t ns ) of the background target using the model.
8. The microarray analysis apparatus according to claim 7, wherein
をさらに含むことを特徴とする請求項8記載のマイクロアレイの解析装置。 The processing means is a parameter for obtaining an equilibrium constant of the model based on a measured value of fluorescence intensity of a random probe when only a sample obtained by fragmenting the genome to be analyzed is hybridized with a probe on the microarray ( 9. The microarray analysis apparatus according to claim 8, further comprising determining w pf , ε ns ).
前記プローブの状態には、プローブが溶液中でフリーである状態、プローブが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態、ターゲットが溶液中でフリーである状態、ターゲットが自己ハイブリダイゼーションによって折り畳まれ二次構造をとっている状態、プローブとバックグラウンドターゲットとが非特異的に結合した状態、及びプローブとバックグラウンドターゲットとが特異的に結合した状態が含まれ、
前記結合エネルギーは前記モデルの平衡定数を求めるためのパラメータである
ことを特徴とする請求項7記載のマイクロアレイの解析装置。 The data storage means stores information relating to a model indicating an equilibrium between possible states of the probe and the target;
The state of the probe includes a state where the probe is free in a solution, a state where the probe is folded by self-hybridization and has a secondary structure, a state where the target is free in the solution, and a state where the target is self-hybridized. Includes a folded and secondary structure, a probe and background target non-specifically bound, and a probe and background target specifically bound,
8. The microarray analysis apparatus according to claim 7, wherein the binding energy is a parameter for obtaining an equilibrium constant of the model.
ことを特徴とする請求項10記載のマイクロアレイの解析装置。 The processing means is based on the measurement value of the fluorescence intensity of the measurement probe when a mixed solution of the sample fragmented from the genome to be analyzed and the DNA whose concentration has been determined is hybridized with the probe on the microarray. 11. The microarray analysis apparatus according to claim 10, wherein parameters (w tf , ε s ) for obtaining the binding energy are obtained.
ことを特徴とする請求項7記載のマイクロアレイの解析装置。 The processing means is configured to hybridize a partial probe of the plurality of random probes and a DNA having a base sequence corresponding to the base sequence of the partial probe and having a determined concentration. 8. The microarray analyzer according to claim 7, wherein a proportionality constant between the probe fluorescence intensity and the target concentration is determined based on a measured value of the fluorescence intensity of the probe and a determined value of the concentration of the DNA. .
a)前記マイクロアレイは、解析対象とするターゲットの塩基配列に対応した塩基配列を有する複数の計測プローブと、解析対象とするターゲットの塩基配列に対応しない塩基配列を有する複数のランダムプローブとを含み、
b)前記解析プログラムは、
ターゲットを含む溶液とマイクロアレイの各プローブとをハイブリダイゼーションさせた結果得られる各プローブの蛍光強度の測定値を入力するステップと、
入力したランダムプローブの蛍光強度の測定値から、プローブに非特異的に結合するターゲットであるバックグラウンドターゲットの量(tns)を求めるステップと、
前記バックグラウンドターゲットの量と各プローブの結合エネルギーとに基づき、前記計測プローブの蛍光強度の測定値におけるクロスハイブリダイゼーションの影響度(NSi)を予測するステップと、
前記計測プローブの蛍光強度の測定値(Im i)から前記クロスハイブリダイゼーションの影響度を除外して、解析対象とするターゲットの量(tt i)を求めるステップと
をコンピュータに実行させる、ことを特徴とするマイクロアレイの解析プログラム。
An analysis program for analyzing a signal from a microarray in which a plurality of probes are arranged, and causing a computer to execute a process for obtaining a concentration of a target in a sample solution,
a) The microarray includes a plurality of measurement probes having a base sequence corresponding to the base sequence of the target to be analyzed, and a plurality of random probes having a base sequence not corresponding to the base sequence of the target to be analyzed,
b) The analysis program is
Inputting a measurement value of the fluorescence intensity of each probe obtained as a result of hybridization of the solution containing the target and each probe of the microarray;
Determining the amount (t ns ) of a background target that is a target that non-specifically binds to the probe from the measured fluorescence intensity of the input random probe;
Predicting the degree of influence of cross hybridization (NS i ) on the measured fluorescence intensity of the measurement probe based on the amount of the background target and the binding energy of each probe;
Causing the computer to execute the step of determining the target amount (t t i ) to be analyzed by excluding the influence of the cross hybridization from the measured value (I m i ) of the fluorescence intensity of the measurement probe. A microarray analysis program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006211110A JP4947573B2 (en) | 2006-08-02 | 2006-08-02 | Microarray data analysis method and analyzer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006211110A JP4947573B2 (en) | 2006-08-02 | 2006-08-02 | Microarray data analysis method and analyzer |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008039475A JP2008039475A (en) | 2008-02-21 |
JP4947573B2 true JP4947573B2 (en) | 2012-06-06 |
Family
ID=39174672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006211110A Expired - Fee Related JP4947573B2 (en) | 2006-08-02 | 2006-08-02 | Microarray data analysis method and analyzer |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4947573B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5698471B2 (en) | 2009-06-30 | 2015-04-08 | シスメックス株式会社 | Nucleic acid detection method using microarray and program for microarray data analysis |
US20140128270A1 (en) * | 2012-11-08 | 2014-05-08 | Roche Molecular Systems, Inc. | Method of improving microarray performance by strand elimination |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10142643A1 (en) * | 2001-08-31 | 2003-04-24 | Clondiag Chip Tech Gmbh | Detection of interactions on probe arrays |
EP1474530A4 (en) * | 2002-01-18 | 2007-07-25 | Syngenta Participations Ag | Probe correction for gene expression level detection |
CN103397082B (en) * | 2003-02-26 | 2017-05-31 | 考利达基因组股份有限公司 | The random array DNA analysis carried out by hybridization |
GB2413796B (en) * | 2004-03-25 | 2006-03-29 | Global Genomics Ab | Methods and means for nucleic acid sequencing |
-
2006
- 2006-08-02 JP JP2006211110A patent/JP4947573B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008039475A (en) | 2008-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sloma et al. | Exact calculation of loop formation probability identifies folding motifs in RNA secondary structures | |
Lucas et al. | Sparse statistical modelling in gene expression genomics | |
Mathews | Using an RNA secondary structure partition function to determine confidence in base pairs predicted by free energy minimization | |
Mustonen et al. | From fitness landscapes to seascapes: non-equilibrium dynamics of selection and adaptation | |
McLoughlin | Microarrays for pathogen detection and analysis | |
Held et al. | Relationship between gene expression and observed intensities in DNA microarrays—a modeling study | |
Zhao et al. | Interpreting omics data with pathway enrichment analysis | |
Bell et al. | Capturing RNA folding free energy with coarse-grained molecular dynamics simulations | |
JP5079694B2 (en) | Primer design device for nucleic acid amplification, primer design program, and primer design server device | |
Ding | Statistical and Bayesian approaches to RNA secondary structure prediction | |
Zuber et al. | Analysis of RNA nearest neighbor parameters reveals interdependencies and quantifies the uncertainty in RNA secondary structure prediction | |
Stenberg et al. | ProbeMaker: an extensible framework for design of sets of oligonucleotide probes | |
Torkamaneh et al. | Accurate imputation of untyped variants from deep sequencing data | |
JP4947573B2 (en) | Microarray data analysis method and analyzer | |
Su et al. | ENTRNA: a framework to predict RNA foldability | |
Bachu et al. | Analysis on the in-silico ensemble methods for 3D modelling of ssDNA aptamers | |
US20020133301A1 (en) | Methods for selecting nucleic acid probes | |
Martin et al. | Rank Difference Analysis of Microarrays (RDAM), a novel approach to statistical analysis of microarray expression profiling data | |
Lievens et al. | Simulation of between repeat variability in real time PCR reactions | |
US20040002083A1 (en) | Statistical algorithms for folding and target accessibility prediction and design of nucleic acids | |
De Hertogh et al. | A benchmark for statistical microarray data analysis that preserves actual biological and technical variance | |
JP5744875B2 (en) | Method and system for analyzing hybridization | |
Wu et al. | The effects of differential gene expression on coding sequence features: analysis by one-way ANOVA | |
Saviozzi et al. | Microarray probe expression measures, data normalization and statistical validation | |
Chong et al. | SeqControl: process control for DNA sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20080220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090729 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090729 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120229 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |