[go: up one dir, main page]

JP4841396B2 - 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体 - Google Patents

塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP4841396B2
JP4841396B2 JP2006283757A JP2006283757A JP4841396B2 JP 4841396 B2 JP4841396 B2 JP 4841396B2 JP 2006283757 A JP2006283757 A JP 2006283757A JP 2006283757 A JP2006283757 A JP 2006283757A JP 4841396 B2 JP4841396 B2 JP 4841396B2
Authority
JP
Japan
Prior art keywords
sequence
nucleic acid
motif
base
stranded region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006283757A
Other languages
English (en)
Other versions
JP2008102675A (ja
Inventor
穣 秋冨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2006283757A priority Critical patent/JP4841396B2/ja
Priority to US12/446,199 priority patent/US8200441B2/en
Priority to PCT/JP2007/070366 priority patent/WO2008047876A1/ja
Priority to EP07830100A priority patent/EP2077513A4/en
Publication of JP2008102675A publication Critical patent/JP2008102675A/ja
Application granted granted Critical
Publication of JP4841396B2 publication Critical patent/JP4841396B2/ja
Priority to US13/477,714 priority patent/US9311447B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、塩基配列の同定装置、核酸分子の二次構造取得装置塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体に関する。
DNAやRNAなどの核酸分子は、転写/翻訳によりタンパク質を産生する機能を有することが広く知られている一方で、リボザイムやRNAiといった、タンパク質や高分子物質との相互作用により、核酸分子に本来見出されていた役割とは異なる役割を有する分子種が多数発見され、治療分野等への応用に注目が集まっている。なかでも、アプタマーは、タンパク質、高分子材料、医薬品等の標的物質に直接結合することにより、機能を発現する分子種として注目されている。現在、アプタマーを取得する一般的な方法としては、SELEX(Systematic Evolution of Ligands by EXponential enrichment)法(特許文献1参照)が知られている。アプタマー及びSELEX法の詳細については、非特許文献1に述べられている。
SELEX法によって取得されるアプタマーの特徴の一つは、任意のプライマー配列と、任意の長さのランダム配列とによって構成されることである。また、SELEX法によって取得されるアプタマーのもう一つの特徴としては、SELEX法において候補となり得るアプタマーを選別するサイクルによって十分な回数の選別を行ったとしても、最終的に取得されるアプタマーは複数種類存在するということである。
このような特徴を有するアプタマーは、プライマー配列などで例示される冗長な領域を多く含み、アプタマーが標的物質に実際に結合するのに必要な領域は、アプタマーを構成する塩基の一部であることが知られている。従って、アプタマーにおいて標的物質との結合に必要な領域を同定することは、アプタマーの製造効率のみならず、アプタマーと標的物質との結合様式を把握する上でも非常に重要である。
しかしながら、従来、アプタマーと標的物質との結合に必要な領域の同定には、取得したアプタマーと、標的物質とを用いて、in vitroなどで実際に結合実験を行う必要があった。例えば、取得したアプタマーから、標的物質との結合に必要でないと考えられる冗長な配列を遺伝子工学的に消化して得られる塩基配列を調製した上で、これら塩基配列と標的物質とを用いた結合実験等を行い、結合に必要な領域を同定する必要があった。このような方法では、多大な労力を伴う上に、取得したアプタマーをどの程度消化すればよいか等、最終的には実験者の経験に基づく試行錯誤が必要であった。従って、アプタマーにおいて、標的物質との結合に必須な領域を効率よく同定する方法が求められていた。
特表平5−507413号公報 中村義一、大内将司監修、「バイオテクノロジーシリーズ RNA工学の最前線」、シーエムシー出版、p.139−141
本発明は、上述の問題に鑑みてなされたものであって、標的物質と親和性を有するアプタマーなどの核酸分子の塩基配列のうち、各塩基配列の共通性と、塩基配列の有する親和性に関する評価値とに基づいて、標的物質との親和性の発現に必要な塩基配列を同定する方法、及び同定された塩基配列を含む核酸分子の二次構造を予測する方法、これらの方法を実行する装置及びプログラム、並びに前記プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
本発明による塩基配列の同定装置は、標的物質への親和性を有する核酸分子の塩基配列を取得する塩基配列取得手段と、
核酸配列を記憶する配列記憶手段と、
前記配列記憶手段が記憶する各配列の配列構造を記憶する配列構造記憶手段と、
前記配列記憶手段が記憶する各配列と前記標的物質との親和性の評価値を規定値として記憶する規定値記憶手段と、
前記配列記憶手段及び前記配列構造記憶手段から、前記塩基配列取得手段が取得した塩基配列と一致する配列及び配列構造を取得し、その配列中において相補的塩基対(ステム構造)を形成し得る塩基を予測し、その塩基を前記配列から除外して一本鎖領域を抽出する一本鎖領域抽出手段と、
前記一本鎖領域中における各配列の出現頻度の高さに、それら各配列が有する前記親和性の評価値を重み付けして、前記一本鎖領域からモチーフ配列を探索するモチーフ配列探索手段と
を有することを特徴とする、前記核酸分子の塩基配列のうち、前記親和性の発現に必要な塩基配列の同定装置である。
本発明による核酸分子の二次構造取得装置は、
前記本発明の塩基配列の同定装置と、概要構造取得手段とを含み、
前記概要構造取得手段は、前記標的物質への親和性を有する核酸分子の二次構造から、前記モチーフ配列に一致する前記一本鎖領域と、その一本鎖領域の両端に位置する前記ステム構造とを含む構造を概要構造として取得することを特徴とする、前記核酸分子の二次構造取得装置である。
本発明による塩基配列の同定方法は、
前記本発明の塩基配列の同定装置を用い、
前記一方鎖領域抽出手段により、前記配列記憶手段及び前記配列構造記憶手段から、前記塩基配列取得手段が取得した塩基配列と一致する配列及び配列構造を取得し、その配列中において相補的塩基対(ステム構造)を形成し得る塩基を予測し、その塩基を前記配列から除外して一本鎖領域を抽出する一本鎖領域抽出工程と、
前記モチーフ配列探索手段により、前記一本鎖領域中における各配列の出現頻度の高さに、それら各配列が有する前記親和性の評価値を重み付けして、前記一本鎖領域からモチーフ配列を探索するモチーフ配列探索工程と、
を有することを特徴とする、前記核酸分子の塩基配列のうち、前記親和性の発現に必要な塩基配列の同定方法である。
本発明による核酸分子の二次構造取得方法は、
前記本発明の核酸分子の二次構造取得装置を用い、
前記本発明の塩基配列の同定装置により前記本発明の塩基配列の同定方法を行う塩基配列同定工程と、
前記概要構造取得手段により、前記標的物質への親和性を有する核酸分子の二次構造から、前記モチーフ配列に一致する前記一本鎖領域と、その一本鎖領域の両端に位置する前記ステム構造とを含む構造を概要構造として取得する概要構造取得工程と、
を有することを特徴とする核酸分子の二次構造取得方法である。
本発明によるプログラムは、前記本発明の塩基配列の同定方法または核酸分子の二次構造取得方法をコンピュータ上で実行可能なことを特徴とする。なお、以下、これらを、「塩基配列の同定プログラム」又は「核酸分子の二次構造取得プログラム」ということがある。
本発明による記録媒体は、前記本発明の塩基配列の同定プログラム又は核酸分子の二次構造取得プログラムを記録したコンピュータ読み取り可能な記録媒体である
なお、本発明において、塩基配列の同定装置及び塩基配列の同定プログラムは、それぞれ、塩基配列の同定方法を実行する装置及びプログラムをいい、核酸分子の二次構造取得装置及び核酸分子の二次構造取得プログラムは、それぞれ、核酸分子の二次構造取得方法を実行する装置及びプログラムをいう。また、本発明において、「核酸分子」とは、DNA、RNAなど、種々の遺伝子をいう。
本発明によれば、第1の効果は、実験を行わずに、アプタマーなどの核酸分子の重要構造を抽出することができることにある。その結果、機能と関係の無い冗長部位を削った実用性の高い核酸分子を取得するために重要な情報を効率良く得ることができる。
その理由は、SELEX法によってアプタマーのランダム部位のうち、二次構造を形成した際に一本鎖領域に含まれるという極めて限定された領域に共通に保存されている配列(モチーフ配列)又は、この配列を含むループ部位を含む最小の二次構造を、標的物質への親和性の評価値に基づき、計算機シミュレーションによって抽出するためである。
本発明によれば、任意に、入力情報として取り入れる複数の二次構造候補に対して、ループ部位にモチーフ配列を含むという絞込みを行うことにより、構造の候補を厳選することもできる。
これによれば、アプタマーなどの核酸分子の二次構造を高い精度で予測することができるという第2の効果を得ることも可能である。
本発明によれば、任意に、モチーフ配列の候補を選定する段階で、アプタマーなどの核酸分子と標的物質との結合力を評価した値によって重み付けされたスコアによってモチーフ配列の候補を評価することにより、出現頻度カウントによる単純な評価と比べて、核酸分子と標的物質との結合に重要なモチーフ配列が抽出されやすくすることもできる。
これによれば、アプタマーなどの核酸分子が標的物質と結合するのに重要な役割を持つモチーフ配列を抽出できるという第3の効果を得ることも可能である。
以下、図面を参照しながら、本発明の好適な実施形態につき説明する。
<本発明による塩基配列の同定方法、塩基配列の同定装置及び塩基配列の同定プログラム>
(本発明による塩基配列の同定装置の構成および各構成の機能等)
まず、図1aを参照しながら、本発明による塩基配列の同定装置の構成の例について説明する。図1aは、本発明による塩基配列の同定装置の例を示す概略図である。同図に示す塩基配列の同定装置は、キーボードなどの入力装置1(「塩基配列取得手段」と呼ぶことができる)と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3(前記「配列記憶手段」、「配列構造記憶手段」、及び「規定値記憶手段」を含む)と、ディスプレイ装置や印刷装置などの出力装置4とを有する。
データ処理装置2は、一本鎖領域抽出手段21と、モチーフ配列探索手段22とを有する。
一本鎖領域抽出手段21は、入力装置1(塩基配列取得手段)で入力(取得)された前記核酸分子の塩基配列から、ステム構造を形成し得る塩基を除外して一本鎖領域を抽出する。例えば、一本鎖領域抽出手段21は、まず、配列記憶部32(「配列記憶手段」と呼ぶことができる)から各配列の情報を、配列構造記憶部33(「配列構造記憶手段」と呼ぶことができる)からその各塩基配列に対応する二次構造予測の結果などの配列構造を、それぞれ取り出す。次に、一本鎖領域抽出手段21は、これらの情報に基づいて、各配列の二次構造において、AとUや、GとCといった相補的な塩基対(ステム構造)を形成し得る塩基を空白に置換することによって、塩基配列中の一本鎖領域の候補を抽出する。その結果は、各配列の各配列構造ごとに抽出される。これらは一本鎖領域記憶部34に格納されてもよい。なお、一本鎖領域抽出手段21は、アプタマー等の核酸分子の塩基配列に含まれるプライマー領域を構成する各塩基を、上述のステム構造で説明したのと同様の方式で、空白に置換してもよい。この際、一本鎖領域抽出手段21は、プライマー配列を構成する塩基を上述の除外する塩基とするか否かの情報を規定値記憶部31(「規定値記憶手段」と呼ぶことができる)から取得してもよい。これにより、後述の各工程により、プライマー配列のみがモチーフ配列と判定されることが避けられ、より効率的且つ実質的に、核酸分子に含まれる標的物質との結合に必要な塩基配列等を取得することが可能となる。
モチーフ配列探索手段22は、一本鎖領域抽出手段21で抽出された一本鎖領域から、入力装置1で入力された核酸分子が有する標的物質との親和性に関する評価値に基づいて、モチーフ配列を探索する。つまり、モチーフ配列探索手段22は、規定値記憶部31に記憶されている核酸分子の標的物質との親和性に関する評価値を取り出し、一本鎖領域記憶部34から各配列の一本鎖領域の情報を取り出し、これらに基づいて、各配列のモチーフ配列を探索する。ここで探索されるモチーフ配列とは、入力装置1から入力される任意の長さや、任意のミスマッチ個数などで確定される探索範囲内における特定の配列の出現頻度の高さと、この配列に由来する核酸分子と標的物質との親和性に関する評価値(結合定数など)とを考慮した配列パターンである。従って、探索されるモチーフ配列は、特定の配列の出現頻度の高さに、この特定の配列が有する評価値を重み付けして得られる配列である。このことから、例えば、標的物質との結合力が高いアプタマーに出現する配列パターンほど、優先的にモチーフ配列と定義されることとなる場合がある。また、複数の配列パターンが同じスコアでモチーフ配列の候補となった場合は、モチーフ配列が複数個存在することとなる場合もある。
また、モチーフ配列探索手段22は、上述のモチーフ配列を探索する機能の他、出力装置4に出力する機能や、この探索結果を、モチーフ配列記憶部35に格納する機能を有してもよい。
記憶装置3は、規定値記憶部31と、配列記憶部32と、配列構造記憶部33とを備える。また、記憶装置3は、これらに加えて、一本鎖領域記憶部34を有してもよいし、モチーフ配列記憶部35を有してもよい。
規定値記憶部31は、探索するモチーフ配列の長さ、この配列で許容するミスマッチの個数、プライマー配列などの特定領域を一本鎖領域の抽出やモチーフ配列の探索の対象に含めるか否かといった情報、モチーフ配列候補の探索で使用する最大スコアや、入力装置1から入力される核酸分子と標的物質との親和性を示す評価値などの規定値の情報を記憶している。特に、入力装置1からこれらの値についての入力があった場合には、入力されたこれらの値は、対応する規定値で更新され、記憶される。なお、核酸分子と標的物質との親和性を示す評価値とは、核酸分子と標的物質とが分子生物学的に結合する程度を示す種々の値であれば特に制約はなく、例えば、放射線ラベルした核酸分子と標的物質とを試験管内で結合させた検討や、SPR(表面プラズモン共鳴)分析の原理に基づくBIACORE2000を用いた検討等で得られる結合定数(Kd)が例示される。また、特定領域としては、核酸分子をSELEX法で得られたアプタマーとする場合、プライマー配列が挙げられるが、核酸分子の配列の特徴に応じて、適宜選択されてもよい。
配列記憶部32は、入力装置1により入力されたDNAや、RNAなどの核酸分子の各塩基配列を記憶する。RNAを入力の対象とする場合、核酸分子の塩基配列は、SELEX法で得たアプタマーであってもよい。
配列構造記憶部33は、入力装置1により入力された各核酸分子の塩基配列に対して一つ以上の二次構造予測の結果を、この塩基配列の配列構造の候補として記憶する。核酸分子の二次構造を配列構造記憶部33に記憶する形態としては、特に限定されない。例えば、入力装置1で入力された核酸分子で形成され得る塩基対(ステム構造)を、このステム構造を構成する塩基に対応させて「(」や「)」などと表現し、ループなどの一本鎖領域を「:」などと表現したものであってもよい。なお、図2に示す塩基配列をこの表現形態で示すと、「(((::::)))」となる。
一本鎖領域記憶部34は、一本鎖領域抽出手段21から出力された配列の一本鎖領域の情報を記憶する。
モチーフ配列記憶部35は、モチーフ配列探索手段22によって検出されたモチーフ配列を格納する。モチーフ配列は、A、C、G、U(T)の四種類の塩基の他に、ミスマッチを表す「.」を加えた五種類の文字によって表現される。
(本発明による塩基配列の同定方法及び塩基配列の同定プログラムの各工程、並びに本発明による塩基配列の同定装置の動作等について)
次に、図1a及び図3a、図4及び図5を参照して、本発明による塩基配列の同定方法及び塩基配列の同定プログラムの各工程、並びに本発明による塩基配列の同定装置及び塩基配列の同定プログラムの動作等の例について詳細に説明する。
同定の対象となる同一のSELEXから取得されたアプタマーなどの核酸分子の塩基配列は、入力装置1から入力される(A1)。この核酸分子の塩基配列の二次構造のリストは、入力装置1から入力される(A2)。必要に応じて、核酸分子と標的物質との親和性などの評価値(例えば、結合定数)や、下述のモチーフ配列を探索する塩基配列の長さや、モチーフ配列に許容されるミスマッチの個数などの規定値は、入力装置1から入力される(A3)。これら入力された、核酸分子の塩基配列、二次構造のリスト、及び規定値は、それぞれ、配列記憶部32、配列構造記憶部33及び規定値記憶部31に記憶される(A1、A2、A3)。
次に、一本鎖領域抽出手段21を用いて、入力された核酸分子の塩基配列から、一本鎖領域の抽出(「一本鎖領域抽出工程」と呼ぶことができる)を行う(A4)。この一本鎖領域の抽出の例について、図4を参照して、説明する。
図4は、一本鎖領域抽出の概要を例示するフローチャートである。一本鎖領域抽出手段21は、まず、核酸分子の塩基配列中に存在するプライマー配列などの特定領域を一本鎖領域を抽出する領域に含めるかどうかの値を規定値記憶部31から取り出す。また、一本鎖領域抽出手段21は、配列記憶部32から核酸分子の塩基配列の情報を取り出し、且つ配列構造記憶部33から各核酸分子が取り得る二次構造(配列構造)の情報を取り出す。次に、一本鎖領域抽出手段21は、入力された核酸分子の塩基配列のうち、最初に抽出の対象とする塩基配列と、これに対応する配列構造とをセットする(A41)。セット完了後、一本鎖領域抽出手段21は、プライマー配列などの特定領域を抽出の対象に含めるかどうかを判断する(A42)。特定領域を抽出の対象に含めない場合は、一本鎖領域抽出手段21は、セットした塩基配列のうち、特定領域に相当する塩基を空白に置換する(A43)。特定領域を抽出の対象に含める場合は、ステップA43を行わずに、次のステップ(A44)に進む。次に、一本鎖領域抽出手段21は、入力された核酸分子の塩基配列に対応する配列構造を参照して、この配列構造においてステム構造を構成する塩基を空白に置換する(A44)。ステップA44が終了すると、セットされた塩基配列は、配列中の一本鎖領域を構成する塩基以外の塩基が空白に置換された状態になっているので、一本鎖領域抽出手段21は、空白に置換されていない塩基(つまり、一本鎖領域を構成する各塩基)の情報を一本鎖領域記憶部34に記憶する(A45)。次に、一本鎖領域抽出手段21は、セットされた塩基配列について、この配列に対応する未抽出の配列構造があるかどうかを判断する(A46)。未抽出の配列構造がある場合には、一本鎖領域抽出手段21は、その配列構造を、抽出の対象とする配列構造としてセットして(A47)、ステップA42以降の各ステップを行う。このステップA47からステップA42を経てステップA46に至るまでの各ステップは、同一の塩基配列について、未抽出の配列構造が存在する限り行われる。未抽出の配列構造が存在しなくなった場合、つまり、同一の塩基配列に対応する全ての配列構造について一本鎖領域が抽出された場合には、一本鎖領域抽出手段21は、セットされた塩基配列とは別の次の塩基配列をセットし(A49)、この塩基配列に対応する配列構造をセットし(A47)、ステップA42以下の各ステップを行う。このようにして、入力された全ての核酸分子の塩基配列と、これらの塩基配列に対応する全ての配列構造について、一本鎖領域抽出手段21による一本鎖領域の抽出が完了すると、ステップA4の一本鎖領域の抽出は、終了となる。なお、一本鎖領域の情報は、各核酸分子の塩基配列ごとに分けて、一本鎖領域記憶部34に記憶される。
このようにしてステップA4で得た一本鎖領域を用いて、次に、モチーフ配列探索手段22は、この一本鎖領域から、核酸分子と標的物質との親和性に関する評価値に基づいて、モチーフ配列を探索する(A5)。このモチーフ配列を探索する工程(「モチーフ配列探索工程」ということができる)は、各一本鎖領域に由来する核酸分子の塩基配列の出現頻度の高さに、それら各配列が有する前記親和性の評価値を重み付けしてモチーフ配列を探索する工程であれば、特に限定されるものではなく、例示として、図5を参照して、以下に説明する。
図5は、モチーフ配列探索の概要を例示するフローチャートである。モチーフ配列探索手段22は、まず、一本鎖領域記憶部34に記憶されている各核酸分子ごとの塩基配列の一本鎖領域の情報を取り出す(A501)。また、モチーフ配列探索手段22は、規定値記憶部31から、このモチーフ配列の探索工程で探索するモチーフ配列の長さ、この配列で許容するミスマッチの個数、核酸分子と標的物質との親和性を示す評価値などの規定値を取り出す(A502)。
次に、モチーフ配列探索手段22は、上記のモチーフ配列に関する規定値で規定される条件に合致する配列を生成し、モチーフ配列の候補(以下、モチーフ配列候補や、モチーフ候補とも称する。)の最初のもの(つまり、最初のモチーフ配列候補)を、セットする。モチーフ配列候補の生成については、後述する。このようにして得られるモチーフ配列候補は、通常、複数個となる。また、モチーフ配列探索手段22は、セットした最初のモチーフ配列候補に、スコアなる変数を設定し、このスコアを初期化してもよい(A503)。
ここで、モチーフ配列探索手段22によるモチーフ配列候補の生成の方法(A503)の一例について、説明する。セットされるモチーフ配列候補は、四種類の塩基(RNAならばA、C、G及びU)に、ミスマッチの「.」を加えた五種類の文字の組み合わせで表現される。このように表現されるモチーフ配列候補は、例えばモチーフ配列の候補をモチーフ配列長桁の5進数、及びその10進数表現によって表現し、その中から許容するミスマッチの数を上回るミスマッチを含む配列を調査対象外とすることにより、モチーフ配列候補の網羅的な探索を実現する。なお、ミスマッチとは、A、C、G及びUのいずれの塩基を取り得るものと解してもよいし、トランケートされたものと解してもよい。また、A、C、G及びU並びにトランケートされたものを任意で組み合わせた、例えば、GとCや、AとUなどと解してもよい。
次に、モチーフ配列探索手段22は、モチーフ配列候補のセットとスコアの初期化とが終わると、モチーフ配列の最初の探索対象として、最初の核酸分子の塩基配列の最初の配列構造に由来する最初の一本鎖領域をセットする(A504)。
次に、モチーフ配列探索手段22は、セットされた最初のモチーフ配列候補が最初にセットされた一本鎖領域と一致するかどうかを判断する(A505)。最初にセットされたモチーフ配列候補が最初にセットされた一本鎖領域と一致すると判断した場合、モチーフ配列探索手段22は、この一致したモチーフ配列候補のスコアに、この最初の一本鎖領域に由来する核酸分子の塩基配列が有する評価値を加算する(A506)。その後、モチーフ配列探索手段22は、最初にセットした一本鎖領域に対応する塩基配列以外に未探索の核酸分子の塩基配列が存在するかどうかを判断する(A508)。未探索の核酸分子の塩基配列がある場合、モチーフ配列探索手段22は、この未探索の核酸分子の塩基配列に対応する最初の一本鎖領域をセットし(A509)、ステップA505において、上述と同様の判断を行い、以下のステップを行う。
ステップA505において、モチーフ配列探索手段22が最初にセットされたモチーフ配列候補が最初にセットされた一本鎖領域と一致しないと判断した場合、モチーフ配列探索手段22は、最初にセットした一本鎖領域に由来する核酸分子の塩基配列において未探索の一本鎖領域があるかどうかを判断する(A507)。未探索の一本鎖領域があると判断した場合、モチーフ配列探索手段22は、この未探索の一本鎖領域をセットし(A510)、最初にセットしたモチーフ配列候補とここでセットした未探索の一本鎖領域とが一致するかどうかを判断し(A505)、以下のステップを行う。
このように、モチーフ配列探索手段22は、未探索のモチーフ配列候補も、未探索の一本鎖領域も存在しなくなるまで、ステップA505、A506、A508及びA509の一連のステップ並びにステップA505、A507及びA510の一連のステップを行う。未検索の一本鎖領域がないと判断し(A507の「いいえ」に相当)、且つ未検索の塩基配列がないと判断すると(A508の「いいえ」に相当)、モチーフ配列探索手段22は、ステップA511以下のステップを行う。
ステップA511において、モチーフ配列探索手段22は、ここで探索されて得たモチーフ配列候補のスコアが、規定値記憶部31に記憶された最大スコアよりも大きいかどうかを判断する(A511)。モチーフ配列候補のスコアが最大スコアよりも大きいと判断すると、モチーフ配列探索手段22は、規定値記憶部31に記憶されているこの時の最大スコアを書き換えるとともに、このモチーフ配列候補をモチーフ配列としてモチーフ配列記憶部35に記憶する(A512)。モチーフ配列候補のスコアが最大スコアよりも大きくないと判断されると、モチーフ配列探索手段22は、このスコアが最大スコアと同じ値であるかどうかを判断する(A513)。スコアが同じ値であると判断すると、モチーフ配列探索手段22は、このモチーフ配列候補をモチーフ配列のひとつとしてモチーフ配列記憶部35に記憶する。なお、この場合、規定値記憶部31に記憶されている最大スコアは、更新されることはない。
ステップA512若しくはA514が終了し、又はステップA513において、スコアが最大スコアと同じ値ではないと判断すると、モチーフ配列探索手段22は、A503で生成した全てのモチーフ配列候補について、探索が終了したかを判断する(A515)。全てのモチーフ配列候補の探索が終了していないと判断すると、モチーフ配列探索手段22は、次のモチーフ配列候補をセットするとともに、このモチーフ配列候補のスコアが初期化され、A504以下のステップが行われ、全てのモチーフ配列候補の探索が終了していると判断されると、モチーフ配列候補の探索は、終了する。
また、ステップA5は、各配列の一本鎖領域を並べてマルチプルアラインメントを行った後に、特に保存されている領域に対してPWM(Positional Weight Matrix)を作成し、ステップA5で得た各一本鎖領域について、末端からの何残基目にどの塩基が出現するかを計数したカウントに、規定値記憶部31に記憶されている評価値などの規定値を重み付けすることによってモチーフ配列を得てもよい。このようにステップA5を行う場合、例えば、下記式に従って、各塩基の特定の位置におけるウェイトとして算出して行ってもよい。
ウェイトi,j=ln(((ni,j+p)/(N+1))/p
i,j:各一本鎖領域について塩基iが位置jに出現する回数
:塩基iについての事前確率(priori probability)
N:検討する一本鎖領域の数
なお、このマルチプルアラインメントを行って正確にアラインメントされた配列が得られた場合、PWMで表現されるひとつのモチーフ配列が得られるのみであるところ、比較的高速で処理を行うことが可能である。
このようにしてステップA1からA5までが終了すると、本発明による塩基配列の同定方法の各工程は終了し、標的物質に親和性を有する核酸分子の塩基配列に含まれるモチーフ配列が同定される。また、このモチーフ配列に対応する最大スコアが得られる。これらを含めた全ての情報は、出力装置4に出力される。
このように、本発明による塩基配列の同定方法、塩基配列の同定装置及び塩基配列の同定プログラムによると、標的物質に親和性を有する核酸分子の塩基配列に含まれるモチーフ配列が同定されるとともに、好ましくは、このモチーフ配列に対応する最大スコアが得られる。ここで得られる最大スコアは、モチーフ配列と標的物質との親和性の高さを示す指標と考えられ、この最大スコアに対応するモチーフ配列は、標的物質に対して高い親和性を有する分子種として有用であると考えられる。なお、その時点での最大スコアよりも大きなスコアを有するモチーフ配列が見出されると、最大スコアは、随時更新され、最終的に、ひとつの最大スコアに対応するモチーフ配列のみが出力されるように述べてきたが、それぞれのモチーフ配列に対応するスコアをモチーフ配列記憶部35に記憶しておき、スコアの順に各モチーフ配列を整列したものを、標的物質に対して親和性の大小を比較した配列として、同定してもよい。
<本発明による核酸分子の二次構造取得方法、核酸分子の二次構造取得装置及び核酸分子の二次構造取得プログラム>
(本発明による核酸分子の二次構造取得装置の構成及び各構成の機能等)
次に、図1bを参照しながら、本発明による核酸分子の二次構造取得装置の構成の例について説明する。図1bは、本発明による核酸分子の二次構造取得装置の例を示す概略図である。同図に示す核酸分子の二次構造取得装置は、上述の本発明による塩基配列の同定装置の例と同様に、入力装置1と、データ処理装置2と、記憶装置3と、出力装置4とを有する。同図に示す核酸分子の二次構造取得装置において、データ処理装置2は、上述の一本鎖領域抽出手段21及びモチーフ配列探索手段22に加えて、概要構造取得手段23を有する。また、同図に示す核酸分子の二次構造取得装置において、記憶装置3は、規定値記憶部31、配列記憶部32及び配列構造記憶部33を備える。また、記憶装置3は、これらに加えて、一本鎖領域記憶部34を有してもよいし、モチーフ配列記憶部35を有してもよい。
なお、一本鎖領域抽出手段21及びモチーフ配列探索手段22、並びに規定値記憶部31、配列記憶部32、配列構造記憶部33、一本鎖領域記憶部34及びモチーフ配列記憶部35については、上述と同様の機能を有することから、ここでは説明を省略する。
図1bに示す核酸分子の二次構造取得装置において、データ処理装置2には、概要構造取得手段23が含まれる。概要構造取得手段23は、例えば、まず、配列記憶部32から各塩基配列の情報を、配列構造記憶部33からこの塩基配列に対応する二次構造などの配列構造の情報を、一本鎖領域記憶部34からこの配列構造に対応する一本鎖領域の情報を、モチーフ配列記憶部35からこの塩基配列に対応するモチーフ配列の情報を、それぞれ取り出す。次に、概要構造取得手段23は、各塩基配列の各一本鎖領域がモチーフ配列と一致するどうかの探索を行い、モチーフ配列と一致する一本鎖領域を検出する。モチーフ配列と一致する一本鎖領域が存在する塩基配列については、その塩基配列の情報とこの塩基配列に対応する配列構造の情報とを参照して、このモチーフ配列と一致する一本鎖領域と、この一本鎖領域の両端に位置するステム構造とに基づいて、核酸分子の二次構造を概要構造として取得して、この概要構造を出力装置4に出力する。この際、概要構造取得手段23は、このモチーフ配列に一致する一本鎖領域が含まれる核酸分子の塩基配列の二次構造から、この一本鎖領域とこの一本鎖領域の両端に位置するステム構造とを中心とした塩基に対応する塩基配列の概要構造を取得して、出力してもよい。また、概要構造取得手段23は、このモチーフ配列に一致する一本鎖領域が含まれる核酸分子の塩基配列の二次構造から、このモチーフ配列と、このモチーフ配列に一致する一本鎖領域の両端に位置するステム構造とを中心とした塩基に対応する塩基配列の概要構造を取得して、この概要構造を出力装置4に出力してもよい。
なお、概要構造取得手段23により対象となる核酸分子の二次構造から概要構造を取得する工程において、「一本鎖領域とこの一本鎖領域の両端に位置するステム構造とを中心とした塩基」と規定する「中心」とは、取得される概要構造において、この一本鎖領域とこのステム構造とからなる領域がこの概要構造において左右対称な位置に存在する場合を含め、この領域がこの概要構造において、およそ中心部分に位置することを意図するものである。従って、本発明において、取得される概要構造は、一本鎖領域とこの一本鎖領域の両端に位置するステム構造を構成する塩基とに基づく限り、特に限定されるものではなく、上記「中心」は、取得される概要構造の一態様を意図するものである。
(本発明による核酸分子の二次構造取得方法及び核酸分子の二次構造取得プログラムの各工程、並びに本発明による核酸分子の二次構造取得装置の動作等について)
次に、図1b、図3b、図6等を参照して、本発明による核酸分子の二次構造取得方法及び核酸分子の二次構造取得プログラムの各工程、並びに本発明による核酸分子の二次構造取得装置の動作等の例について詳細に説明する。なお、図3bに記載のステップA1〜A5、図3bのステップA4に対応する図4のステップA41〜A49及び図3bのステップA5に対応する図5のステップA501〜A515の各ステップは、上述の本発明による塩基配列の同定方法等の例でした説明と同様であるので、重複を避けるため、ここでは、割愛する。従って、以下、ステップA6以降のステップについて、説明する。
ステップA6において、概要構造取得手段23を用いて、ステップA1〜A5で得たモチーフ配列を含む塩基配列の二次構造を、概要構造として検出する(A6)。この概要構造の取得(「概要構造取得工程」と呼ぶことができる)について、図6を参照して、説明する。
図6は、概要構造取得(概要構造取得工程)の概要を例示するフローチャートである。概要構造取得手段23は、まず、配列記憶部32から塩基配列(元配列)の情報を、配列構造記憶部33からこの元配列の配列構造の情報を、一本鎖領域記憶部34からその配列構造に対応する一本鎖領域の情報を、モチーフ配列記憶部35からこの塩基配列から同定されたモチーフ配列の情報を、それぞれ取り出す(A61)。次に、概要構造取得手段23は、最初のモチーフ配列及び最初の元配列の最初の一本鎖領域をセットし(A62)、この一本鎖領域とこのモチーフ配列とが一致するかどうかを判定する(A63)。
A63において概要構造取得手段23がモチーフ配列が一本鎖領域と一致すると判断した場合、概要構造取得手段23は、モチーフ配列と一致する一本鎖領域を検出したことになる。次に、概要構造取得手段23は、この一本鎖領域に対応する元配列とこの元配列に対応する配列構造とを参照して、このモチーフ配列と一致する一本鎖領域と、この一本鎖領域を形成するのに必要なステム構造(つまり、この一本鎖領域の両端に位置する塩基からなるステム構造)とを中心とした塩基に対応する二次構造などの概要構造を、元配列の配列構造から取得する(A64)。この概要構造は、ステップA63で取得される概要構造である。また、概要構造取得手段23は、この概要構造を出力装置4に出力する(A64)。
なお、A64において、概要構造取得手段23は、概要構造として、モチーフ配列と一致する一本鎖領域を、このモチーフ配列に置き換えて、取得してもよい。つまり、A64において、概要構造取得手段23は、モチーフ配列と一致すると判断された一本鎖領域に対応する元配列とこの元配列に対応する配列構造とを参照して、この元配列の概要構造から、モチーフ配列と一致すると判断された一本鎖領域と、この一本鎖領域を形成するのに必要なステム構造とを中心とした塩基に対応する元配列の概要構造を取得し、この概要構造の一本鎖領域に該当する領域をモチーフ配列と置き換えたものを概要構造として、取得してもよい。
A64における出力が終わった後、又はA63においてモチーフ配列と一致する一本鎖領域がないと判断した場合、概要構造取得手段23は、元配列に未探索の一本鎖領域があるかどうかがを判断する(A65)。未探索の一本鎖領域があった場合、概要構造取得手段23は、新しい一本鎖領域を探索対象としてセットし(A66)、上述と同様にして、ステップA63以下のステップを行う。未探索の一本鎖領域がないと判断した場合、概要構造取得手段23は、今度は未探索の元配列があるかどうかを判定する(A67)。未探索の元配列があった場合、概要構造取得手段23は、未探索の元配列の最初の一本鎖領域を探索対象としてセットし(A68)、その配列にモチーフがあるかどうかを判断する(A63)。未探索の元配列がないと判断した場合、概要構造取得手段23は、未探索のモチーフ配列があるかどうかを判定する(A69)。未探索のモチーフ配列があった場合、概要構造取得手段23は、この未探索のモチーフ配列と最初の元配列の最初の一本鎖領域を探索対象としてセットし(A62)、以下同様の手順を繰り返す。この手順は未探索のモチーフ配列が存在する限り繰り返され、未探索のモチーフ配列が無くなった段階で、概要構造を取得する工程は、終了する。
このようにしてステップA1からA6までが終了すると、本発明による核酸分子の二次構造取得方法の各工程は終了し、標的物質に親和性を有する核酸分子の塩基配列に含まれるモチーフ配列を含む核酸分子の二次構造を取得する。
このように、本発明による核酸分子の二次構造取得方法、核酸分子の二次構造取得装置及び核酸分子の二次構造取得プログラムによると、標的物質に親和性を有する核酸分子の塩基配列に含まれるモチーフ配列を含む核酸分子の二次構造を取得し得る。この二次構造を元に、標的物質に親和性を有する最小の構造物を効率よく合成することが可能となる。
<その他の構成>
次に、本発明において、その他の構成について説明する。
(二次構造予測手段)
本発明において、データ処理装置2は、核酸分子の塩基配列においてステム構造を形成し得る塩基を予測する機能を有する二次構造予測手段24を有してもよい。つまり、二次構造予測手段24は、入力装置1で入力された核酸分子の塩基配列を構成する各塩基のうち、AとUや、GとCといった相補的な塩基対(ステム構造)を形成し得る塩基を予測する。また、二次構造予測手段24は、このように予測された塩基に基づいて、核酸分子の塩基配列において取り得る二次構造などの配列構造を予測してもよい。これら、二次構造予測手段24によって予測される二次構造などの配列構造に関する情報は、配列構造として、配列構造記憶部33に記憶される。従って、本発明において、核酸分子の塩基配列に対応する二次構造の結果などの配列構造を入力装置1から入力する代わりに、二次構造予測手段24で得られる配列構造の情報を用いてもよい。なお、二次構造予測手段24を用いた上述の工程は、ステップA2に代えて行う工程であって、ステップA4の工程までに行えばよい。
次に、本発明における実施例について、具体例を参照して説明する。
(実施例1)
まず、入力装置1より、図7の配列(配列1、配列番号1)及びその構造(構造1−1及び構造1−2)が入力されたとすると、これらの情報は、それぞれ、配列記憶部32及び配列構造記憶部33に記憶され(A1、A2、A3)、あらかじめ記憶されていた規定値の初期値と共に一本鎖領域抽出手段21に渡される。
一本鎖領域抽出手段21は、まず、一本鎖領域の最初の抽出対象として配列1(配列番号1)及び構造1−1をセットし(A41)、プライマー領域に相当する塩基を除去した後(A42、A43)、配列中の塩基対を形成する塩基(各構造の「(」及び「)」で示した箇所に対応する塩基)を空白に置換し(A44)、結果として一本鎖領域1−1(図8、配列番号3)を一本鎖領域記憶部34に記憶する(A45)。配列1には構造1−1と構造1−2という二種類の構造が入力されているので、次に、配列1と構造1−2がセットされ(A46、A47)、構造1−1のときと同様にして、一本鎖領域1−2(図8、配列番号3)を一本鎖領域記憶部34に記憶する。これで配列1については全ての構造で一本鎖領域を抽出したことになる。次に、配列2(図7、配列番号2)について、先ほどと同様の処理が行われ(A48、A49)、結果として一本鎖領域2−1(図8、配列番号4)、一本鎖領域2−2(図8、配列番号4)が一本鎖領域記憶部34に記憶される。この操作が終わった後、一本鎖領域記憶部34には、図8のような一本鎖領域がそれぞれ記憶されていることになる。
モチーフ配列探索手段22は、一本鎖領域記憶部34に記憶されている一本鎖領域の情報、及び規定値記憶部31に記憶されている規定値の情報を取り出す(A501、A502)。この際、規定値として記憶されている探索するモチーフ配列の長さは4、許容するミスマッチの個数は1、最大スコアの初期値が0.1、配列1及び配列2の標的物質に対する結合力の評価値がそれぞれ1であるとする。するとまず、モチーフ配列探索手段22は、最初のモチーフ配列候補として「AAAA」をセットし、このモチーフ配列候補のスコアを0に初期化した後(A503)、最初の一本鎖領域として一本鎖領域1−1をセットする(A504)。一本鎖領域1−1には、セットした最初のモチーフ配列候補と一致する一本鎖領域「AAAA」が存在するため、配列1の結合力の評価値である1が、このモチーフ配列候補のスコアに加算される(A505、A506)。配列1には、モチーフ配列候補が存在することが分かったため、配列1の未探索の一本鎖領域1−2についてはモチーフ候補の探索は行われない。次の探索領域としては、配列2の最初の一本鎖領域である一本鎖領域2−1がセットされる(A508、A509)。一本鎖領域2−1には最初にセットしたモチーフ配列候補「AAAA」が存在しないため(A505の「いいえ」に相当)、今度は配列2の未探索の一本鎖領域である一本鎖領域2−2をセットする(A505、A507、A510)。同様にして、一本鎖領域2−2にもモチーフ配列候補「AAAA」が存在せず、未探索の配列も残っていないため、スコアの判定に入る(A508、A511、A513)。このときのモチーフ配列候補「AAAA」のスコアは1であり、現在の最大スコアである0.1よりもスコアが高いため、最大スコアとして1が規定値記憶部31に記憶され、モチーフ配列として「AAAA」がモチーフ配列記憶部35に記憶される(A512)。この後、新たなモチーフ配列候補として「AAAC」がセットされ、このモチーフ配列候補のスコアが0に初期化され、最初の一本鎖領域1−1がセットされる(A515、A503、A504)。以下、上述と同様の処理が行われ、規定値の条件に適合する全てのモチーフ配列のパターンについての評価が終了するまで繰り返される(A515)。今回の場合、最終的にモチーフ配列としてモチーフ配列記憶部35に記憶されるモチーフ配列候補は、全通りの中で唯一スコアが2になる「A.AA」(配列番号5)である。このようにして、核酸分子の各塩基配列(配列1及び2)に含まれるモチーフ配列が取得される。
(実施例2)
次に、概要構造取得手段23は、実施例1で得た、配列、構造、一本鎖領域、モチーフの各情報をそれぞれ配列記憶部32、配列構造記憶部33、一本鎖領域記憶部34、モチーフ配列記憶部35から取り出し(A61)、モチーフ配列「A.AA」と、最初の一本鎖領域である一本鎖領域1−1とをセットする(A62)。一本鎖領域1−1にはモチーフ配列「A.AA」が存在するため、一本鎖領域1−1に対応する配列1と構造1−1に対して、モチーフ配列を含むループ部位及びそのループ部位を形成するのに必要なステム構造を中心として形成される二次構造(概要構造)を出力装置4に出力する。具体的には、構造1−1については図9のような概要構造(この概要構造の塩基配列は、配列番号6)が出力される(A63、A64)。以下、同様にして、全ての配列の全ての一本鎖領域についてモチーフ配列「A.AA」が存在するかどうかの判定が行われ、モチーフ配列が存在するものについてはその概要構造が出力装置4に出力される。さらに、配列番号6に記載の配列に対応する概要構造における配列番号1に対応する塩基を、モチーフ配列「A.AA」に置き換えたものを、概要構造として出力する。
(実施例3)
配列番号7に示す配列(74残基)について、上記の本発明による核酸分子の二次構造取得方法に従って、配列番号8に示す配列(40残基)の概要構造を取得した。この配列番号7及び8に示す配列について、BIACORE3000を用いた結合アッセイを実施した。その結果を図10に示す。図10によると、Rmax、Kd値共に、配列番号8に示す配列の方が、配列番号7に示す配列よりも、アプタマーとしての結合力が高いことを示す値が得られた。このことは、本発明がアプタマーの概要構造を取得する上で極めて有効であることを示すものである。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
本発明は、SELEX法によって取得されたアプタマーの冗長部位を削る、重要部位を抽出するプロセスなどに用いることができると考えられる。本発明によれば、従来は実験的手法のみであったアプタマー重要部位抽出のプロセスに、情報学的なアプローチをかけることができる。これは従来の実験的手法と組み合わせることによってより厳密な重要部位抽出方法としてもよいし、本発明を実験的手法の代わりに用いることによって労力の縮小としてもよい。
本発明による塩基配列の同定装置の概略図である。 本発明による核酸分子の二次構造取得装置の概略図である。 塩基対と、一本鎖領域とを有する塩基配列の例である。 本発明による塩基配列の同定方法の概要を示すフローチャートである。 本発明による核酸分子の二次構造取得方法の概要を示すフローチャートである。 一本鎖領域抽出の概要を示すフローチャートである。 モチーフ配列探索の概要を示すフローチャートである。 概要構造取得の概要を示すフローチャートである。 核酸分子及びその構造の一例である。 図7に示した配列1及び配列2についての一本鎖領域の例である。 図7の配列1について取得される概要構造の例である。 IgGに対して取得されたアプタマーと、本発明によって得られたその概要構造との結合力の比較である。
1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
21 一本鎖領域抽出手段
22 モチーフ配列探索手段
23 概要構造取得手段
24 二次構造予測手
1 規定値記憶部
32 配列記憶部
33 配列構造記憶部
34 一本鎖領域記憶部
35 モチーフ配列記憶部

Claims (10)

  1. 標的物質への親和性を有する核酸分子の塩基配列を取得する塩基配列取得手段と、
    核酸配列を記憶する配列記憶手段と、
    前記配列記憶手段が記憶する各配列の配列構造を記憶する配列構造記憶手段と、
    前記配列記憶手段が記憶する各配列と前記標的物質との親和性の評価値を規定値として記憶する規定値記憶手段と、
    前記配列記憶手段及び前記配列構造記憶手段から、前記塩基配列取得手段が取得した塩基配列と一致する配列及び配列構造を取得し、その配列中において相補的塩基対(ステム構造)を形成し得る塩基を予測し、その塩基を前記配列から除外して一本鎖領域を抽出する一本鎖領域抽出手段と、
    前記一本鎖領域中における各配列の出現頻度の高さに、それら各配列が有する前記親和性の評価値を重み付けして、前記一本鎖領域からモチーフ配列を探索するモチーフ配列探索手段と、
    を有することを特徴とする、前記核酸分子の塩基配列のうち、前記親和性の発現に必要な塩基配列の同定装置。
  2. 前記モチーフ配列探索手段は、複数のモチーフ配列候補を生成し、前記複数のモチーフ配列候補のいずれかと一致する前記一本鎖領域を検出した際、その一本鎖領域に一致するモチーフ配列候補に対応する塩基配列の評価値を、そのモチーフ配列候補に、スコアとして加算し、最も大きいスコアを有するモチーフ配列候補を、モチーフ配列と判定することを特徴とする請求項1に記載の塩基配列の同定装置。
  3. 前記評価値は、前記標的物質と前記核酸分子との結合定数に基づいて定められた値であることを特徴とする請求項1又は2に記載の塩基配列の同定装置。
  4. 請求項1から3のいずれか一項に記載の塩基配列の同定装置と、概要構造取得手段とを含み、
    前記概要構造取得手段は、前記標的物質への親和性を有する核酸分子の二次構造から、前記モチーフ配列に一致する前記一本鎖領域と、その一本鎖領域の両端に位置する前記ステム構造とを含む構造を概要構造として取得することを特徴とする、前記核酸分子の二次構造取得装置。
  5. 請求項1に記載の塩基配列の同定装置を用い、
    前記一方鎖領域抽出手段により、前記配列記憶手段及び前記配列構造記憶手段から、前記塩基配列取得手段が取得した塩基配列と一致する配列及び配列構造を取得し、その配列中において相補的塩基対(ステム構造)を形成し得る塩基を予測し、その塩基を前記配列から除外して一本鎖領域を抽出する一本鎖領域抽出工程と、
    前記モチーフ配列探索手段により、前記一本鎖領域中における各配列の出現頻度の高さに、それら各配列が有する前記親和性の評価値を重み付けして、前記一本鎖領域からモチーフ配列を探索するモチーフ配列探索工程と、
    を有することを特徴とする、前記核酸分子の塩基配列のうち、前記親和性の発現に必要な塩基配列の同定方法。
  6. 請求項2に記載の塩基配列の同定装置を用い、
    前記モチーフ配列探索工程は、前記モチーフ配列探索手段が、複数のモチーフ配列候補を生成し、前記複数のモチーフ配列候補のいずれかと一致する前記一本鎖領域を検出した際、その一本鎖領域に一致するモチーフ配列候補に対応する塩基配列の評価値を、そのモチーフ配列候補に、スコアとして加算し、最も大きいスコアを有するモチーフ配列候補を、モチーフ配列と判定することを特徴とする請求項5に記載の塩基配列の同定方法。
  7. 請求項3に記載の塩基配列の同定装置を用い、
    前記評価値は、前記標的物質と前記核酸分子との結合定数に基づいて定められた値であることを特徴とする請求項5又は6に記載の塩基配列の同定方法。
  8. 請求項4に記載の核酸分子の二次構造取得装置を用い、
    請求項1から3のいずれか一項に記載の塩基配列の同定装置により請求項5から7のいずれか一項に記載の塩基配列の同定方法を行う塩基配列同定工程と、
    前記概要構造取得手段により、前記標的物質への親和性を有する核酸分子の二次構造から、前記モチーフ配列に一致する前記一本鎖領域と、その一本鎖領域の両端に位置する前記ステム構造とを含む構造を概要構造として取得する概要構造取得工程と、
    を有することを特徴とする核酸分子の二次構造取得方法。
  9. 請求項5から8のいずれか一項に記載の塩基配列の同定方法または核酸分子の二次構造取得方法をコンピュータ上で実行可能なことを特徴とするプログラム。
  10. 請求項9記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006283757A 2006-10-18 2006-10-18 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体 Expired - Fee Related JP4841396B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006283757A JP4841396B2 (ja) 2006-10-18 2006-10-18 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体
US12/446,199 US8200441B2 (en) 2006-10-18 2007-10-18 Method for identifying nucleotide sequence, method for acquiring secondary structure of nucleic acid molecule, apparatus for identifying nucleotide sequence, apparatus for acquiring secondary structure of nucleic acid molecule, program for identifying nucleotide sequence, and program for acquiring secondary structure of nucleic acid molecule
PCT/JP2007/070366 WO2008047876A1 (fr) 2006-10-18 2007-10-18 Procédé permettant d'identifier une séquence nucléotidique et procédé permettant d'obtenir une structure secondaire de molécule d'acide nucléique, appareil permettant d'identifier une séquence nucléotidique et appareil permettant d'obtenir une structure secondaire de molécule d'acide nucléique, et programme permettant d'ide
EP07830100A EP2077513A4 (en) 2006-10-18 2007-10-18 METHOD FOR IDENTIFYING A NUCLEOTIDE AND PROCEDURE FOR OBTAINING THE SECONDARY STRUCTURE a nucleic acid molecule DEVICE FOR IDENTIFYING A NUCLEOTIDE AND DEVICE FOR OBTAINING THE SECONDARY STRUCTURE OF NUCLEIC MOLECULE AND PROGRAM FOR IDENTIFYING A NUCLEOTIDE AND PROGRAM TO OBTAIN THE SECONDARY STRUCTURE
US13/477,714 US9311447B2 (en) 2006-10-18 2012-05-22 Method for identifying nucleotide sequence, method for acquiring secondary structure of nucleic acid molecule, apparatus for identifying nucleotide sequence, apparatus for acquiring secondary structure of nucleic acid molecule, program for identifying nucleotide sequence, and program for acquiring secondary structure of nucleic acid molecule

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006283757A JP4841396B2 (ja) 2006-10-18 2006-10-18 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2008102675A JP2008102675A (ja) 2008-05-01
JP4841396B2 true JP4841396B2 (ja) 2011-12-21

Family

ID=39314093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006283757A Expired - Fee Related JP4841396B2 (ja) 2006-10-18 2006-10-18 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体

Country Status (4)

Country Link
US (2) US8200441B2 (ja)
EP (1) EP2077513A4 (ja)
JP (1) JP4841396B2 (ja)
WO (1) WO2008047876A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4841396B2 (ja) 2006-10-18 2011-12-21 Necソフト株式会社 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体
JP5348702B2 (ja) * 2008-07-11 2013-11-20 Necソフト株式会社 特徴抽出方法、特徴抽出装置及び特徴抽出プログラム
JP2010115177A (ja) * 2008-11-14 2010-05-27 Nec Soft Ltd 分解耐性を有するrnaアプタマー分子の修飾ヌクレオチド配列の選択方法
JP5561755B2 (ja) * 2009-04-01 2014-07-30 Necソリューションイノベータ株式会社 Selex法用のプライマーの設計方法、プライマーの製造方法、アプタマーの製造方法、プライマーの設計装置、プライマー設計用コンピュータプログラムおよび記録媒体
JP5419145B2 (ja) * 2009-07-24 2014-02-19 Necソフト株式会社 アプタマー分類装置、アプタマー分類方法、プログラムおよび記録媒体
JPWO2012002541A1 (ja) * 2010-07-01 2013-08-29 独立行政法人産業技術総合研究所 標的分子の検出法
US9483463B2 (en) * 2012-09-10 2016-11-01 Xerox Corporation Method and system for motif extraction in electronic documents
EP4006154A3 (en) * 2020-10-30 2022-06-29 ARKRAY, Inc. Nucleic acid aptamer for influenza virus and detection of influenza virus

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0786469T3 (da) 1990-06-11 2006-07-10 Gilead Sciences Inc Nukleinsyreligander
JP4040764B2 (ja) * 1998-08-19 2008-01-30 富士通株式会社 遺伝子のモチーフ抽出処理装置及び遺伝子のモチーフ抽出処理方法並びに遺伝子のモチーフ抽出処理プログラムを記録した記録媒体
AU4107501A (en) * 2000-03-10 2001-09-17 Daiichi Seiyaku Co Method of anticipating interaction between proteins
JP2005245254A (ja) * 2004-03-02 2005-09-15 Kyoto Univ アプタマーのスクリーニング方法、及びアプタマー
JP2005284595A (ja) * 2004-03-29 2005-10-13 Kiyoshi Asai Rna配列情報処理方法、プログラムおよび装置
JPWO2006004182A1 (ja) * 2004-07-07 2008-04-24 日本電気株式会社 配列予測システム
JP4841396B2 (ja) 2006-10-18 2011-12-21 Necソフト株式会社 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
EP2077513A1 (en) 2009-07-08
US9311447B2 (en) 2016-04-12
EP2077513A4 (en) 2011-02-16
US20100185397A1 (en) 2010-07-22
JP2008102675A (ja) 2008-05-01
US8200441B2 (en) 2012-06-12
US20130158884A1 (en) 2013-06-20
WO2008047876A1 (fr) 2008-04-24

Similar Documents

Publication Publication Date Title
JP4841396B2 (ja) 塩基配列の同定装置、核酸分子の二次構造取得装置、塩基配列の同定方法、核酸分子の二次構造取得方法、プログラム及び記録媒体
Taskiran et al. Cell-type-directed design of synthetic enhancers
Janssens et al. Decoding gene regulation in the fly brain
Bjerrum et al. Molecular generation with recurrent neural networks (RNNs)
Leontis et al. RNA 3D structure analysis and prediction
Tayara et al. iSS-CNN: Identifying splicing sites using convolution neural network
CN105893787A (zh) 一种蛋白质翻译后修饰甲基化位点的预测方法
JP2008146538A (ja) マイクロrna検出装置、方法およびプログラム
CN104951669A (zh) 一种用于蛋白质结构预测的距离谱构建方法
Kulakovskiy et al. Discovery of DNA motifs recognized by transcription factors through integration of different experimental sources
Hassan et al. Classify a protein domain using sigmoid support vector machine
Sutanto et al. Assessing the use of secondary structure fingerprints and deep learning to classify RNA sequences
Nembot et al. Prediction of essential genes in G20 using machine learning model
Li et al. Understanding sequence conservation with deep learning
Basha Gutierrez et al. A genetic algorithm for motif finding based on statistical significance
Wang et al. Emap2sec+: detecting protein and DNA/RNA structures in Cryo-EM maps of intermediate resolution using deep learning
Aswath et al. DNA sequence classification with improved performance of supervised classifiers using nature inspired algorithms
Zheng et al. Deep learning to identify transcription start sites from CAGE data
Al Bataineh et al. TFBS detection algorithm using distance metrics based on center of mass and polyphase mapping
US20240096443A1 (en) Generalized Scaffolds for Polypeptide Display and Uses Thereof
JP5441189B2 (ja) モチーフ探索方法およびモチーフ探索装置
KR101856293B1 (ko) 회문 정보를 이용하는 패턴 매칭 방법 및 장치
Singh et al. Predicting Enhancer-Promoter Interaction from Genomic Sequence with Deep Learning
Küng et al. Decoding Stability and Epistasis in Human Myoglobin by Deep Mutational Scanning and Codon-level Machine Learning
Afanasyev et al. Multi-plateau force-extension curves of long double-stranded DNA

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111004

R150 Certificate of patent or registration of utility model

Ref document number: 4841396

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees