[go: up one dir, main page]

JP5441189B2 - モチーフ探索方法およびモチーフ探索装置 - Google Patents

モチーフ探索方法およびモチーフ探索装置 Download PDF

Info

Publication number
JP5441189B2
JP5441189B2 JP2011529960A JP2011529960A JP5441189B2 JP 5441189 B2 JP5441189 B2 JP 5441189B2 JP 2011529960 A JP2011529960 A JP 2011529960A JP 2011529960 A JP2011529960 A JP 2011529960A JP 5441189 B2 JP5441189 B2 JP 5441189B2
Authority
JP
Japan
Prior art keywords
motif
candidate
sequence
searched
aptamer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011529960A
Other languages
English (en)
Other versions
JPWO2011027869A1 (ja
Inventor
信太郎 加藤
穣 秋冨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP2011529960A priority Critical patent/JP5441189B2/ja
Publication of JPWO2011027869A1 publication Critical patent/JPWO2011027869A1/ja
Application granted granted Critical
Publication of JP5441189B2 publication Critical patent/JP5441189B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1048SELEX
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Wood Science & Technology (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、モチーフ探索方法およびモチーフ探索装置に関する。
アプタマーは、標的分子に特異的に結合する核酸リガンドである。アプタマーは、1990年、GOLD等により、初めてその概念が報告された。アプタマーは、例えば、Systematic Evolution of Ligands by Exponential Enrichment(SELEX)法により取得される(特許文献1、非特許文献1)。SELEX法は、例えば、以下のように行う。まず、標的分子をビーズ等の担体に固定化し、これにDNAおよびRNA等の核酸ライブラリーを添加する。前記標的分子に結合する核酸を、核酸プールとして回収する。そして、回収した前記核酸プール中の前記核酸を増幅し、増幅した前記核酸のクローンを再び前記標的分子に添加する。このような結合、回収、増幅という一連の工程を1ラウンドとして、数ラウンド、例えば、10ラウンド程度繰り返す。これによって、前記標的分子に対し、特異性および結合力が高い核酸のクローンの濃縮を行う。そして、あるラウンド、例えば、最終ラウンドで得られた核酸プールにおいて、前記核酸のクローンが充分に濃縮されたとき、その核酸プール中の核酸クローンについて、シーケンサにより、配列情報を取得し、また、前記核酸クローンと前記標的分子との結合実験を行う。前記結合実験により、前記核酸クローンと前記標的分子との結合が確認された場合、前記核酸クローンを前記標的分子に結合するアプタマーとし、前記配列情報を、前記アプタマーの配列情報とする。しかしながら、SELEX法によるアプタマーの取得は、長時間かかる。
特許第2763958号
Science.(1990)249,505−510.
そこで、本発明は、短時間でのアプタマーの取得を可能とする、モチーフ探索方法およびモチーフ探索装置を提供することを目的とする。
前記目的を達成するために、本発明のモチーフ探索方法は、下記(A)工程、(B)工程、(C)工程および(D)工程を含むことを特徴とする、配列上のモチーフを探索するモチーフ探索方法である。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
本発明のモチーフ探索装置は、
モチーフ候補配列を選択するモチーフ候補選択手段と、
前記モチーフ候補配列に修正を加えるモチーフ候補修正手段と、
探索対象のモチーフを決定するモチーフ決定手段とを備え、
前記モチーフ候補選択手段は、下記(A)工程および(B)工程を実行し、
前記モチーフ候補修正手段は、下記(C)工程を実行し、
前記モチーフ決定手段は、下記(D)工程を実行することを特徴とする、配列上のモチーフを探索するモチーフ探索装置である。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
本発明のアプタマー候補探索方法は、
前記本発明のモチーフ探索方法により、配列上のモチーフを探索し、
前記配列が、塩基配列であり、
前記モチーフが、前記塩基配列上のモチーフであり、
決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とすることを特徴とするアプタマー候補探索方法である。
本発明のモチーフ探索方法およびモチーフ探索装置によれば、例えば、大量の配列情報の中から、短時間でモチーフを探索可能である。
図1は、本発明のアプタマー候補探索方法の基本的な処理の流れの一例を示すフローチャート図である。 図2は、本発明のアプタマー候補探索装置の一例の実施形態を示すブロック図である。 図3は、本発明のアプタマー候補探索方法の一例の評価結果を示すグラフである。 図4は、本発明のアプタマー候補探索方法の一例の評価結果を示すグラフである。 図5は、本発明のアプタマー候補探索方法の一例の評価結果を示すグラフである。
本発明の特徴は、前述のように、大量の配列情報からモチーフを探索可能な点である。従来のシーケンサによると、取得可能な配列情報の数は、数十から百数十という数であるが、近年の次世代シーケンサによると、非常に多くの配列情報を取得可能である。したがって、例えば、次世代シーケンサと本発明とを組み合わせれば、非常に多くの配列情報からでも、目的のモチーフを検索できる。このため、例えば、前述のように、核酸ライブラリーから、前記一連の工程によって核酸プールを得る場合、前記核酸プールが、目的のアプタマーが充分に濃縮されていないラウンドのプールであっても、前記核酸プール中の核酸の配列情報から、アプタマー候補を推定可能である。この結果、アプタマーを短時間で取得可能となる。また、SELEX法では、前記一連の工程による選択によって、前記核酸ライブラリー中の核酸のうち、複数の種類の核酸は淘汰される。このため、前記核酸ライブラリーには、最終ラウンドにおいて観測されない核酸が存在し、前記核酸の中に、前記標的分子に結合可能なアプタマーが存在する可能性がある。本発明では、例えば、SELEX法において、前記核酸ライブラリー中に存在する複数の種類のアプタマーのうち、前記一連の工程によって淘汰さる可能性のあるアプタマーを取得することも可能である。
本発明において、モチーフ探索の対象は、配列である。前記配列は、特に制限されず、例えば、塩基配列、アミノ酸配列などがあげられる。本発明において、前記配列は、これらに制限されず、例えば、ある情報が時系列に並んでいるものでもよい。前記情報が時系列に並んでいるものとしては、例えば、一年間の各地の天気の情報がある。本発明において、モチーフは、例えば、複数の配列間における共通配列である。
前記配列は、具体的に、例えば、核酸クローンまたは前記核酸クローンの塩基配列ということもできる。前述のように、例えば、SELEX法によると、各ラウンドで核酸プールが得られる。そして、初期のラウンドでは、核酸クローンの多様性が非常に高く、前記標的分子に対するアプタマー候補となりうる核酸クローンの選択が困難である。一方、ラウンドが進むに従って、核酸クローンの多様性は低下し、特定の核酸クローンの占める割合が高くなる。このように、前記特定の核酸クローンが濃縮されるため、この核酸クローンを、前記標的分子に対するアプタマー候補として選択できる。本発明においては、前述のように、例えば、大量の配列情報からモチーフを検索可能である。このため、例えば、前記初期ラウンドの核酸プールのように、多数の核酸クローンを含むことから、アプタマー候補となりうる核酸クローンを選択できない場合でも、前記核酸プールに含まれる多数の核酸クローンの配列から、モチーフを決定し、アプタマー候補を決定できる。
本発明のモチーフ検索方法は、前述のように、下記(A)工程、(B)工程、(C)工程および(D)工程を含むことを特徴とする配列上のモチーフを探索するモチーフ探索方法である。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
本発明のモチーフ探索方法およびモチーフ探索装置によれば、例えば、大量の配列情報の中から、短時間でモチーフを探索可能である。したがって、本発明をアプタマーの取得方法に適用すれば、例えば、目的のアプタマーが充分に濃縮されていないラウンドのプールから配列情報を取得し、モチーフを探索することで、所望のアプタマー候補を正確に探索することが可能になる。
本発明のモチーフ探索方法は、前記(C)モチーフ候補修正工程が、例えば、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、前記(D)モチーフ決定工程が、例えば、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフと決定するモチーフ決定工程である。
本発明のモチーフ探索方法は、前記(A)第1モチーフ候補列挙工程が、下記(A1)工程〜(A6)工程を含むことが好ましい。
(A1) lminに該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(lmin)を算出する。Z(lmin)が0を超えるモチーフ配列を、初期モチーフ配列の集合Mlminとする。
(A2) モチーフの配列長さl=lminとし、集合Mlmin=Mとし、Z(lmin)=Z(l)とする。
(A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
(A4) Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
(A5) l+δ>lmaxの場合は、終了する。
(A6) l+δ≦lmaxの場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
本発明のモチーフ探索方法は、前記(B)第2次モチーフ候補選択工程において、最もZ値が高いモチーフを、前記モチーフ候補配列とすることが好ましい。
本発明のモチーフ探索方法は、前記(C)モチーフ候補修正工程が、例えば、下記(C1)工程〜(C6)工程を含むことが好ましい。
(C1) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
(C2) 前記(C1)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMとする。
(C3) i=1とする。
(C4) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
(C5) 前記(C4)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMi+1とする。
(C6) i=i+1とし、前記(C4)に戻る。
本発明のモチーフ探索方法は、さらに、下記(E)工程を含むことが好ましい。
(E) 前記(D)工程で決定された前記モチーフを評価する、モチーフ評価工程
本発明のモチーフ探索方法は、前記配列が塩基配列であり、前記モチーフが前記塩基配列上のモチーフであることが好ましい。
つぎに、本発明のアプタマー候補探索方法は、本発明のモチーフ探索方法により、配列上のモチーフを探索し、
前記配列が塩基配列であり、
前記モチーフが、前記塩基配列上のモチーフであり、
決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補の探索方法である。
本発明のアプタマー候補探索方法は、例えば、下記(A)工程、(B)工程、(C)工程、(D)工程および(F)工程を含むことを特徴とする。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
(F) 前記(D)工程で決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
本発明のアプタマー候補探索方法は、前記(C)モチーフ候補修正工程が、例えば、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、前記(D)モチーフ決定工程が、例えば、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、前記探索対象のモチーフと決定するモチーフ決定工程である。
本発明のアプタマー候補探索方法は、例えば、前記(D)モチーフ決定工程の後、さらに、前記(E)モチーフ評価工程を含んでもよい。前記(E)工程は、例えば、前記(D)工程の後であればよく、前記(F)工程の前に行ってもよいし、前記(F)工程の後に行ってもよい。
(E) 前記(D)工程で決定された前記モチーフを評価する、モチーフ評価工程
前記(F)アプタマー候補決定工程において、前記モチーフを含む塩基配列は、例えば、前記モチーフを含む塩基配列からなる核酸または前記塩基配列を含む核酸ということもできる。前記モチーフを含む塩基配列は、例えば、前記モチーフを含むクローンまたは前記モチーフを含むクローンの塩基配列ということもできる。
本発明のアプタマー候補探索方法は、さらに、下記(G)アプタマー候補評価工程を含んでいてもよい。
(G) 前記(F)工程で決定された前記アプタマー候補を評価する、アプタマー候補評価工程
本発明のアプタマー候補探索方法において、前記(A)工程〜前記(E)工程は、前記本発明のモチーフ探索方法における各工程と同様である。
本発明のモチーフ探索装置は、前述のように、
モチーフ候補配列を選択するモチーフ候補選択手段と、
前記モチーフ候補配列に修正を加えるモチーフ候補修正手段と、
探索対象のモチーフを決定するモチーフ決定手段とを備え、
前記モチーフ候補選択手段は、下記(A)工程および(B)工程を実行し、
前記モチーフ候補修正手段は、下記(C)工程を実行し、
前記モチーフ決定手段は、下記(D)工程を実行することを特徴とする、配列上のモチーフを探索するモチーフ探索装置である。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
本発明のモチーフ探索装置において、前記(C)モチーフ候補修正工程が、例えば、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、前記(D)モチーフ決定工程が、例えば、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフと決定するモチーフ決定工程である。この場合、前記モチーフ候補修正手段は、例えば、モチーフ精度向上手段ということもできる。
本発明のモチーフ探索装置は、さらに、情報を出力する出力手段を備え、前記出力手段は、前記(D)工程で決定された前記探索対象のモチーフを出力することが好ましい。
本発明のアプタマー候補検索装置は、モチーフ候補配列を選択するモチーフ候補選択手段と、
前記モチーフ候補配列に修正を加えるモチーフ候補修正手段と、
探索対象のモチーフを決定するモチーフ決定手段と、
アプタマー候補を決定するアプタマー候補決定手段とを備え、
前記モチーフ候補選択手段は、下記(A)工程および(B)工程を実行し、
前記モチーフ候補修正手段は、下記(C)工程を実行し、
前記モチーフ決定手段は、下記(D)工程を実行し、
前記アプタマー候補決定手段は、下記(F)工程を実行することを特徴とする、アプタマー候補を探索するアプタマー候補探索装置である。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
(F) 前記(D)工程で決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
本発明のアプタマー候補探索装置において、前記(C)工程が、例えば、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、前記(D)工程が、例えば、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、前記探索対象のモチーフと決定するモチーフ決定工程である。この場合、前記モチーフ候補修正手段は、例えば、モチーフ精度向上手段ということもできる。
本発明のアプタマー候補探索装置は、さらに、情報を出力する出力手段を備え、前記出力手段は、前記(D)工程で決定された前記探索対象のモチーフおよび前記(F)工程で決定されたアプタマー候補の少なくとも一方を出力することが好ましい。
本発明のコンピュータプログラムは、前記本発明のモチーフ探索方法を、コンピュータ上で実行可能なコンピュータプログラムである。
本発明のコンピュータプログラムは、前記本発明のアプタマー候補探索方法を、コンピュータ上で実行可能なコンピュータプログラムである。
本発明の記録媒体は、前記本発明のコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体である。
つぎに、本発明について、例をあげて説明する。本発明は、以下の説明には制限されない。本発明のアプタマー候補探索方法を中心として説明するが、これ以外にも、本発明は適用可能である。
[実施形態1]
本実施形態のアプタマー候補探索方法は、前述のように、下記(A)工程、(B)工程、(C)工程、(D)工程および(F)工程を含むことを特徴とする。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
(F) 前記(D)工程で決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
図1のフローチャート図に、本実施形態のアプタマー候補探索方法について、基本的な処理の流れを示す。図示のように、まず、前記(A)第1次モチーフ候補列挙工程において、長さlの範囲[lmin,lmax]に含まれる第1次モチーフ候補配列を列挙する(S1−1)。つぎに、前記(B)第2次モチーフ候補選択工程において、前記(A)工程で列挙された第1次モチーフ候補配列の中から、第2次モチーフ候補配列を選択する(S1−2)。続いて、前記(C)モチーフ候補修正工程において、前記(B)工程で選択された第2次モチーフ候補配列に対して修正を加える(S1−3)。具体的には、例えば、この修正によって、前記第2次モチーフ候補配列の精度を向上させる。前記(C)モチーフ候補修正工程は、例えば、モチーフ精度向上工程ともいう。前記(C)工程で修正された前記第2次モチーフ候補配列が、前記(D)モチーフ決定工程において、探索対象のモチーフとして決定される。具体的には、例えば、前記修正によって精度が向上された前記第2次モチーフ候補配列が、前記探索対象のモチーフとして決定される。そして、前記(F)アプタマー候補決定工程において、前記(D)工程で決定した探索対象のモチーフを含む塩基配列を、所望のアプタマー候補とする(S1−4)。具体的には、例えば、前記探索対象のモチーフを含むクローンを、所望のアプタマー候補とする。
本実施形態のアプタマー候補探索方法は、さらに、下記(E)モチーフ評価工程を含んでいてもよい。
(E) 前記(D)工程で決定された前記モチーフを評価する、モチーフ評価工程
本実施形態のアプタマー候補探索方法は、さらに、下記(G)アプタマー候補評価工程を含んでいてもよい。
(G) 前記(D)工程で決定された前記アプタマー候補を評価する、アプタマー候補評価工程
前記(A)第1次モチーフ候補列挙工程または前記(C)モチーフ候補修正工程においては、例えば、所定の値を用いて、モチーフを評価できる。以下に、モチーフを評価するための値として、Z値を一例にあげて、説明する。以下、クローンは、例えば、モチーフを有する塩基配列である。
(Z値)
塩基の集合を、Σ∈{A,T(U),G,C}とする。プールにおける各塩基の出現確率を、それぞれ、p、p(p)、p、pとする。前記クローンの長さを、Lとする。前記モチーフの長さを、lとする。前記モチーフに含まれる塩基の数を、nkj、j∈Σとする。このとき、長さlの前記モチーフを含む長さLのクローンが出現する確率Pは、下記漸化式(1)で示すことができる。ただし、下記式(1)において、P=0、L<lである。
Figure 0005441189
次に、self−overlappingのモチーフを考慮し、前記式(1)を拡張する。前記self−overlappingのモチーフは、例えば、“ATAT”のように、同じ配列“AT”が重なる配列を意味する。前記self−overlappingを有する部分文字列を、[Sk、k∈К]とする。ただし、Кは、前記self−overlappingの部分文字列の長さの集合である。例として、“ATATA”というモチーフを想定した場合、К={1、3}、S={A}、S={AT}となる。前記部分文字列[S、k∈К]に含まれる塩基の数を、[nkj、j∈Σ]とする。前記self−overlappingを有する場合、あるモチーフを含むクローンの出現確率は、下記式(2)となる。ただし、下記式(2)において、P=0、L<lである。下記式(2)は、塩基の出現確率を考慮して、任意のモチーフを含むクローンの出現確率を正確に計算する。
Figure 0005441189
全ての配列の数が一様であれば、前記モチーフを含む前記クローンの出現確率は、前記式(2)で示すことができる。他方、観測されるデータのクローンの長さは、例えば、全てが同一ではない場合がある。そこで、異なる長さのクローンが混在する中で、モチーフを含むクローンの出現確率を考える。観測されたi番目の配列の長さをLとした場合、あるモチーフを含むクローンの出現確率Pは、下記式(3)となる。仮に、全てのクローンの長さが同一であると仮定すると、P=Pとなる。
Figure 0005441189
モチーフを含むクローンの頻度をFとする。このとき、Z値は、下記式(4)となる。
Figure 0005441189
つぎに、各工程について、説明するが、これらには制限されない。
(A)第1次モチーフ候補列挙工程
前記第1次モチーフ候補列挙工程において、モチーフの列挙の方法は、特に制限されない。例えば、初期の短いモチーフを網羅的に調査し、その中から、有効なモチーフを基準に、長いモチーフを探索する方法等があげられる。これにより、例えば、指数的に増加するモチーフのパターン全てを計算することなく、長いモチーフの候補を探索可能である。
前記モチーフの長さを、前述のように、「l」で表わす。そして、探索対象となるモチーフの配列の長さの幅を、前述のように、[lmin,lmax]とする。最少の長さlminおよび最大の長さlmaxは、任意であり、ユーザが設定するパラメータである。
長さが前記範囲[lmin,lmax]に含まれる第1次のモチーフ候補配列を列挙する方法の一例を、以下に示す。第1次モチーフ候補配列の列挙は、例えば、下記の(A1)工程〜(A6)工程により行うことができる。
(A1) lminに該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(lmin)を算出する。Z(lmin)が0を超えるモチーフ配列を、初期モチーフ配列の集合Mlminとする。
(A2) モチーフの配列長さl=lminとし、集合Mlmin=Mとし、Z(lmin)=Z(l)とする。
(A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
(A4)Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
(A5)l+δ>lmaxの場合は、終了する。
(A6)l+δ≦lmaxの場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
前記(A1)工程において、集合「Mlmin」に含まれるモチーフ配列を、例えば、「要素」といい、前記モチーフ配列の数を、例えば、「要素の数」ともいう。集合「Mlmin」は、例えば、初期モチーフの集合ということもできる。
前記(A3)工程において、δは、伸長する塩基の長さであり、正の整数である。δの上限および下限は、特に制限されない。
このような手法で、第1次モチーフ候補配列を列挙することにより、下記式(5)のモチーフが列挙される。
Figure 0005441189
そのモチーフの数は、下記式(6)である。
Figure 0005441189
長さlminに該当するモチーフ配列を全て列挙するため、例えば、長さlminが大きい場合、非常に大きな計算時間を要する。長さlのモチーフの集合Mから伸長するモチーフのパターンの数は、|Σ|δである。ただし、|Σ|は、Σの要素数とする。そのため、δの値が大きいと、モチーフを伸長して評価するのに、計算コストが大きくなる。
(B)第2次モチーフ候補選択工程
前記第2次モチーフ候補選択工程において、前記第1次モチーフ候補配列の中から、前記第2次モチーフ候補配列を選択する方法は、特に制限されず、例えば、以下の方法等があげられる。
前述のように、モチーフの列挙により、長さ[lmin,lmax]の第1次モチーフ候補配列が列挙される。一般に、モチーフの長さが長くなった場合、Z値は、非常に大きくなってしまう。これは、そのモチーフの期待する出現確率が、非常に小さくなるためである。そこで、全てのZ値を補正して、長さの異なるモチーフを比較する方法を、以下に示す。
長さlのモチーフの候補のZ値の標準偏差を、下記式(7)の二重下線部とし、標本平均を、下記式(7)の下線部(破線)とする。このとき、補正したZ値であるZ値を、下記式(7)とする。
Figure 0005441189
列挙された全てのモチーフのZ値を計算し、最も高い値のモチーフを、モチーフ候補配列とする。
(C)モチーフ候補修正工程
前記モチーフ候補修正工程において、前記第2次モチーフ候補配列に修正を加えることで、例えば、その精度を向上させる。精度の向上は、例えば、スコアの向上ということもできる。前記モチーフ候補修正工程において、前記第2次モチーフ候補配列の修正方法は、特に制限されず、例えば、以下の方法等があげられる。
探索したモチーフの長さの幅を[lmin,lmax]とすると、列挙されたモチーフには、異なる長さのモチーフが混在する。一般に、モチーフの長さが長くなると、そのモチーフは確率的に出現しないため、統計的に有意となりやすい。そこで、異なる長さのモチーフを、経験分布から補正し、評価する方法を、以下に示す。得られた第2次モチーフ候補配列を元に、探索的に修正を行い、モチーフの精度を向上させる。前記修正は、例えば、置換、挿入、欠失、退化、伸長等である。
前記第2次モチーフ候補配列の精度を更に向上させる際、前記第2次モチーフ候補配列に、修正として、例えば、置換、挿入、欠失、退化、伸長等を行う。退化を行う場合、IUPACで表記されたモチーフの評価が必要となる。そこで、IUPACで表記されたモチーフを含むクローンの出現確率を示す。
IUPAC表記の塩基の集合を、Σ*∈{A,C,G,T(U),M,R,W,S,Y,K,V,H,D,B,N}とする。Self−overlappingの文字列が異なる場合、その文字列の和集合を、S,k∈Кとする。例として、モチーフ“WAW”を想定する。このモチーフが、self−overlappingするのは、k=1,2の場合である。k=1のとき、S=Wとなる。k=2のとき、前方の部分文字列が“WA”、後方の部分文字列が“AW”となる。“WA”、“AW”の和集合を部分文字列とするため、S=WWとなる。前記式(2)を拡張し、IUPAC対応の確率計算の近似式を、以下の式(8)に示す。ただし、下記式(8)において、P=0,L<lである。前記式(3)および前記式(4)と同様に、Z値を計算してモチーフの評価を行う。精度の向上は、例えば、前記式(4)と下記式(8)とを組合せることが好ましい。
Figure 0005441189
前記第2次モチーフ候補配列に、前記修正を行い、より精度の高いモチーフを、探索的に求める。一度に修正を加える上限数をγとする。前記修正は、例えば、置換、挿入、欠失、退化、伸長である。以下に修正する方法の一例について、その流れを、下記(C1)工程〜(C6)工程に示す。
(C1) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
(C2) 前記(C1)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMとする。
(C3) i=1とする。
(C4) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
(C5) 前記(C4)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMi+1とする。
(C6) i=i+1とし、前記(C4)に戻る。
(D)モチーフ決定工程
前記(C)工程において修正した前記第2次モチーフ候補配列を、探索対象のモチーフとして決定する。具体的には、前記(C)工程において、修正により精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフとして決定する。
(E)モチーフ評価工程
前記(E)モチーフ評価工程において、前記決定した前記モチーフの評価方法は、特に制限されない。前記(E)モチーフ評価工程は、任意である。
(F)アプタマー候補決定工程
前記(D)モチーフ決定工程後または前記(E)モチーフ評価工程後に、最終的に決定された前記探索対象のモチーフを含む塩基配列(クローン)を、アプタマー候補とする。前記(C)モチーフ候補修正工程において、修正を行う上限回数γが大きい場合、更新する際のモチーフのパターンの数が増大する。
(G)アプタマー候補評価工程
次に、前記(G)アプタマー候補評価工程において、選択された前記アプタマー候補について評価を行う。前記評価方法は、特に制限されず、例えば、以下の3点を考慮することが好ましい。
(G1)アプタマー候補の自由エネルギーの分布
(G2)アプタマー候補が含むモチーフの構造の類似性
(G3)アプタマー候補の二次構造の類似性
自由エネルギーおよび二次構造は、例えば、RNAfold(Nucleic Acids Res,36(Web Server issue):W70−W74, Jul 2008.)、Mford等を用いて計算できる。RNAfoldを用いる場合、RNAfoldに指定するパラメータは、例えば、“− T20 −noLonelyPairs”を指定し、温度を室温20度に設定し、単一でのペアを作らない、とすることができる。アプタマーの自由エネルギーは、ランダム配列の自由エネルギーと比較して低いことが知られている。そこで、アプタマー候補の自由エネルギーの分布が、ランダム配列の自由エネルギーの分布より低い分布であることを調査し、アプタマー候補の妥当性を評価する。アプタマー候補およびランダムに生成した配列について、それぞれの自由エネルギーの分布を得て、前記二つの分布に対して、例えば、WelchのT検定、KS検定等を適用する。検定の結果、有意でない場合、これらのアプタマー候補を、候補から除去する。
モチーフが結合に関連して濃縮されている場合、モチーフは、同様の構造を形成している。アプタマー候補の二次構造を計算し、モチーフ部分の構造を抜き出す。アプタマー候補に含まれるモチーフが構成する主な構造の度数を、<capt>とし、それ以外の構造を構成するモチーフの度数を、<capt>とする。また、モチーフを含むランダム配列を生成し、それらの中で、アプタマー候補の主な構造の度数を<crnd>とし、それ以外の構造を構成するモチーフの度数を、<crnd>とする。度数より、下記表1の分割表を得る。例えば、Fisherの正確確率検定、Chi−squared test等により、アプタマー候補の主な構造が有意に出現していない場合、これらのアプタマー候補を候補から除外する。
Figure 0005441189
同じモチーフを含むアプタマーの二次構造は、類似していると考えられる。構造の類似性を比較するため、例えば、構造のトポロジー(RNA, 11(6):853−863, Jun 2005.)を適用する。アプタマー候補の二次構造からトポロジーを求め、主なトポロジーの度数を<tapt>とし、それ以外を<tapt>とする。ランダムな配列を生成し、その中での、アプタマー候補の主な二次構造のトポロジーを<trnd>とし、それ以外を<trnd>とする。アプタマー候補のモチーフの構造の類似性の調査と同様に、下記表2の分割表を作成する。例えば、Fisherの正確確率検定、Chi−squared test等により、アプタマー候補のトポロジーが有意に出現していない場合、これらのアプタマー候補を、候補から除外する。
Figure 0005441189
機能を有するアプタマーは、一般的に、ランダムな配列より、自由エネルギーが低い。そこで、アプタマー候補の自由エネルギーの分布とランダムに生成された配列の自由エネルギーの分布との間に差があることを、検定により調べる。また、アプタマー候補に含まれるモチーフは、同じ役割を担うため、モチーフの構造が類似することが想定される。モチーフの構造を考慮して、モチーフを探索する手法も報告されている。モチーフの構造の類似性を評価するため、アプタマー候補のモチーフの構造とランダムに生成された配列のモチーフの構造との類似性の差を検定する。同様に、アプタマー候補の二次構造の類似性と、ランダムに生成された配列の二次構造の類似性との差を検定する。アプタマーの構造類似性の差を検定する際、二次構造のトポロジーを元に、類似性の評価を行う。
[実施形態2]
図2に、本実施形態のアプタマー候補探索装置の一例の構成を示す。図示のとおり、このアプタマー候補探索装置20は、モチーフ候補選択手段21とモチーフ候補修正手段(モチーフ精度向上手段ともいう。以下、同様)22とアプタマー候補決定手段23と出力手段24とを備える。モチーフ決定手段は、モチーフ候補修正手段22により修正された第2次モチーフ候補を、検索対象のモチーフとする。このため、本実施形態において、モチーフ候補修正手段(モチーフ精度向上手段)22は、モチーフ決定手段を兼ねている。また、これには制限されず、さらに、モチーフ決定手段を備えてもよい。モチーフ候補選択手段21とモチーフ候補修正手段(モチーフ精度向上手段)22とアプタマー候補決定手段23とは、例えば、図2に示すように、データ処理装置25を形成していてもよい。
モチーフ候補選択手段21は、モチーフ候補修正手段22に電気的に接続されている。モチーフ候補修正手段22は、アプタマー候補決定手段23に電気的に接続されている。アプタマー候補決定手段23は、出力手段24に電気的に接続されている。
モチーフ候補選択手段21は、前述のように、下記(A)工程および下記(B)工程を実行する。
(A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義した場合、前記範囲に含まれる第1次のモチーフ候補配列を列挙する、第1次モチーフ候補列挙工程
(B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
モチーフ候補選択手段21は、特に制限されず、例えば、中央演算処理回路(CPU)を備えてもよいし、プログラム制御により動作してもよい。本実施形態のアプタマー候補探索装置が、例えば、操作部、表示部、メモリ等を備える場合、モチーフ候補選択手段21は、例えば、これらの部材と電気的に接続されてもよい。
モチーフ候補修正手段22は、前述のように、下記(C)工程を実行する。
(C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
前記(C)工程は、例えば、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程ともいう。
モチーフ候補修正手段22は、特に制限されず、例えば、中央演算処理回路(CPU)を備えてもよいし、プログラム制御により動作してもよい。本実施形態のアプタマー候補探索装置が、例えば、操作部、表示部、メモリ等を備える場合、モチーフ候補修正手段22は、例えば、これらの部材と電気的に接続されてもよい。
本実施形態において、モチーフ候補修正手段22は、前述のように、モチーフ決定手段を兼ねることから、前述のように、下記(D)工程を実行する。
(D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
前記(D)工程は、例えば、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、前記探索対象のモチーフと決定するモチーフ決定工程ともいう。
アプタマー候補決定手段23は、前述のように、下記(F)工程を実行する。本実施形態においては、例えば、前記決定したモチーフを含むクローンを所望のアプタマー候補とする下記(F)工程を実行する。
(F) 前記(D)工程で決定した探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
アプタマー候補決定手段23は、特に制限されず、例えば、中央演算処理回路(CPU)を備えてもよいし、プログラム制御により動作してもよい。本実施形態のアプタマー候補探索装置が、例えば、操作部、表示部、メモリ等を備える場合、アプタマー候補決定手段23は、例えば、これらの部材と電気的に接続されてもよい。
出力手段24は、アプタマー候補の結果を出力する手段であればよい。前記結果は、例えば、前記アプタマー候補の配列でもよいし、アプタマー候補の塩基配列の分類結果でもよい。出力手段24は、特に制限されず、例えば、ディスプレイ装置、印刷装置等のコンピュータに備わる通常の出力装置、出力ファイル、および他のコンピュータ等を用いることができる。
次に、本発明の実施例について説明する。ただし、本発明は、下記の実施例により制限されない。
[実施例1]
モチーフ“GGTTGGTGTGGTTGG”を含むクローンの出現確率を、p=0.01に設定した。そして、前記出現確率の条件下、配列数Nを変化させて、その計算時間を測定した。前記モチーフ“GGTTGGTGTGGTTGG”は、Bockら(Nature 355(6360):564-566, 1992)に報告されている、Thrombinのモチーフである。計算環境は、以下のとおりである。
・CPU: Intel(R) Core(TM)2 CPU 2.4GHz
・Memory: 2G byte
・言語: C++
・コンパイラ: g++ −O3
生成した前記配列の長さは、40塩基長とした。これは、ランダム領域の長さが40塩基長であることから想定した。配列数Nに対するアルゴリズムの速度を計測し、その結果を下記表3に示す。
Figure 0005441189
前記表3に示すように、大量の配列データに対して、短時間で計算できたことが分かる。
[実施例2]
<アルゴリズムの評価方法>
本実施例では、シミュレーションデータを新たに生成して、アルゴリズムの評価を行った。シミュレーションデータは、PSPM(Position Specific Probabilistic Matrix)からモチーフを生成して、任意の確率クローンに挿入するものであり、配列を生成するプログラムrMotifGen(BMC Bioinformatics,8:292,2007.)で実装されている。前記rMotifGenは、低い頻度でモチーフを含む大量の配列の生成に対応していない。すなわち、配列の生成の制限、頻度の制限がある。そこで、別途データを生成するためのプログラムを作成し、データを生成した。シミュレーションでは、モデルおよび任意の確率に対して、100のデータを生成し、モチーフを含むクローンの正答率を指標として、検出力を計算した。
Aptamer Database(Nucleic Acids Res,32(Database issue):D95-100, Jan 2004.)より、2005年以降に、アプタマーの取得に成功した標的分子を10種類選択した。選択した標的分子に結合するアプタマーの配列を、前記Aptamer Databaseより取得した。取得したアプタマー配列の標的分子を、以下に示す。
・ABF1 (Autonomously replicating sequence Binding Factor 1)
(FEBS Lett, 579(20):4535-4540,Aug 2005.)
・DNA polymerase B
(Nucleic Acids Res,34(9):2579-2586,2006.)
・HCV (Hepatitis C Virus)
(Nucleic Acids Res, 33(2):683-692,2005.)
・IDI4 (Induced During Incompatibility 4)
(Eukaryot Cell,4(2):476-483, Feb 2005.)
・codein
(Nucleic Acids Res,34(19):5670-5682, 2006.)
・RdRp (RNA-dependent RNA polymerase)
(Antimicrob Agents Chemother,50(9):3019-3027, Sep 2006.)
・eIF4g (eukalyotic translation Initiation Factor 4G)
(RNA, 12(10):1825-1834, 2006)
・neuropeptide Y
(J Am Chem Soc,127(26):9382-9383, Jul 2005.)
・thrombin
(Nucleic Acids Res,33(9):2942-2951, 2005.)
・Atf1-Pcr1
(Genetics,169(4):1973-1983, Apr 2005.)
これらのデータに対して、MEME(Proc Int Conf Intell Syst Mol Biol,2:28-36,1994.)により、PSPMを作成した。MEMEのオプションには、“-zoops -dna”を含めた。
本実施例における、PSPMによるシミュレーションのデータの生成方法を、以下に示す。
(1)塩基配列の出現確率を元に、塩基配列を生成してクローンを作成する。今回は、p=p(p)=p=p=0.25とする。生成する配列の長さは、各々の文献に従う。
(2)乱数x,x∈[0,1]が、クローンがモチーフを含む確率pより低ければ、(3)へ移る。それ以外は(4)へ移る。
(3)PSPMからモチーフを作成して、クローンの内部を置換する。この際、モチーフが置換される座位は、無作為に選択される。
(4)必要な数の配列nを生成したら終了。それ以外は(1)へ移る。
PSPMから生成されたモチーフを含むクローンの出現確率pを、0.001刻みで、0.001から0.01まで変動させたデータを、100セット生成する。このとき生成されるデータの配列数は、10000である。100セット生成したデータに対してアルゴリズムを適用し、モチーフを含むクローンの特定を行う。モチーフを含むクローンで特定されたクローンの数をM、モチーフを含まないクローンで特定されたクローンをMとする。この時の正答率をR=M/(M+M)とする。三つの条件[R>0,R>0.5,R=1]の場合、アプタマーの推定に成功したとし、その時の検出力(Power)を、図3〜5に示す。図3〜5において、縦軸は、検出力(Power)を示し、横軸は、クローンの出現確率を示す。図3は、R>0の場合の結果を示す。R>0は、一つでも正解のクローンを見つけた場合であり、感度(Sensitivity)に相当する。図4は、R>0.5の場合の結果を示す。R>0.5は、正解したクローンの数が、不正解のクローンより多い場合に相当する。図5は、R=1の場合の結果を示す。R=1は、一つも偽のクローンを含まずに推定したときであり、特異度(Specificity)に相当する。
図3〜5に示した結果から、標的分子によっては、非常に低い頻度でも、高い検出力で、アプタマーを特定できることが分かった。
[実施例3]
本実施例では、大量の配列データに対して、配列解析を行う実行速度を計算した。配列数は、1万、10万、100万および1000万とした。各配列には、p=0.01の確率で、PSPMから生成される文字列が含まれる。報告されているアプタマー配列に対して、MEMEによりPSPMを作成した。実データは、ABF1、codein、DNA polymeraseB、HCV、IDI4、neuropeptide Y、RdRp、thrombin、Atf1-Pcr1およびeIF4gの10種類とした。計算環境は、以下のとおりである。
・OS: Ubuntu 9.04
・CPU: Intel(R) Core(TM)2 CPU 2.4GHz
・Memory: 2G byte
・言語: C++
・コンパイラ: g++ −O3
・使用ライブラリ:libboost version 1.37
下記表4〜表13に、それぞれの標的分子に対する計算時間および推定されたモチーフを示す。表題には、標的分子名およびPSPMから得られるIUPAC表記の配列を示す。
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
Figure 0005441189
前記表10および前記表11に示すように、「Enumerate」の段階で良いモチーフを推定している場合、「Modify」に必要とされる計算時間を短くできる。一方、前記表4および前記表5に示すように、「Enumerate」の段階で推定されたモチーフが、真のモチーフと大きく異なる場合、「Modify」に必要とされる時間が長くなる。実データから作成されたPSPMにおいて、最も多様性を有するのは、codeinである。このように、多様性のあるPSPMから得られるモチーフであっても、10万以上の配列にp=0.01の確率で含まれている状態であれば、良いモチーフの推定値を得ることができる。この場合、10万、100万、1000万の配列で推定されたモチーフは、それぞれ、codeinのconsensus配列の
「RARDR−WKRGK[RWRGGGRWWBSKKST]GKK」、
「RARDRRWKRGK[RWRGGGRWWBSKKS−]GKK」、
「RA[RDRRWKRGKRWRGGG]RWWBSKKSTGKK」
および
「RARDR[RWKR−KRWRGGGRWW]BSKKSTGKK」
に対応する。
以上、実施形態を参照して本願発明を説明したが、本願発明は、上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解しうる様々な変更をすることができる。
この出願は、2009年9月4日に出願された日本出願特願2009−205118を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、配列上のモチーフの探索に使用でき、例えば、大量の塩基配列およびアミノ酸配列データから、短時間でモチーフを探索できる。本発明は、アプタマーの探索に適用することが好ましいが、その用途は制限されず、幅広い分野に適用可能である。
20 アプタマー候補探索装置
21 モチーフ候補選択手段
22 モチーフ候補修正手段
23 アプタマー候補決定手段
24 出力手段
25 データ処理装置

Claims (20)

  1. 下記(A)工程、(B)工程、(C)工程および(D)工程を含み、前記各工程が全てコンピュータ上で実行されることを特徴とする配列上のモチーフを探索するモチーフ探索方法。
    (A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義し、複数の配列から、前記各配列上の前記範囲に含まれる第1次のモチーフ候補配列を列挙する工程であり、下記(A1)〜(A6)を含む第1次モチーフ候補列挙工程
    (A1) l min に該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(l min )を算出する。Z(l min )が0を超えるモチーフ配列を、初期モチーフ配列の集合M lmin とする。
    (A2) モチーフの配列長さl=l min とし、集合M lmin =Mとし、Z(l min )=Z(l)とする。
    (A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
    (A4)Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
    (A5)l+δ>l max の場合は、終了する。
    (A6)l+δ≦l max の場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
    (B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
    (C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
    (D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
  2. 前記(C)工程が、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、
    前記(D)工程が、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフと決定するモチーフ決定工程であることを特徴とする請求項1記載のモチーフ探索方法。
  3. さらに、下記(E)工程を含むことを特徴とする請求項1または2記載のモチーフ探索方法。
    (E) 前記(D)工程で決定された前記モチーフを評価する、モチーフ評価工程
  4. 前記(B)工程において、最もZ値が高いモチーフを、前記第2次モチーフ候補配列とすることを特徴とする、請求項1からのいずれか一項に記載のモチーフ探索方法。
  5. 前記(C)工程が、下記(C1)工程〜(C6)工程を含むことを特徴とする請求項1からのいずれか一項に記載のモチーフ探索方法。
    (C1) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
    (C2) 前記(C1)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
    修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
    修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMとする。
    (C3) i=1とする。
    (C4) 修正対象の第2次モチーフ候補をMとし、Mに対してγ以下の回数の修正を行い、修正された1つまたは複数のMを発生させる。
    (C5) 前記(C4)で修正された1つまたは複数のMのそれぞれのZ値と、修正前のMのZ値を比較し、
    修正後の1つまたは複数のMのZ値の全てが、修正前のMのZ値を超えなければ、終了し、
    修正後の1つまたは複数のMの中で、修正前のMのZ値を超えるものがある場合は、修正前のMのZ値を超える修正後の1つまたは複数のMの中で最もZ値が大きいものをMi+1とする。
    (C6) i=i+1とし、前記(C4)に戻る。
  6. 前記配列が塩基配列であり、前記モチーフが前記塩基配列上のモチーフであることを特徴とする請求項1から5のいずれ一項に記載のモチーフ探索方法。
  7. 請求項1から6のいずれか一項に記載のモチーフ探索方法により、塩基配列上のモチーフを探索し、決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする工程を含み、前記工程が全てコンピュータ上で実行されるアプタマー候補探索方法。
  8. 下記(A)工程、(B)工程、(C)工程、(D)工程および(F)工程を含むことを特徴とする、請求項7記載のアプタマー候補探索方法。
    (A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義し、複数の塩基配列から、前記各配列上の前記範囲に含まれる第1次のモチーフ候補配列を列挙する工程であり、下記(A1)〜(A6)を含む第1次モチーフ候補列挙工程
    (A1) l min に該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(l min )を算出する。Z(l min )が0を超えるモチーフ配列を、初期モチーフ配列の集合M lmin とする。
    (A2) モチーフの配列長さl=l min とし、集合M lmin =Mとし、Z(l min )=Z(l)とする。
    (A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
    (A4)Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
    (A5)l+δ>l max の場合は、終了する。
    (A6)l+δ≦l max の場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
    (B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
    (C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
    (D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
    (F) 前記(D)工程で決定した前記探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
  9. 前記(C)工程が、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、
    前記(D)工程が、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフと決定するモチーフ決定工程であることを特徴とする請求項8記載のアプタマー候補探索方法。
  10. さらに、前記アプタマー候補を評価するアプタマー候補評価工程を含むことを特徴とする請求項7からのいずれか一項に記載のアプタマー候補検索方法。
  11. モチーフ候補配列を選択するモチーフ候補選択手段と、
    前記モチーフ候補配列に修正を加えるモチーフ候補修正手段と、
    探索対象のモチーフを決定するモチーフ決定手段とを備え、
    前記モチーフ候補選択手段は、下記(A)工程および(B)工程を実行し、
    前記モチーフ候補修正手段は、下記(C)工程を実行し、
    前記モチーフ決定手段は、下記(D)工程を実行することを特徴とする、配列上のモチーフを探索するモチーフ探索装置。
    (A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義し、複数の配列から、前記各配列上の前記範囲に含まれる第1次のモチーフ候補配列を列挙する工程であり、下記(A1)〜(A6)を含む第1次モチーフ候補列挙工程
    (A1) l min に該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(l min )を算出する。Z(l min )が0を超えるモチーフ配列を、初期モチーフ配列の集合M lmin とする。
    (A2) モチーフの配列長さl=l min とし、集合M lmin =Mとし、Z(l min )=Z(l)とする。
    (A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
    (A4)Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
    (A5)l+δ>l max の場合は、終了する。
    (A6)l+δ≦l max の場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
    (B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
    (C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
    (D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
  12. 前記(C)工程が、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、
    前記(D)工程が、前記(C)工程で精度が向上した前記第2次モチーフ候補を、探索対象のモチーフと決定するモチーフ決定工程であることを特徴とする請求項11記載のモチーフ探索装置。
  13. さらに、情報を出力する出力手段を備え、
    前記出力手段は、前記(D)工程で決定された前記探索対象のモチーフを出力することを特徴とする請求項11または12記載のモチーフ探索装置。
  14. モチーフ候補を選択するモチーフ候補選択手段と、
    前記モチーフ候補配列に修正を加えるモチーフ候補修正手段と、
    探索対象のモチーフを決定するモチーフ決定手段と、
    アプタマー候補を決定するアプタマー候補決定手段とを備え、
    前記モチーフ候補選択手段は、下記(A)工程および(B)工程を実行し、
    前記モチーフ候補修正手段は、下記(C)工程を実行し、
    前記モチーフ決定手段は、下記(D)工程を実行し、
    前記アプタマー候補決定手段は、下記(F)工程を実行することを特徴とする、アプタマー候補を探索するアプタマー候補探索装置。
    (A) 探索対象となるモチーフの配列の最小の長さをlminとし、前記探索対象となるモチーフの配列の最大長さをlmaxとし、前記探索対象となるモチーフの長さlの範囲を[lmin,lmax]と定義し、複数の塩基配列から、前記各配列上の前記範囲に含まれる第1次のモチーフ候補配列を列挙する工程であり、下記(A1)〜(A6)を含む第1次モチーフ候補列挙工程
    (A1) l min に該当するモチーフ配列を全て列挙し、列挙された各モチーフ配列のZ値であるZ(l min )を算出する。Z(l min )が0を超えるモチーフ配列を、初期モチーフ配列の集合M lmin とする。
    (A2) モチーフの配列長さl=l min とし、集合M lmin =Mとし、Z(l min )=Z(l)とする。
    (A3) 集合Mに含まれる各モチーフ配列にδ(デルタ)の長さの配列を加えたモチーフ配列をl+δとし、各l+δのZ値であるZ(l+δ)を算出する。
    (A4)Z(l)とZ(l+δ)の大きさを比較し、Z(l+δ)>Z(l)であるモチーフ配列の集合をMとする。
    (A5)l+δ>l max の場合は、終了する。
    (A6)l+δ≦l max の場合は、前記(A4)の集合Mの各モチーフ配列l+δをlにして、前記(A3)に戻る。
    (B) 前記(A)工程で列挙された前記第1次モチーフ候補配列の中から、第2次のモチーフ候補配列を選択する、第2次モチーフ候補選択工程
    (C) 前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加える、モチーフ候補修正工程
    (D) 前記(C)工程で修正を加えた前記第2次モチーフ候補配列を、探索対象のモチーフと決定する、モチーフ決定工程
    (F) 前記(D)工程で決定した探索対象のモチーフを含む塩基配列を、アプタマー候補とする、アプタマー候補決定工程
  15. 前記(C)工程が、前記(B)工程で選択された前記第2次モチーフ候補配列に対して修正を加えて精度を向上させるモチーフ精度向上工程であり、
    前記(D)工程が、前記(C)工程で精度が向上した前記第2次モチーフ候補配列を、探索対象のモチーフと決定するモチーフ決定工程であることを特徴とする請求項14記載のアプタマー候補探索装置。
  16. さらに、情報を出力する出力手段を備え、
    前記出力手段は、前記(D)工程で決定された前記探索対象のモチーフおよび前記(F)工程で決定された前記アプタマー候補の少なくとも一方を出力することを特徴とする請求項14または15記載のアプタマー候補探索装置。
  17. 請求項1からのいずれか一項に記載のモチーフ探索方法を、コンピュータ上で実行可能なコンピュータプログラム。
  18. 請求項17記載のコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体。
  19. 請求項7から10のいずれか一項に記載のアプタマー候補探索方法を、コンピュータ上で実行可能なコンピュータプログラム。
  20. 請求項19記載のコンピュータプログラムが格納されたコンピュータ読み取り可能な記録媒体。
JP2011529960A 2009-09-04 2010-09-03 モチーフ探索方法およびモチーフ探索装置 Expired - Fee Related JP5441189B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011529960A JP5441189B2 (ja) 2009-09-04 2010-09-03 モチーフ探索方法およびモチーフ探索装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009205118 2009-09-04
JP2009205118 2009-09-04
JP2011529960A JP5441189B2 (ja) 2009-09-04 2010-09-03 モチーフ探索方法およびモチーフ探索装置
PCT/JP2010/065168 WO2011027869A1 (ja) 2009-09-04 2010-09-03 モチーフ探索方法およびモチーフ探索装置

Publications (2)

Publication Number Publication Date
JPWO2011027869A1 JPWO2011027869A1 (ja) 2013-02-04
JP5441189B2 true JP5441189B2 (ja) 2014-03-12

Family

ID=43649404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011529960A Expired - Fee Related JP5441189B2 (ja) 2009-09-04 2010-09-03 モチーフ探索方法およびモチーフ探索装置

Country Status (2)

Country Link
JP (1) JP5441189B2 (ja)
WO (1) WO2011027869A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6012085B2 (ja) * 2012-11-13 2016-10-25 Necソリューションイノベータ株式会社 サルモネラに結合する核酸分子およびその用途

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187666A (ja) * 1996-12-27 1998-07-21 Nec Corp タンパク質及び遺伝子の配列の確率的モチーフ発見方法
JP2007108949A (ja) * 2005-10-12 2007-04-26 Ajinomoto Co Inc 遺伝子発現制御配列の推定方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187666A (ja) * 1996-12-27 1998-07-21 Nec Corp タンパク質及び遺伝子の配列の確率的モチーフ発見方法
JP2007108949A (ja) * 2005-10-12 2007-04-26 Ajinomoto Co Inc 遺伝子発現制御配列の推定方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JPN6013015036; PESOLE, G.: 'WORDUP: an efficient algorithm for discoveringstatistically significant patterns in DNA sequences' NucleicAcids Research Vol.20, No.11, 199206, p.2871-2875 *
JPN6013015038; OGIWARA, A.: 'Construction of a dictionary of sequence motifs thatcharacterize groups of related proteins' Protein Engineering Vol.5, No.6, 199209, p.479-488 *
JPN6013015043; SMITH, H.O.: 'Finding sequence motifs in groups of functionallyrelated proteins' Proceedings of the National Academy ofSciences of the United States of America Vol.87, No.2, 199001, p.826-830 *
JPN6013015045; van HELDEN, J.: 'Extracting regulatory sites from the upstreamregion of yeast genes by computational analysis ofoligo' Journal of molecular biology Vol.281, No.5, 199809, p.827-842 *

Also Published As

Publication number Publication date
WO2011027869A1 (ja) 2011-03-10
JPWO2011027869A1 (ja) 2013-02-04

Similar Documents

Publication Publication Date Title
Shapiro et al. Bridging the gap in RNA structure prediction
Niu et al. CirRNAPL: a web server for the identification of circRNA based on extreme learning machine
KR20160073406A (ko) 방향성 비순환 구조에서 쌍형성된-말단 데이터를 사용하기 위한 시스템 및 방법
Heller et al. ssHMM: extracting intuitive sequence-structure motifs from high-throughput RNA-binding protein data
JP2015119718A (ja) アプタマーを選択する方法
US9311447B2 (en) Method for identifying nucleotide sequence, method for acquiring secondary structure of nucleic acid molecule, apparatus for identifying nucleotide sequence, apparatus for acquiring secondary structure of nucleic acid molecule, program for identifying nucleotide sequence, and program for acquiring secondary structure of nucleic acid molecule
Sasse et al. Motif models for RNA-binding proteins
JP2008146538A (ja) マイクロrna検出装置、方法およびプログラム
Rampášek et al. RNA motif search with data-driven element ordering
CN113066527A (zh) 一种siRNA敲减mRNA的靶点预测方法和系统
Runge et al. Rnabench: A comprehensive library for in silico rna modelling
JP5441189B2 (ja) モチーフ探索方法およびモチーフ探索装置
Yamamoto et al. dsRID: in silico identification of dsRNA regions using long-read RNA-seq data
Backofen et al. Comparative RNA genomics
Xulvi-Brunet et al. Computational analysis of fitness landscapes and evolutionary networks from in vitro evolution experiments
CN108595914B (zh) 一种烟草线粒体rna编辑位点高精度预测方法
KR100793505B1 (ko) 복수의 표적 mRNA에 적용 가능한 siRNA염기서열을 추출하는 방법
Backofen et al. Comparative RNA genomics
Zhong et al. Improved Pre‐miRNA Classification by Reducing the Effect of Class Imbalance
Barash et al. Energy minimization methods applied to riboswitches: a perspective and challenges
Sharma et al. An experimental comparison of PMSprune and other algorithms for motif search
Montaseri et al. Evaluating the quality of SHAPE data simulated by k-mers for RNA structure prediction
Golabi et al. Development of a new sequential block finding strategy for detection of conserved sequences in riboswitches
Gajula et al. Role of bioinformatics in agriculture
Khaladkar et al. Detecting conserved secondary structures in RNA molecules using constrained structural alignment

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131212

R150 Certificate of patent or registration of utility model

Ref document number: 5441189

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees