[go: up one dir, main page]

JP2024527307A - ヌクレオチド塩基コール及び塩基コール品質を決定するための信号対雑音比メトリック - Google Patents

ヌクレオチド塩基コール及び塩基コール品質を決定するための信号対雑音比メトリック Download PDF

Info

Publication number
JP2024527307A
JP2024527307A JP2023579787A JP2023579787A JP2024527307A JP 2024527307 A JP2024527307 A JP 2024527307A JP 2023579787 A JP2023579787 A JP 2023579787A JP 2023579787 A JP2023579787 A JP 2023579787A JP 2024527307 A JP2024527307 A JP 2024527307A
Authority
JP
Japan
Prior art keywords
signal
nucleotide
noise ratio
noise
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023579787A
Other languages
English (en)
Other versions
JPWO2023278927A5 (ja
Inventor
エリック・ジョン・オジャード
ニティン・ウドパ
アブデ・アリ・カガルワラ
ジョン・エス・ヴィエチェリ
ラミ・メヒオ
Original Assignee
イルミナ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ インコーポレイテッド filed Critical イルミナ インコーポレイテッド
Publication of JP2024527307A publication Critical patent/JP2024527307A/ja
Publication of JPWO2023278927A5 publication Critical patent/JPWO2023278927A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Figure 2024527307000001
本開示は、タグ付けされたヌクレオチド塩基が付加されたオリゴヌクレオチドのクラスターの信号対雑音比メトリックを生成し、かつ信号対雑音比メトリックを利用してヌクレオチド塩基コールを生成し、塩基コール品質を決定することができる方法、非一時的コンピュータ可読媒体、及びシステムを説明する。例えば、開示されるシステムは、オリゴヌクレオチドのクラスターから検出された光信号に関連付けられたスケーリングファクタ及び雑音レベルを使用して、信号対雑音比メトリックを生成することができる。開示されるシステムは、信号対雑音比メトリックを利用して、1つ以上の塩基コール分布モデルに従って、信号についてのヌクレオチド塩基コールを生成するための強度-値境界を生成することができる。追加的に、開示されるシステムは、閾値を利用して、低い信号対雑音比メトリックを有する、オリゴヌクレオチドのクラスターから検出された信号をフィルタリングして除去することができる。開示されるシステムは、信号対雑音比メトリックを更に利用して、生成されたヌクレオチド塩基コールの品質メトリックを生成することができる。

Description

(関連出願の相互参照)
本出願は、2021年6月29日に出願された米国仮出願第63/216,401号の利益及び優先権を主張する。上記出願は、参照によりその全体が本明細書に組み込まれる。
近年、バイオテクノロジ企業及び研究機関は、核酸試料中のヌクレオチド塩基(「核酸塩基」とも呼ばれる)の配列を決定するために使用されるハードウェア及びソフトウェアプラットフォームを改善してきた。例えば、いくつかの既存の核酸配列決定プラットフォームは、従来のサンガー配列決定を使用することによって、又は合成による配列決定(sequencing-by-synthesis、SBS)を使用することによって、核酸配列の個々のヌクレオチド塩基を決定する。SBSを使用する場合、既存のプラットフォームは、より正確なヌクレオチド塩基コールを検出するために、並行して合成される数千、数万、又はそれ以上の核酸ポリマーをモニタリングすることができる。例えば、SBSプラットフォームにおけるカメラは、そのような合成された核酸配列(多くの場合、クラスターに分けられる)に組み込まれたヌクレオチド塩基からの照射された蛍光タグの画像を捕捉することができる。画像を捕捉した後、既存のSBSプラットフォームは、配列決定データ分析ソフトウェアを有するコンピューティング装置に画像データを送信して、核酸ポリマーのヌクレオチド塩基配列を決定する。配列決定データ分析ソフトウェアは、画像データにおいて捕捉された光信号に基づいて、所与の画像において検出されたヌクレオチド塩基を決定することができる。ヌクレオチド塩基をオリゴヌクレオチドに反復して組み込み、様々な配列決定サイクルにおいて放出された光信号の画像を捕捉することによって、SBSプラットフォームは、核酸試料中に存在するヌクレオチド塩基の配列を決定することができる。
これらの最近の進歩にもかかわらず、既存の配列決定プラットフォームは、典型的には、これらのプラットフォームの精度及び柔軟性を妨げる技術的制限に悩まされている。特に、柔軟性のない強度-値境界モデルは、多くの場合、そのような配列決定プラットフォームが、正しいヌクレオチド塩基コールを行うために画像データにおいて捕捉された光信号を解釈することを妨げる。更に、欠陥のある塩基コール品質モデル及びフィルタリングモデルは、決定されたヌクレオチド塩基コールの精度を決定するためのそのようなプラットフォームの能力を制限する傾向がある。
実際、既存の配列決定プラットフォームの強度-値境界モデルは、ヌクレオチド塩基コールを行うときに、ヌクレオチド塩基の照射された蛍光タグから放出される光信号を解釈してそれらのヌクレオチド塩基を分類するときに、不正確さをもたらすことが多い。例えば、いくつかの既存のプラットフォームは、光信号に関連付けられた強度値(例えば、波長及び/又は輝度値)を対応するヌクレオチド塩基にマッピングする決定境界を使用して、ヌクレオチド塩基コールを生成する。しかしながら、これらのプラットフォームは、所与の光信号に対して不適切である(例えば、強度値をヌクレオチド塩基に正確にマッピングしない)決定境界を使用する場合があり、不正確なヌクレオチド塩基コールをもたらす。そのような不正確なコールは、多くの場合、全ての光信号に対する決定境界の同じセットのいくつかの既存のプラットフォームによる厳格な適用によって引き起こされる。実際、既存の配列決定プラットフォームは、単一モデル(例えば、単一ガウス混合モデル)を使用して、全ての検出された光信号に使用される決定境界を生成し得る。しかしながら、異なる光信号は、関連付けられた強度値に影響を及ぼす様々な要因(信号純度の様々なレベルなど)を有し得る。これらの要因を考慮しないことによって、既存のプラットフォームは、決定境界を光信号の特性に合わせて柔軟に調整することができない。
いくつかの既存の配列決定プラットフォームは、核酸ポリマーの問題のあるクラスターをフィルタリングして除去することによって(例えば、結果として得られた塩基コールデータから対応するヌクレオチド塩基コールを除外することによって)、ヌクレオチド塩基コールの生成の不正確さを回避しようと試みる。例えば、既存のプラットフォームは、対応する光信号の純度値を分析する純度フィルタを使用して核酸ポリマーのクラスターをフィルタリングして除去することができる。純度値は、光信号に関連付けられた強度と最も近いヌクレオチド塩基の重心との間の距離と、当該強度と別の重心(例えば、2番目に近い重心)との間の距離と、の比として決定することができる。
既存のプラットフォームは、クラスターのヌクレオチド塩基コールを、その純度値が閾値を満たすことができず(例えば、配列決定サイクルの第1のセット内で複数回)、放出された光信号は低品質で信頼できない(例えば、対応するヌクレオチド塩基コールが不正確であり得る)ことを示す場合、フィルタリングして除去することができる。しかし、クラスターは、配列決定が進行するにつれてより問題となり得る。実際に、初期の配列決定サイクルにおいて純度フィルタを満たすクラスターの低品質が、後の配列決定サイクルにおいて表面化する場合がある。純度フィルタを使用することによって、多くの既存のプラットフォームは、これらの問題のあるクラスターを適切に同定することができない。したがって、そのようなプラットフォームは、これらのクラスターから放出される不十分な光信号に基づいて信頼できないヌクレオチド塩基コールを生成し、これらのヌクレオチド塩基コールを塩基コールデータに含める傾向がある。
正確なヌクレオチド塩基コールを生成すること、及び信頼できない光信号を放出する核酸ポリマーをフィルタリングして除去することに関する問題に加えて、既存の配列決定プラットフォームは、所与のヌクレオチド塩基コールの品質を決定する際に不正確であることが多い。例えば、多くの既存のプラットフォームは、ヌクレオチド塩基コールの誤差の可能性を推定するPhred品質スコアなどのメトリックを決定する。しかしながら、この品質スコアを決定するために使用されるモデルは、ヌクレオチド塩基コールに関連付けられた(例えば、対応する光信号に関連付けられた)多くの特徴を、そのような特徴がヌクレオチド塩基コールの品質に有意に寄与する場合であっても、考慮されないままにする。したがって、既存のプラットフォームは、ヌクレオチド塩基コールの品質を正確に推定することができないことが多い。
更に、前述したように、既存のプラットフォームは、ヌクレオチド塩基コールを生成するために使用される決定境界を光信号の特性に合わせて調整することができない。多くの事例では、品質推定は、ヌクレオチド塩基コールの生成に使用される決定境界に本質的に結び付けられている。したがって、光信号の強度値をヌクレオチド塩基に正確にマッピングすることができない決定境界を使用することは、結果として得られるヌクレオチド塩基コールの品質の不正確な推定につながる可能性もある。
本開示は、ヌクレオチド塩基の蛍光タグから放出される光信号の信号対雑音比メトリックを決定し、そのような信号対雑音比メトリックを使用して、より正確かつ柔軟な塩基コールを決定する方法、非一時的コンピュータ可読媒体、及びシステムの実施形態を説明する。例えば、開示されるシステムは、タグ付けされたヌクレオチド塩基が付加されるオリゴヌクレオチドの様々なクラスターに対して、別個の信号対雑音比メトリックを決定することができる。開示されるシステムは、クラスターから放出される光信号に関連付けられた強度値を利用して、その対応する信号対雑音比メトリックを決定することができる。例えば、開示されるシステムは、クラスターの光信号のスケーリングファクタ及び雑音レベルに基づいて、オリゴヌクレオチドのクラスター内の標識ヌクレオチド塩基の信号対雑音比メトリックを決定する。場合によっては、開示されるシステムは、各配列決定サイクル後に信号対雑音比メトリックを更新する。
開示されるシステムは、以下で更に説明される様々な塩基コーリング用途のために、クラスターと関連付けられるそのような信号対雑音比メトリックを利用することができる。例えば、開示されるシステムは、そのような信号対雑音比メトリックを使用して、塩基コール分布モデル(例えば、セグメント化ガウス混合モデル)に従って異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成し、低品質のクラスターをフィルタリングして除去し、及び/又はヌクレオチド塩基コールの品質スコアを決定することができる。そのような信号対雑音比メトリックを利用することによって、開示されるシステムは、ヌクレオチド塩基コールを決定するために使用される異なるヌクレオチドクラウド間の決定境界を、検出された光信号の特性に合わせて柔軟に調整し、より正確な塩基コーリングを可能にする。更に、開示されるシステムは、低品質ウェルをより正確にフィルタリングし、所与のヌクレオチド塩基コールの品質スコアをより正確に決定するために、信号対雑音比メトリックを利用することができる。
本開示の1つ以上の実施形態の追加の特徴及び利点は、以下の説明において概説される。
詳細な説明は、以下に簡単に説明される図面を参照する。
1つ以上の実施形態に従って、信号対雑音認識塩基コーリングシステムを含む配列決定システムのブロック図を図示する。 1つ以上の実施形態に従って、信号対雑音比メトリックを生成及び利用する信号対雑音認識塩基コーリングシステムの概観図を図示する。 1つ以上の実施形態に従って、信号対雑音比メトリックを決定するための図を図示する。 1つ以上の実施形態に従って、分布モデルセグメンテーションのために信号対雑音比メトリックを利用するブロック図を図示する。 1つ以上の実施形態に従って、ヌクレオチド塩基コールをフィルタリングするために、信号の信号対雑音比メトリックを利用するためのブロック図を図示する。 1つ以上の実施形態に従って、ヌクレオチド塩基コールの品質メトリックを生成するためのブロック図を図示する。 1つ以上の実施形態に従って、信号対雑音認識塩基コーリングシステムの有効性に関する研究結果を反映するグラフを図示する。 1つ以上の実施形態に従って、信号対雑音認識塩基コーリングシステムの有効性に関する追加の研究結果を反映するグラフを図示する。 1つ以上の実施形態に従って、信号対雑音認識塩基コーリングシステムの有効性に関する追加の研究結果を反映するグラフを図示する。 1つ以上の実施形態に従って、信号対雑音比メトリックを使用してヌクレオチド塩基コールの品質メトリックを生成するための一連の動作のフローチャートを図示する。 1つ以上の実施形態に従って、信号対雑音比メトリックを使用して信号に対応するヌクレオチド塩基コールをフィルタリングするための一連の動作のフローチャートを図示する。 1つ以上の実施形態に従って、信号対雑音比メトリックを使用して信号対雑音範囲の強度-値境界を生成するための一連の動作のフローチャートを図示する。 本開示の1つ以上の実施形態を実装するための例示的なコンピューティング装置のブロック図を図示する。
本開示は、ヌクレオチド塩基コールを決定し、ヌクレオチド塩基コールの品質を測定し、低品質ウェルをフィルタリングして除去するために信号対雑音比メトリックを利用する信号対雑音認識塩基コーリングシステムの1つ以上の実施形態を説明する。特に、いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、オリゴヌクレオチドのクラスターを含有するヌクレオチド-試料スライドのセクション(例えば、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクション)の信号対雑音比メトリックを決定する。例えば、信号対雑音認識塩基コーリングシステムは、クラスターによって放出される光信号の強度値に対応するスケーリングファクタ及び雑音レベルに基づいて、信号対雑音比メトリックを決定することができる。
信号対雑音認識塩基コーリングシステムは、そのような信号対雑音比メトリックを利用して、様々な用途を通して、より良好な品質又はより正確な核酸塩基コールを決定することができる。例えば、場合によっては、信号対雑音認識塩基コーリングシステムは、信号対雑音比メトリックを利用して、1つ以上の塩基コール分布モデル(例えば、セグメント化されたガウス混合モデル)に従って、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成する。いくつかの事例では、信号対雑音認識塩基コーリングシステムは、信号対雑音閾値を使用又は確立し、信号対雑音比メトリックが閾値を満たさない場合、ヌクレオチド-試料スライドのセクションに関連付けられたヌクレオチド塩基コールを配列決定データからフィルタリングして除去する。いくつかの実施形態では、信号対雑音認識塩基コーリングシステムは、信号対雑音比メトリックを、ヌクレオチド-試料スライドのセクションについて生成されたヌクレオチド塩基コールの品質を推定するモデル(例えば、Phredアルゴリズム)への入力として利用する。
直前に述べたように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを決定する。1つ以上の実施形態では、信号対雑音比メトリックは、ヌクレオチド-試料スライドのそのセクションに特異的であり、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドの他のセクションの他の信号対雑音比メトリックを決定する。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、各配列決定サイクルでヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを更新する。
上記で示唆したように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションから検出された信号(例えば、光信号)の強度値に基づいて、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを決定する。例えば、信号対雑音認識塩基コーリングシステムは、検出された信号についてのスケーリングファクタを決定することができる。場合によっては、信号対雑音認識塩基コーリングシステムは、信号の強度値に基づいて最小二乗アルゴリズムを使用してスケーリングファクタを決定する。信号対雑音認識塩基コーリングシステムは、検出された信号に対応する雑音レベルを更に決定することができる。例えば、いくつかの実施形態では、信号対雑音認識塩基コーリングシステムは、信号についての補正された強度値に基づいて雑音レベルを決定する。信号対雑音認識塩基コーリングシステムは、スケーリングファクタ及び雑音レベルの両方に基づいて信号対雑音比メトリックを決定することができる。
更に上述したように、いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、信号対雑音比メトリックを利用して、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成する。例示すると、ある特定の場合では、信号対雑音認識塩基コーリングシステムは、(例えば、配列決定サイクル中に検出された信号に基づいて)ヌクレオチド-試料スライドの複数のセクションの信号対雑音比メトリックを生成する。信号対雑音認識塩基コーリングシステムは、決定された信号対雑音比メトリックについての信号対雑音比範囲を決定し、塩基コール分布モデルを各信号対雑音比範囲に関連付けられたヌクレオチド-試料スライドセクションにフィッティングすることができる。次いで、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションについてのヌクレオチド塩基コールを、ヌクレオチド-試料スライドのそのセクションの信号対雑音比メトリックを包含する信号対雑音比範囲の塩基コール分布モデルに従って生成することができる。
追加的に、上述のように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、配列決定から生じるヌクレオチド塩基コールデータ(例えば、配列決定データ)から対応するヌクレオチド塩基コールをフィルタリングして除去するかどうかを決定する際に、ヌクレオチド-試料スライドセクションの信号対雑音比メトリックを利用する。実際、いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、信号対雑音比閾値を確立する。信号対雑音比メトリックが信号対雑音比閾値を満たすと決定すると、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションに対するヌクレオチド塩基コールを決定し、ヌクレオチド塩基コールデータ内に含めることができる。信号対雑音比メトリックが信号対雑音比閾値を満たさない場合、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションのヌクレオチド塩基コールをヌクレオチド塩基コールデータから除外することができる。
強度-値境界の生成又はフィルタリングに加えて(又はその代わりに)、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを利用して、ヌクレオチド-試料スライドのセクションについて生成されたヌクレオチド塩基コールの品質を推定する。例えば、場合によっては、信号対雑音認識塩基コーリングシステムは、信号対雑音比メトリックを、塩基コール品質モデル(例えば、Phredアルゴリズム)への入力として提供する。信号対雑音認識塩基コーリングシステムは、塩基コール品質モデルを利用して、信号対雑音比メトリックに基づいてヌクレオチド塩基コールの誤差を推定する品質メトリックを生成することができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、信号対雑音比メトリックを、塩基コール品質モデルへの多くの入力のうちの1つとして(例えば、純度値とともに)提供する。
信号対雑音認識塩基コーリングシステムは、従来の配列決定プラットフォームを上回るいくつかの利点を提供する。例えば、始めに、信号対雑音認識塩基コーリングシステムは、蛍光タグによって放出され、カメラによって捕捉される光信号の信号対雑音比メトリックを決定するための新しい計算モデルを導入する。特に、開示される計算モデルは、光信号の純度を分解し、蛍光タグによって放出された光の波長又は強度に関連付けられた雑音に関連させることによって、光信号に対応する信号対雑音比メトリックを決定する。例えば、上及び下で説明されるように、計算モデルは、検出された光信号をスケーリングファクタ及び雑音レベルに分け、これらの値に基づいて信号対雑音比メトリックを決定することができる。そうすることによって、計算モデルは、ヌクレオチド塩基コールに対応する光信号と雑音とをより正確に区別することができる。ヒトの精神は、標識ヌクレオチド塩基から放出される光信号を検出することができず、ましてや、関連付けられた雑音から光信号を分離することができない。したがって、信号対雑音比メトリックを決定することによって、新しい計算モデルは、以前は配列決定プラットフォームに利用不可能であった機能性を提供する。
信号対雑音比メトリックを利用することによって、信号対雑音認識塩基コーリングシステムは、ヌクレオチド塩基コールを改善する。例えば、上述したように、信号対雑音認識塩基コーリングシステムは、ヌクレオチド塩基コールを生成するために使用される塩基コール分布モデルを様々な信号対雑音比範囲にフィッティングする。これらの塩基コール分布モデルは、ヌクレオチド塩基コールが基づく強度-値境界(例えば、決定境界)を提供する。したがって、信号対雑音認識塩基コーリングシステムは、強度-値境界を、ヌクレオチド-試料スライドのセクションから検出される信号に関連付けられた信号純度の様々なレベルに合わせて、柔軟に調整する。以下に説明する結果によって更に実証されるように、信号対雑音認識塩基コーリングシステムは、それらの放出された信号に適切な強度-値境界を使用して、ヌクレオチド-試料スライドのセクションのヌクレオチド塩基コールを改善し、より正確なヌクレオチド塩基コールがもたらされる。
信号対雑音比メトリックを利用することによって、信号対雑音認識塩基コーリングシステムはまた、ヌクレオチド-試料スライドのセクションの低品質の塩基コールをフィルタリングして除去する。特に、信号対雑音認識塩基コーリングシステムは、不十分な信号を放出しているヌクレオチド-試料スライドのセクションをより正確に同定する。実際、信号対雑音認識塩基コーリングシステムは、後の配列決定サイクルにおいて誤差を表面化するためだけに従来の配列決定プラットフォームによって実装される純度フィルタを、そうでなければ通過するヌクレオチド-試料スライドのセクションを同定することができる。フィルタリングプロセスを改善することによって、信号対雑音認識塩基コーリングシステムは、より正確で、より信頼性のあるヌクレオチド塩基コールデータを生成する。
改善されたヌクレオチド塩基コール及び改善されたフィルタリングに加えて、信号対雑音認識塩基コーリングシステムは、従来の配列決定プラットフォームよりも正確にヌクレオチド塩基コール品質を決定する。実際、信号対雑音比メトリックを利用することによって、信号対雑音認識塩基コーリングシステムは、ヌクレオチド塩基コールの品質をより正確に推定することができる。例えば、上述のように、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを、塩基コール品質モデル(例えば、Phredモデル)への入力として提供することができる。したがって、信号対雑音認識塩基コーリングシステムは、従来の配列決定プラットフォームと比較して、ヌクレオチド塩基コール品質の新規かつ改善された(場合によっては追加の)指標を利用し、より正確な品質推定を可能にする。更に、検出された光信号の特性に合わせて調整された強度-値境界を使用することによって、これらの強度-値境界に結び付けられた品質推定も、光信号の特性に合わせて調整される。
前述の議論によって示されるように、本開示は、信号対雑音認識塩基コーリングシステムの特徴及び利点を説明するために、様々な用語を利用する。ここで、そのような用語の意味に関して更なる詳細を提供する。例えば、本明細書で使用される場合、用語「ヌクレオチド-試料スライド」は、試料についてヌクレオチドセグメントを配列決定するためのオリゴヌクレオチドを含むプレート又はスライドを指す。特に、ヌクレオチド-試料スライドは、配列決定の一部として試薬及び緩衝液が移動することができる流体チャネルを含有するスライドを指す。例えば、1つ以上の実施形態では、ヌクレオチド-試料スライドは、小さな流体チャネル及びアダプター配列に相補的な短いオリゴヌクレオチドを含むフローセル(例えば、パターン化されたフローセル又はパターン化されていないフローセル)を含む。
関連して、本明細書中で使用される場合、用語「ヌクレオチド-試料スライドのセクション」(又は「ヌクレオチド-試料スライドセクション」)は、ヌクレオチド-試料スライドの一部である領域を指す。特に、ヌクレオチド-試料スライドのセクションは、ヌクレオチド-試料スライドの他の部分とは異なるヌクレオチド-試料スライドの個別の部分を指すことができる。例えば、ヌクレオチド試料スライドのセクションは、パターン化されたフローセルのウェル(例えば、ナノウェル)又はパターン化されていないフローセルの個別のサブセクション(例えば、クラスターに対応するサブセクション)を含むことができる。場合によっては、ヌクレオチド試料スライドのセクションは、平行して成長中の同じ又は類似のオリゴヌクレオチドのクラスターを有するタイル又はサブタイルを含む。
追加的に、本明細書中で使用される場合、用語「標識ヌクレオチド塩基」は、ヌクレオチド塩基の分類の蛍光又は光ベースの指標を有するヌクレオチド塩基を指す。特に、標識ヌクレオチド塩基は、塩基のタイプ(例えば、アデニン、シトシン、チミン、又はグアニン)を同定するための蛍光又は光ベースの指標を組み込むヌクレオチド塩基を指すことができる。例えば、1つ以上の実施形態では、標識ヌクレオチド塩基は、塩基タイプを同定する信号を放出する蛍光タグを有するヌクレオチド塩基を含む。
更に、本明細書中で使用される場合、用語「信号」は、標識ヌクレオチド塩基又は標識ヌクレオチド塩基(例えば、オリゴヌクレオチドのクラスターに付加された標識ヌクレオチド塩基)の群から放出されるか、反射されるか、又はそうでなければ伝達される信号を指す。特に、信号は、塩基のタイプを示す信号を指すことができる。例えば、信号は、ヌクレオチド塩基の蛍光タグ又はオリゴヌクレオチドに組み込まれた複数のヌクレオチド塩基の蛍光タグから放出又は反射される光信号を含むことができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、レーザ又は他の光源などの外部刺激を通して信号をトリガする。場合によっては、信号対雑音認識塩基コーリングシステムは、いくつかの内部刺激を通して信号をトリガする。更に、いくつかの実施形態では、信号対雑音認識塩基コーリングシステムは、ヌクレオチド-試料スライド(例えば、ヌクレオチド-試料スライドのセクション)の画像を捕捉するときに適用されるフィルタを使用して信号を観察する。上記で示唆したように、ある特定の事例では、信号は、オリゴヌクレオチドのクラスター中の個々のオリゴヌクレオチドに付加された各標識ヌクレオチド塩基によって提供される信号の集合体を含む。
本明細書中で使用される場合、用語「強度値」は、標識ヌクレオチド塩基又はオリゴヌクレオチドのクラスターからの標識ヌクレオチド塩基のクラスターから放出されるか、反射されるか、又はそうでなければ伝達される信号の特性又は属性を示す値を指す。特に、強度値は、色強度(例えば、波長)又は光強度(例えば、輝度)に関連付けられた値を指すことができる。場合によっては、信号対雑音認識塩基コーリングシステムは、異なるフィルタ(又は強度チャネル)を使用して、標識ヌクレオチド塩基を有するオリゴヌクレオチドのクラスターのいくつかの画像を捕捉する。したがって、信号の強度値は、特定のフィルタを通して観察される信号の強度に対応することができる。
追加的に、本明細書で使用される場合、用語「信号対雑音比メトリック」は、雑音のレベル又は含有量と比較した標的信号の尺度を指す。特に、信号対雑音比メトリックは、関連付けられた雑音と比較した、標識ヌクレオチド塩基から検出される光信号の強さを指すことができる。例えば、いくつかの実装形態では、信号対雑音比メトリックは、対応する雑音レベルと比較した、信号に関連付けられたスケーリングファクタの比を含む。本明細書で使用される場合、用語「スケーリングファクタ」は、輝度を示す係数又は値を指す。特に、本明細書で使用される場合、スケーリングファクタという用語は、クラスター間強度プロファイル変動(クラスター母集団内のクラスターの強度プロファイルの多次元空間の原点からのスケール及びシフトの差に関連する)におけるスケール変動(例えば、振幅/輝度変動)を説明する値を指すことができる。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステムは、光信号について決定されたスケーリングファクタを光信号自体(例えば、雑音の追加を伴わない信号純度)と等しくなる。更に、本明細書で使用される場合、用語「雑音レベル」は、信号に関連付けられた雑音を示す値を指す。実際、場合によっては、雑音レベルは、観察された母集団における分布をもたらす(又は反映する)信号変動を含む雑音を示す値を含む。信号変動は、オリゴヌクレオチド長、フェージング若しくはプレフェージング、又はカメラ若しくは他のセンサの視野に対するオリゴヌクレオチドのクラスターの位置に起因する信号変動など、ヌクレオチド-試料スライドの成分若しくは内容物又は配列決定装置の化学的若しくは物理的特性に由来し得る。1つ以上の実施形態では、以下でより詳細に論じられるように、信号対雑音認識塩基コーリングシステムは、信号の1つ以上の強度値を使用して、スケーリングファクタ及び雑音レベルを決定する。本明細書で使用される場合、用語「信号対雑音比範囲」は、信号対雑音比メトリックの範囲を指す。言い換えれば、いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、1つ以上の信号対雑音比範囲を確立し、信号の信号対雑音比メトリックが特定の信号対雑音比範囲内に入るかどうかを決定する。
更に、本明細書で使用される場合、用語「信号対雑音比閾値」は、信号対雑音比メトリックに基づいてオリゴヌクレオチドのクラスター(例えば、オリゴヌクレオチドのクラスターに関連付けられるヌクレオチド塩基コール)をフィルタリングして除去するために確立された閾値を指す。例えば、いくつかの実装形態では、信号対雑音認識塩基コーリングシステムは、信号対雑音比閾値を、オリゴヌクレオチドのクラスターに対応する標識ヌクレオチド塩基からの信号によって、そのクラスターのヌクレオチド塩基コールが結果として得られるヌクレオチド塩基コールデータに含まれるために、満たされなければならない(例えば、合致又は超えられなければならない)信号対雑音比値として決定する。
本明細書で使用される場合、用語「ヌクレオチド塩基コール」は、配列決定サイクルについてオリゴヌクレオチドに付加するか又はオリゴヌクレオチド内に組み込む特定のヌクレオチド塩基の割り当て又は決定を指す。特に、ヌクレオチド塩基コールは、ヌクレオチド-試料スライド上のオリゴヌクレオチド内に組み込まれたヌクレオチドのタイプの割り当て又は決定を示す。場合によっては、ヌクレオチド塩基コールは、ヌクレオチド-試料スライドのセクション中のオリゴヌクレオチドに付加されたヌクレオチドから生じる強度値へのヌクレオチド塩基の割り当て又は決定を含む。代替的に、ヌクレオチド塩基コールは、ヌクレオチド-試料スライドのナノポアを通過するヌクレオチドから生じるクロマトグラムピーク又は電流変化へのヌクレオチド塩基の割り当て又は決定を含む。ヌクレオチド塩基コールを使用することによって、配列決定システムは、核酸ポリマーの配列を決定する。例えば、単一のヌクレオチド塩基コールは、アデニンコール、シトシンコール、グアニンコール、又はチミンコールを含むことができる。
追加的に、本明細書で使用される場合、用語「配列決定サイクル」(又は「サイクル」)は、オリゴヌクレオチドにヌクレオチド塩基を付加する若しくは組み込むことの反復、又は並行してオリゴヌクレオチドにヌクレオチド塩基を付加する若しくは組み込むことの反復を指す。特に、サイクルは、オリゴヌクレオチドに、又は並行してオリゴヌクレオチドに付加された又は組み込まれた個々のヌクレオチド塩基を示すデータを用いて1つ以上の画像を撮影し、分析することの反復を含むことができる。したがって、核酸ポリマーの配列決定の一部としてサイクルを繰り返すことができる。例えば、1つ以上の実施形態では、各配列決定サイクルは、DNA鎖若しくはRNA鎖が単一方向のみで読み取られる単一読み取り、又はDNA鎖若しくはRNA鎖が両端から読み取られるペアエンド読み取りのいずれかを伴う。更に、ある特定の場合では、各配列決定サイクルは、特定のオリゴヌクレオチドに付加された又は組み込まれた特定のヌクレオチド塩基を決定するための画像データを生成するために、ヌクレオチド-試料スライド又はヌクレオチド-試料スライドの複数のセクションの画像を撮影するカメラを伴う。画像捕捉段階に続いて、配列決定システムは、組み込まれたヌクレオチド塩基から特定の蛍光標識を除去し、核酸ポリマーが完全に配列決定されるまで別の配列決定サイクルを実施することができる。1つ以上の実施形態では、配列決定サイクルは、合成による配列決定(SBS)ラン内のサイクルを含む。
追加的に、本明細書で使用される場合、用語「ヌクレオチド塩基コールデータ」は、核酸ポリマーの個々のヌクレオチド塩基若しくはヌクレオチド塩基の配列を示すデジタルファイル、画像データ、又は他のデジタル情報を指す。特に、ヌクレオチド塩基コールデータは、ヌクレオチド-試料スライドのカメラによって撮影された画像からの強度値(例えば、個々のクラスターの色又は光強度値)、又は核酸ポリマーの個々のヌクレオチド塩基若しくはヌクレオチド塩基の配列を示す他のデータを含むことができる。ヌクレオチド塩基コールデータは、強度値に加えて、又は代替として、配列中の個々の核酸塩基を示すクロマトグラムピーク又は電流変化を含むことができる。追加的に、いくつかの実施形態では、ヌクレオチド塩基コールデータは、個々のヌクレオチド塩基(例えば、A、T、C、又はG)を同定する個々のヌクレオチド塩基コールを含む。例えば、ヌクレオチド塩基コールデータは、バイナリ塩基コール(Binary Base Call、BCL)ファイルなどのデジタルファイルに編成された、核酸ポリマーの配列中のヌクレオチド塩基コールのデータ、特定の塩基(例えば、アデニン、シトシン、チミン、又はグアニン)に対応するヌクレオチド塩基コールの数を含むことができる。更に、ヌクレオチド塩基コールデータは、各ヌクレオチド塩基コールに関連付けられた品質メトリックなどの誤差/精度情報を含むことができる。いくつかの実施形態では、ヌクレオチド塩基コールデータは、合成による配列決定(SBS)を利用する配列決定装置からの情報を含む。
本明細書で使用される場合、用語「品質メトリック」は、配列決定サイクルのヌクレオチド塩基コールの精度を示す特定のスコア又は他の測量を指す。特に、品質メトリックは、1つ以上の予測されたヌクレオチド塩基コールが誤差を含む可能性を示す値を含む。例えば、ある特定の実装形態では、品質メトリックは、配列決定サイクル内の任意の所与のヌクレオチド塩基コールの誤差確率を予測するQスコア(例えば、Phred品質スコア)を含むことができる。
本明細書で使用される場合、用語「塩基コール品質モデル」は、ヌクレオチド塩基コールの品質メトリックを生成するコンピュータモデル又はアルゴリズムを指す。例えば、塩基コール品質モデルは、信号及び/又は対応するクラスター若しくは標識ヌクレオチド塩基の特性を分析し、分析に基づいてヌクレオチド塩基コールの品質メトリックを生成するコンピュータアルゴリズムを指すことができる。例示すると、いくつかの実装形態では、塩基コール品質モデルは、Phred品質スコアを生成するコンピュータアルゴリズムを含む。
追加的に、本明細書中で使用される場合、用語「強度-値境界」とは、信号についてのヌクレオチド塩基コールを生成する際に使用される決定境界を指す。特に、強度-値境界は、信号の1つ以上の強度値に基づいてヌクレオチド塩基を(例えば、A、T、C、又はGとして)分類する決定境界を指すことができる。例示すると、強度-値境界は、ヌクレオチド塩基の各々に対応するヌクレオチドクラウドの境界を定義するか、又はそうでなければ示すことができる。いくつかの実装形態では、強度-値境界は、信号がヌクレオチド塩基として分類される限界をマークするのではなく、信号が特定のレベルの精度でヌクレオチド塩基として分類され得る点をマークする。
本明細書で使用される場合、用語「塩基コール分布モデル」は、強度-値境界を生成するコンピュータモデル又はアルゴリズムを指す。例えば、いくつかの実装形態では、塩基コール分布モデルは、ガウス分布モデル、一様分布モデル、ベルヌーイ分布モデル、二項分布モデル、又はポアソン分布モデルを含むが、これらに限定されない。本明細書中で使用される場合、用語「重心」は、1つ以上の強度-値境界によって定義されるか、又はそうでなければ示されるヌクレオチドクラウドの中心を指す。更に、本明細書で使用される場合、用語「重心強度値」は、重心に関連付けられた強度値を指す。特に、重心強度値は、ヌクレオチドクラウドの中心に対応する強度値を示す。
以下の段落は、例示的な実施形態及び実装形態を描写する例示的な図に関して、信号対雑音認識塩基コーリングシステムを説明する。例えば、図1は、信号対雑音認識塩基コーリングシステム106が1つ以上の実施形態に従って動作するシステム環境(又は「環境」)100の概略図を示す。図示されるように、環境100は、ネットワーク108を介して配列決定装置110及びユーザクライアント装置114に接続された1つ以上のサーバー装置102を含む。図1は、信号対雑音認識塩基コーリングシステム106の実施形態を示すが、本開示は、代替実施形態及び構成を以下に説明する。
図1に示されるように、サーバー装置102、配列決定110、及びユーザクライアント装置114は、ネットワーク108を介して接続される。したがって、環境100の構成要素の各々は、ネットワーク108を介して通信することができる。ネットワーク108は、コンピューティング装置が通信することができる任意の適切なネットワークを含む。例示的なネットワークを、図12に関して以下で更に詳細に説明する。
図1によって示されるように、配列決定装置110は、核酸ポリマーを配列決定するための装置を含む。いくつかの実施形態では、配列決定装置110は、配列決定装置110上で直接的又は間接的のいずれかでコンピュータ実施方法及びシステムを利用して、試料から抽出された核酸セグメント又はオリゴヌクレオチドを分析してデータを生成する。より具体的には、配列決定装置110は、ヌクレオチド-試料スライド(例えば、フローセル)内で、試料から抽出された核酸配列セグメントを受け取り、分析する。1つ以上の実施形態では、配列決定装置110は、SBSを利用して、核酸ポリマーを配列決定する。いくつかの実施形態では、配列決定装置110は、ネットワーク108を介して通信することに加えて、又は代替として、ネットワーク108を迂回し、サーバー装置102及び/又はユーザクライアント装置114と直接通信する。
直前に述べたように、また図1に図示するように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールデータ112を生成することができるか、又は少なくともヌクレオチド塩基コールデータ112の生成に寄与することができる。特に、いくつかの実施形態では、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックを利用してヌクレオチド塩基コールデータ112を生成する。例示すると、場合によっては、信号対雑音認識塩基コーリングシステム106は、各配列決定サイクル中にヌクレオチド-試料スライドのセクションの(例えば、これらのセクションから検出された信号の)信号対雑音比メトリックを決定する。信号対雑音認識塩基コーリングシステム106は、各セクションの信号対雑音比メトリックを利用して、そのセクションから検出された信号に対応するヌクレオチド塩基コールを生成することができる。信号対雑音認識塩基コーリングシステム106はまた、信号対雑音比メトリックを利用して、塩基コーリングプロセスからセクションを除外し、及び/又はヌクレオチド塩基コールデータ112からそのセクションに対して生成されたヌクレオチド塩基コールを除外することができる。更に、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて決定された信号対雑音比メトリックを利用して、そのセクションから検出された信号について生成されたヌクレオチド塩基コールに対応する品質メトリックを生成することができる。いくつかの事例では、信号対雑音認識塩基コーリングシステム106は、追加の情報(例えば、信号対雑音比メトリック自体、フィルタリングのために使用される信号対雑音比閾値、平均品質メトリックなど)をヌクレオチド塩基コールデータ112に寄与する。
図1によって更に示されるように、サーバー装置102は、ヌクレオチド塩基コール又は核酸ポリマーの配列決定に関連するデータなどのデジタルデータを生成、受信、分析、記憶、及び送信することができる。図1に示されるように、配列決定装置110は、ヌクレオチド塩基コールデータ112を配列決定装置110から送信し得る(及びサーバー装置102は受信し得る)。サーバー装置102はまた、ユーザクライアント装置114と通信することができる。特に、サーバー装置102は、核酸塩基配列、誤差データ、及び他の情報をユーザクライアント装置114に送信することができる。
いくつかの実施形態では、サーバー装置102は、サーバーの分散型集合を含み、サーバー装置102は、ネットワーク108にわたって分散され、同じ又は異なる物理的場所に位置する、いくつかのサーバー装置を含む。更に、サーバー装置102は、コンテンツサーバー、アプリケーションサーバー、通信サーバー、ウェブホスティングサーバー、又は別のタイプのサーバーを含むことができる。
図1に更に示されるように、サーバー装置102は、配列決定システム104を含むことができる。一般に、配列決定システム104は、配列決定装置110から受信したヌクレオチド塩基コールデータ112を分析して、試料ゲノムのヌクレオチド塩基配列などの核酸ポリマーのヌクレオチド塩基配列を決定する。例えば、配列決定システム104は、配列決定装置110から生データを受信し、核酸セグメントの核酸塩基配列を決定することができる。いくつかの実施形態では、配列決定システム104は、DNA及び/又はRNAセグメント若しくはオリゴヌクレオチド中の核酸塩基の配列を決定する。場合によっては、上述のように、配列決定システム104は、ヌクレオチド塩基コール、品質メトリックの形態の誤差/精度情報、及び又はフィルタリングされた(例えば、除外された)クラスターに関するデータを含む前処理されたデータを受信する。したがって、いくつかの実装形態では、配列決定システム104は、ヌクレオチド塩基コールデータ112からのデータを有用なユーザ可読フォーマットに編成する。
図1に更に示されるように、信号対雑音認識塩基コーリングシステム106は、配列決定装置110上及び/又は配列決定システム104の一部として、サーバー装置102上に位置し得る。したがって、いくつかの実施形態では、信号対雑音認識塩基コーリングシステム106は、サーバー装置102上によって実装される(例えば、全体的に又は部分的に位置する)。更に他の実施形態では、信号対雑音認識塩基コーリングシステム106は、配列決定装置110など、環境100の1つ以上の他の構成要素によって実装される。特に、信号対雑音認識塩基コーリングシステム106は、サーバー装置102、ネットワーク108、及び配列決定装置110にわたって様々な異なる方法で実装することができる。
図1に更に図示され示されるように、ユーザクライアント装置114は、デジタルデータを生成、記憶、受信、及び送信することができる。特に、ユーザクライアント装置114は、サーバー装置102又は配列決定装置110から配列決定データを受信することができる。更に、ユーザクライアント装置114は、サーバー装置102と通信して、核酸塩基配列、並びに配列決定サイクル内の不規則性の報告を受信することができる。したがって、ユーザクライアント装置114は、配列決定データ及び核酸塩基コールの通知をグラフィカルユーザインターフェース内でユーザクライアント装置114に関連付けられたユーザに提示することができる。場合によっては、ユーザクライアント装置114は、強度-値境界、ヌクレオチド塩基コールデータ、並びに表示のための信号対雑音比メトリックの計算及び使用に関連する他の情報を更に提示することができる。
図1に図示するユーザクライアント装置114は、様々なタイプのクライアント装置を含むことができる。例えば、いくつかの実施形態では、ユーザクライアント装置114は、デスクトップコンピュータ若しくはサーバー、又は他のタイプのクライアント装置などの非モバイル装置を含む。更に他の実施形態では、ユーザクライアント装置114は、ラップトップ、タブレット、携帯電話、又はスマートフォンなどのモバイル装置を含む。ユーザクライアント装置114に関する追加の詳細は、図12に関して以下で説明する。
図1に更に図示されるように、ユーザクライアント装置114は、配列決定アプリケーション116を含む。配列決定アプリケーション116は、ユーザクライアント装置114上に記憶され、実行されるウェブアプリケーション又はネイティブアプリケーション(例えば、モバイルアプリケーション、デスクトップアプリケーション)であり得る。配列決定アプリケーション116は、信号対雑音認識塩基コーリングシステム106からデータを受信することができ、ユーザクライアント装置114における表示のために、配列決定データを提示することができる。更に、配列決定アプリケーション116は、強度-値境界、フィルタリングされたヌクレオチド塩基コールなどに関する通知を提供することができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、配列決定アプリケーション116の一部としてユーザクライアント装置114上に位置する。
図1は、ネットワーク108を介して通信する環境100の構成要素を図示しているが、ある特定の実装形態では、環境100の構成要素はまた、ネットワーク108を迂回して互いに直接通信することができる。例えば、また、前述したように、いくつかの実装形態では、サーバー装置102は、配列決定装置110及び/又はユーザクライアント装置114と直接通信する。更に、信号対雑音認識塩基コーリングシステム106は、サーバー装置102又は環境100内の他の場所に収容された、又はそれによってアクセスされる1つ以上のデータベースにアクセスすることができる。
前述したように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを生成する。特に、信号対雑音認識塩基コーリングシステム106は、セクションに又はセクション内に位置する標識ヌクレオチド塩基から検出された信号の信号対雑音比メトリックを生成する。信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックを利用して、様々なヌクレオチド塩基コーリング特徴を提供することができる。図2は、1つ以上の実施形態に従って、信号対雑音比メトリックを生成及び利用する信号対雑音認識塩基コーリングシステム106の概観図を図示する。
図2に示されるように、信号対雑音認識塩基コーリングシステム106は、配列決定のためにヌクレオチド-試料スライド202を利用する。ヌクレオチド-試料スライド202は、標識ヌクレオチド塩基を受容する又は組み込むオリゴヌクレオチドを含むことができる。特に、ヌクレオチド-試料スライド202は、各セクション(例えば、ウェル)内にオリゴヌクレオチドのクラスターを含むことができる。刺激されると、標識ヌクレオチド塩基は、ヌクレオチド塩基のタイプに関連付けられる特性を有する信号を放出することができる。
図2に更に示されるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライド202の少なくとも1つのセクションの画像204を捕捉する。特に、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライド202のセクション内の標識ヌクレオチド塩基が信号を放出するときに画像204を捕捉する。示されるように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、複数の画像を捕捉する。例えば、信号対雑音認識塩基コーリングシステム106は、様々な画像フィルタを使用して複数の画像を捕捉することができる。例示すると、いくつかの実施形態では、信号対雑音認識塩基コーリングシステム106は、2チャネル実装形態を利用し、ヌクレオチド-試料スライド202のセクションの2つの画像を捕捉する。特に、信号対雑音認識塩基コーリングシステム106は、第1の画像フィルタを使用する第1の画像を使用して第1の画像を捕捉し、第2の画像フィルタを使用して第2の画像を捕捉する。第1の画像及び第2の画像は、使用された画像フィルタに対応する放出された信号の強度を捕捉することができる。場合によっては、信号対雑音認識塩基コーリングシステム106は、4チャネル実装形態を利用し、ヌクレオチド-試料スライド202のセクションの4つの異なる画像を捕捉する。2チャネル実装形態と同様に、信号対雑音認識塩基コーリングシステム106は、異なる画像フィルタを使用して4チャネル実装形態のために各画像を捕捉することができる。各画像は、その画像に使用された画像フィルタに基づいて、放出された信号の強度を捕捉することができる。したがって、場合によっては、4つの画像の各々は、異なる強度を有する放出された信号を示す。
図2に示されるように、画像204は、ヌクレオチド-試料スライド202のセクション内に位置する標識ヌクレオチド塩基から放出される信号206を描写する。前述したように、信号206は、ヌクレオチド-試料スライド202のセクション内のオリゴヌクレオチドに付加されたヌクレオチド塩基のタイプを示すことができる。例えば、以下でより詳細に論じられるように、信号206は、ヌクレオチド塩基のタイプを示す1つ以上の対応する強度値を有することができる。例示すると、いくつかの実装形態では、画像204の各々は、信号206に対応する少なくとも1つの強度値を捕捉する。
信号206は、何らかの関連付けられた雑音を有し得る。特に、信号206は、信号206の純度に影響を及ぼす関連付けられた雑音レベルを有し得る。したがって、図2によって示されるように、信号対雑音認識塩基コーリングシステム106は、信号206の信号対雑音比メトリック208を生成することができる。例えば、信号対雑音認識塩基コーリングシステム106は、信号206に対応するスケーリングファクタを決定することができる。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、決定されたスケーリングファクタを信号206と等しくなる。更に、信号対雑音認識塩基コーリングシステム106は、信号206に対応する雑音レベルを決定することができる。したがって、信号対雑音認識塩基コーリングシステム106は、スケーリングファクタ及び雑音レベルを利用して、信号206の信号対雑音比メトリック208を生成することができる。
信号対雑音認識塩基コーリングシステム106は、様々な塩基コーリング特徴を提供するために、信号対雑音比メトリック208を利用することができる。例えば、図2に示されるように、信号対雑音認識塩基コーリングシステム106は、分布モデルセグメンテーション210のために信号対雑音比メトリック208を利用することができる。特に、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック208を利用して、ガウス混合モデルなどの塩基コール分布モデルを別個の塩基コール分布モデルにセグメント化することができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、別個の塩基コール分布モデルを複数の信号対雑音比範囲の各々にフィッティングすることによって、塩基コール分布モデルをセグメント化する。実際に、以下で更に論じられるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライド202の複数のセクションから検出された複数の信号の信号対雑音比メトリック(信号対雑音比メトリック208を含む)を決定することができる。信号対雑音認識塩基コーリングシステム106は更に、複数の信号対雑音比メトリックについての複数の信号対雑音比範囲を決定する。したがって、信号対雑音認識塩基コーリングシステム106は、塩基コール分布を信号対雑音比範囲の各々にフィッティングすることができる。
信号対雑音認識塩基コーリングシステム106は、特定の信号対雑音比範囲についての塩基コール分布モデルを更に利用して、その範囲内に入る信号対雑音比メトリックを有する信号についてのヌクレオチド塩基コールを生成することができる。したがって、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック208を利用して、分布モデルセグメンテーション210を介して信号206に対するヌクレオチド塩基コールを生成することができる。
図2に更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号対雑音フィルタリング212のために信号対雑音比メトリック208を利用することができる。特に、信号対雑音認識塩基コーリングシステム106は、信号対雑音比閾値を確立し、信号対雑音比メトリック208が信号対雑音比閾値を満たさない場合、信号206(例えば、ヌクレオチド-試料スライド202の対応するセクション)をヌクレオチド塩基コールデータから除外することができる。
追加的に、図2に更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック208を利用して、信号206について生成されたヌクレオチド塩基コールの品質メトリック214を決定し得る。例えば、信号対雑音認識塩基コーリングシステム106は、塩基コール品質モデルを利用して、信号対雑音比メトリック208に基づいて品質メトリック214を決定することができる。
上記の議論(並びに以下の議論)の多くは、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを決定することに焦点を当てているが、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの複数のセクションの各々の信号対雑音比メトリックを並行して決定し得ることが理解されるべきである。例えば、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの各セクション(例えば、クラスターに対応する各ウェル又は各セクション)からの信号を検出し、検出された各信号の信号対雑音比メトリックを決定する。したがって、信号対雑音認識塩基コーリングシステム106は、様々な信号対雑音比メトリックを、セグメント化された塩基コール分布モデルを介してヌクレオチド塩基コールを決定すること、信号対雑音フィルタリング、及び生成されたヌクレオチド塩基コールの品質メトリックを決定することに利用することができる。
前述したように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基から検出された信号の信号対雑音比メトリックを決定する。図3は、1つ以上の実施形態に従って、信号対雑音比メトリックを決定するための図を図示する。
図3に示されるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライド302の少なくとも1つのセクションの画像304を捕捉する。例えば、配列決定装置110のための(また、信号対雑音認識塩基コーリングシステム106に関連付けられている)カメラが、ヌクレオチド-試料スライド302内のタイルの画像304を捕捉する。各タイルは、クラスターを構成する複数のナノウェル又はクラスターを構成する複数のサブセクションを含む。更に示されるように、画像304は、ヌクレオチド-試料スライド302の少なくとも1つのセクションから(例えば、クラスターに対応するウェル又はサブセクション内の標識ヌクレオチド塩基から)放出された信号306を描写する。
図3に更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号306に対応するスケーリングファクタ310を決定する。特に、信号対雑音認識塩基コーリングシステム106は、最小二乗モデル308を利用してスケーリングファクタ310を決定する。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、最小二乗モデル308を利用して、信号306に対応する変動補正係数を決定する。2チャネル実装形態が使用される場合など、1つ以上の実施形態では、変動補正係数は、クラスター間強度プロファイルにおけるスケール変動を考慮するスケーリングファクタ310と、クラスター間強度プロファイル変動における第1及び第2の強度チャネルに沿ったシフト変動をそれぞれ考慮する2つのオフセットファクタ(チャネル固有のオフセット係数とも呼ばれる)と、を含む。
信号対雑音認識塩基コーリングシステム106は、最小二乗モデル308を利用して、標識ヌクレオチド塩基の測定された強度(例えば、信号306に対応する測定された強度)と変動補正係数との間の関係を決定することによって、変動補正係数を決定することができる。信号対雑音認識塩基コーリングシステム106は、測定された強度と変動補正係数との間の関係に基づいて誤差関数を更に決定することができる。信号対雑音認識塩基コーリングシステム106は、スケーリングファクタに関する誤差関数の偏導関数を生成することによって、スケーリングファクタ310を決定することができる。特に、いくつかの実装形態では、106は、最小二乗モデル308を利用して、誤差関数の2つの偏導関数:一方はスケーリングファクタ310に関するものであり、他方はチャネル固有のオフセットファクタに関するもの、を決定する。実際、いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、2020年10月27日に出願され、「SYSTEMS AND METHODS FOR PRE-CLUSTER INTENSITY CORRECTION AND BASE CALLING」と題された米国特許出願第63/106,256号に説明されるように、最小二乗モデル308を利用して、スケーリングファクタ310を決定する。この米国特許出願は、参照によりその全体が本明細書に組み込まれる。
図3に更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号306に対応する雑音レベル312を決定する。特に、示されるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライド302のセクションについて(例えば、信号306について)、補正された強度値を使用して雑音レベル312を決定することができる。1つ以上の実施形態では、用語「補正された強度値」は、信号の1つ以上の特徴に基づいて調整されたヌクレオチド-試料スライドのセクションから放出された信号に対応する強度値を指す。例示すると、1つ以上の実施形態では、補正された強度値は、オフセットを考慮するように補正された強度値と、強度値に対応するスケーリングファクタとを含む。補正が行われると、場合によっては、補正された強度値は、信号の最初に測定された対応する強度値よりもヌクレオチドクラウドの重心に近い。例えば、2チャネル実装形態では、信号対雑音認識塩基コーリングシステム106は、補正された強度値の対(例えば、各強度チャネルについて1つ)を、その対が、信号の最初に測定された強度値の対応する対よりもヌクレオチドクラウドの重心に近くなるように決定することができる。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、以下を使用して、補正された強度値を決定する。
関数(1)において、
は、補正された強度値を表し、I及びIは、信号306の最初に測定された強度値を表す。更に、Sは、信号306のために決定されたスケーリングファクタ(例えば、スケーリングファクタ310)を表し、O及びOは、信号306に対応するオフセットファクタを表す。4チャネル実装形態では、信号対雑音認識塩基コーリングシステム106は、同様に、4つの補正された強度値(例えば、使用される4つの強度チャネルの各々に対して1つ)を決定するように動作する。そのような場合、信号対雑音認識塩基コーリングシステム106は、関数(1)と同様の関数を利用して、それぞれのオフセットファクタを組み込むことによって補正された強度値を決定する。特に、信号対雑音認識塩基コーリングシステム106は、所与の強度チャネルについての補正された強度値を、その強度チャネルについて最初に測定された強度値、その強度チャネルについて決定されたオフセットファクタ、及びスケーリングファクタを使用して決定することができる。
図3は、グラフ314を介して補正された強度値の視覚化を提供する。グラフ314の軸316a~316bは、2チャネル実装形態における各強度チャネルについての強度値を表す。グラフ314は、ヌクレオチドクラウド318a~318dを、それぞれの強度-値境界を有する強度値にマッピングする。図3に示されるように、信号306について最初に測定された強度値は、ヌクレオチドクラウド318d内の点320に対応する。更に、補正された強度値は点322に対応する。更に示されるように、補正された強度値に対応する点322は、ヌクレオチドクラウド318dの重心324により近い。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、補正された強度値と、最も近いヌクレオチドクラウド又は最も近い重心などのヌクレオチドクラウドの重心強度値との間の距離を決定することによって、雑音レベル312を決定する。例えば、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、以下のように雑音レベル312を決定する。ここで、B及びB重心強度値を表す。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、1つ以上の以前の配列決定サイクルについて決定されたヌクレオチド-試料スライド302の同じセクションについて決定された雑音レベルを使用して、雑音レベル312を更に決定する。実際、いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、各配列決定サイクル後にヌクレオチド-試料スライド302のセクションについて決定された雑音レベルを記憶する。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、以前の配列決定サイクルについての記憶された雑音レベルを平均し、現在の配列決定サイクルについての雑音レベル312を決定する際に平均化された雑音レベルを利用する(例えば、平均化された雑音レベルを、関数2を使用して決定された雑音レベルに加算することによって、平均化された雑音レベルを、関数2を使用して決定された雑音レベルと平均化することによってなど)。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、以前の配列決定サイクルについての雑音レベルの加重平均を利用する。例えば、信号対雑音認識塩基コーリングシステム106は、最新性に基づいて、以前の配列決定サイクルについて決定された雑音レベルに重みを割り当てることができる。例示すると、信号対雑音認識塩基コーリングシステム106は、より最近の配列決定サイクルについて決定された雑音レベルに比較的高い重みを割り当てることができる。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、現在の配列決定サイクルについての雑音レベルを決定する際に、設定された数の以前の配列決定サイクルについての雑音レベルを利用する。例えば、信号対雑音認識塩基コーリングシステム106は、ユーザ入力に基づいて、利用すべき以前の配列決定サイクルの設定数を決定することができる。場合によっては、信号対雑音認識塩基コーリングシステム106は、全ての以前の配列決定サイクルについての雑音レベル(例えば、同じ読み取り内又は複数の読み取りにわたる全ての雑音レベル)を利用する。
上記の段落は、ヌクレオチド-試料スライドのセクションに関連付けられた以前の雑音レベルを、現在の配列決定サイクルについてのそのセクションについての雑音レベルを決定するために、使用することを説明しているが、場合によっては、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの全てのセクションに関連付けられた以前の雑音レベルを利用する。
図3に示されるように、信号対雑音認識塩基コーリングシステム106は、スケーリングファクタ310及び雑音レベル312を利用して、信号306の信号対雑音比メトリック326を決定する。例えば、信号対雑音認識塩基コーリングシステム106は、雑音レベル312に対するスケーリングファクタ310の比を利用して信号対雑音比メトリック326を決定することができる。実際、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック326を決定する目的で、スケーリングファクタ310を信号306と等しくなる(例えば、スケーリングファクタ310を信号306として扱う)。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、信号の信号対雑音比メトリックを決定するときに、フェージング又はプレフェージングを考慮する。本明細書中で使用される場合、用語「フェージング」は、1つの分子に対する配列決定が、特定のサイクルにおいて他の分子よりも少なくとも1塩基遅れる作用又は状況を指す。逆に、本明細書中で使用される場合、用語「プレフェージング」は、1つの分子に対する配列決定が、特定のサイクルにおいて他の分子よりも少なくとも1塩基先に飛ぶ作用又は状況を指す。1つ以上の実施形態では、フェージング又はプレフェージングの作用について補正するために、信号対雑音認識塩基コーリングシステム106は、各サイクルにおける塩基組み込みのための強度値を有する信号を検出し、(i)現在のサイクルの強度値から直前のサイクルの強度値を減算し、(ii)現在のサイクルの強度値から直後のサイクルの強度値を減算することによって、強度値を補正することができる。実際、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、2020年6月23日に発行され、「Methods and Systems for Analyzing Image Data」と題された米国特許第10,689,696号に説明されるように、フェージング又はプレフェージングの作用を補正する。この米国特許は、参照によりその全体が本明細書に組み込まれる。
前述したように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、分布モデルセグメンテーションのために、ヌクレオチド-試料スライドの複数のセクションから検出された信号に対応する信号対雑音比メトリックを利用する。図4は、1つ以上の実施形態に従って、分布モデルセグメンテーションのために信号対雑音比メトリックを利用するブロック図を図示する。
図4に示されるように、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック402a~402dを決定する。特に、信号対雑音認識塩基コーリングシステム106は、配列決定サイクル中に、ヌクレオチド-試料スライドの複数のセクションの信号対雑音比メトリックを、これらのセクションから検出された信号に基づいて決定する。信号対雑音認識塩基コーリングシステム106は、図3を参照して上述したように、信号対雑音比メトリックを決定することができる。
図4に更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリック402a~402dを異なるグループに分離する。例えば、信号対雑音認識塩基コーリングシステム106は、信号対雑音比範囲を利用して、信号対雑音比メトリック402a~402dを分離することができる。実際、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、複数の信号対雑音比範囲を確立する。信号対雑音認識塩基コーリングシステム106は、ユーザ入力に基づいて、固定範囲を使用して、又は現在の配列決定サイクルについて決定された信号対雑音比メトリックに基づいて、信号対雑音比範囲を確立することができる(例えば、信号対雑音比メトリックの最低セットをカバーする第1の範囲を確立する、信号対雑音比メトリックの2番目に低いセットをカバーする第2の範囲を確立するなど)。図4は、特定の数の信号対雑音比範囲を図示しているが、信号対雑音認識塩基コーリングシステム106は、様々な数の信号対雑音比範囲を確立することができる。
1つ以上の実施形態では、信号対雑音比メトリック402a~402dの各々は、異なる信号対雑音比範囲に対応する。例えば、信号対雑音比メトリック402aは、第1の信号対雑音比範囲(例えば、9.00~9.99)に対応することができ、信号対雑音比メトリック402bは、第2の信号対雑音比範囲(例えば、10.00~10.99)に対応することができ、信号対雑音比メトリック402cは、第3の信号対雑音比範囲(例えば、11.00~11.99)に対応することができ、信号対雑音比メトリック402dは、第4の信号対雑音比範囲(例えば、12.00~12.99)に対応することができる。信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの各セクションから検出された信号を、信号の対応する信号対雑音比メトリックが入る信号対雑音比範囲と関連付けることができる。実際、図4に示されるように、信号対雑音認識塩基コーリングシステム106は、信号対雑音比範囲に基づいて強度値404a~404dのセットを確立する。例えば、強度値404aのセットは、信号対雑音比メトリック402aに関連付けられた(例えば、信号対雑音比メトリック402aを含む第1の信号対雑音比範囲に関連付けられた)信号についての強度値を含む。
更に示されるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションからの信号について強度-値境界を生成する。例えば、図4は、可能な各ヌクレオチド塩基(例えば、A、T、C、又はG)に対応する強度-値境界(例えば、強度-値境界408)のセットを有するグラフ406a~406dを示す。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、1つ以上の塩基コール分布モデルに従って、強度-値境界のセットを生成する。例えば、信号対雑音認識塩基コーリングシステム106は、第1の塩基コール分布モデルに従って強度-値境界(例えば、グラフ406aに示されるもの)の第1のセット、第2の塩基コール分布モデルに従って強度-値境界(例えば、グラフ406bに示されるもの)の第2のセットなどを生成することができる。
図4に示されるように、信号対雑音認識塩基コーリングシステム106は、塩基コール分布モデル410を利用して、強度-値境界を生成することができる。場合によっては、塩基コール分布モデル410は、単一の塩基コール分布モデルを含むが、信号対雑音認識塩基コーリングシステム106は、いくつかの実装形態では、複数の塩基コール分布モデル(例えば、各信号対雑音比範囲について別個の塩基コール分布モデル)を利用することができる。更に、塩基コール分布モデル410は、1つ以上の実施形態では、ガウス分布モデルを含むことができるが、他の塩基コール分布モデルも利用することができる。
図4には示されていないが、信号対雑音認識塩基コーリングシステム106は、強度-値境界のセットのうちの1つを利用して、信号についてのヌクレオチド塩基コールを生成することができる。特に、信号対雑音認識塩基コーリングシステム106は、信号に関連付けられた信号対雑音比範囲に対応する強度-値境界のセットを利用して(すなわち、信号対雑音比範囲に対応する塩基コール分布モデルに従って)ヌクレオチド塩基コールを生成することができる。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、信号について決定された強度値を利用してヌクレオチド塩基コールを更に生成する。
例示すると、信号が、第1の信号対雑音比範囲(例えば、9.00~9.99)内に入る対応する信号対雑音比メトリックを有したと決定すると、信号対雑音認識塩基コーリングシステム106は、第1の信号対雑音比範囲について生成された強度-値境界(例えば、グラフ406aに示されるもの)のセットを使用して、ヌクレオチド塩基コールを生成することができる。信号対雑音認識塩基コーリングシステム106は、信号についての強度値のセットが強度-値境界のセットにどのように関連するかを更に決定し、それに応じてヌクレオチド塩基コールを生成することができる。例えば、信号についての強度値のセットが特定のヌクレオチド塩基の決定境界内に入ることを決定すると、信号対雑音認識塩基コーリングシステム106は、信号がそのヌクレオチド塩基に関連付けられていることを示すヌクレオチド塩基コールを生成することができる。信号についての強度値のセットが全てのヌクレオチド塩基の決定境界の外側にあると決定することに基づいて、信号対雑音認識塩基コーリングシステム106は、各ヌクレオチド塩基の決定境界への近接性に基づいて、及び/又は各ヌクレオチド塩基に対応するヌクレオチドクラウドの重心への近接性に基づいて、信号についてのヌクレオチド塩基コールを生成することができる。
信号対雑音認識塩基コーリングシステム106は、信号に関連付けられた信号対雑音比範囲に対応する塩基コール分布モデルに従って、信号についてのヌクレオチド塩基コールを生成するので、信号対雑音認識塩基コーリングシステム106は、場合によっては、同様の強度値を有する信号についての異なるヌクレオチド塩基コールを生成することができる。例示すると、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、第1の信号対雑音比範囲について、第1の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する強度-値境界の第1のセットを生成する。信号対雑音認識塩基コーリングシステム106は、第2の信号対雑音比範囲について、第2の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する強度-値境界の第2のセットを更に生成し、強度-値境界の第2のセットは、強度-値境界の第1のセットとは異なる。
更に、信号対雑音認識塩基コーリングシステム106は、第1の信号対雑音比範囲内の第1の信号対雑音比メトリックに対応し、かつ強度-値境界の第1のセットの外側及び強度-値境界の第2のセットの外側の強度値のセットを有する第1の信号を検出し、第2の信号対雑音比範囲内の第2の信号対雑音比メトリックに対応し、かつ強度値のセット(例えば、第1の信号と同じ強度値のセット)を有する第2の信号を検出することができる。したがって、信号対雑音認識塩基コーリングシステム106は、第1の塩基コール分布モデルについての強度-値境界の第1のセットに基づいて、第1の信号についての第1のヌクレオチド塩基コールを生成し、第2の塩基コール分布モデルについての強度-値境界の第2のセットに基づいて、第2の信号についての第2のヌクレオチド塩基コールを生成することができる。実際、2つの信号が強度値の同じセットを有する場合であっても、信号対雑音認識塩基コーリングシステム106は、2つの異なる塩基コール分布モデルを利用して異なるヌクレオチド塩基コールを生成することができる。
様々な信号対雑音比範囲の強度-値境界を生成することによって、信号対雑音認識塩基コーリングシステム106は、従来の配列決定プラットフォームと比較して、より柔軟に動作する。実際に、信号対雑音認識塩基コーリングシステム106は、検出された信号の信号対雑音比メトリックなどの特性に合わせて強度-値境界を調整し、それらの特性にかかわらず全ての信号に対して決定境界の同じセットを利用する傾向がある従来のプラットフォームよりも高い柔軟性を提供する。説明されるように強度-値境界を調整することによって、信号対雑音認識塩基コーリングシステム106は、従来の配列決定プラットフォームよりも正確に更に動作する。特に、信号対雑音認識塩基コーリングシステム106は、信号についてのヌクレオチド塩基コールを、強度-値境界が信号の特性により密接に対応するので、それらの信号に対してより適切である強度-値境界を使用して生成する。
更に、異なる信号対雑音比範囲に対して異なる強度-値境界を生成することによって、信号対雑音認識塩基コーリングシステム106は、検出された信号に対して生成されたヌクレオチド塩基コールの品質をより正確に決定する。実際、図4に見られるように、グラフ406a~406dは、各々、破線の等高線のセットを含む。等高線は、ヌクレオチド塩基コールに対応する異なる品質メトリック(例えば、Qスコア)を表すことができる。例えば、所与の強度-境界値に最も近接して位置する等高線は、強度-値境界に関連付けられたヌクレオチド塩基コールの精度における比較的高い信頼度(例えば、低い誤差確率)を示す品質メトリックに対応することができる一方、更に離れた等高線は、比較的低い信頼度を示す品質メトリックに対応する。したがって、強度-値境界に関連付けられた等高線は、強度-値境界に対応するヌクレオチド塩基コールが割り当てられた場合、強度-値境界からより遠く離れた強度値が、より低い信頼度に対応することを示す。
図4に更に見られるように、強度-値境界に関連付けられた破線の等高線のセットは、グラフ406a~406dの間で変化する(例えば、グラフの信号対雑音比範囲がより高い信号対雑音比メトリックを含むにつれて、等高線は互いにより近くなる)。したがって、ヌクレオチド塩基コール自体の生成と同様に、グラフ406a~406dは、ヌクレオチド塩基コールの品質の決定も、対応する信号の特性に合わせて調整されることを示す。したがって、別個の強度-値境界を使用してヌクレオチド塩基コールを生成することは、それらのヌクレオチド塩基コールの品質のより正確な決定をもたらすことができ、これは、図6を参照して以下で更により詳細に論じられる。
図4は、2つの強度チャネルが使用される2チャネル実装形態における強度-値境界及び対応するヌクレオチド塩基コールの生成を示す。しかしながら、信号対雑音認識塩基コーリングシステム106は、4つの強度チャネルが使用される4チャネル実装形態において同様に動作することができることに留意されたい。例えば、いくつかの実装形態では、強度-値境界を生成するために利用される塩基コール分布モデルは、4つの強度チャネルに従って強度-値境界を生成するように構成される。
更に上述したように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションに関連付けられた信号対雑音比メトリックを利用して、ヌクレオチド塩基コールデータから、そのセクションに対して生成された1つ以上のヌクレオチド塩基コールをフィルタリングして除去する。図5は、1つ以上の実施形態に従って、ヌクレオチド塩基コールをフィルタリングするために、信号の信号対雑音比メトリックを利用する信号対雑音認識塩基コーリングシステム106のブロック図を図示する。
図5に示されるように、信号対雑音認識塩基コーリングシステム106は、信号について決定された信号対雑音比メトリックを信号対雑音比閾値と比較する502の動作を行う。実際に、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールをフィルタリング使用される信号対雑音比閾値を確立する。信号対雑音認識塩基コーリングシステム106は、ユーザ入力に基づいて信号対雑音比閾値を確立するか、又は所定の信号対雑音比閾値を利用することができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、履歴データに基づいて信号対雑音比閾値を確立する。例えば、信号対雑音認識塩基コーリングシステム106は、以前の配列決定データを分析して、どの信号対雑音比メトリックが、典型的には、所望の品質メトリックを下回るヌクレオチド塩基コールに関連付けられるかを決定することができる。したがって、信号対雑音認識塩基コーリングシステム106は、そのような望ましくない信号対雑音比メトリックを有する信号をフィルタリングして除去するのに十分高い信号対雑音比閾値を確立することができる。場合によっては、信号対雑音認識塩基コーリングシステム106は、各配列決定サイクル又は一連の配列決定サイクルで信号対雑音比閾値を調整する。しかしながら、場合によっては、信号対雑音認識塩基コーリングシステム106は、全ての配列決定サイクルを通して一定の信号対雑音比閾値を利用する。
図5に更に示されるように、信号対雑音比メトリックが信号対雑音比閾値を満たさない(例えば、未満である)と決定すると、信号対雑音認識塩基コーリングシステム106は、信号に対応するヌクレオチド塩基コールをヌクレオチド塩基コールデータから除外する動作504を行う。特に、いくつかの実装形態では、信号に対応する信号対雑音比メトリックが信号対雑音比閾値を満たさないと決定すると、信号対雑音認識塩基コーリングシステム106は、信号が低品質であり、対応するヌクレオチド塩基コール(生成された場合)が信頼できないと決定する。したがって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールデータからヌクレオチド塩基コールを除外する。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの同じセクションから検出された1つ以上の後続の信号について生成された1つ以上の後続のヌクレオチド塩基コールを、ヌクレオチド塩基コールデータから更に除外する。言い換えれば、信号対雑音認識塩基コーリングシステム106は、後続の配列決定サイクル中にヌクレオチド-試料スライドのそのセクションに対して生成される全てのヌクレオチド塩基コールを除外することができる。上述のように、信号対雑音認識塩基コーリングシステム106は、したがって、パターン化されたヌクレオチド-試料スライドのウェルに対応するオリゴヌクレオチドのクラスター、又はクラスターのパターン化されていないヌクレオチド-試料スライドのサブセクションの全てのヌクレオチド塩基コールを除外することができる(又はヌクレオチド塩基コールの決定を継続しない)。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106はまた、ヌクレオチド-試料スライドのそのセクションから生成された1つ以上の以前のヌクレオチド塩基コールを、ヌクレオチド塩基コールデータから除外する。
実際に、1つ以上の実施形態では、信号について決定された信号対雑音比メトリックが信号対雑音比閾値を満たさないと決定すると、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの対応するセクションを完全にフィルタリングして除去する。言い換えれば、信号対雑音認識塩基コーリングシステム106は、信号対雑音比閾値を満たさないことに基づいて、ヌクレオチド-試料スライドの対応するセクションが低品質であり信頼できないものであると決定する。したがって、信号対雑音比閾値を満たさないと決定すると、信号対雑音認識塩基コーリングシステム106は、後続の配列決定サイクルからヌクレオチド-試料スライドのセクションを除去することができる(例えば、信号対雑音認識塩基コーリングシステム106は、将来のサイクルにおいてセクションを分析しない)。
図5に示されるように、信号対雑音比メトリックが信号対雑音比閾値を満たさない(例えば、以上である)と決定すると、信号対雑音認識塩基コーリングシステム106は、信号に対応するヌクレオチド塩基コールをヌクレオチド塩基コールデータに含める動作506を行う。例えば、信号対雑音認識塩基コーリングシステム106は、信号についてのヌクレオチド塩基コールを生成し、ヌクレオチド塩基コールデータにヌクレオチド塩基コールを追加することができる。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、配列決定サイクルごとにヌクレオチド-試料スライドのセクションについて決定された信号対雑音比メトリックを信号対雑音比閾値と比較する。したがって、信号対雑音認識塩基コーリングシステム106は、任意の配列決定サイクルにおいて、ヌクレオチド-試料スライドのそのセクションについて生成されたヌクレオチド塩基コールをヌクレオチド塩基コールデータから除外することを決定することができる。
信号対雑音比メトリックを使用してある特定のヌクレオチド塩基コール(又はヌクレオチド-試料スライド全体のそれらの対応するセクション)をフィルタリングして除去することによって、信号対雑音認識塩基コーリングシステム106は、従来の配列決定プラットフォームよりも正確に動作する。実際、信号対雑音認識塩基コーリングシステム106は、しばしば純度ベースのフィルタリングに排他的に依存する従来のプラットフォームと比較して、低品質ヌクレオチド塩基コール(又はヌクレオチド-試料スライドの低品質セクション)をより正確に同定することができる。実際、上述されたように、純度値に基づくフィルタリングは、初期の配列決定サイクルでは休止状態であるが、配列決定が進行するにつれて現れる可能性がある問題を同定することができない可能性がある。したがって、フィルタリングのために純度値に排他的に依存する従来のプラットフォームは、結果として生じるヌクレオチド塩基コールデータ内に誤ったヌクレオチド塩基コールを含む傾向がある。しかしながら、フィルタリングのために信号対雑音比メトリックを利用することによって、信号対雑音認識塩基コーリングシステム106は、低品質のヌクレオチド塩基コールをより正確に同定し、それらをヌクレオチド塩基コールデータから除外し、より正確な配列決定結果を提供することができる。
上述のように、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックを利用して、信号について生成されたヌクレオチド塩基コールの誤差を推定する品質メトリックを決定する。図6は1つ以上の実施形態に従って、ヌクレオチド塩基コールの品質メトリックを生成するためのブロック図を図示する。
図6に示されるように、信号対雑音認識塩基コーリングシステム106は、画像604(又は複数の画像)を用いて捕捉された信号に対応する信号対雑音比メトリック602を決定する。更に示されるように、信号対雑音認識塩基コーリングシステム106は、信号についてのヌクレオチド塩基コール610を生成する。例えば、信号対雑音認識塩基コーリングシステム106は、図3を参照して上述したように、塩基コール分布モデルに従って、信号対雑音比メトリック602を利用してヌクレオチド塩基コール610を生成することができる。
図6に更に示されるように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コール610の誤差を推定するために、ヌクレオチド塩基コール610の品質メトリック612を生成する。特に、信号対雑音認識塩基コーリングシステム106は、塩基コール品質モデル606を利用して品質メトリック612を生成する。1つ以上の実施形態では、塩基コール品質モデル606は、信号の特徴及び/又はヌクレオチド-試料スライドの対応するセクションの特徴に関連する1つ以上の次元(例えば、入力)を受け入れ、これらの次元に基づいて品質メトリックを生成する。したがって、信号対雑音認識塩基コーリングシステム106は、塩基コール品質モデル606への入力の1つとして、信号対雑音比メトリック602を提供することができる。
図6に示されるように、また前述したように、塩基コール品質モデル606は、(グラフ608によって示すように)Phredアルゴリズムを含むことができる。したがって、信号対雑音認識塩基コーリングシステム106は、Phredアルゴリズムへの入力の1つとして信号対雑音比メトリック602を利用することができる。更に、信号対雑音認識塩基コーリングシステム106は、Phredアルゴリズムを利用して、ヌクレオチド塩基コール610の精度を推定するQスコア(すなわち、Phred品質スコア)を生成することができる。言い換えれば、品質メトリック612は、Phredアルゴリズムによって生成されたQスコアを含むことができる。
場合によっては、信号対雑音認識塩基コーリングシステム106は、信号に対応するヌクレオチド塩基コールについて決定された品質メトリックを利用して、ヌクレオチド塩基コールを参照ゲノムにマッピングする。特に、信号対雑音認識塩基コーリングシステム106は、信号を放出するヌクレオチド-試料スライドのセクションに位置するオリゴヌクレオチドを参照ゲノムにマッピングすることができる。したがって、1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、参照ゲノムとのアラインメントにおいて後に決定されるゲノム位置における成長中のオリゴヌクレオチドに組み込まれた標識ヌクレオチド塩基からの信号を検出することによって、信号を検出する。追加的に、信号対雑音認識塩基コーリングシステム106は、信号に対応するゲノム位置におけるヌクレオチド塩基コールの信号対雑音比メトリックを生成する。更に、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールの品質メトリックを決定し、品質メトリックを利用して、ヌクレオチド塩基コールを参照ゲノムにマッピングすることができる。
上記で示されるように、いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールの品質メトリックを決定するために、信号対雑音比メトリックに加えて値を利用する。例えば、場合によっては、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックに加えて、信号に対応する純度値を利用する。例示すると、場合によっては、信号対雑音認識塩基コーリングシステム106は、信号についての強度値と最も近い重心の強度値との間の距離、及び信号についての強度値と少なくとも1つの追加の重心の強度値との間の距離に基づいて、信号の(例えば、ヌクレオチド-試料スライドの対応するセクションの)純度値を決定する。いくつかの事例では、信号対雑音認識塩基コーリングシステム106は、2番目に近い重心を追加の重心として利用する。したがって、信号対雑音認識塩基コーリングシステム106は、塩基コール品質モデルを利用して、信号対雑音比メトリック及び純度値に基づいて品質メトリックを生成することができる。
信号に対応する信号対雑音比メトリックを利用して、信号に対応するヌクレオチド塩基コールの品質メトリックを生成することによって、信号対雑音認識塩基コールシステム106は、従来の配列決定プラットフォームと比較して、ヌクレオチド塩基コールの品質をより正確に推定することができる。実際、信号対雑音比メトリックを分析に組み込むことによって、信号対雑音認識塩基コーリングシステム106は、品質の追加の指標を利用する。したがって、信号対雑音認識塩基コーリングシステム106は、従来の配列決定プラットフォームよりも多くの情報を利用して品質の決定を行う。
上述のように、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの低品質セクションの改善されたフィルタリングを提供する。特に、信号対雑音認識塩基コーリングシステム106は、低品質セクションをより正確に同定し、対応するヌクレオチド塩基コールが生成されること、又はヌクレオチド塩基コールデータに含まれることから除外する。したがって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの問題のある部分を同定することができない場合がある従来の配列決定プラットフォームと比較して、より正確な配列決定結果を提供する。
研究者らは、様々な信号対雑音比メトリックに関連付けられたヌクレオチド-試料スライドのセクションのヌクレオチド塩基コール誤差率を決定するために研究を行った。特に、研究者らは、一連の配列決定サイクルにわたるヌクレオチド塩基コール誤差率を分析した。図7は、1つ以上の実施形態に従って、様々な信号対雑音比メトリックを有する1つ以上のヌクレオチド-試料スライドのセクションのヌクレオチド塩基コール誤差率を示すグラフを図示する。
図7のグラフによって示されるように、より低い信号対雑音比メトリック(例えば、SNR=4、SNR=5など)に関連付けられた1つ以上のヌクレオチド-試料スライドの試験されたセクションは、ヌクレオチド-塩基コールに対して高い誤差率を示す。比較すると、より高い信号対雑音比メトリック(例えば、SNR=15、SNR=14など)に関連付けられたセクションは、ヌクレオチド塩基コールに対して比較的低い誤差率に関連付けられている。したがって、ヌクレオチド塩基コールデータから、より低い信号対雑音比メトリックを有するセクションに関連付けられたヌクレオチド塩基コールを除外することによって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールデータ内の高誤差データの包含を防止する。したがって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド塩基コールデータにより正確で信頼できる塩基コールを提供する。
研究者らは、信号対雑音認識塩基コーリングシステム106の様々な実施形態の有効性を比較するために追加の研究を行った。図8A~図8Bは、1つ以上の実施形態に従って、信号対雑音認識塩基コーリングシステム106の有効性に関する研究結果を反映するグラフを図示する。
特に、図8A~図8Bのグラフは、信号対雑音認識塩基コーリングシステム106の実施形態の性能をベースラインヌクレオチド塩基コーリングシステム(「RTA3」と標識される)と比較する。グラフは、純度フィルタを利用し、分布モデルセグメンテーションを使用しない(「LS、SNRなし、純度フィルタ」と標識される)信号対雑音認識塩基コーリングシステム106の一実施形態の性能を更に比較する。グラフは、分布モデルセグメンテーションとともに純度フィルタを使用する(「LS、SNRあり、純度フィルタ」と標識される)信号対雑音認識塩基コーリングシステム106の別の実施形態の性能を示す。更に、グラフは、分布モデルセグメンテーション及び信号対雑音比閾値を利用するフィルタを使用する(「LS、SNRあり、SNRフィルタ」と標識される)信号対雑音認識塩基コーリングシステム106の更に別の実施形態の性能を示す。
図8Aのグラフは、分析されるヌクレオチド-試料スライドのセクション(例えば、ウェル)の割合に基づく、試験された各モデルに関連付けられたヌクレオチド塩基コール誤差率を示す。例えば、分析されるセクションの割合は、試験されるモデルによって実装されるフィルタ(例えば、純度フィルタ又は信号対雑音比閾値に基づくフィルタ)を通過し、参照(例えば、参照ゲノム)とアラインするセクションの割合に基づき得る。図8Aに示されるように、信号対雑音比メトリックの実装は、より低いヌクレオチド塩基コール誤差率をもたらす。より具体的には、分布モデルセグメンテーション及び信号対雑音比閾値の使用は、全ての比較されたモデルの中で最も低いヌクレオチド塩基コール誤差率を提供する。更なる注記として、図8Aのグラフは、ヌクレオチド-試料スライドのセクションをフィルタリングして除去するために使用される閾値を調整することが、誤差率に対して逆の効果を有することを示す(すなわち、x軸上で右に移動することは、より低い閾値に対応し、したがって、フィルタを通過するセクションのより高いパーセンテージに対応し、より高い誤差率を引き起こす)。
図8Bのグラフは、一連の配列決定サイクルにわたるモデルの性能を比較している。示されるように、各モデルに関連付けられた誤差率は、モデルが一連の配列決定サイクルを通して進行するにつれて増加する。しかしながら、信号対雑音認識塩基コーリングシステム106の実施形態は、最も低い誤差率を提供する。更に、図8Aのグラフを参照して上述したように、信号対雑音認識塩基コーリングシステム106による分布モデルセグメンテーション及び信号対雑音比閾値の使用は、全ての比較されたモデルの中から最も低いヌクレオチド塩基コール誤差率を提供する。したがって、図8A及び図8Bの両方によって示されるように、信号対雑音比メトリックの実装は、ヌクレオチド塩基コールを生成するときに改善された精度を提供する。
図1~図8B、対応する本文、及び実施例は、信号対雑音認識塩基コーリングシステム106のいくつかの異なる方法、システム、装置、及び非一時的コンピュータ可読媒体を提供する。上記に加えて、1つ以上の実施形態はまた、図9~図11に示されるように、特定の結果を達成するための動作を含むフローチャートに関して説明することができる。図9~図11は、より多くの又はより少ない動作で行われてもよい。更に、動作は異なる順序で行われてもよい。追加的に、本明細書で説明される動作は、互いに並行して、又は同じ若しくは同様の動作の異なる出現と並行して、繰り返されるか、又は実行され得る。
図9は、1つ以上の実施形態に従って、信号対雑音比メトリックを使用してヌクレオチド塩基コールの品質メトリックを生成するための一連の動作900のフローチャートを図示する。図9は、一実施形態による動作を図示するが、代替実施形態は、図9に示される動作のいずれかを省略、追加、再配列、及び/又は修正してもよい。いくつかの実装形態では、図9の動作は、方法の一部として行われる。いくつかの事例では、非一時的コンピュータ可読媒体は、少なくとも1つのプロセッサによって実行されると、コンピューティング装置に図9の動作を行わせる命令を記憶する。いくつかの実装形態では、システムは、図9の動作を行う。例えば、1つ以上の場合では、システムは、少なくとも1つのプロセッサと、命令を含む非一時的コンピュータ可読媒体と、を含み、命令は、少なくとも1つのプロセッサによって実行されると、システムに図9の動作を行わせる。
一連の動作900は、ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出するための動作902を含む。例えば、動作902は、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクション内の標識ヌクレオチド塩基からの信号を検出することを含み得る。
追加的に、一連の動作900は、信号に対応するスケーリングファクタ及び雑音レベルを決定する動作904を含む。例えば、動作904は、ヌクレオチド-試料スライドのセクションについて、信号についての強度値に基づいて、信号に対応するスケーリングファクタ及び雑音レベルを決定することを含むことができる。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、信号についての補正された強度値を決定し、信号についての補正された強度値に基づいて信号に対応する雑音レベルを決定することによって、ヌクレオチド-試料スライドのセクションについて、信号についての強度値に基づいて信号に対応する雑音レベルを決定する。場合によっては、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、信号についての強度値、信号に対応するスケーリングファクタ、及び信号に対応する補正オフセットファクタに基づいて補正された強度値を決定することによって、信号についての補正された強度値を決定する。いくつかの事例では、信号対雑音認識塩基コーリングシステム106は、信号に対応するヌクレオチド塩基コールの重心強度値を決定することと、重心強度値と信号についての補正された強度値との間の距離を決定することと、によって、信号についての補正された強度値に基づいて信号に対応する雑音レベルを決定する。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、1つ以上の以前の配列決定サイクルの平均雑音レベルを決定する。したがって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、1つ以上の以前の配列決定サイクルの平均雑音レベルに基づいて現在の配列決定サイクルの雑音レベルを決定することによって、信号に対応する雑音レベルを決定することができる。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、複数の以前の配列決定サイクルの複数の雑音レベルを決定し、配列決定サイクルの最新性に基づいて複数の雑音レベルに加重値を適用することによって、複数の以前の配列決定サイクルの加重平均雑音レベルを決定し、ヌクレオチド-試料スライドのセクションについて、複数の以前の配列決定サイクルの加重平均雑音レベルに基づいて、現在の配列決定サイクルの雑音レベルを決定することによって、信号に対応する雑音レベルを決定する。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、標識ヌクレオチド塩基の測定された強度と、スケーリングファクタを含む変動補正係数との間の関係を決定し、測定された強度と変動補正係数との間の関係に基づいて誤差関数を決定し、スケーリングファクタに関する誤差関数の偏導関数を生成することによってスケーリングファクタを決定することによって、信号についての強度値に基づいて、信号に対応するスケーリングファクタを決定する。
更に、一連の動作900は、スケーリングファクタ及び雑音レベルに基づいて信号対雑音比メトリックを生成する動作906を含む。例えば、動作906は、スケーリングファクタ及び雑音レベルに基づいて、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを生成することを含むことができる。1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクションの信号対雑音比メトリックを生成することによって、ヌクレオチド試料スライドのセクションの信号対雑音比メトリックを生成する。
一連の動作900は、信号対雑音比メトリックに基づいて品質メトリックを生成する動作908を更に含む。特に、動作908は、塩基コール品質モデルを利用して、信号対雑音比メトリックに基づいて信号に対応するヌクレオチド塩基コールの誤差を推定する品質メトリックを生成することを含むことができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックに基づいて、信号に対応するヌクレオチド塩基コールの精度を推定するPhred品質スコアを生成することによって、信号対雑音比メトリックに基づいて、信号に対応するヌクレオチド塩基コールの誤差を推定する品質メトリックを生成する。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、信号についての強度値と最も近い重心の強度値との間の距離、及び信号についての強度値と少なくとも1つの追加の重心の強度値との間の距離に基づいて、ヌクレオチド-試料スライドのセクションの純度値を更に決定する。したがって、信号対雑音認識塩基コーリングシステム106は、塩基コール品質モデルを利用して、信号対雑音比メトリック及び純度値に基づいて品質メトリックを生成することができる。
図10は、1つ以上の実施形態に従って、信号対雑音比メトリックを使用して信号に対応するヌクレオチド塩基コールをフィルタリングするための一連の動作1000のフローチャートを図示する。図10は、一実施形態による動作を図示するが、代替実施形態は、図10に示される動作のいずれかを省略、追加、再配列、及び/又は修正してもよい。いくつかの実装形態では、図10の動作は、方法の一部として行われる。いくつかの事例では、非一時的コンピュータ可読媒体は、少なくとも1つのプロセッサによって実行されると、コンピューティング装置に図10の動作を行わせる命令を記憶する。いくつかの実装形態では、システムは、図10の動作を行う。例えば、1つ以上の場合では、システムは、少なくとも1つのプロセッサと、命令を含む非一時的コンピュータ可読媒体と、を含み、命令は、少なくとも1つのプロセッサによって実行されると、システムに図10の動作を行わせる。
一連の動作1000は、ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出する動作1002を含む。例えば、動作1002は、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクション内の標識ヌクレオチド塩基からの信号を検出することを含む。いくつかの事例では、信号対雑音認識塩基コーリングシステム106は、参照ゲノムとのアラインメントにおいて後に決定されるゲノム位置における成長中のオリゴヌクレオチドに組み込まれた標識ヌクレオチド塩基からの信号を検出することによって、信号を検出する。
一連の動作1000はまた、信号についてのスケーリングファクタ及び雑音レベルを決定する動作1004を含む。例えば、動作1004は、ヌクレオチド-試料スライドのセクションについて、信号についての強度値に基づいて、信号に対応するスケーリングファクタ及び雑音レベルを決定することを含むことができる。
1つ以上の実施形態では、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、1つ以上の以前の配列決定サイクルの平均雑音レベルを決定する。したがって、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクションについて、1つ以上の以前の配列決定サイクルの平均雑音レベルに基づいて現在の配列決定サイクルの雑音レベルを決定することによって、信号に対応する雑音レベルを決定することができる。
追加的に、一連の動作1000は、スケーリングファクタ及び雑音レベルに基づいて信号対雑音比メトリックを生成する動作1006を含む。例えば、動作1006は、スケーリングファクタ及び雑音レベルに基づいて、ヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを生成することを含むことができる。いくつかの事例では、信号対雑音認識塩基コーリングシステム106は、雑音レベルに対するスケーリングファクタの比を決定するために、スケーリングファクタを信号と等しくすることによって、信号対雑音比メトリックを生成する。場合によっては、信号対雑音認識塩基コーリングシステム106は、信号に対応するゲノム位置におけるヌクレオチド塩基コールの信号対雑音比メトリックを生成する。
更に、一連の動作1000は、信号対雑音比メトリックに基づいて、信号に対応するヌクレオチド塩基コールをフィルタリングする動作1008を含む。例えば、動作1008は、信号対雑音比メトリックを信号対雑音比閾値と比較することに基づいて、信号に対応するヌクレオチド塩基コールを、ヌクレオチド塩基コールデータ内に含めさせるか、又はヌクレオチド塩基コールデータから除外させることを含むことができる。いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクションについての信号に対応するヌクレオチド塩基コールを除外する。
いくつかの実装形態では、信号対雑音認識塩基コーリングシステム106は、信号対雑音比メトリックが信号対雑音比閾値よりも低いと決定することに基づいて、ヌクレオチド-試料スライドのセクション内のオリゴヌクレオチドのクラスターに付加された後続の標識ヌクレオチド塩基から検出された後続の信号に対応する後続のヌクレオチド塩基コールを除外させる。
図11は、1つ以上の実施形態に従って、信号対雑音比メトリックを使用して信号対雑音範囲の強度-値境界を生成するための一連の動作1100のフローチャートを図示する。図11は、一実施形態による動作を図示するが、代替実施形態は、図11に示される動作のいずれかを省略、追加、再配列、及び/又は修正してもよい。いくつかの実装形態では、図11の動作は、方法の一部として行われる。いくつかの事例では、非一時的コンピュータ可読媒体は、少なくとも1つのプロセッサによって実行されると、コンピューティング装置に図11の動作を行わせる命令を記憶する。いくつかの実装形態では、システムは、図11の動作を行う。例えば、1つ以上の場合では、システムは、少なくとも1つのプロセッサと、命令を含む非一時的コンピュータ可読媒体と、を含み、命令は、少なくとも1つのプロセッサによって実行されると、システムに図11の動作を行わせる。
一連の動作1100は、ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出する動作1102を含む。例えば、動作1102は、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクション内の標識ヌクレオチド塩基からの信号を検出することを含むことができる。
一連の動作1100はまた、信号の信号対雑音比メトリックを生成する動作1104を含む。例えば、動作1104は、信号及び信号に対応する雑音レベルに基づいて、少なくとも1つのヌクレオチド-試料スライドのセクションの信号対雑音比メトリックを生成することを含むことができる。
一連の動作1100は、信号対雑音比メトリックについての信号対雑音比範囲を決定する動作1106を更に含む。実際に、信号対雑音認識塩基コーリングシステム106は、複数の信号対雑音比範囲を決定することができる。
更に、一連の動作は、信号対雑音比範囲の強度-値境界を生成する動作1108を含む。例えば、動作1108は、信号対雑音比範囲の各信号対雑音比範囲について、1つ以上の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成することを含むことができる。1つ以上の実施形態では、1つ以上の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成することは、信号対雑音比範囲の各信号対雑音比範囲について、1つ以上のガウス分布モデルに従って強度-値境界を生成することを含む。
場合によっては、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドのセクション内のオリゴヌクレオチドのクラスターからの標識ヌクレオチド塩基のサブセットからの信号を検出し、信号に基づいて、ヌクレオチド-試料スライドのセクションについての、信号対雑音比範囲内の信号対雑音比メトリックを生成し、信号対雑音比範囲に対応する強度-値境界のうちの強度-値境界のセットに基づいて、信号に対応するヌクレオチド塩基コールを決定する。更に、信号対雑音認識塩基コーリングシステム106は、ヌクレオチド-試料スライドの追加のセクション内のオリゴヌクレオチドの追加のクラスターからの標識ヌクレオチド塩基の追加のサブセットからの追加の信号を検出し、追加の信号に基づいて、ヌクレオチド-試料スライドの追加のセクションについての、追加の信号対雑音比範囲内の追加の信号対雑音比メトリックを生成し(追加の信号対雑音比範囲は、信号対雑音比範囲とは異なる)、追加の信号対雑音比範囲に対応する強度-値境界のうちの強度-値境界の追加のセットに基づいて、追加の信号に対応する追加のヌクレオチド塩基コールを決定することができる。
1つ以上の実施形態では、信号対雑音比範囲の各信号対雑音比範囲について、1つ以上の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成することは、第1の信号対雑音比範囲について、第1の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する強度-値境界の第1のセットを生成することと、第2の信号対雑音比範囲について、第2の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する強度-値境界の第2のセットを生成することと、を含み、強度-値境界の第2のセットは、強度-値境界の第1のセットとは異なる。
場合によっては、信号対雑音認識塩基コーリングシステム106は、第1の信号対雑音比範囲内の第1の信号対雑音比メトリックに対応し、かつ強度-値境界の第1のセットの外側及び強度-値境界の第2のセットの外側の強度値のセットを有する第1の信号を検出し、第2の信号対雑音比範囲内の第2の信号対雑音比メトリックに対応し、かつ強度値のセットを有する第2の信号を検出し、第1の塩基コール分布モデルの強度-値境界の第1のセットに基づいて、第1の信号についての第1のヌクレオチド塩基コールを生成し、第2の塩基コール分布モデルの強度-値境界の第2のセットに基づいて、第2の信号についての第2のヌクレオチド塩基コールを生成する。
本明細書に記載の方法は、様々な核酸配列決定技術と併せて使用することができる。特に適用可能な技術は、核酸を、それらの相対的位置が変化しないようにアレイ内の固定位置に付着させ、アレイが繰り返し撮像されるものである。例えば、1つのヌクレオチド塩基型を別のヌクレオチド塩基型と区別するために使用される異なる標識と一致する異なる色チャネルで画像が得られる実施形態は、特に適用可能である。いくつかの実施形態では、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好ましい実施形態は、合成による配列決定(SBS)技術を含む。
SBS技術は、一般に、鋳型鎖に対するヌクレオチドの反復的付加による、新生核酸鎖の酵素的伸長を伴う。SBSの従来の方法では、単一のヌクレオチドモノマーが、各送達においてポリメラーゼの存在下で標的ヌクレオチドに提供され得る。しかしながら、本明細書に記載の方法では、送達中のポリメラーゼの存在下で、複数の種類のヌクレオチドモノマーを標的核酸に提供することができる。
SBSは、ターミネーター部分を有するヌクレオチドモノマー、又は任意のターミネーター部分を欠くヌクレオチドモノマーを利用することができる。ターミネーターを欠くヌクレオチドモノマーを利用する方法としては、例えば、以下に更に詳細に記載されるように、γ-リン酸標識ヌクレオチドを使用するピロ配列決定及び配列決定が挙げられる。ターミネーターを含まないヌクレオチドモノマーを使用する方法では、各サイクルに添加されるヌクレオチドの数は、概ね可変であり、テンプレート配列及びヌクレオチド送達のモードに依存する。ターミネーター部分を有するヌクレオチドモノマーを利用するSBS技術では、ターミネーターは、ジデオキシヌクレオチドを利用する従来のサンガー配列決定の場合のように使用される配列決定条件下で有効に不可逆的であり得るか、又はターミネーターは、Solexa(現Illumina)によって開発された配列決定方法の場合のように可逆的であり得る。
SBS技術は、標識部分を有するヌクレオチドモノマー、又は標識部分を欠くヌクレオチドモノマーを使用することができる。したがって、標識の蛍光などの標識の特性、分子量又は電荷などのヌクレオチドモノマーの特性、ピロリン酸の放出などのヌクレオチドの組み込みの副生成物などに基づいて、組み込みイベントを検出することができる。2つ以上の異なるヌクレオチドが配列決定試薬中に存在する実施形態では、異なるヌクレオチドは、互いに区別可能であり得るか、又は代替的に、2つ以上の異なる標識は、使用される検出技術の下で区別可能であり得る。例えば、配列決定試薬中に存在する異なるヌクレオチドは、異なる標識を有することができ、それらは、Solexa(現Illumina)によって開発された配列決定方法によって例示される適切な光学系を使用して区別することができる。
好ましい実施形態としては、パイロシークエンシング(パイロ配列決定)技術が挙げられる。パイロ配列決定は、特定のヌクレオチドが新生鎖に組み込まれるときに無機ピロリン酸塩(PPi)の放出を検出する(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.and Nyren,P.(1996)「Real-time DNA sequencing using detection of pyrophosphate release.」Analytical Biochemistry 242(1)、84-9、Ronaghi,M.(2001)「Pyrosequencing sheds light on DNA sequencing.」Genome Res.11(1)、3-11、Ronaghi,M.、Uhlen,M.、及びNyren,P.(1998の)「リアルタイム無機ピロリン酸塩に基づくシークエンシング」、Science 281(5375),363、米国特許第6,210,891号、同第6,258,568号及び同第6,274,320号、参照によりその開示の全体が本明細書に組み込まれる)。パイロシークエンシングにおいて、放出されたPPiは、ATPスルフラーゼによってアデノシン三リン酸(adenosine triphosphate、ATP)に即座に変換されることによって検出することができ、生成されたATPのレベルはルシフェラーゼで生成された光子を介して検出される。配列決定される核酸は、アレイ中の特徴部に付着させることができ、アレイは、アレイの特徴部にヌクレオチドを組み込むことにより生成される化学発光シグナルを捕捉するために画像化することができる。アレイを特定のヌクレオチド型(例えば、T、C、又はG)で処理した後に、画像を得ることができる。各ヌクレオチド型の添加後に得られる画像は、アレイ内のどの特徴部が検出されるかに関して異なる。画像内のこれらの差異は、アレイ上の特徴部の異なる配列コンテンツを反映する。しかしながら、各特徴部の相対的な位置は、画像内で変わらないままである。画像は、本明細書に記載の方法を使用して記憶、処理、及び分析することができる。例えば、アレイを各異なるヌクレオチド型で処理した後に得られる画像は、可逆的ターミネーターベースの配列決定方法についての異なる検出チャネルから得られる画像について、本明細書に例示されるものと同じ方法で処理することができる。
別の例示的な種類のSBSでは、サイクル配列決定は、例えば、その開示が参照により組み込まれる、国際公開第04/018497号及び米国特許第7,057,026号に記載されているような切断可能な又は光漂白可能な色素標識を含む可逆的ターミネーターヌクレオチドを段階的に添加することによって達成される。この手法は、Solexa(now Illumina Inc.)によって商品化されており、国際公開第91/06678号及び同第07/123,744号にも記載されており、これらの各々は、参照により本明細書に組み込まれる。終端の両方を逆転させることができ、蛍光標識が開裂された蛍光標識ターミネーターの可用性は、効率的な循環可逆的終端(cyclic reversible termination、CRT)配列決定を容易にする。ポリメラーゼはまた、これらの修飾されたヌクレオチドを効率的に組み込み、かつそこから伸長するように共操作することもできる。
好ましくは、可逆的ターミネーターベースの配列決定実施形態では、標識は、SBS反応条件下での伸長を実質的に阻害しない。しかしながら、検出標識は、例えば、開裂又は分解によって除去可能であり得る。画像は、アレイ化された核酸特徴部への標識の組み込み後に撮影することができる。特定の実施形態では、各サイクルは、アレイへの4つの異なるヌクレオチド型の同時送達を伴い、各ヌクレオチド型は、スペクトル的に異なる標識を有する。次に、4つの異なる標識の1つに選択的な検出チャネルをそれぞれ使用して、4つの画像を得ることができる。代替的に、異なるヌクレオチド型を順次追加することができ、各追加ステップの間にアレイの画像を得ることができる。このような実施形態では、各画像は、特定の型のヌクレオチドを組み込んだ核酸特徴部を示す。各特徴部のシーケンスコンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しない。しかしながら、特徴部の相対的な位置は、画像内で変わらないままである。このような可逆的ターミネーター-SBS法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。画像撮影ステップに続いて、標識を除去することができ、後続のヌクレオチド添加及び検出のサイクルについて可逆的ターミネーター部分を除去することができる。特定のサイクルで検出された後、及び後続のサイクルの前に標識を除去すると、サイクル間のバックグラウンド信号及びクロストークを低減できるという利点がある。有用な標識及び除去方法の例を以下に記載する。
特定の実施形態では、ヌクレオチドモノマーの一部又は全ては、可逆的ターミネーターを含むことができる。このような実施形態では、可逆的ターミネーター/開裂可能なフルオロフォア(fluor)は、3’エステル結合を介してリボース部分に結合したフルオロフォア(fluor)を含むことができる(Metzker,Genome Res.15:1767-1776(2005)、これは参照により本明細書に組み込まれる)。他の手法は、ターミネーターの化学を蛍光標識の切断から分離している(参照によりその全体が本明細書に組み込まれる、Ruparel et al.,Proc Natl Acad Sci USA 102:5932-7(2005))。Ruparelらは、少量の3’アリル基を使用して伸長をブロックするが、パラジウム触媒で短時間処理することにより容易に脱ブロックすることができる可逆性ターミネーターの開発について説明している。フルオロフォアは、長波長UV光への30秒の曝露によって容易に開裂することができる光開裂可能リンカーを介して基に付着された。したがって、ジスルフィド還元又は光開裂のいずれかを開裂可能なリンカーとして使用することができる。可逆的終端への別の手法は、dNTP上に嵩高な染料を配置した後に続く自然終端の使用である。dNTP上の帯電した嵩高な染料の存在は、立体障害及び/又は静電障害を介して効果的なターミネーターとして作用することができる。1つの組み込みイベントの存在は、染料が除去されない限り、それ以上の結合を防止する。染料の開裂は、フルオロフォア(fluor)を除去し、終端を効果的に逆転させる。修飾ヌクレオチドの例はまた、米国特許第7,427,673号及び米国特許第7,057,026号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
本明細書に記載の方法及びシステムとともに利用することができる追加の例示的なSBSシステム及び方法は、米国特許出願公開第2007/0166705号、米国特許出願公開第2006/0188901号、米国特許第7,057,026号、米国特許出願公開第2006/0240439号、米国特許出願公開第2006/0281109号、国際公開第05/065814号、米国特許出願公開第2005/0100900号、国際公開第06/064199号、国際公開第07/010,251号、米国特許出願公開第2012/0270305号、及び米国特許出願公開第2013/0260372号に記載されており、これらの開示は、参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態は、4つ未満の異なる標識を使用する4つの異なるヌクレオチドの検出を利用することができる。例えば、SBSは、組み込まれた資料である米国特許出願公開第2013/0079232号に記載される方法及びシステムを使用して実施することができる。第1の例として、ヌクレオチド型の対は、同じ波長で検出することができるが、対のうちの1つのメンバーに対する強度の差に基づいて、又は、対の他の部材について検出された信号と比較して明らかなシグナルを出現又は消失させる、対の1つのメンバーへの変化(例えば、化学修飾、光化学修飾、又は物理的改質を行うことを介して)に基づいて区別され得る。第2の例として、4つの異なるヌクレオチド型のうちの3つを特定の条件下で検出することができ、一方、第4のヌクレオチド型は、それらの条件下で検出可能な標識がないか、又はそれらの条件下で最小限に検出される(例えば、バックグラウンド蛍光による最小限の検出など)。最初の3つのヌクレオチド型を核酸に組み込むことは、それらの対応するシグナルの存在に基づいて決定することができ、第4のヌクレオチド型を核酸に組み込むことは、任意のシグナルの不在又は最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチド型は、2つの異なるチャネルで検出される標識を含むことができ、一方、他のヌクレオチド型は、チャネルのうちの1つ以下で検出される。前述の3つの例示的な構成は、相互に排他的であるとはみなされず、様々な組み合わせで使用することができる。3つ全ての例を組み合わせた例示的な実施形態は、第1のチャネルで検出される第1のヌクレオチド型(例えば、第1の励起波長によって励起されたときに第1のチャネルで検出される標識を有するdATP)、第2のチャネルで検出される第2のヌクレオチド型(例えば、第2の励起波長によって励起されたときに第2のチャネルで検出される標識を有するdCTP)、第1及び第2のチャネルの両方において検出される第3のヌクレオチド型(例えば、第1及び/又は第2の励起波長によって励起されたときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)、及びいずれのチャネルでも検出されないか、又は最小限に検出される標識を欠く第4のヌクレオチド型(例えば、標識のないdGTP)を使用する蛍光ベースのSBS法である。
更に、組み込まれた資料である米国特許出願公開第2013/0079232号に記載のように、配列決定データは、単一のチャネルを使用して得ることができる。このようないわゆる1つの染料配列決定方法では、第1のヌクレオチド型は標識されるが、第1の画像が生成された後に標識が除去され、第2のヌクレオチド型は、第1の画像が生成された後にのみ標識される。第3のヌクレオチド型は、第1及び第2の画像の両方においてその標識を保持し、第4のヌクレオチド型は、両方の画像において標識されていないままである。
いくつかの実施形態は、ライゲーション技術による配列決定を利用することができる。このような技術は、DNAリガーゼを利用してオリゴヌクレオチドを組み込み、そのようなオリゴヌクレオチドの組み込みを識別する。オリゴヌクレオチドは、典型的には、オリゴヌクレオチドがハイブリダイズする配列中の特定のヌクレオチドの同一性と相関する異なる標識を有する。他のSBS法と同様に、標識された配列決定試薬で核酸配列のアレイを処理した後、画像を得ることができる。各画像は、特定の型の標識を組み込んだ核酸特徴部を示す。各特徴部のシーケンスコンテンツが異なるため、様々な画像に様々な特徴部が存在するか、存在しないが、特徴部の相対的な位置は、画像内で変わらないままである。ライゲーションベースの配列決定方法から得られる画像は、本明細書に記載されるように保存、処理、及び分析することができる。本明細書に記載の方法及びシステムとともに利用することができる例示的なSBSシステム及び方法は、米国特許第6,969,488号、米国特許第6,172,218号、及び米国特許第6,306,597号に記載されており、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる。
いくつかの実施形態は、ナノ細孔配列決定を利用することができる(Deamer,D.W.& Akeson,M.「Nanopores and nucleic acids:prospects for ultrarapid sequencing.」Trends Biotechnol.18,147-151(2000)、Deamer,D.and D.Branton,「Characterization of nucleic acids by nanopore analysis」.Acc.Chem.Res.35:817-825(2002)、Li,J.,M.Gershow,D.Stein,E.Brandin,and J.A.Golovchenko,「DNA molecules and configurations in a solid-state nanopore microscope」Nat.Mater.2:611-615(2003)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。そのような実施形態では、標的核酸はナノ細孔を通過する。ナノ細孔は、α-ヘモリジンなどの合成孔又は生体膜タンパク質であり得る。標的核酸がナノ細孔を通過するとき、各塩基対は、細孔の電気コンダクタンスの変動を測定することによって識別することができる。(米国特許第7,001,792号、Soni,G.V.& Meller,「A.Progress toward ultrafast DNA sequencing using solid-state nanopores.」Clin.Chem.53,1996-2001(2007)、Healy,K.「Nanopore-based single-molecule DNA analysis.」Nanomed.2,459-481(2007)、Cockroft,S.L.,Chu,J.,Amorin,M.& Ghadiri,M.R.「A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution.」J.Am Chem.Soc.130,818-820(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。ナノ細孔配列決定から得られるデータは、本明細書に記載されるように、保存、処理、及び分析することができる。具体的には、データは、本明細書に記載される光学画像及び他の画像の例示的な処理に従って、画像として処理することができる。
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。ヌクレオチドの組み込みは、例えば、各々が参照により本明細書に組み込まれる、米国特許第7,329,492号及び米国特許第7,211,414号に記載されているようなフルオロフォア含有ポリメラーゼとγ-ホスフェート標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用を介して検出することができ、又はヌクレオチドの組み込みは、例えば、参照により本明細書に組み込まれる米国特許第7,315,019号に記載されているようなゼロモード導波路、並びに、例えば、各々が参照により本明細書に組み込まれる、米国特許第7,405,281号及び米国特許出願公開第2008/0108082号に記載されているような蛍光ヌクレオチド類似体及び操作ポリメラーゼを使用して検出することができる。照明は、蛍光標識されたヌクレオチドの組み込みが低バックグラウンドで観察され得るように、表面繋留ポリメラーゼの周囲のゼプトリットルスケールの体積に制限することができる(Levene,M.J.et al.「Zero-mode waveguides for single-molecule analysis at high concentrations.」Science,299,682-686(2003)、Lundquist,P.M.et al.「Parallel confocal detection of single molecules in real time.」Opt.Lett.33,1026-1028(2008);Korlach,J.et al.「Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures.」Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)、これらの開示は、参照によりそれらの全体が本明細書に組み込まれる)。このような方法から得られる画像は、本明細書に記載されるように、記憶、処理、及び分析することができる。
いくつかのSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又は、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、若しくは同第2010/0282617(A1)号に記載されている配列決定方法及びシステムであり、これらの各々は、参照により本明細書に組み込まれる。動力学的除外を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用し、プロトンを検出するために使用されるアンプリコンのクローン集団を産生することができる。
上記のSBS法は、複数の異なる標的核酸が同時に操作されるように、多重形式で有利に実施することができる。特定の実施形態では、異なる標的核酸は、共通の反応容器又は特定の基質の表面上で処理することができる。これにより、配列決定試薬の簡便な送達、未反応試薬の除去、及び取り込み事象の検出が多重方式で可能になる。表面結合された標的核酸を使用する実施形態では、標的核酸は、アレイ形式であり得る。アレイ形式では、標的核酸は、典型的には、空間的に区別可能な方式で表面に結合され得る。標的核酸は、直接共有付着、ビーズ若しくは他の粒子への付着、又は表面に付着したポリメラーゼ若しくは他の分子への結合によって結合され得る。アレイは、各部位(特徴とも称される)における標的核酸の単一コピーを含むことができ、又は同じ配列を有する複数のコピーは、各部位若しくは特徴に存在することができる。複数のコピーは、以下で更に詳細に記載されるブリッジ増幅又はエマルジョンPCRなどの増幅方法によって生成することができる。
本明細書に記載の方法は、例えば、少なくとも約10個の特徴/cm、100個の特徴/cm、500個の特徴/cm、1,000個の特徴/cm、5,000個の特徴/cm、10,000個の特徴/cm、50,000個の特徴/cm、100,000個の特徴/cm、1,000,000個の特徴/cm、5,000,000個の特徴/cm、又はそれ超を含む、様々な密度のいずれかの特徴を有するアレイを使用することができる。
本明細書に記載の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、上記で例示されるものなどの当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の固定化されたDNAフラグメントに送達することができる流体成分を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許第2010/0111768(A1)号及び米国特許出願第13/273,666号に記載され、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、また核酸の配列を決定することができる統合配列決定システムの例としては、MiSeq(商標)プラットフォーム(Illumina Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願第13/273,666号に記載の装置が挙げられるが、これらに限定されない。
上記の配列決定システムは、配列決定装置によって受け取られた試料中に存在する核酸ポリマーを配列決定する。本明細書で定義されるように、「試料」及びその誘導体は、最も広い意味で使用され、標的を含むことが疑われる任意の試料、培養物などを含む。いくつかの実施形態では、試料は、DNA、RNA、PNA、LNA、キメラ又はハイブリッド形態の核酸を含む。試料は、1以上の核酸を含有する任意の生物学的試料、臨床試料、外科試料、農業試料、大気試料又は水試料を含むことができる。この用語はまた、任意の単離された核酸試料、例えば、ゲノムDNA、新鮮凍結又はホルマリン固定パラフィン包埋核酸試料を含む。試料は、単一個体、遺伝的に関連するメンバーからの核酸試料のコレクション、遺伝的に関連しないメンバーからの核酸試料、腫瘍試料及び正常組織試料のような単一個体からの核酸試料(適合)、又は母体被験体から得られた母体及び胎児DNAのような遺伝物質の2つの異なる形態を含む単一供給源からの試料、又は植物又は動物DNAを含む試料中の混入細菌DNAの存在に由来し得ることも想定される。いくつかの実施形態では、核酸物質の供給源は、例えば新生児スクリーニングに典型的に使用されるような新生児から得られた核酸を含むことができる。
核酸試料は、ゲノムDNA(genomic DNA、gDNA)などの高分子量物質を含むことができる。試料は、FFPE又は保管されたDNA試料から得られた核酸分子などの低分子量物質を含むことができる。別の実施形態では、低分子量物質は、酵素的又は機械的にフラグメント化されたDNAを含む。試料は、無細胞循環DNAを含むことができる。いくつかの実施形態では、試料は、生検、腫瘍、擦過物、スワブ、血液、粘液、尿、血漿、精液、毛髪、レーザ捕捉顕微解剖、外科的切除、及び他の臨床的又は実験室で得られた試料から得られた核酸分子を含むことができる。いくつかの実施態様では、試料は、疫学、農業、法医学又は病原性の試料であり得る。いくつかの実施態様では、試料は、ヒト又は哺乳動物源などの動物から得られた核酸分子を含むことができる。別の実施態様では、試料は、植物、細菌、ウイルス又は真菌などの非哺乳類源から得られた核酸分子を含むことができる。いくつかの実施態様では、核酸分子の供給源は、保存された又は絶滅した試料若しくは種であり得る。
更に、本明細書中に開示される方法及び組成物は、法医学試料からの分解及び/又はフラグメント化されたゲノムDNAなどの低品質核酸分子を有する核酸試料を増幅するのに有用であり得る。一実施態様では、法医学試料は、犯罪現場から得られた核酸、行方不明者DNAデータベースから得られた核酸、法医学調査と関連した研究所から得られた核酸を含むことができ、又は法執行機関、1つ以上のミリタリーサービス若しくはそのような隊員によって得られた法医学試料を含むことができる。核酸試料は、例えば、口腔スワブ、紙、布、又は唾液、血液、若しくは他の体液で含浸され得る他の基質に由来する、精製された試料又は溶解物を含む粗DNAであり得る。したがって、いくつかの実施態様では、核酸試料は、ゲノムDNAなどの、少量のDNA又はフラグメント化されたDNAの部分を含むことができる。いくつかの実施形態では、標的配列は、限定されるものではないが、血液、痰、血漿、精液、尿及び血清を含む1つ以上の体液に存在し得る。いくつかの実施態様では、標的配列は、犠牲者の毛髪、皮膚、組織試料、剖検又は遺体から得ることができる。いくつかの実施態様では、1つ以上の標的配列を含む核酸は、死亡した動物又はヒトから得ることができる。いくつかの実施態様では、標的配列は、微生物、植物又は昆虫学的DNAなど非ヒトDNAから得られた核酸を含むことができる。いくつかの実施形態では、標的配列又は増幅された標的配列は、ヒト同定を目的とする。いくつかの実施形態では、本開示は、概して、法医学試料の特徴を同定するための方法に関する。いくつかの実施形態では、本開示は、概して、本明細書に開示された1つ以上の標的特異的プライマー、又は本明細書に概説されたプライマー設計基準を用いて設計された1以上の標的特異的プライマーを使用するヒト同定方法に関する。一実施形態では、少なくとも1つの標的配列を含む法医学試料又はヒト同定試料は、本明細書に開示された標的特異的プライマーのいずれか1つ以上を用いて、又は本明細書に概説されたプライマー基準を用いて増幅することができる。
信号対雑音認識塩基コーリングシステム106の構成要素は、ソフトウェア、ハードウェア、又はその両方を含むことができる。例えば、信号対雑音認識塩基コーリングシステム106の構成要素は、コンピュータ可読記憶媒体上に記憶され、1つ以上のコンピューティング装置のプロセッサによって実行可能な1つ以上の命令を含むことができる。1つ以上のプロセッサによって実行されると、信号対雑音認識塩基コーリングシステム106のコンピュータ実行可能命令は、コンピューティング装置に、本明細書で説明される泡検出方法を行わせることができる。代替的に、信号対雑音認識塩基コーリングシステム106の構成要素は、特定の機能又は機能群を行うための専用処理装置などのハードウェアを含むことができる。追加的に、又は代替的に、信号対雑音認識塩基コーリングシステム106の構成要素は、コンピュータ実行可能命令及びハードウェアの組み合わせを含むことができる。
更に、信号対雑音認識塩基コーリングシステム106に関して本明細書で説明される機能を行う信号対雑音認識塩基コーリングシステム106の構成要素は、例えば、スタンドアロンアプリケーションの一部として、アプリケーションのモジュールとして、アプリケーションのプラグインとして、他のアプリケーションによって呼び出され得るライブラリ関数(複数可)として、及び/又はクラウドコンピューティングモデルとして実装され得る。したがって、信号対雑音認識塩基コーリングシステム106の構成要素は、パーソナルコンピューティング装置又はモバイル装置上のスタンドアロンアプリケーションの一部として実装され得る。追加的に、又は代替的に、信号対雑音認識塩基コーリングシステム106の構成要素は、Illumina BaseSpace、Illumina DRAGEN、又はIllumina TruSightソフトウェアを含むが、これらに限定されない配列決定サービスを提供する任意のアプリケーションにおいて実装されてもよい。「Illumina」、「BaseSpace」、「DRAGEN」、及び「TruSight」は、米国及び/又は他の国におけるIllumina,Inc.の登録商標又は商標である。
本開示の実施形態は、以下でより詳細に論じられるように、例えば、1つ以上のプロセッサ及びシステムメモリなどのコンピュータハードウェアを含む、専用又は汎用コンピュータを含み、又は利用してもよい。本開示の範囲内の実施形態はまた、コンピュータ実行可能命令及び/又はデータ構造を搬送又は記憶するための物理的及び他のコンピュータ可読媒体を含む。特に、本明細書で説明されるプロセスのうちの1つ以上は、非一時的コンピュータ可読媒体において具現化され、1つ以上のコンピューティング装置(例えば、本明細書で説明されるメディアコンテンツアクセス装置のうちのいずれか)によって実行可能な命令として少なくとも部分的に実装されてもよい。概して、プロセッサ(例えば、マイクロプロセッサ)は、非一時的コンピュータ可読媒体(例えば、メモリなど)から命令を受信し、それらの命令を実行し、それによって、本明細書で説明するプロセスのうちの1つ以上を含む、1つ以上のプロセスを実行する。
コンピュータ可読媒体は、汎用コンピュータシステム又は専用コンピュータシステムによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータ実行可能命令を記憶するコンピュータ可読媒体は、非一時的コンピュータ可読記憶媒体(装置)である。コンピュータ実行可能命令を搬送するコンピュータ可読媒体は、伝送媒体である。したがって、限定ではなく例として、本開示の実施形態は、少なくとも2つの明確に異なる種類のコンピュータ可読媒体、すなわち非一時的コンピュータ可読記憶媒体(装置)及び伝送媒体を含むことができる。
非一時的コンピュータ可読記憶媒体(装置)は、RAM、ROM、EEPROM、CD-ROM、(例えば、RAMに基づく)ソリッドステートドライブ(solid state drive、SSD)、フラッシュメモリ、相変化メモリ(phase-change memory、PCM)、他のタイプのメモリ、他の光ディスクストレージ、磁気ディスクストレージ若しくは他の磁気ストレージ装置、又はコンピュータ実行可能命令若しくはデータ構造の形態で所望のプログラムコード手段を記憶するために使用することができ、汎用若しくは専用コンピュータによってアクセスすることができる任意の他の媒体を含む。
「ネットワーク」は、コンピュータシステム及び/又はモジュール及び/又は他の電子装置間の電子データの移送を可能にする1つ以上のデータリンクとして定義される。情報が、ネットワーク又は別の通信接続(ハードワイヤード、ワイヤレス、又はハードワイヤード若しくはワイヤレスの組み合わせのいずれか)を介してコンピュータに転送又は提供されるとき、コンピュータは、その接続を伝送媒体として適切に認識する。伝送媒体は、コンピュータ実行可能命令又はデータ構造の形態で所望のプログラムコード手段を搬送するために使用することができ、汎用又は専用コンピュータによってアクセスすることができるネットワーク及び/又はデータリンクを含むことができる。上記の組み合わせも、コンピュータ可読媒体の範囲内に含まれるべきである。
更に、様々なコンピュータシステム構成要素に到達すると、コンピュータ実行可能命令又はデータ構造の形態のプログラムコード手段は、伝送媒体から非一時的コンピュータ可読記憶媒体(装置)に(又はその逆に)自動的に転送され得る。例えば、ネットワーク又はデータリンクを介して受信されたコンピュータ実行可能命令又はデータ構造は、ネットワークインターフェースモジュール(例えば、NIC)内のRAMにバッファリングされ、次いで、最終的に、コンピュータシステムRAM及び/又はコンピュータシステムにおけるより揮発性の低いコンピュータ記憶媒体(装置)に転送され得る。したがって、非一時的コンピュータ可読記憶媒体(装置)は、伝送媒体も(又は更に主に)利用するコンピュータシステム構成要素に含まれ得ることを理解されたい。
コンピュータ実行可能命令は、例えば、プロセッサで実行されると、汎用コンピュータ、専用コンピュータ、又は専用処理装置に、ある機能又は機能群を実行させる命令及びデータを含む。いくつかの実施形態では、コンピュータ実行可能命令は、汎用コンピュータ上で実行され、汎用コンピュータを、本開示の要素を実装する専用コンピュータに変える。コンピュータ実行可能命令は、例えば、バイナリ、アセンブリ言語などの中間フォーマット命令、又は更にソースコードであってもよい。主題は、構造的特徴及び/又は方法論的動作に特有の言語で説明されているが、添付の特許請求の範囲において定義される主題は、説明された特徴又は上述の動作に必ずしも限定されないことを理解されたい。むしろ、説明された特徴及び動作は、特許請求の範囲を実装する例示的な形態として開示される。
当業者は、本開示が、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、メッセージプロセッサ、ハンドヘルド装置、マルチプロセッサシステム、マイクロプロセッサベース又はプログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ページャ、ルータ、スイッチなどを含む、多くのタイプのコンピュータシステム構成を有するネットワークコンピューティング環境で実施され得ることを理解するであろう。本開示はまた、ネットワークを介して(ハードワイヤードデータリンク、ワイヤレスデータリンク、又はハードワイヤード及びワイヤレスデータリンクの組み合わせのいずれかによって)リンクされたローカル及びリモートコンピュータシステムが両方ともタスクを実行する分散システム環境において実施され得る。分散システム環境では、プログラムモジュールは、ローカルメモリ記憶装置及びリモートメモリ記憶装置の両方に位置することができる。
本開示の実施形態は、クラウドコンピューティング環境において実装することもできる。本明細書では、「クラウドコンピューティング」は、構成可能なコンピューティングリソースの共有プールへのオンデマンドネットワークアクセスを可能にするためのモデルとして定義される。例えば、クラウドコンピューティングは、構成可能なコンピューティングリソースの共有プールへのユビキタスで便利なオンデマンドアクセスを提供するために、市場で使用され得る。構成可能なコンピューティングリソースの共有プールは、仮想化を介して迅速に設定され、低い管理労力又はサービスプロバイダ対話で公開され、次いで、それに応じて拡大縮小され得る。
クラウドコンピューティングモデルは、例えば、オンデマンドセルフサービス、広域ネットワークアクセス、リソースプーリング、迅速な弾力性、測定されたサービスなどの様々な特性から構成することができる。クラウドコンピューティングモデルはまた、例えば、Software as a Service(SaaS)、Platform as a Service(PaaS)、及びInfrastructure as a Service(IaaS)などの様々なサービスモデルを公開することができる。クラウドコンピューティングモデルは、プライベートクラウド、コミュニティクラウド、パブリッククラウド、ハイブリッドクラウドなどの異なる展開モデルを使用して展開することもできる。本明細書及び特許請求の範囲において、「クラウドコンピューティング環境」は、クラウドコンピューティングが採用される環境である。
図12は、上記で説明したプロセスのうちの1つ以上を行うように構成され得るコンピューティング装置1200のブロック図を図示する。コンピューティング装置1200などの1つ以上のコンピューティング装置が、信号対雑音認識塩基コーリングシステム106及び配列決定システム104を実装することができることが理解されよう。図12によって示されるように、コンピューティング装置1200は、プロセッサ1202、メモリ1204、記憶装置1206、I/Oインターフェース1208、及び通信インターフェース1210を含むことができ、これらは、通信インフラストラクチャ1212によって通信可能に結合され得る。ある特定の実施形態では、コンピューティング装置1200は、図12に示されるものよりも少ない又は多い構成要素を含むことができる。以下の段落は、図12に示されるコンピューティング装置1200の構成要素を更に詳細に説明する。
1つ以上の実施形態では、プロセッサ1202は、コンピュータプログラムを構成する命令などの命令を実行するためのハードウェアを含む。限定ではなく、例として、ワークフローを動的に修正するための命令を実行するために、プロセッサ1202は、内部レジスタ、内部キャッシュ、メモリ1204、又は記憶装置1206から命令を取り出し(又はフェッチし)、それらを復号して実行することができる。メモリ1204は、データ、メタデータ、及びプロセッサによる実行のためのプログラムを記憶するために使用される揮発性又は不揮発性メモリであってもよい。記憶装置1206は、本明細書に記載の方法を行うためのデータ又は命令を記憶するための、ハードディスク、フラッシュディスクドライブ、又は他のデジタル記憶装置などの記憶装置を含む。
I/Oインターフェース1208は、ユーザが、コンピューティング装置1200に入力を提供し、コンピューティング装置1200から出力を受信し、そうでなければコンピューティング装置1200にデータを転送し、コンピューティング装置1200からデータを受信することを可能にする。I/Oインターフェース1208は、マウス、キーパッド若しくはキーボード、タッチスクリーン、カメラ、光学スキャナ、ネットワークインターフェース、モデム、他の既知のI/O装置、又はそのようなI/Oインターフェースの組み合わせを含むことができる。I/Oインターフェース1208は、グラフィックスエンジン、ディスプレイ(例えば、ディスプレイスクリーン)、1つ以上の出力ドライバ(例えば、ディスプレイドライバ)、1つ以上のオーディオスピーカ、及び1つ以上のオーディオドライバを含むが、これらに限定されない、ユーザに出力を提示するための1つ以上の装置を含むことができる。ある特定の実施形態では、I/Oインターフェース1208は、ユーザに提示するためにグラフィカルデータをディスプレイに提供するように構成される。グラフィカルデータは、1つ以上のグラフィカルユーザインターフェース及び/又は特定の実装に役立ち得る任意の他のグラフィカルコンテンツを表してもよい。
通信インターフェース1210は、ハードウェア、ソフトウェア、又はその両方を含むことができる。いずれにしても、通信インターフェース1210は、コンピューティング装置1200と1つ以上の他のコンピューティング装置又はネットワークとの間の通信(例えば、パケットベースの通信など)のための1つ以上のインターフェースを提供することができる。限定ではなく例として、通信インターフェース1210は、Ethernet(イーサネット)(登録商標)若しくは他の有線ベースのネットワークと通信するためのネットワークインターフェースコントローラ(network interface controller、NIC)若しくはネットワークアダプタ、又はWI-FIなどのワイヤレスネットワークと通信するためのワイヤレスNIC(wireless NIC、WNIC)若しくはワイヤレスアダプタを含むことができる。
追加的に、通信インターフェース1210は、様々なタイプの有線又は無線ネットワークとの通信を容易にすることができる。通信インターフェース1210はまた、様々な通信プロトコルを使用して、通信を容易にすることもできる。通信インフラストラクチャ1212はまた、コンピューティング装置1200の構成要素を互いに結合するハードウェア、ソフトウェア、又はその両方を含むことができる。例えば、通信インターフェース1210は、1つ以上のネットワーク及び/又はプロトコルを使用して、特定のインフラストラクチャによって接続された複数のコンピューティング装置が互いに通信して、本明細書で説明するプロセスの1つ以上の態様を実行することを可能にすることができる。例示すると、配列決定プロセスは、複数の装置(例えば、クライアント装置、配列決定装置、及びサーバー装置)が配列決定データ及びエラー通知などの情報を交換することを可能にすることができる。
前述の明細書において、本開示は、その特定の例示的な実施形態を参照して説明された。本開示の様々な実施形態及び態様は、本明細書で論じられる詳細を参照して説明され、添付の図面は様々な実施形態を図示する。上記の説明及び図面は、本開示の例示であり、本開示を限定するものとして解釈されるべきではない。本開示の様々な実施形態の完全な理解を提供するために、多数の特定の詳細が説明される。
本開示は、その趣旨又は本質的な特徴から逸脱することなく、その他の特定の形態で具現化されてもよい。記載された実施形態は、全ての点において、例示的なものに過ぎず、限定的ではないとみなされるべきである。例えば、本明細書で説明される方法は、より少ない又はより多いステップ/動作を用いて行われてもよく、又はステップ/動作は、異なる順序で行われてもよい。追加的に、本明細書で説明されるステップ/動作は、互いに並行して、又は同じ若しくは同様の動作の異なる出現と並行して、繰り返されるか、又は実行され得る。したがって、本願の範囲は、前述の説明ではなく、添付の特許請求の範囲によって示される。特許請求の範囲の意味及び均等範囲内に含まれる全ての変更は、それらの範囲内に包含されるものである。
100 環境
102 サーバー装置
104 配列決定システム
106 信号対雑音認識塩基コーリングシステム
108 ネットワーク
110 配列決定装置
112 ヌクレオチド塩基コールデータ
114 ユーザクライアント装置
116 配列決定アプリケーション
202 ヌクレオチド-試料スライド
204 画像
206 信号
208 信号対雑音比メトリック
210 分布モデルセグメンテーション
212 信号対雑音フィルタリング
214 品質メトリック
302 ヌクレオチド-試料スライド
304 画像
306 信号
308 最小二乗モデル
310 スケーリングファクタ
312 雑音レベル
314 グラフ
316a~316b 軸
318a~318d ヌクレオチドクラウド
320 点
322 点
324 重心
326 信号対雑音比メトリック
402a~402d 信号対雑音比メトリック
404a~404d 強度値
406a~406d グラフ
408 強度-値境界
410 塩基コール分布モデル
602 信号対雑音比メトリック
604 画像
606 塩基コール品質モデル
608 グラフ
610 ヌクレオチド塩基コール
612 品質メトリック
1200 コンピューティング装置
1202 プロセッサ
1204 メモリ
1206 記憶装置
1208 I/Oインターフェース
1210 通信インターフェース
1212 通信インフラストラクチャ

Claims (22)

  1. システムであって、
    少なくとも1つのプロセッサと、
    命令を含む非一時的コンピュータ可読媒体であって、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記システムに、
    ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出させ、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての強度値に基づいて、前記信号に対応するスケーリングファクタ及び雑音レベルを決定させ、
    前記スケーリングファクタ及び前記雑音レベルに基づいて、前記ヌクレオチド-試料スライドの前記セクションの信号対雑音比メトリックを生成させ、
    塩基コール品質モデルを利用して、前記信号対雑音比メトリックに基づいて前記信号に対応するヌクレオチド塩基コールの誤差を推定する品質メトリックを生成させる、非一時的コンピュータ可読媒体と、を備える、システム。
  2. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての前記強度値に基づいて、前記信号に対応する前記雑音レベルを、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての補正された強度値を決定することと、
    前記信号についての前記補正された強度値に基づいて、前記信号に対応する前記雑音レベルを決定することと、によって決定させる命令を更に含む、請求項1に記載のシステム。
  3. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての前記強度値、前記信号に対応する前記スケーリングファクタ、及び前記信号に対応する補正オフセットファクタに基づいて前記補正された強度値を決定することによって、前記信号についての前記補正された強度値を決定させる命令を更に含む、請求項2に記載のシステム。
  4. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記信号についての前記補正された強度値に基づいて、前記信号に対応する前記雑音レベルを、
    前記信号に対応する前記ヌクレオチド塩基コールについての重心強度値を決定することと、
    前記重心強度値と前記信号についての前記補正された強度値との間の距離を決定することと、によって決定させる命令を更に含む、請求項2に記載のシステム。
  5. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
    前記ヌクレオチド-試料スライドの前記セクションについて、1つ以上の以前の配列決定サイクルについての平均雑音レベルを決定させ、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記1つ以上の以前の配列決定サイクルについての前記平均雑音レベルに基づいて現在の配列決定サイクルについての前記雑音レベルを決定することによって、前記信号に対応する前記雑音レベルを決定させる命令を更に含む、請求項1に記載のシステム。
  6. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての前記強度値に基づいて、前記信号に対応する前記スケーリングファクタを、
    前記標識ヌクレオチド塩基についての測定された強度と、前記スケーリングファクタを含む変動補正係数との間の関係を決定することと、
    前記測定された強度と前記変動補正係数との間の前記関係に基づいて誤差関数を決定することと、
    前記スケーリングファクタに関する前記誤差関数の偏導関数を生成することによって、前記スケーリングファクタを決定することと、によって決定させる命令を更に含む、請求項1に記載のシステム。
  7. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクションの前記信号対雑音比メトリックを生成することによって、前記ヌクレオチド-試料スライドの前記セクションの前記信号対雑音比メトリックを生成させる命令を更に含む、請求項1に記載のシステム。
  8. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、前記信号対雑音比メトリックに基づいて前記信号に対応する前記ヌクレオチド塩基コールの精度を推定するPhred品質スコアを生成することによって、前記信号対雑音比メトリックに基づいて前記信号に対応する前記ヌクレオチド塩基コールの前記誤差を推定する前記品質メトリックを生成させる命令を更に含む、請求項1に記載のシステム。
  9. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
    信号についての前記強度値と最も近い重心の強度値との間の距離、及び前記信号についての前記強度値と少なくとも1つの追加の重心についての強度値との間の距離に基づいて、前記ヌクレオチド-試料スライドの前記セクションについての純度値を決定させ、
    前記塩基コール品質モデルを利用して、前記信号対雑音比メトリック及び前記純度値に基づいて前記品質メトリックを生成させる命令を更に含む、請求項1に記載のシステム。
  10. 前記少なくとも1つのプロセッサによって実行されると、前記システムに、
    前記ヌクレオチド-試料スライドの前記セクションについて、複数の以前の配列決定サイクルについての複数の雑音レベルを決定させ、
    配列決定サイクルの最新性に基づいて前記複数の雑音レベルに加重値を適用することによって、前記複数の以前の配列決定サイクルについての加重平均雑音レベルを決定させ、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記複数の以前の配列決定サイクルについての前記加重平均雑音レベルに基づいて現在の配列決定サイクルについての前記雑音レベルを決定することによって、前記信号に対応する前記雑音レベルを決定させる命令を更に含む、請求項1に記載のシステム。
  11. 命令が記憶された非一時的コンピュータ可読媒体であって、前記命令は、少なくとも1つのプロセッサによって実行されると、コンピューティング装置に、
    ヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出させ、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記信号についての強度値に基づいて、前記信号に対応するスケーリングファクタ及び雑音レベルを決定させ、
    前記スケーリングファクタ及び前記雑音レベルに基づいて、前記ヌクレオチド-試料スライドの前記セクションの信号対雑音比メトリックを生成させ、
    前記信号対雑音比メトリックを信号対雑音比閾値と比較することに基づいて、前記信号に対応するヌクレオチド塩基コールを、ヌクレオチド塩基コールデータ内に含めさせるか、又はヌクレオチド塩基コールデータから除外させる、非一時的コンピュータ可読媒体。
  12. 前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、前記信号対雑音比メトリックが前記信号対雑音比閾値よりも低いと決定することに基づいて、前記ヌクレオチド-試料スライドの前記セクション内のオリゴヌクレオチドのクラスターに付加された後続の標識ヌクレオチド塩基から検出された後続の信号に対応する後続のヌクレオチド塩基コールを除外させる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
  13. 前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、パターン化されたフローセルのウェル又はパターン化されていないフローセルのサブセクションについての前記信号に対応する前記ヌクレオチド塩基コールを除外させる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
  14. 前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、前記雑音レベルに対する前記スケーリングファクタの比を決定するために前記スケーリングファクタを前記信号と等しくすることによって、前記信号対雑音比メトリックを生成させる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
  15. 前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
    参照ゲノムとのアラインメントにおいて後に決定されるゲノム位置における成長中のオリゴヌクレオチドに組み込まれた前記標識ヌクレオチド塩基からの前記信号を検出することによって、前記信号を検出させ、
    前記信号に対応する前記ゲノム位置における前記ヌクレオチド塩基コールの前記信号対雑音比メトリックを生成させる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
  16. 前記少なくとも1つのプロセッサによって実行されると、前記コンピューティング装置に、
    前記ヌクレオチド-試料スライドの前記セクションについて、1つ以上の以前の配列決定サイクルについての平均雑音レベルを決定させ、
    前記ヌクレオチド-試料スライドの前記セクションについて、前記1つ以上の以前の配列決定サイクルについての前記平均雑音レベルに基づいて現在の配列決定サイクルについての前記雑音レベルを決定することによって、前記信号に対応する前記雑音レベルを決定させる命令を更に含む、請求項11に記載の非一時的コンピュータ可読媒体。
  17. 方法であって、
    少なくとも1つのヌクレオチド-試料スライドのセクション内の標識ヌクレオチド塩基からの信号を検出することと、
    前記信号及び前記信号に対応する雑音レベルに基づいて、前記少なくとも1つのヌクレオチド-試料スライドの前記セクションの信号対雑音比メトリックを生成することと、
    前記信号対雑音比メトリックについての信号対雑音比範囲を決定することと、
    前記信号対雑音比範囲の各信号対雑音比範囲について、1つ以上の塩基コール分布モデルに従って、異なるヌクレオチド塩基に対応する信号を区別するための強度-値境界を生成することと、を含む、方法。
  18. 前記信号対雑音比範囲の各信号対雑音比範囲について、前記1つ以上の塩基コール分布モデルに従って、前記異なるヌクレオチド塩基に対応する前記信号を区別するための前記強度-値境界を生成することは、
    第1の信号対雑音比範囲について、第1の塩基コール分布モデルに従って、前記異なるヌクレオチド塩基に対応する強度-値境界の第1のセットを生成することと、
    第2の信号対雑音比範囲について、第2の塩基コール分布モデルに従って、前記異なるヌクレオチド塩基に対応する強度-値境界の第2のセットを生成することであって、強度-値境界の前記第2のセットは、強度-値境界の前記第1のセットとは異なる、生成することと、を含む、請求項17に記載の方法。
  19. 前記第1の信号対雑音比範囲内の第1の信号対雑音比メトリックに対応し、かつ強度-値境界の前記第1のセットの外側及び強度-値境界の前記第2のセットの外側の強度値のセットを有する第1の信号を検出することと、
    前記第2の信号対雑音比範囲内の第2の信号対雑音比メトリックに対応し、かつ強度値の前記セットを有する第2の信号を検出することと、
    前記第1の塩基コール分布モデルについての強度-値境界の前記第1のセットに基づいて、前記第1の信号についての第1のヌクレオチド塩基コールを生成することと、
    前記第2の塩基コール分布モデルについての強度-値境界の前記第2のセットに基づいて、前記第2の信号についての第2のヌクレオチド塩基コールを生成することと、を更に含む、請求項18に記載の方法。
  20. ヌクレオチド-試料スライドのセクション内のオリゴヌクレオチドのクラスターからの標識ヌクレオチド塩基のサブセットからの信号を検出することと、
    前記信号に基づいて、前記ヌクレオチド-試料スライドの前記セクションについての、信号対雑音比範囲内の信号対雑音比メトリックを生成することと、
    前記信号対雑音比範囲に対応する前記強度-値境界のうちの強度-値境界のセットに基づいて、前記信号に対応するヌクレオチド塩基コールを決定することと、を更に含む、請求項17に記載の方法。
  21. 前記ヌクレオチド-試料スライドの追加のセクション内のオリゴヌクレオチドの追加のクラスターからの標識ヌクレオチド塩基の追加のサブセットからの追加の信号を検出することと、
    前記追加の信号に基づいて、前記ヌクレオチド-試料スライドの前記追加のセクションについての、追加の信号対雑音比範囲内の追加の信号対雑音比メトリックを生成することであって、前記追加の信号対雑音比範囲は、前記信号対雑音比範囲とは異なる、生成することと、
    前記追加の信号対雑音比範囲に対応する前記強度-値境界のうちの強度-値境界の追加のセットに基づいて、前記追加の信号に対応する追加のヌクレオチド塩基コールを決定することと、を更に含む、請求項20に記載の方法。
  22. 前記1つ以上の塩基コール分布モデルに従って、前記異なるヌクレオチド塩基に対応する前記信号を区別するための前記強度-値境界を生成することは、前記信号対雑音比範囲の各信号対雑音比範囲について、1つ以上のガウス分布モデルに従って前記強度-値境界を生成することを含む、請求項17に記載の方法。
JP2023579787A 2021-06-29 2022-06-02 ヌクレオチド塩基コール及び塩基コール品質を決定するための信号対雑音比メトリック Pending JP2024527307A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163216401P 2021-06-29 2021-06-29
US63/216,401 2021-06-29
PCT/US2022/072737 WO2023278927A1 (en) 2021-06-29 2022-06-02 Signal-to-noise-ratio metric for determining nucleotide-base calls and base-call quality

Publications (2)

Publication Number Publication Date
JP2024527307A true JP2024527307A (ja) 2024-07-24
JPWO2023278927A5 JPWO2023278927A5 (ja) 2025-06-10

Family

ID=82483142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023579787A Pending JP2024527307A (ja) 2021-06-29 2022-06-02 ヌクレオチド塩基コール及び塩基コール品質を決定するための信号対雑音比メトリック

Country Status (11)

Country Link
US (1) US20220415442A1 (ja)
EP (1) EP4364154A1 (ja)
JP (1) JP2024527307A (ja)
KR (1) KR20240022490A (ja)
CN (1) CN117730372A (ja)
AU (1) AU2022305321A1 (ja)
BR (1) BR112023026615A2 (ja)
CA (1) CA3224402A1 (ja)
IL (1) IL309308A (ja)
MX (1) MX2023015504A (ja)
WO (1) WO2023278927A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20250210137A1 (en) * 2023-12-20 2025-06-26 Illumina, Inc. Directly determining signal-to-noise-ratio metrics for accelerated convergence in determining nucleotide-base calls and base-call quality
CN117497055B (zh) * 2024-01-02 2024-03-12 北京普译生物科技有限公司 神经网络模型训练、碱基测序电信号的片段化方法及装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0450060A1 (en) 1989-10-26 1991-10-09 Sri International Dna sequencing
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP3034626A1 (en) 1997-04-01 2016-06-22 Illumina Cambridge Limited Method of nucleic acid sequencing
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
DE60131194T2 (de) 2000-07-07 2008-08-07 Visigen Biotechnologies, Inc., Bellaire Sequenzbestimmung in echtzeit
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP3795577A1 (en) 2002-08-23 2021-03-24 Illumina Cambridge Limited Modified nucleotides
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP1701785A1 (en) 2004-01-07 2006-09-20 Solexa Ltd. Modified molecular arrays
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
EP1828412B2 (en) 2004-12-13 2019-01-09 Illumina Cambridge Limited Improved method of nucleotide detection
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
ES2675047T3 (es) 2006-03-31 2018-07-06 Illumina, Inc. Sistemas para análisis de secuencia mediante síntesis
EP2089517A4 (en) 2006-10-23 2010-10-20 Pacific Biosciences California POLYMERASEENZYME AND REAGENTS FOR ADVANCED NUCKIC ACID SEQUENCING
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
EP2639578B1 (en) 2006-12-14 2016-09-14 Life Technologies Corporation Apparatus for measuring analytes using large scale fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
PT3290528T (pt) 2011-09-23 2019-10-14 Illumina Inc Métodos e composições para sequenciamento de ácido nucleico
CA2867665C (en) 2012-04-03 2022-01-04 Illumina, Inc. Integrated optoelectronic read head and fluidic cartridge useful for nucleic acid sequencing
EP3077943B1 (en) * 2013-12-03 2020-06-03 Illumina, Inc. Methods and systems for analyzing image data
CA3088687A1 (en) * 2018-01-26 2019-08-01 Quantum-Si Incorporated Machine learning enabled pulse and base calling for sequencing devices
US11210554B2 (en) * 2019-03-21 2021-12-28 Illumina, Inc. Artificial intelligence-based generation of sequencing metadata

Also Published As

Publication number Publication date
KR20240022490A (ko) 2024-02-20
EP4364154A1 (en) 2024-05-08
AU2022305321A1 (en) 2024-01-18
US20220415442A1 (en) 2022-12-29
IL309308A (en) 2024-02-01
CN117730372A (zh) 2024-03-19
WO2023278927A1 (en) 2023-01-05
BR112023026615A2 (pt) 2024-03-05
MX2023015504A (es) 2024-01-22
CA3224402A1 (en) 2023-01-05

Similar Documents

Publication Publication Date Title
US20220415442A1 (en) Signal-to-noise-ratio metric for determining nucleotide-base calls and base-call quality
EP4562638A1 (en) Rapid single-cell multiomics processing using an executable file
US20220319641A1 (en) Machine-learning model for detecting a bubble within a nucleotide-sample slide for sequencing
JP2024529836A (ja) ゲノム座標の確信度分類を生成するための機械学習モデル
US20250210137A1 (en) Directly determining signal-to-noise-ratio metrics for accelerated convergence in determining nucleotide-base calls and base-call quality
US20240266003A1 (en) Determining and removing inter-cluster light interference
US20240127906A1 (en) Detecting and correcting methylation values from methylation sequencing assays
US20230313271A1 (en) Machine-learning models for detecting and adjusting values for nucleotide methylation levels
US20250210141A1 (en) Enhanced mapping and alignment of nucleotide reads utilizing an improved haplotype data structure with allele-variant differences
US20230410944A1 (en) Calibration sequences for nucelotide sequencing
US20250111899A1 (en) Predicting insert lengths using primary analysis metrics
US20250111898A1 (en) Tracking and modifying cluster location on nucleotide-sample slides in real time
US20230420080A1 (en) Split-read alignment by intelligently identifying and scoring candidate split groups
US20230095961A1 (en) Graph reference genome and base-calling approach using imputed haplotypes
WO2025006570A2 (en) Modifying sequencing cycles or imaging during a sequencing run to meet customized coverage estimation
EP4515547A1 (en) Machine-learning models for selecting oligonucleotide probes for array technologies
CN119698662A (zh) 生成并实现结构变异图基因组

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250602

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250602