JP2025508348A

JP2025508348A - バイオ医薬品製造における精製プロセスのための高度なデータ駆動モデリング

Info

Publication number: JP2025508348A
Application number: JP2024545897A
Authority: JP
Inventors: マイティ，シュレヤ; スペツィエリス，コンスタンティノス
Original assignee: Bayer Healthcare LLC
Current assignee: Bayer Healthcare LLC
Priority date: 2022-02-04
Filing date: 2023-01-24
Publication date: 2025-03-26
Also published as: CN118613721A; US20250053712A1; EP4473303A1; KR20240145988A; WO2023150037A1

Abstract

一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための例示的な方法は、化学プロセスのインスタンスに関連するデータを取得するステップと、化学プロセスのインスタンスに関連するデータに基づいて、複数の性能閾値を使用して化学プロセスのインスタンスの性能を評価するステップと、を含み、複数の性能閾値は、化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、階層モデルは、階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）と、階層の第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）と、階層の第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルと、を含む。
【選択図】図１

Description

関連出願の相互参照
本出願は、２０２２年２月４日に出願された米国仮特許出願第６３／３０６，９７１号の益を主張し、その開示は、その全体が参照により本明細書に組み込まれる。

本開示は、概して化学プロセスの性能を評価することに関し、より具体的には、一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するために機械学習およびデータモデリング技術を使用することに関する。

精製は、その活性形態の治療用タンパク質を他の不純物から分離することを可能にする、バイオ医薬品製造における重要なプロセスである。典型的な精製プロセスは、いくつかのクロマトグラフィベースの単位操作を含むことができ、各単位操作は、複数のフェーズを含むことができる。

各クロマトグラフィステップの操作中、連続的な（各バッチのパラメータ毎の時系列データ）は、生産フロアのクロマトグラフィスキッドに設置されたインライン／オンラインセンによって生成され得、バッチデータ（例えば、各バッチのパラメータ毎に１つのデータポイント）は、それぞれアットライン／オフラインインプロセス試料によって生成され得る。これらのバイオ製造プロセスデータは、プロセス専門家の決定および行動を支持するための彼らの洞察を生成することができる高度なデータ駆動モデルの開発のために活用することができる。

従来、インライン／オンライン／アットライン／オフライン分析の各々の管理チャートは、バイオ製造プロセスを監視するために、単変量的（例えば、チャート毎に１つのパラメータ）な傾向がある。これにより、パラメータ間の任意の相関を見つけるために、同時に複数のチャートを検討する必要が生じる。これにより、リアルタイムの早期障害検出および遡及的な根本原因分析は時間がかかり、面倒になる。加えて、各パラメータの個々のチャートを単純に検討することによって複数の属性間の関係を見出そうとすることは、例外的に困難であり、基礎となる相関を全て捕捉する上で制限される可能性がある。多変量データ解析（ＭＶＤＡ）は、大きく複雑な異種データセットを全て同時に効果的に分析するために使用することができる高度な統計技術を含む方法論である。このようなＭＶＤＡモデルの開発および展開は、より効果的で効率的なほぼリアルタイムのプロセス監視、早期障害検出および診断を可能にする。ＭＶＤＡモデルは、プロセス変数間の相関構造において見出された有用なプロセス情報を活用しながら、わずかな多変量メトリックのみを用いて複数のプロセス変数を監視するために使用することができる。したがって、ＭＶＤＡは、プロセスエクスカーションの根本原因特定によってプロセス技術者および科学者を支援し、全体的なプロセスの理解および制御を強化するために活用することができる製造作業の多くの洞察を提供するために使用することができる、強力な方法論である。

本開示の実施形態は、商用生物製剤製造におけるアフィニティクロマトグラフィカラムへの高度なデータ駆動モデリングの適用を含む。これは、精製ステップにおいてプロセスパラメータおよびインプロセス制御パラメータを使用し、その間の相関を視覚化する、多変量モデルを開発することを含む。具体的には、本開示の実施形態は、（ａ）精製単位操作およびその対応するフェーズの効果的な監視のための階層データ駆動モデリング方法論の適用を提示し、（ｂ）このようなデータ駆動モデルの有用性を強調し、（ｃ）生物製剤製造における高度なデータ駆動モデルの開発に含まれる重要なステップの概要を提供するために使用することができる。モデルはアフィニティクロマトグラフィカラムのために開発されているが、イオン交換、水素イオン濃度など、他のタイプのクロマトグラフィカラムを監視するために、同様のモデリング手法を採用することができる。本明細書で論じられるデータ駆動モデリング手法の基本概念は、バイオ製造プロセス中に生成されたデータの相関およびパターンを見出すことである。

一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための例示的な方法は、化学プロセスのインスタンスに関連するデータを取得するステップと、化学プロセスのインスタンスに関連するデータに基づいて、複数の性能閾値を使用して化学プロセスのインスタンスの性能を評価するステップと、を含み、複数の性能閾値は、化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、階層モデルは、階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチ進化モデル（ＢＥＭ）と、階層の第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチレベルモデル（ＢＬＭ）と、階層の第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、全体性能モデルは一連の連続フェーズの全てに対応する、全体性能モデルと、を含む。

いくつかの実施形態では、化学プロセスは、１つ以上のクロマトグラフィカラムを使用して細胞培養液中の他のタンパク質から組換えタンパク質を分離するための精製プロセスである。

いくつかの実施形態では、一連のフェーズは、１つ以上のクロマトグラフィカラムの平衡化、充填、洗浄、および溶出を含む。

いくつかの実施形態では、化学プロセスは、細胞培養開発プロセス、細胞分離プロセス、ウイルス不活性化プロセス、医薬品の製造プロセス、またはこれらの任意の組み合わせを含む。

いくつかの実施形態では、複数のＢＥＭの各ＢＥＭは、化学プロセスのフェーズに関連するインラインデータを評価するための１つ以上の性能閾値を取得するように訓練される。

いくつかの実施形態では、１つ以上の性能閾値は、ホテリングのＴ２法および１つ以上のモデル残差を含む。

いくつかの実施形態では、複数のＢＥＭは、化学プロセスの１つ以上の履歴インスタンスに関連するインラインデータを使用して訓練される。

いくつかの実施形態では、インラインデータは、１つ以上のセンサから取得された時系列データを含む。

いくつかの実施形態では、インラインデータは、定義された頻度で補間される。

いくつかの実施形態では、複数のＢＥＭの各ＢＥＭモデルは、部分最小二乗（ＰＬＳ）モデルである。

いくつかの実施形態では、複数のＢＬＭの各ＢＬＭは、化学プロセスのフェーズに関連するインラインデータ、アットラインデータ、およびオフラインデータを評価するための１つ以上の性能閾値を取得するように訓練される。

いくつかの実施形態では、複数のＢＬＭは、化学プロセスの１つ以上の履歴インスタンスに関連するインラインデータ、アットラインデータ、およびオフラインデータを使用して訓練される。

いくつかの実施形態では、アットラインデータおよびオフラインデータは、タンパク質溶液（バルク）属性、バルク融解プロセス属性、カラム充填属性、カラム属性、溶出属性、試料測定値、またはこれらの任意の組み合わせを含む。

いくつかの実施形態では、複数のＢＬＭの各ＢＬＭモデルは、主成分分析（ＰＣＡ）モデルである。

いくつかの実施形態では、全体性能モデルは、第２のレベルの訓練されたＢＬＭモデルに基づいて訓練される。

いくつかの実施形態では、方法は、化学プロセスのインスタンスの評価された性能の１つ以上の結果をディスプレイに表示するステップをさらに含む。

いくつかの実施形態では、方法は、化学プロセスのインスタンスの評価された性能に基づいて化学プロセスの変数を更新するステップをさらに含む。

一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための例示的なシステムは、１つ以上のプロセッサと、メモリと、１つ以上のプログラムであって、１つ以上のプログラムは、メモリに記憶されており、１つ以上のプロセッサによって実行されると、化学プロセスのインスタンスに関連するデータを取得し、化学プロセスのインスタンスに関連するデータに基づいて、複数の性能閾値を使用して化学プロセスのインスタンスの性能を評価するための命令を含み、複数の性能閾値は、化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、階層モデルは、階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチ進化モデル（ＢＥＭ）と、階層の第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチレベルモデル（ＢＬＭ）と、階層の第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、全体性能モデルは一連の連続フェーズの全てに対応する、全体性能モデルと、を含む、１つ以上のプログラムと、を備える。

例示的な非一時的コンピュータ可読記憶媒体は、一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための１つ以上のプログラムを記憶し、１つ以上のプログラムは、電子デバイスの１つ以上のプロセッサによって実行されると、電子デバイスに、化学プロセスのインスタンスに関連するデータを取得させ、化学プロセスのインスタンスに関連するデータに基づいて、複数の性能閾値を使用して化学プロセスのインスタンスの性能を評価させる、命令を含み、複数の性能閾値は、化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、階層モデルは、階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチ進化モデル（ＢＥＭ）と、階層の第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは一連の連続フェーズのうちの１つのフェーズに対応する、複数のバッチレベルモデル（ＢＬＭ）と、階層の第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、全体性能モデルは一連の連続フェーズの全てに対応する、全体性能モデルと、を含む。

いくつかの実施形態による、例示的な階層モデルの概略図である。全てのベースレベルモデルからの情報は、コンセンサス行列Ｒへのそれぞれの行列（Ｔ_ｊ）を通じてトップレベルに伝達される。Ｒは、トップレベルスコアＴ_ＴＬおよび負荷Ｐ_ＴＬを生成することによって全てのベースレベルモデルからのデータをさらに要約するために使用される。いくつかの実施形態による、例示的な交差検証プロトコルを示す図である。データセットは、訓練および試験サブセットに分割される。（データセットの異なる分割を伴う）交差検証ラウンドの各々についてモデルが開発される。全てのモデルからの交差検証結果は、モデルの最終予測力を推定するために平均化される。いくつかの実施形態による、例示的なデータ構造（Ａ）および（Ｂ）を示す図である。（Ａ）バッチ進化モデルに関して、異なる色のデータセットは異なるバッチからのデータを表す。各データセットは、「ｍ」個のＸ変数（プロセス関連変数）、「ｎ」個の観測値（時点）、および１つのＹ変数（カラム体積）を含む。（Ｂ）バッチレベルモデルに関しては、バッチ進化モデルに使用されるデータセット列は、バッチレベルモデルのデータセットを生成するために転置される。各行は、異なるバッチを表す。Ｘ_１時間１は、時間_１における最初のＸ_１変数の値を示す。同様に、Ｘ_ｍ時間ｎは、時間_ｎにおけるＸ_ｍ変数の値を示す。いくつかの実施形態による、精製カラム監視モデル構造の例示的な概略図である。階層の一番下のレベルは、インラインデータのみを有するＰＬＳモデルであるバッチ進化モデル（ＢＥＭ）である。階層内の次に低いレベルは、インラインおよびアットライン／オフラインデータを有するＰＣＡモデルである、フェーズの各々のバッチレベルモデル（ＢＬＭ）である。最後に、トップレベルモデルは、まとめられた全てのフェーズのインラインおよびアットライン／オフラインデータを含む包括的なＰＣＡモデルである。いくつかの実施形態による、（精製プロセスの成熟度変数と見なされる）カラム体積の関数としてのＸ空間について第１の主成分ｔ［１］のスコアを示す例示的なＢＥＭスコアプロットである。緑色の破線はデータの平均を示し、赤色の破線は平均からの±３の標準偏差に対応する。いくつかの実施形態による、例示的なモデル訓練を示す図である。精製プロセスの異なるフェーズについてバッチ進化モデルが示されている。プロットの各々は、精製カラムを通過した材料のカラム体積に対するＸ空間のＭＶＤＡスコアｔ［１］によって要約されたバッチの進行を示す。いくつかの実施形態による、例示的なモデル訓練を示す図である。精製プロセスにおける４つのフェーズのバッチレベルモデルが示されている。各プロットは単フェーズを表し、楕円の境界は、フェーズの各々のモデルを構築するために使用されるデータの９５％信頼度を示す。楕円内の各円は単一のバッチを指し、ＭＶＤＡスコアによってその特定のフェーズについて要約されたバッチの全ての情報を示す。いくつかの実施形態による、例示的なモデル訓練を示す図である。この図は、４つのフェーズ、すなわちプロセスの平衡化、充填、洗浄、および溶出を考慮するアフィニティ精製カラムのトップレベルモデルを示す。いくつかの実施形態による、単一のＢＬＭのエクスカーション検出および診断に使用されるモデルメトリックの例を示す図である。具体的に示されているのは、以下の通りである：（Ａ）ホテリングのＴ^２；（Ｂ）モデル残差は、プロセス監視中にエクスカーションを特定するために両方とも使用される；および（Ｃ）寄与チャートは、全てのバッチの平均と比較して、バッチのエクスカーションに対する変数の寄与を示す。いくつかの実施形態による、モデルベンチマーク例を示す図である。ＭＶＤＡメトリックを使用するモデル検出エクスカーション、および寄与チャートを使用する特定された寄与プロセスパラメータも示されている。さらに記載されているのは以下の通りである：（Ａ）充填フェーズバッチレベルモデル（ＢＬＭ）におけるＭＶＤＡメトリック「ホテリングのＴ^２」および「残差」を通じてバッチのために検出されたプロセスエクスカーション；（Ｂ）充填フェーズバッチ進化モデル（ＢＥＭ）のＭＶＤＡスコアプロットによって確認されたエクスカーション；（Ｃ）エクスカーションに関連付けられたプロセスパラメータを特定するために使用される寄与チャートであり、カラムポンプ流量は、このエクスカーションに対して最も高い寄与を有することが見出された；および（Ｄ）ポンプ流量対カラム体積の単変量表現であり、カラム充填ポンプ流量は、一定期間のポンプ停止に起因して、バッチの充填フェーズの間、しばらくの間劇的に減少した。

以下の説明は、当業者が様々な実施形態を作成および使用することを可能にするために提示される。具体的なデバイス、技術、および用途の説明は、例としてのみ提供される。本明細書に記載される例に対する様々な修正が当業者にとって明らかとなり、本明細書で定義される一般原理は、様々な実施形態の趣旨および範囲から逸脱することなく、他の例および用途に適用され得る。したがって、様々な実施形態は本明細書に記載および図示される例に限定されることを意図するものではなく、特許請求の範囲と一致する範囲が与えられるべきである。

１．材料および方法
１．１．精製プロセス
精製プロセスは、任意の組換え治療用タンパク質の製造プロセスにおける細胞培養および分離ステップの下流にある。精製中、選択された組換えタンパク質は、無数のタンパク質、ＤＮＡ、代謝体などのプールから分離され、細胞培養中の哺乳動物宿主細胞ならびに他のプロセスおよび生成物に関連する不純物によって合成される。精製されているタンパク質のタイプに応じて、特定のタンパク質の精製中に異なるクロマトグラフィカラムが使用される。イオン交換、疎水性相互作用、およびアフィニティクロマトグラフィは、タンパク質精製のために実施される最も広く使用される分離技術に含まれる。精製プロセスは通常、平衡、充填、洗浄、溶出、および最終的に精製カラムの生成および貯蔵などのいくつかのフェーズに分離される。アフィニティクロマトグラフィカラムを使用する治療用タンパク質精製プロセスのオンライン監視のために開発された多変量モデルが、本明細書で論じられる。このカラムは、「充填」フェーズの間に標的タンパク質分子を捕捉し、「溶出」フェーズの間にタンパク質分子を放出する固定フェーズビーズ上の（標的タンパク質結合ドメインを有する）ペプチドリガンドを含む。カラムリガンドに対する親和性のない非標的タンパク質は、廃棄物としてカラムを流れる。

１．１．１．平衡化
平衡化の間、精製カラムは、標的タンパク質を充填する前に、その内部ｐＨおよび導電率に関して平衡化される。これは、選択されたタンパク質の適切な条件でカラムに緩衝液を流すことによって達成される。

１．１．２．充填
カラムは、まず標的タンパク質溶液で充填される。このフェーズの間、不純物はペプチドリガンドに対する親和性がないので、不純物が廃棄されるためにカラムを流れている間、カラム内の充填されたビーズに対する親和性を有する治療用タンパク質分子は、ビーズと結合する。

１．１．３．洗浄
しっかりと保持された標的タンパク質分子を固定フェーズビーズに結合されたまま、緩く結合された不純物のみを除去するために、洗浄緩衝液がカラムに通される。

１．１．４．溶出
標的タンパク質とペプチドリガンドとの間の結合を破壊し、カラムからの標的タンパク質分子の除去を容易にする溶出緩衝液が、カラムに通される。標的タンパク質を含有するカラム溶出液が、さらなる処理のために収集される。

１．２．データおよびデータソース
データは、本明細書に記載されるモデリングの努力の基礎である。アフィニティクロマトグラフィカラムのためのＭＶＤＡモデルの開発に使用されるデータには２つのカテゴリがある。

インライン／オンラインデータ
モデルで使用されるインライン測定は、以下のタイプである：（ａ）クロマトグラフィカラムからの廃液の総体積、（ｂ）導電率、（ｃ）紫外線吸光度（ＵＶ）、（ｄ）温度、（ｅ）圧力、および（ｆ）流量。プロセス測定値からのデータは、ＰＩｐｒｏｃｅｓｓｈｉｓｔｏｒｉａｎ（ＯＳＩｓｏｆｔ）と呼ばれるデータベースに記憶される。導電率センサなどのプロセスセンサから取得された全ての時系列データはＰＩアーカイブに記憶され、その対応するバッチコンテキスト（例えば、バッチＩＤ、個々のプロセスフェーズの開始および終了タイムスタンプなど）は、ＰＩアセットフレームワーク（ＡＦ）データベースに記憶される。

アットライン／オフラインデータ
アットラインおよびオフラインデータの両方は、リレーショナルデータベースであるＤｉｓｃｏｖｅｒａｎｔ（ＢＩＯＶＩＡ）を介してアクセス可能である。製造実行システム（ＭＥＳ）、実験室情報管理システム（ＬＩＭＳ）、ならびにシステムアプリケーションおよび製品（ＳＡＰ）などの基礎となるデータシステムからデータを取得するために、構造化照会言語（ＳＱＬ）が使用される。モデル開発に使用されるアットライン／オフラインデータのタイプは、タンパク質溶液（バルク）属性、バルク融解プロセス属性、カラム充填属性、カラム属性、溶出属性、および試料測定値を含む。

１．３．ソフトウェア
このケーススタディでは、以下のソフトウェアを使用した。

モデリング：Ｓｉｍｃａ１４．１（ＳａｒｔｏｒｉｕｓＳｔｅｄｉｍＢｉｏｔｅｃｈ）およびＭａｔｌａｂ２０１５ｂ（ＭａｔｈＷｏｒｋｓ）
データ取得、前処理、視覚化、およびモデル自動化：Ｍａｔｌａｂ，Ｐｙｔｈｏｎ３．６（ＰｙｔｈｏｎＳｏｆｔｗａｒｅＦｏｕｎｄａｔｉｏｎ）。

１．４．インライン／オンラインデータ前処理
ＰＩｐｒｏｃｅｓｓｈｉｓｔｏｒｉａｎから取得したインライン／オンラインデータは、バッチ間比較を容易にするために、データを捕捉するとともにデータを標準形式に整列させながら、明らかな異常（クロマトグラムベースラインオフセットなど）を除去するために標準化された方法で処理する必要がある。精製プロセスのためのデータ前処理は、以下のステップを含む：（ａ）補間、（ｂ）セグメント化、および（ｃ）整列。

バッチの進行中に様々なセンサによって捕捉されたインラインデータは、異なるプロセスパラメータについて不均一なサンプリング周波数でＰＩｈｉｓｔｏｒｉａｎに保存される。バッチの各々がどのようにして精製プロセスを進むかを監視し、その性能を比較するために、定義された頻度で全てのパラメータについてインラインデータが補間される。アフィニティカラムのバッチを含むいくつかのフェーズの各々について、開始時点と終了時点との間で連続的に記録された時系列データを抽出することによって、インラインデータを対応するフェーズにセグメント化するために、開始および終了タイムスタンプを含むメタデータを活用した。アフィニティ精製プロセスのサブフェーズ毎に全てのバッチが開始時間に対して整列されていることを保証するために、各カラムセンサの時系列データを前処理した。

１．５．多変量データ解析
多変量データ解析（ＭＶＤＡ）は、３つ以上の変数からのデータを共同で分析するために使用される統計技術およびアルゴリズムを指す。具体的には、これらのアルゴリズムは、データ内のパターンおよび関係を検出するために使用することができる。これらの方法のいくつかの用途は、クラスタリング（グループ化の検出）、分類（グループ／クラスメンバーシップを決定）、および回帰（入力と連続数値出力との間の関係を決定）である。広く使用されているＭＶＤＡ技術のいくつかは、主成分分析（ＰＣＡ）および潜在構造への部分最小二乗投影（ＰＬＳ－以下、部分最小二乗と呼ばれる）である。

１．５．１．主成分分析
主成分分析（ＰＣＡ）は、先験的情報および目標値または出力値への先験的情報のラベリングまたはマッピングなしで基礎となるデータの概要を取得するために使用することができるＭＶＤＡ法である。ＰＣＡは、共線関係が存在するデータセットの次元数を減少させることによって、データ内の構造およびパターンを見出すことができる。ＰＣＡの動作原理は、主成分と呼ばれる新しい直交する潜在変数を定義することによって元データを要約することである。これらの主成分（ＰＣ）は、データセット内の元の変数の線形結合を含む。これらは、固定数のＰＣによって説明される分散が最大化されるように選択される。新しい潜在変数空間における元データの値は、スコアと呼ばれる。ｎ個の観測値およびｍ個の変数を有するｎｘｍ行列によって記述されるデータセットが与えられると、Ｔは、スコアと呼ばれるｋ個の主成分値を含むｎｘｋ行列を示す。主成分に対するｉ＝１，．．．，ｎを有する各個々の変数Ｘ_ｉｊの寄与を決定するＪ＝１，．．．，ｍおよびｑ＝１，．．．，ｋを有する係数ｐ_ｊｑは、負荷と呼ばれる。ｍｘｋ行列Ｐは負荷行列と呼ばれ、Ｔ、Ｘ、およびＰの間の関係は、式（２．１）によって行列表記法において与えられる。

Ｘ＝ＴＰ^Ｔ＋Ｅ（２．１）
ここで、Ｅは残差ｎｘｍ行列を示す。残差は、主成分ｌからｋによって説明されない分散を含む。ＰＣＡの詳細な紹介は、参照により本明細書に組み込まれる、Ｂａｓｉｌｅｖｓｋｙ，Ａ．，“Ｓｔａｔｉｓｔｉｃａｌｆａｃｔｏｒａｎａｌｙｓｉｓａｎｄｒｅｌａｔｅｄｍｅｔｈｏｄｓ：ｔｈｅｏｒｙａｎｄａｐｐｌｉｃａｔｉｏｎｓ”，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，２００９において入手可能である。モデル品質は、交差検証（セクション２．５．４参照）、ならびに利用可能であれば外部データセットを用いて評価される。この目的のために、Ｒ^２およびＱ^２統計が評価される。Ｒ^２統計は、モデルによって説明される平方和の割合を記述し、Ｑ^２統計は、モデルの予測能力に関する情報を伝達する。両者の詳細な導出は、参照により本明細書に組み込まれる、Ｅｒｉｋｓｓｏｎ，Ｌ．，Ｂｙｒｎｅ，Ｔ．，Ｊｏｈａｎｓｓｏｎ，Ｅ．，Ｔｒｙｇｇ，Ｊ．およびＶｉｋｓｔｒｏｍ，Ｅ．，“Ｍｕｌｔｉ－ａｎｄｍｅｇａｖａｒｉａｔｅｄａｔａａｎａｌｙｓｉｓ：ＢａｓｉｃＰｒｉｎｃｉｐｌｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ”（２０１３）：４２５で与えられる。

１．５．２．部分最小二乗
部分最小二乗（ＰＬＳ）回帰は、入力と出力との間の関数関係を決定することを目的とするＭＶＤＡ法である。この方法は、参照により本明細書に組み込まれる、ＳＩＡＭＪ．Ｓｃｉ．Ｓｔａｔ．Ｃｏｍｐｕｔ．５（３）１９８４：７３５－７４３で公開されたＷｏｌｄＳらによる“ＴｈｅＣｏｌｌｉｎｅａｒｉｔｙＰｒｏｂｌｅｍｉｎＬｉｎｅａｒＲｅｇｒｅｓｓｉｏｎ：ＴｈｅＰａｒｔｉａｌＬｅａｓｔＳｑｕａｒｅｓ（ＰＬＳ）ＡｐｐｒｏａｃｈｔｏＧｅｎｅｒａｌｉｚｅｄＩｎｖｅｒｓｅｓ”およびＩｎｔｅｌｌ．Ｌａｂ．Ｓｙｓｔ．５８（２）２００１：１０９－１３０で公開されたＷｏｌｄＳらによる“ＰＬＳＲｅｇｒｅｓｓｉｏｎ：ＡＢａｓｉｃＴｏｏｌｏｆＣｈｅｍｏｍｅｔｒｉｃｓ”にさらに記載されている。簡潔には、データセット内で利用可能な元の変数に対してではなく、潜在変数と呼ばれるより少ない直交する変数に対して回帰が行われる点で、ＰＣＡと同様の手法がとられる。これらは、元の変数の線形結合である。分散を最大化するように潜在変数が選択されるＰＣＡとは対照的に、ＰＬＳでは、従属変数と独立変数との間の共分散を最大化するように潜在変数が決定される。回帰問題の解を得るために、Ｘ空間およびＹ空間の両方において以下の演算が行われる。Ｘ空間では、線形変換は、以下のように定義される。

Ｔ＝ＸＷ^＊（２．２）
および
Ｘ＝ＴＰ^Ｔ＋Ｅ（２．３）
ここで、ＴはＸスコアｎｘｋ行列を示し、ＰはＸ負荷ｍｘｋ行列を示し、Ｗ^＊はＸ重みｍｘｋ行列を示し、Ｅはｋ＜ｍのＸ残差ｎｘｍ行列を示す。Ｙ空間では、変換は以下のように求められる。

Ｙ＝ＵＣ^Ｔ＋Ｇ（２．４）
ここで、ＵはＹスコアｎｘｋ行列を示し、ＣはＹ重みｑｘｋ行列を示し、ＧはＹ残差ｎｘｑ行列を示す。Ｘスコアは、Ｘ残差Ｅを最小化し、Ｙの良好な予測子となるように選択され、Ｙスコアは、Ｙ残差Ｇを最小化するように選択される。ＰＣＡと同様に、ＰＬＳモデルについてＲ^２およびＱ^２を計算することができる。

１．５．３．階層モデリング
階層モデリングは、ＰＣＡ、ＰＬＳのいずれか、または両方の異なるモデルからのデータの結合を容易にする。これは、典型的に、正確には類似していないが相互接続されているプロセスの異なる部分からの情報を要約するために行われる。これの適用は、平衡化、充填、洗浄、および溶出などのアフィニティクロマトグラフィベースの精製プロセスにおける異なるフェーズを組み合わせることであり、これらの全ては、フェーズの各々について特定の目的を達成し、最終的に精製物を出力するために、順次実行される。

階層ＭＶＤＡモデルは、複数のレベルを含む。階層モデルの詳細な説明は、参照により本明細書に組み込まれる、Ｗｏｌｄ，Ｓ．，Ｋｅｔｔａｎｅｈ，Ｎ．，Ｆｒｉｄｅｎ，Ｈ．およびＨｏｌｍｂｅｒｇ，Ａ．，“Ｍｏｄｅｌｌｉｎｇａｎｄｄｉａｇｎｏｓｔｉｃｓｏｆｂａｔｃｈｐｒｏｃｅｓｓｅｓａｎｄａｎａｌｏｇｏｕｓｋｉｎｅｔｉｃｅｘｐｅｒｉｍｅｎｔｓ”，ＣｈｅｍｏｍｅｔｒｉｃｓａｎｄＩｎｔｅｌｌｉｇｅｎｔＬａｂｏｒａｔｏｒｙＳｙｓｔｅｍｓ４４（１９９８）：３３１－３４０に見出すことができる。ベースレベル（ＢＬ）モデルおよびトップレベル（ＴＬ）モデルを有する２レベル階層モデル構造の例が、それぞれデータＸ_１およびＸ_２を有する２つのフェーズ１および２を用いるプロセスについて図１に示されている。ベースレベルモデルは、（ａ）複数の数であり、ＰＣＡまたはＰＬＳのいずれかに基づき、（ｂ）その潜在変数（すなわち、スコア行列Ｔ_ｊ）によって入力データを要約し、（ｃ）ＰＣＡモデルのＰ_ｊなどの負荷行列によって記述することができ、ここでｊは異なるＢＬモデルを示す。両方のベースレベルモデルからの情報（データセットＸ_１およびＸ_２に対応する）は、次元ｎｘｋ_１およびｎｘｋ_２を有するそれぞれのスコア行列Ｔ_１およびＴ_２を通じてトップレベルモデルに供給される。観測値の数はｎで表され、フェーズ１および２のＢＬモデルの潜在変数の数は、それぞれｋ_１およびｋ_２である。ＴＬモデル入力は、２つのＢＬモデルからのスコアを含むｎｘ（ｋ_１＋ｋ_２）行列Ｒによって定義される。具体的には、個々のＸブロックからのスコア行列Ｔ_ｊは、ＴＬモデルのスコアおよび負荷を計算するために使用されるコンセンサス行列Ｒ（式（２．５））を形成するために結合される。ＰＣＡＴＬモデルでは、スコア行列Ｔ_ＴＰ、負荷Ｐ_ＴＰ、およびＲ行列の間の関係は、式（２．６）によって与えられる。

Ｒ＝［Ｔ_１，Ｔ_２］（２．５）
Ｔ_ＴＰ＝ＲＰ_ＴＰ（２．６）
一般に、ｋ_ＴＬ＜（ｋ_１＋ｋ_２）であり、これは、ＭＶＤＡ階層モデリング構造が全ての異なるＢＬモデルの圧縮を容易にすることを示す。階層モデルの重要な利点は、異なる次元を有するＸ_１およびＸ_２などのデータブロックの各々が、ＴＬモデルに対する相当な寄与を維持することである。Ｔ_１がＴ_２（ｋ_１＜ｋ_２）と比較してより少ない潜在変数を含む場合であっても、階層モデリングは、同様の重み付けで両方のＢＬモデルからのスコア行列を処理する。

１．５．４．交差検証
交差検証は、データ内の基礎となる統計的関係が、モデル訓練に使用されなかったデータセットを予測するのに十分に一般的であるかどうかを評価するために使用されるモデル試験技術である。交差検証技術では、所与のデータセットが訓練および試験サブセットに分割される。モデルは、訓練データセットを使用して開発され、次いで試験サブセットに対して評価される。いくつかのラウンドの交差検証が（異なる分割を用いて）実行され、複数の並列モデルをもたらす（図２参照）。全ての並列モデルからの結果は、モデルの最終予測力を推定するために平均化される。交差検証の主な目的は、モデルが訓練データセットに非常によく適合するが、独立したデータセットを合理的に良好に予測するのに十分なほど一般的ではない条件である、過剰適合の可能性を低減することである。

結果および考察
本明細書で論じられるＭＶＤＡ精製監視モデルをエンドユーザにとって使用可能なツールにするために、以下の要因を検討した。（ａ）モデルがプロセスエクスカーションを検出できるように、有意義なモデリング手法の実装、（ｂ）履歴バッチに対する新しいバッチのベンチマーク。この目的のために、（ａ）モデル開発および（ｂ）ベンチマークの２段階でモデリング作業を実行した。

１．６．モデル開発
アフィニティクロマトグラフィカラムのためのＭＶＤＡ監視モデルの開発は、モデル選択、モデル訓練、およびモデル試験の３つのステップを含み得る。

２．１．１．モデル選択
アフィニティクロマトグラフィの全ての単フェーズ、例えば平衡化、充填、洗浄、および溶出（以下、フェーズと呼ばれる）のバッチ軌道の評価は、バッチ進行の関数としてのインラインデータの変化を考慮するモデルの開発を必要とする。このようなモデルは、バッチ進化モデル（ＢＥＭ）と呼ばれる。

各フェーズは、アットラインおよびオフラインデータを考慮することにより、精製バッチ完了後にさらに評価され得る。したがって、アットライン／オフラインディスクリートプロセスパラメータおよび属性に加えてインライン時系列データを組み込むことができるＭＶＤＡモデルが必要とされている。これに関して、バッチレベルモデル（ＢＬＭ）を使用することができる。

最後に、アフィニティクロマトグラフィ単位操作の包括的評価は、全てのフェーズを一緒に評価する能力を必要とする。このような目的は、階層モデリング構造を介して達成することができる。階層モデルのレベルの各々の詳細は、後続のセクションに記載される。

２．１．１．１バッチ進化モデル
バッチ進化モデルは、この階層モデル構造における第１のレベルである。バッチ進化モデルは、様々なプロセスパラメータのインラインデータを考慮することにより、バッチがどのように進行しているかに関する考えを提供する。バッチ進行（処理の時間または処理される物質の体積のいずれかに関する）は、少数の潜在変数によって要約される、全ての利用可能なインラインプロセスパラメータの関数として表される。ＢＥＭは、Ｘ変数としてのプロセスパラメータおよびＹ変数としてのバッチ進行成熟度を有するＰＬＳモデルである。いくつかの実施形態では、１１個のインラインプロセスパラメータはＸ変数を含み、カラム体積は変数Ｙとして使用される。ＢＥＭは、全てのプロセスパラメータＸおよびバッチ成熟度Ｙの間の共分散を最大化することに焦点を当てている。ＢＥＭを生成するために使用されるデータセットは、複数のバッチの時系列データを含む。データセット内の列の各々は、モデル開発に使用される異なる変数に対応する。行の各々は、そのバッチの測定における異なる時点に対応する（図３Ａ）。

２．１．１．２バッチレベルモデル
バッチレベルモデルは、階層モデル構造における第２のレベルである。バッチレベルモデルは、インラインおよびアットライン／オフラインデータを考慮して、精製プロセスのフェーズが完了すると、履歴バッチと比較して、バッチがどのように実行されるかに関する考えを提供する。ここでのＢＬＭは、本質的に、異なるプロセス変数に存在する変動を説明することに焦点を当てるＰＣＡモデルである。全てのインライン時系列データは、ＢＬＭデータセットの各行が単一のバッチを表すように転置される（図３Ｂ参照）。

２．１．１．３トップレベルモデル
トップレベルモデルは、階層モデル構造の第３の最も高いレベルである。ＴＬモデルは、多変量モデリング構造内の異なるレベルを結合し、精製プロセスの全てのフェーズを通じて単一のバッチの性能の包括的な見解を提供する（図４参照）。階層内の最も低いレベルは、各フェーズのインラインデータのみを有する、ＰＬＳモデルであるバッチ進化モデル（ＢＥＭ）である。階層内の次に低いレベルは、各フェーズのインラインおよびアットライン／オフラインデータを結合する、ＰＣＡモデルであるバッチレベルモデル（ＢＬＭ）である。最後に、トップレベルモデルは、まとめられた全てのフェーズのインラインおよびアットライン／オフラインデータを含むＰＣＡモデルである。

２．１．２．モデル訓練
モデルの構造、この場合はベースレベルおよび包括的なトップレベルモデルにバッチ進化およびバッチレベルモデルを有する階層構造を定義した後、次のステップは、モデルを訓練することである。ここでのモデル訓練は、「許容可能な動作範囲」となる多変量管理限界を定義するために履歴データを使用するプロセスを指す。いくつかの実施形態では、モデル訓練のために６０の原薬（ＤＳ）バッチを含む履歴データを使用した。これらの全てのバッチは許容可能な動作範囲を表すので、これらをモデル訓練のために検討した。具体的には、これらのＤＳバッチが生産した最終製品の質は発表するのに許容可能であるから、バッチのいずれもモデル訓練のために排除されなかった。

履歴データ（許容可能なバッチ）を用いてモデルを訓練することで、実際には許容可能な動作範囲である多変量管理限界を定義することが可能になる。ＢＥＭレベルでは、元の時系列データは、ごくわずかな潜在変数で記述され、これらをカラム体積の関数として視覚化することができる。図５では、ＢＥＭからの単一のバッチの第１の主成分のスコアプロットが、カラム体積の関数として示されている。ＢＥＭの多変量限界は、履歴データ平均（緑色の破線で示される）の±３標準偏差（赤色の破線で示される）である。図６は、モデル訓練のために検討された全ての精製フェーズおよびバッチのＢＥＭ表現を示す。モデル訓練に使用されたバッチのほとんどは、多変量限界内に収まっている。（過剰適合の可能性を低減するために）訓練データセットにおける変動性を高めるために、多変量限界の外側にあるが精製プロセスの下流でプロセスおよび製品に影響を及ぼさないいくつかのバッチを含めた。ＢＬＭおよびトップレベルモデルのスコアプロットは、図７および図８にそれぞれ示されている。

プロセス監視は、２つの多変量メトリック、すなわちホテリングのＴ^２およびモデル残差を使用して容易になる。ホテリングのＴ^２は、履歴平均からの観測値の距離を表す。残差は、モデルによって説明することができないデータセットの部分、通常はデータ内のノイズ、または以前はモデルによって見ることがなかった発生を指す。あるバッチのホテリングのＴ^２および残差の許容範囲は、９５％の臨界レベルによって定義される。バッチがホテリングのＴ^２および残差の許容範囲内に収まっている場合、何の措置も取られない。しかしながら、バッチが一方または両方のメトリックについてこれらの許容範囲外にある場合には、寄与因子のさらなる調査がもたらされる。寄与プロットは、特定のエクスカーションに対する異なるプロセスパラメータの潜在的な寄与の定量的比較を提供する。これは、全てのバッチの平均に対する選択されたバッチまたはバッチグループの差を示す。

図９は、単一のＢＬＭについての２つのエクスカーション検出メトリック（ホテリングのＴ^２およびモデル残差）および１つの診断メトリック（変数寄与）の例を示す。しかしながら、これらは、全てのＢＬＭ（図７に示される）およびトップレベル（図８に示される）に関して計算された。

２．１．３．モデル試験
ＭＶＤＡモデルは、以下の目的に基づいて試験される。まず、訓練データセットを使用して開発されたモデルが独立したデータセットを記述するのに十分なほど一般的であることを保証するための試験が行われる。このために、交差検証が実施される（セクション１．５．４参照）。モデル試験目的のために７ラウンドの交差検証を使用した。

さらに、エクスカーションを検出し、基礎となる寄与パラメータを決定するモデルの能力を実証するための試験が行われる。プロセスエクスカーションを検出するため、およびモデルベンチマークのために、アフィニティクロマトグラフィプロセスのための１１個の追加のバッチを２倍使用した。

２．２モデルベンチマーク
モデルベンチマークは、プロセスの許容可能な動作範囲を表す履歴からの予想に対する新しいバッチ（モデル訓練に使用されないバッチ）の評価を指す。これにより、潜在的なエクスカーションの評価、およびもしあれば、特定された寄与因子の調査が可能になる。

（訓練データセットに含まれない）１１の精製バッチをモデルベンチマークに使用した。これは、エクスカーションを検出するモデルの能力の試験として機能した（モデル試験のセクション３．１．３で述べられるとおり）。バッチを評価するために、多変量メトリック、すなわちホテリングのＴ^２およびモデル残差を使用した。モデル試験／ベンチマークの例が図１０に示されている。アフィニティクロマトグラフィカラムについて、ホテリングのＴ^２およびモデル残差値（両方とも許容レベル外）の両方のバッチのうちの１つでプロセスエクスカーションを検出した。エクスカーションは、充填フェーズＢＥＭのＭＶＤＡスコア空間で確認された。図１０（Ｃ）に示される寄与プロットにおいて、ポンプ流量がこのエクスカーションに対して最も高い寄与を有することがわかった。単変量プロットをより深く調べると、図１０（Ｄ）の充填フェーズの間、ポンプがしばらくの間停止していたことがわかった。加えて、ＭａｎｕｆａｃｔｕｒｉｎｇＳｃｉｅｎｃｅｓの主題の専門家は、充填フェーズの間に何らかの技術的問題によってポンプが実際に停止したことを確認した。したがって、この監視手順を通じて、製品品質に影響があろうとなかろうと、エクスカーションを検出することができる。

３．結論
バイオ医薬品の商用製造中に、豊富なプロセスおよび製品データが生成される。これらの大規模で複雑なデータセットは、典型的に、様々な単位操作のためのインライン／オンラインセンサから、ならびに生産フロアおよび品質管理研究所のベンチトップ分析器から生成される。本開示は、プロセス専門家の洞察を生成して組織的決定を支援するために活用することができる高度なデータ駆動モデルを開発するために、精製プロセスのための大量の製造データをどのように利用することができるかを記載している。具体的には、組換え治療用タンパク質の製造で使用される分取アフィニティクロマトグラフィのケーススタディを提示した。

利用可能なインライン、オンライン、アットライン、およびオフラインデータを使用する効果的で効率的なインライン／オンラインプロセス監視の目的で、アフィニティクロマトグラフィカラムのために多変量モデルを開発した。アフィニティクロマトグラフィ単位操作を含むいくつかの精製フェーズを考慮し、その包括的な評価を容易にするために、多変量階層モデリング手法を採用した。これは、階層モデルが、インプロセス制御とのプロセスパラメータの共同評価に加えて、プロセスフェーズ毎のプロセスパラメータの軌道を監視できることを暗示する。具体的には、個々のバッチ進化およびバッチレベルモデルをフェーズ毎に開発し、履歴からの予想の観点から新しいバッチの進行の評価を可能にした。これらのモデルの訓練に利用可能な履歴データを活用し、モデル試験およびベンチマークに追加のデータを使用した。開発されたモデルは、新しいバッチの評価に使用される、履歴的に許容される動作条件を記述する。ベンチマークは、あったとしても、エクスカーションに潜在的に寄与する因子（元の変数）を強調する多変量診断および寄与分析をほとんど介さずに、実行することができる。本明細書に提示されたモデルは、エクスカーションを検出することができるものとして試験および図示した。

本ケーススタディは、高度な階層データ駆動モデルの開発が、単位操作を含む全てのフェーズの包括的な評価を介した効果的な精製プロセス監視、ならびに各フェーズ内および異なるフェーズにわたるパターンおよび関係を検出する能力をどのように可能にするかを実証している。個々の単変量解析を細部まで調査する能力を維持しながら、わずかな多変量メトリックのみを介して多くのプロセスパラメータを評価することができるので、多変量モデリングはまた効率的なプロセス監視を保証する。また、本明細書で論じられるモデリング手法は、精製のみに限定されず、バイオ製造プロセス中に複数の単位操作に適用することができる。細胞培養、ウイルス不活性化、および最終製品製造（充填および仕上げ）プロセスのために多変量モデルを開発することはまた、全体的プロセス監視および早期障害検出の追加のプロセス理解および効率的な方法を提供することができる。

全体として、高度な多変量データ駆動モデリングは、生物製剤製造プロセスのプロセス理解および制御のための全体的な組織的努力を支援しながら、同時に、精製単位操作の早期障害検出および障害診断のためのプロセス監視を強化することができる。

添付の図面を参照して本開示および例を完全に記載してきたが、様々な変更および修正が当業者にとって明らかとなることに留意されたい。このような変更および修正は、特許請求の範囲によって定義されるように、本開示および例の範囲に含まれるものとして理解されるべきである。

上記の説明は、説明を目的として、特定の実施形態を参照して記載されてきた。しかしながら、上記の例示的な説明は、網羅的であること、または本発明を開示された正確な形態に限定することを意図していない。上記の技術を考慮した上で、多くの修正および変形が可能である。実施形態は、本教示の原理およびその実際的応用を最もよく説明するように選択および記載された。これにより、当業者は、企図される特定の使用に適した様々な修正を用いて本技術および様々な実施形態を最良に利用することが可能になる。

Claims

一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための方法であって、
前記化学プロセスの前記インスタンスに関連するデータを取得するステップと、
前記化学プロセスの前記インスタンスに関連する前記データに基づいて、複数の性能閾値を使用して前記化学プロセスの前記インスタンスの前記性能を評価するステップと、
を含み、
前記複数の性能閾値は、前記化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、
前記階層モデルは、
階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第１のレベルの複数のバッチ進化モデル（ＢＥＭ）と、
前記階層の前記第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第２のレベルの複数のバッチレベルモデル（ＢＬＭ）と、
前記階層の前記第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、前記全体性能モデルは前記一連の連続フェーズの全てに対応する、第３のレベルの全体性能モデルと、
を含む、方法。
前記化学プロセスは、１つ以上のクロマトグラフィカラムを使用して細胞培養液中の他のタンパク質から組換えタンパク質を分離するための精製プロセスである、請求項１に記載の方法。
前記一連のフェーズは、前記１つ以上のクロマトグラフィカラムの平衡化、充填、洗浄、および溶出を含む、請求項２に記載の方法。
前記化学プロセスは、
精製プロセス、
細胞培養開発プロセス、
細胞分離プロセス、
ウイルス不活性化プロセス、
医薬品の製造プロセス、または
これらの任意の組み合わせ
を含む、請求項１に記載の方法。
前記複数のＢＥＭの各ＢＥＭは、前記化学プロセスのフェーズに関連するインラインデータを評価するための１つ以上の性能閾値を取得するように訓練される、請求項１～４のいずれか一項に記載の方法。
前記１つ以上の性能閾値は、ホテリングのＴ２法および１つ以上のモデル残差を含む、請求項５に記載の方法。
前記複数のＢＥＭは、前記化学プロセスの前記１つ以上の履歴インスタンスに関連するインラインデータを使用して訓練される、請求項１～６のいずれか一項に記載の方法。
前記インラインデータは、１つ以上のセンサから取得された時系列データを含む、請求項７に記載の方法。
前記インラインデータは、定義された頻度で補間される、請求項７に記載の方法。
前記複数のＢＥＭの各ＢＥＭモデルは、部分最小二乗（ＰＬＳ）モデルである、請求項１～９のいずれか一項に記載の方法。
前記複数のＢＬＭの各ＢＬＭは、前記化学プロセスのフェーズに関連するインラインデータ、アットラインデータ、およびオフラインデータを評価するための１つ以上の性能閾値を取得するように訓練される、請求項１～１０のいずれか一項に記載の方法。
前記１つ以上の性能閾値は、ホテリングのＴ２法および１つ以上のモデル残差を含む、請求項１１に記載の方法。
前記複数のＢＬＭは、前記化学プロセスの前記１つ以上の履歴インスタンスに関連するインラインデータ、アットラインデータ、およびオフラインデータを使用して訓練される、請求項１～１２のいずれか一項に記載の方法。
前記アットラインデータおよびオフラインデータは、タンパク質溶液（バルク）属性、バルク融解プロセス属性、カラム充填属性、カラム属性、溶出属性、試料測定値、またはこれらの任意の組み合わせを含む、請求項１３に記載の方法。
前記複数のＢＬＭの各ＢＬＭモデルは主成分分析（ＰＣＡ）モデルである、請求項１～１４のいずれか一項に記載の方法。
前記全体性能モデルは、前記第２のレベルの前記訓練されたＢＬＭモデルに基づいて訓練される、請求項１～１５のいずれか一項に記載の方法。
前記化学プロセスの前記インスタンスの前記評価された性能の１つ以上の結果をディスプレイに表示するステップをさらに含む、請求項１～１６のいずれか一項に記載の方法。
前記化学プロセスの前記インスタンスの前記評価された性能に基づいて前記化学プロセスの変数を更新するステップをさらに含む、請求項１～１７のいずれか一項に記載の方法。
一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するためのシステムであって、
１つ以上のプロセッサと、
メモリと、
１つ以上のプログラムとを含み、前記１つ以上のプログラムは、前記メモリに記憶されており、前記１つ以上のプロセッサによって実行されるように構成され、前記１つ以上のプログラムは、
前記化学プロセスの前記インスタンスに関連するデータを取得し、
前記化学プロセスの前記インスタンスに関連する前記データに基づいて、複数の性能閾値を使用して前記化学プロセスの前記インスタンスの前記性能を評価する、
ための命令を含み、
前記複数の性能閾値は、前記化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、
前記階層モデルは、
階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第１のレベルの複数のバッチ進化モデル（ＢＥＭ）と、
前記階層の前記第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第２のレベルの複数のバッチレベルモデル（ＢＬＭ）と、
前記階層の前記第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、前記全体性能モデルは前記一連の連続フェーズの全てに対応する、第３のレベルの全体性能モデルと、
を含む、
システム。
一連の連続フェーズを有する化学プロセスのインスタンスの性能を評価するための１つ以上のプログラムを記憶する非一時的コンピュータ可読記憶媒体であって、前記１つ以上のプログラムは、電子デバイスの１つ以上のプロセッサによって実行されると、前記電子デバイスに、
前記化学プロセスの前記インスタンスに関連するデータを取得させ、
前記化学プロセスの前記インスタンスに関連する前記データに基づいて、複数の性能閾値を使用して前記化学プロセスの前記インスタンスの前記性能を評価させる、
命令を含み、
前記複数の性能閾値は、前記化学プロセスの１つ以上の履歴インスタンスに基づいて階層モデルを訓練することによって取得され、
前記階層モデルは、
階層の第１のレベルの複数のバッチ進化モデル（ＢＥＭ）であって、各ＢＥＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第１のレベルの複数のバッチ進化モデル（ＢＥＭ）と、
前記階層の前記第１のレベルより上の第２のレベルの複数のバッチレベルモデル（ＢＬＭ）であって、各ＢＬＭモデルは前記一連の連続フェーズのうちの１つのフェーズに対応する、第２のレベルの複数のバッチレベルモデル（ＢＬＭ）と、
前記階層の前記第２のレベルより上の第３のレベルの第３のレベルの全体性能モデルであって、前記全体性能モデルは前記一連の連続フェーズの全てに対応する、第３のレベルの全体性能モデルと、
を含む、非一時的コンピュータ可読記憶媒体。