JP7765090B2

JP7765090B2 - ナノボディ及びナノボディ親和性を同定するための組成物及び方法

Info

Publication number: JP7765090B2
Application number: JP2022566362A
Authority: JP
Inventors: シ，イ; シャン，ユーフェイ; サン，ジェ
Original assignee: ユニバーシティオブピッツバーグ－オブザコモンウェルスシステムオブハイヤーエデュケイション
Priority date: 2020-05-01
Filing date: 2021-04-29
Publication date: 2025-11-06
Anticipated expiration: 2041-04-29
Also published as: EP4143582A4; US20230176070A1; CN116457368A; CA3177089A1; EP4143582A1; JP2023524719A; WO2021222546A1

Description

関連出願の相互参照
本出願は、２０２０年５月１日に出願された米国仮出願第６３／０１８，５５９号の利益を主張するものであり、この米国仮出願の全体を参照により本明細書に明示的に援用する。

ナノボディ（Ｎｂ）は、ラクダ科動物の重鎖抗体（ＨｃＡｂ）のＶ_ＨＨドメインに由来する天然の抗原結合性フラグメントである。Ｎｂは、その小さなサイズと卓越した構造的堅牢性、優れた溶解性及び安定性、生物工学及び製造の容易さ、ヒトにおける低免疫原性、ならびに迅速な組織透過性という性質を持っている。これらの理由によって、Ｎｂは、最先端の生物医学、診断、及び治療への応用のための有望な薬剤として浮上している（Ｍｕｙｌｄｅｒｍａｎｓ，２０１３；Ｂｅｇｈｅｉｎ，２０１７；Ｒａｓｍｕｓｓｅｎ，２０１１；Ｊｏｖｃｅｖｓｋａ，Ｉ．＆Ｍｕｙｌｄｅｒｍａｎｓ，Ｓ，２０２０）。

Ｎｂ発見のためにディスプレイベースの技術が開発されている（Ｌａｕｗｅｒｅｙｓ，１９９８；Ｐａｒｄｏｎ，２０１４；ＭｃＭａｈｏｎ，２０１８；Ｅｇｌｏｆｆ，２０１９）。これらの方法では、通常、特定の標的に中程度の親和性で結合する少数の標的合成Ｎｂを産出し、自然に循環する抗原特異的ＨｃＡｂ／Ｎｂレパートリーを直接分析しない。最近、質量分析に基づくプロテオミクスが、Ｎｂ発見の有望な手法として浮上している（Ｆｒｉｄｙ，２０１４）。ただし、少なくともいくつかの理由により、抗原特異的Ｎｂプロテオームの大規模、高感度、及び高信頼性の分析に向けた重要な課題が残っている。（ａ）循環抗体の多様性及びダイナミックレンジは、どの細胞プロテオームよりも桁違いに高い。（ｂ）免疫化されたラクダ科動物から得られたＮｂ配列データベースには、通常、正確なデータベース検索に課題をもたらす何百万もの一意の配列が含まれている（Ｓａｖｉｔｓｋｉ，２０１５）。（ｃ）この大規模なデータベースは、保存されたＮｂフレームワーク配列が大きな比率を占めており、同定に対する特異性をほとんど提供しない。特異性は主に相補性決定領域（ＣＤＲ）によって決定されるが、その中でもＣＤＲ３ループは長くなる可能性があり、信頼できるＭＳ分析が困難になる。（ｄ）現在の方法は、大規模なＮｂレパートリーの正確な定量化及び分類を可能にする効率的なプロトコル及びインフォマティクスの利用可能性によって制限されている。

本明細書に提供されるのは、相補性決定領域（ＣＤＲ）３、２、及び／または１のナノボディアミノ酸配列（ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列）群を同定する、減数されたＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列が対照と比較して偽陽性である、方法であって、（ａ）抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、（ｂ）血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、（ｃ）ライブラリー中の各ｃＤＮＡの配列を同定することと、（ｄ）抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、（ｅ）ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、（ｆ）消化産物の質量分析を実行して、質量分析データを取得することと、（ｇ）質量分析データと相関する、ステップｃで同定された配列を選択することと、（ｈ）ステップｇの配列内のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列を同定することと、（ｉ）ステップｈのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ（ｉ）の選択された配列が、減数された偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列を有する群を含む、方法である。いくつかの実施形態では、ステップ（ｄ）は、血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ（ｄ）の１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む。いくつかの態様では、ステップ（ｄ）は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ（ｅ）からステップ（ｉ）までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ（ｉ）のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の親和性を、それぞれ、ナノボディフラクションのそれぞれにおけるＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。

いくつかの実施形態では、相補性決定領域（ＣＤＲ）３のナノボディアミノ酸配列（ＣＤＲ２配列）群を同定する、減数されたＣＤＲ３配列が対照と比較して偽陽性である、方法であって、（ａ）抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、（ｂ）血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、（ｃ）ライブラリー中の各ｃＤＮＡの配列を同定することと、（ｄ）抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、（ｅ）ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、（ｆ）消化産物の質量分析を実行して、質量分析データを取得することと、（ｇ）質量分析データと相関する、ステップｃで同定された配列を選択することと、（ｈ）ステップｇの配列内のＣＤＲ３領域の配列を同定することと、（ｉ）ステップｈのＣＤＲ３領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ（ｉ）の選択された配列が、減数された偽陽性のＣＤＲ３配列を有する群を含む、方法である。いくつかの実施形態では、ステップ（ｄ）は、血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ（ｄ）の１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む。いくつかの態様では、ステップ（ｄ）は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ（ｅ）からステップ（ｉ）までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ（ｉ）のＣＤＲ３領域配列の親和性を、ナノボディフラクションのそれぞれにおけるＣＤＲ３領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。

いくつかの実施形態では、相補性決定領域（ＣＤＲ）２のナノボディアミノ酸配列（ＣＤＲ２配列）群を同定する、減数されたＣＤＲ２配列が対照と比較して偽陽性である、方法であって、（ａ）抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、（ｂ）血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、（ｃ）ライブラリー中の各ｃＤＮＡの配列を同定することと、（ｄ）抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、（ｅ）ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、（ｆ）消化産物の質量分析を実行して、質量分析データを取得することと、（ｇ）質量分析データと相関する、ステップｃで同定された配列を選択することと、（ｈ）ステップｇの配列内のＣＤＲ２領域の配列を同定することと、（ｉ）ステップｈのＣＤＲ２領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ（ｉ）の選択された配列が、減数された偽陽性のＣＤＲ２配列を有する群を含む、方法である。いくつかの実施形態では、ステップ（ｄ）は、血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ（ｄ）の１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む。いくつかの態様では、ステップ（ｄ）は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ（ｅ）からステップ（ｉ）までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ（ｉ）のＣＤＲ２領域配列の親和性を、ナノボディフラクションのそれぞれにおけるＣＤＲ２領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。

いくつかの実施形態では、相補性決定領域（ＣＤＲ）１のナノボディアミノ酸配列（ＣＤＲ１配列）群を同定する、減数されたＣＤＲ１配列が対照と比較して偽陽性である、方法であって、（ａ）抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、（ｂ）血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、（ｃ）ライブラリー中の各ｃＤＮＡの配列を同定することと、（ｄ）抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、（ｅ）ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、（ｆ）消化産物の質量分析を実行して、質量分析データを取得することと、（ｇ）質量分析データと相関する、ステップｃで同定された配列を選択することと、（ｈ）ステップｇの配列内のＣＤＲ１領域の配列を同定することと、（ｉ）ステップｈのＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ（ｉ）の選択された配列が、減数された偽陽性のＣＤＲ１配列を有する群を含む、方法である。いくつかの実施形態では、ステップ（ｄ）は、血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ（ｄ）の１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む。いくつかの態様では、ステップ（ｄ）は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ（ｅ）からステップ（ｉ）までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ（ｉ）のＣＤＲ１領域配列の親和性を、ナノボディフラクションのそれぞれにおけるＣＤＲ１領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。

いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、抗原にコンジュゲートされた樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、タンパク質タグ及び抗原に結合された樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び抗原に結合された樹脂である。

いくつかの態様は、ステップ（ｉ）で同定された配列を有するＣＤＲ３、ＣＤＲ２、またはＣＤＲ１ペプチドを作成することをさらに含む。いくつかの態様は、ステップ（ｉ）で同定された配列を有するＣＤＲ３、ＣＤＲ２、及び／またはＣＤＲ１領域を含むナノボディを作成することをさらに含む。

本明細書にはまた、ＳＥＱＩＤＮＯ：１～２５３６及びＳＥＱＩＤＮＯ：２６６５～２６６７から選択されるアミノ酸配列を含むナノボディが含まれる。

本明細書においてさらに提供されるのは、コンピュータ実施方法であって、（ａ）ナノボディペプチド配列を受け取ることと、（ｂ）ナノボディペプチド配列の複数の相補性決定領域（ＣＤＲ）領域を同定することであって、ＣＤＲ領域が、ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を含む、同定することと、（ｃ）フラグメント化フィルターを適用して、ナノボディペプチド配列の１つ以上の偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を破棄することと、（ｄ）ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の存在量を定量化することと、（ｅ）ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の定量化された存在量に基づいて抗原親和性を推測することと、を含む、コンピュータ実施方法である。

いくつかの実施形態では、コンピュータ実施方法は、ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を、低い抗原親和性、中程度の抗原親和性、または高い抗原親和性を有するものとして分類することをさらに含む。

いくつかの実施形態では、コンピュータ実施方法は、高い抗原親和性を有すると分類されたナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域をナノボディタンパク質に組み立てることをさらに含む。

コンピュータ実施方法のいくつかの態様では、フラグメント化フィルターは、最小の計算されたフラグメント化カバー率の割合を要求するように構成される。他の態様またはさらなる態様では、最小の計算されたフラグメント化カバー率の割合は約３０％である。いくつかの態様では、最小の計算されたフラグメント化カバー率の割合は、トリプシン処理サンプルについては約５０％であり、キモトリプシン処理サンプルについては約４０％である。

いくつかの実施形態では、コンピュータ実施方法は、複数のナノボディペプチド配列を受け取ることと、ナノボディペプチド配列のそれぞれをデータベースと比較して、ナノボディペプチド配列を、除外されたサブグループと除外されていないサブグループとに分離することをさらに含み、除外されたサブグループのナノボディペプチド配列はデータベースに見つからず、ＣＤＲ領域は、除外されていないサブグループのナノボディペプチド配列でのみ同定される。

コンピュータ実施方法のいくつかの実施形態では、ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の存在量は、相対ＭＳ１イオンシグナル強度に基づいて定量化される。いくつかの実施形態では、抗原親和性が、エピトープ類似性に基づくｋ－ｍｅａｎｓクラスタリングを使用して推測される。

本明細書にはまた、深層学習モデルをトレーニングする方法であって、上記のコンピュータ実施方法を使用してデータセットを作成することと、データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることであって、データセットは、複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含む、トレーニングすることと、を含む、方法が提供される。いくつかの実施形態では、深層学習モデルは、畳み込みニューラルネットワークである。

本明細書ではさらに、ナノボディペプチド配列の抗原親和性を決定するための方法であって、ナノボディペプチド配列を受け取ることと、トレーニング済みの深層学習モデルにナノボディペプチド配列を入力することと、トレーニング済みの深層学習モデルを使用して、ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、を含む、方法が提供される。いくつかの実施形態では、深層学習モデルは、畳み込みニューラルネットワークである。いくつかの実施形態では、トレーニング済みの深層学習モデルが、上記の深層学習モデルをトレーニングする方法に従ってトレーニングされる。

ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。Ｎｂ結晶構造（ＰＤＢ：４ＱＧＹ）である。ＣＤＲループは色分けされている。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。データベースのＣＤＲの配列長分布である。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。２つのプロテアーゼによるＮｂデータベースのインシリコ消化、及び対応するペプチド質量の累積プロットである。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。トリプシン及びキモトリプシンで消化されたＣＤＲ３ペプチドの長さの分布である。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。シミュレーションに基づくＮｂマッピングのトリプシン及びキモトリプシンの相補性である。一意のＣＤＲ３配列を持つ１０，０００個のＮｂがランダムに選択され、インシリコで消化されてＣＤＲ３ペプチドが生成された。分子量が０．８～３ｋＤａで、十分なＣＤＲ３カバー率（≧３０％）のペプチドがＮｂマッピングに使用された。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ＭＳ／ＭＳスペクトルで一致したＣＤＲ３フラグメントイオンの割合に基づく一意のＣＤＲ３ペプチド同定（１Ｆ：トリプシン；１Ｇ：キモトリプシン）の評価である。ＣＤＲ３ペプチドは、「ターゲット」データベース（サーモン）または「デコイ」データベース（グレー）のいずれかを使用したデータベース検索によって同定された。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ＭＳ／ＭＳスペクトルで一致したＣＤＲ３フラグメントイオンの割合に基づく一意のＣＤＲ３ペプチド同定（１Ｆ：トリプシン；１Ｇ：キモトリプシン）の評価である。ＣＤＲ３ペプチドは、「ターゲット」データベース（サーモン）または「デコイ」データベース（グレー）のいずれかを使用したデータベース検索によって同定された。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたＣＤＲ３ペプチド同定、ＣＤＲ３フラグメントの割合、及びＣＤＲ３長の３Ｄプロットである。ＦＤＲは、偽発見率である。ＣＤＲ３同定のＦＤＲは、３Ｄプロット上で色付けされている。カラーバーはＦＤＲのスケールを示す。５％未満のＦＤＲは、赤のグラデーションで表示される（１Ｈ：トリプシンによる解析；１Ｉ：キモトリプシンによる解析）。Ｊ～Ｌは、トリプシン及びキモトリプシンで消化されたＣＤＲ３ペプチドの代表的な高品質ＭＳ／ＭＳスペクトルである。図１Ｋの配列は、ＮＴＶＹＬＥＭＮＳＬＫＰＥＤＴＡＶＹＳＣＡＡＧＶＳＤＹＧＣＹＲ（配列ＩＤ番号２６５６）である。図１Ｌの配列は、ＹＣＡＡＡＥＧＬＡＳＧＳＹ（配列ＩＤ番号２６５７）である。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたＣＤＲ３ペプチド同定、ＣＤＲ３フラグメントの割合、及びＣＤＲ３長の３Ｄプロットである。ＦＤＲは、偽発見率である。ＣＤＲ３同定のＦＤＲは、３Ｄプロット上で色付けされている。カラーバーはＦＤＲのスケールを示す。５％未満のＦＤＲは、赤のグラデーションで表示される（１Ｈ：トリプシンによる解析；１Ｉ：キモトリプシンによる解析）。Ｊ～Ｌは、トリプシン及びキモトリプシンで消化されたＣＤＲ３ペプチドの代表的な高品質ＭＳ／ＭＳスペクトルである。図１Ｋの配列は、ＮＴＶＹＬＥＭＮＳＬＫＰＥＤＴＡＶＹＳＣＡＡＧＶＳＤＹＧＣＹＲ（配列ＩＤ番号２６５６）である。図１Ｌの配列は、ＹＣＡＡＡＥＧＬＡＳＧＳＹ（配列ＩＤ番号２６５７）である。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたＣＤＲ３ペプチド同定、ＣＤＲ３フラグメントの割合、及びＣＤＲ３長の３Ｄプロットである。ＦＤＲは、偽発見率である。ＣＤＲ３同定のＦＤＲは、３Ｄプロット上で色付けされている。カラーバーはＦＤＲのスケールを示す。５％未満のＦＤＲは、赤のグラデーションで表示される（１Ｈ：トリプシンによる解析；１Ｉ：キモトリプシンによる解析）。Ｊ～Ｌは、トリプシン及びキモトリプシンで消化されたＣＤＲ３ペプチドの代表的な高品質ＭＳ／ＭＳスペクトルである。図１Ｋの配列は、ＮＴＶＹＬＥＭＮＳＬＫＰＥＤＴＡＶＹＳＣＡＡＧＶＳＤＹＧＣＹＲ（配列ＩＤ番号２６５６）である。図１Ｌの配列は、ＹＣＡＡＡＥＧＬＡＳＧＳＹ（配列ＩＤ番号２６５７）である。ＮＧＳＮｂデータベースのインシリコ解析により、Ｎｂプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたＣＤＲ３ペプチド同定、ＣＤＲ３フラグメントの割合、及びＣＤＲ３長の３Ｄプロットである。ＦＤＲは、偽発見率である。ＣＤＲ３同定のＦＤＲは、３Ｄプロット上で色付けされている。カラーバーはＦＤＲのスケールを示す。５％未満のＦＤＲは、赤のグラデーションで表示される（１Ｈ：トリプシンによる解析；１Ｉ：キモトリプシンによる解析）。Ｊ～Ｌは、トリプシン及びキモトリプシンで消化されたＣＤＲ３ペプチドの代表的な高品質ＭＳ／ＭＳスペクトルである。図１Ｋの配列は、ＮＴＶＹＬＥＭＮＳＬＫＰＥＤＴＡＶＹＳＣＡＡＧＶＳＤＹＧＣＹＲ（配列ＩＤ番号２６５６）である。図１Ｌの配列は、ＹＣＡＡＡＥＧＬＡＳＧＳＹ（配列ＩＤ番号２６５７）である。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。Ｎｂプロテオミクスのためのパイプラインの概略図である。パイプラインは、ラクダ科動物の免疫化及び抗原特異的Ｎｂの精製と、Ｎｂのプロテオミクス解析（専用ソフトウェアＡｕｇｕｒＬｌａｍａ及び深層学習によって促進される）と、抗原－Ｎｂ複合体のハイスループット統合構造解析との３つの主要構成要素で構成されている。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。ＧＳＴ、ＨＳＡ及びＰＤＺの３つの抗原のラクダ科動物免疫応答のＥＬＩＳＡ測定である。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。異なる抗原に対する一意のＣＤＲの組み合わせ及び一意のＣＤＲ３配列の同定である。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。高品質Ｎｂ_ＧＳＴのＣＤＲ３マッピングについてのトリプシンとキモトリプシンとの比較である。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。３つの異なるプロテアーゼ（ｇｌｕＣ、トリプシン、及びキモトリプシン）によるＮｂ_ＧＳＴＣＤＲ３同定の比較である。結果は、３つの独立した実験に基づいている。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。ランダムに選択された抗原特異的Ｎｂの溶解度である。抗原結合Ｎｂプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。抗原結合のための選択されたＮｂの検証である。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。キモトリプシンによるＣＤＲ３_ＧＳＴフィンガープリントのラベルフリーＭＳ定量化及びヒートマップ分析である。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。キモトリプシンによるラベルフリーＣＤＲ３_ＧＳＴペプチド定量化の再現性と精度である。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。定量的プロテオミクスによって分類された異なるＮｂ親和性クラスターの割合である。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。ＮｂＥＬＩＳＡ親和性（Ｏ．Ｄ．４５０ｎｍのＬｏｇＩＣ５０）とＳＰＲＫ_Ｄ測定との線形相関（Ｒ^２＝０．８５）のである。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。異なるＮｂクラスターのＥＬＩＳＡ親和性の箱ひげ図である。ｐ値は、スチューデントのｔ検定に基づいて計算された。＊はｐ値＜０．０５、＊＊はｐ値＜０．０１、＊＊＊はｐ値＜０．００１、＊＊＊＊はｐ値＜０．０００１を示し、ｎｓは有意ではない、を示す。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。２５のＮｂ_ＨＳＡ（円）のＥＬＩＳＡ親和性をまとめたプロットであり、Ｏ．Ｄ．は４５０ｎｍである。ＥＬＩＳＡによってランク付けされた上位１４のＮｂのＫ_Ｄ親和性は、ＳＰＲによって測定された（三角形）。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。１１の可溶性Ｎｂ_ＰＤＺのＥＬＩＳＡ親和性をまとめたプロットである。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。３つの異なる親和性クラスターからの代表的なＮｂ_ＧＳＴのＳＰＲ動態解析である。Ｇ６０（Ｃ１）の場合、Ｋａ（１／Ｍｓ）＝４．９ｅ３、Ｋｄ（１／ｓ）＝５．９ｅ－３、Ｋ_Ｄ＝１．３μＭ；Ｇ９５（Ｃ２）の場合、Ｋａ（１／Ｍｓ）＝１．４ｅ４、Ｋｄ（１／ｓ）＝１．１ｅ－３、Ｋ_Ｄ＝７７ｎＭ；Ｇ１３（Ｃ３）の場合、Ｋａ（１／Ｍｓ）＝４．７４ｅ５、Ｋｄ（１／ｓ）＝１．７ｅ－４、Ｋ_Ｄ＝３６０ｐＭである。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。高親和性Ｎｂ_ＨＳＡの代表的なＳＰＲ動態測定である。Ｈ１４の場合、Ｋａ（１／Ｍｓ）＝２．５ｅ５、Ｋｄ（１／ｓ）＝５．７５ｅ－６、Ｋ_Ｄ＝２２．３ｐＭである。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。Ｎｂ_ＰＤＺＰ１０のＳＰＲ動態測定である。Ｐ１０の場合、Ｋａ（１／Ｍｓ）＝２．０６ｅ６、Ｋｄ（１／ｓ）＝９．０３ｅ－６、Ｋ_Ｄ＝４．４ｐＭである。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。異なるＮｂ結合ダイナビーズ及びＧＳＨ樹脂によるＧＳＴ（１ｎＭ）の免疫沈降である。ＧＳＴ、ＨＳＡ、及びＰＤＺ結合のためのＮｂレパートリーの分類である。哺乳類のミトコンドリア外膜タンパク質２５のＰＤＺドメインの概略図である。Ｎｂ_ＰＤＺＰ１０の蛍光顕微鏡分析である。Ｎｂは、ＣＯＳ－７細胞株のネイティブミトコンドリア免疫染色のために、ＡｌｅｘａＦｌｕｏｒ６４７によってコンジュゲートされた。Ｍｉｔｏｔｒａｃｋｅｒは、陽性対照のために使用された。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ヒトとラクダの血清アルブミン間のｐＩ及びハイドロパシーの配列変化である（上のパネル）。構造ドッキングによってマッピングされた主要なエピトープのヒートマップである（下のパネル）。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。４つの優勢なＨＳＡエピトープのリボン表現である。ＨＳＡは灰色で表示される。Ｅ１、Ｅ２及びＥ３はそれぞれサーモン、オレンジ及びシアンである。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。静電ポテンシャル表面と３つの主要なエピトープとの共局在を示す表面表現である。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。収束架橋モデルに基づくＨＳＡエピトープとそのフラクション（％）である（Ｅ１：残基５７～６２、１３５～１６９；Ｅ２：３２２～３３１、３３５、３５６～３６５、３９５～４１０；Ｅ３：２９～３７、８６～９１、１１７～１２３、２５２～２９０；Ｅ４：５６６～５８５、５９５、５９８～６０６及びＥ５：１８８～２０８、３００～３０６、４６３～４６８）。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ＨＳＡ－Ｎｂ複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくＤＳＳまたはＥＤＣ架橋は、青い棒として表示される。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ＨＳＡ－Ｎｂ複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくＤＳＳまたはＥＤＣ架橋は、青い棒として表示される。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ＨＳＡ－Ｎｂ複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくＤＳＳまたはＥＤＣ架橋は、青い棒として表示される。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ＮｂＣＤＲ３のグルタミン酸４００（ＨＳＡ）とアルギニン１０８との間の推定塩橋が示される。ＨＳＡとラクダ科動物アルブミンと間のローカル配列アラインメントが示される。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。野生型ＨＳＡ及び点変異体（Ｅ４００Ｒ）への結合に関する１９の異なるＮｂのＥＬＩＳＡ親和性スクリーニング（ヒートマップ）である。＊は親和性の低下を示す。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。ＨＳＡ－Ｎｂ架橋モデルのＲＭＳＤ（平均二乗偏差）のプロットである。統合的構造手法によって明らかにされたＨＳＡ特異的Ｎｂプロテオームの構造ランドスケープである。モデルを満たすＨＳＡ－Ｎｂの全てのＤＳＳ及びＥＤＣ架橋の割合を示すバープロットである。Ｎｂ親和性成熟のメカニズムである。高親和性（暗い）及び低親和性（明るい）のＮｂ_ＧＳＴ及びＮｂ_ＨＳＡのＣＤＲ３長分布である。Ｎｂ親和性成熟のメカニズムである。異なるＮｂのｐＩの比較である。Ｎｂ親和性成熟のメカニズムである。異なるＮｂ間のＣＤＲのｐＩ及びハイドロパシーの比較である。Ｎｂ親和性成熟のメカニズムである。異なるＮｂ間のＣＤＲのｐＩ及びハイドロパシーの比較である。Ｎｂ親和性成熟のメカニズムである。ＣＤＲ３配列のプロットである。アラインメントは、１５残基の長さが同じである１，０００個の一意のＣＤＲ３配列のランダムな選択に基づいている。ＣＤＲ３アーキテクチャの概略図：超可変「ヘッド」は濃い灰色であり、半可変の「トルソー」は淡い灰色である。Ｎｂ親和性成熟のメカニズムである。ＣＤＲ３ヘッド（Ｎｂ_ＧＳＴ及びＮｂ_ＨＳＡ）及びＣＤＲ２（Ｎｂ_ＧＳＴ）のアミノ酸組成の円グラフである。上位６つの豊富な残基のみが表示される。Ｎｂ親和性成熟のメカニズムである。Ｎｂ_ＧＳＴとＮｂ_ＨＳＡの両方のＣＤＲ３ヘッドに豊富にあるアミノ酸の相対的な変化である。Ｋ（リジン）／Ｒ（アルギニン）／Ｈ（ヒスチジン）の正電荷残基、Ｄ（アスパラギン酸）／Ｅ（グルタミン酸）の負電荷残基、Ｙ（チロシン）の芳香族残基、Ｇ（グリシン）／Ｓ（セリン）の小さな柔軟アミノ酸が示される。Ｎｂ親和性成熟のメカニズムである。高親和性ＮｂＨＳＡと低親和性Ｎｂ_ＨＳＡとの間のＣＤＲ３ヘッド上のＹ、Ｇ、及びＳの相対量の比較である。それらの相対存在量は、それぞれの残基の相対位置の関数としてプロットされる。ＣＤＲ３ヘッドの２つのチロシンを示す抗原－Ｎｂ複合体の代表的な構造（ＰＤＢ：５Ｆ１Ｏ）は、抗原の深いポケットに挿入される。Ｎｂ親和性成熟のメカニズムである。Ｎｂ_ＨＳＡのＣＤＲ３ヘッド上のＥＬＩＳＡ親和性と特定のアミノ酸の数の相関プロットである。ピアソン相関係数と統計値が表示される。Ｎｂ親和性成熟のメカニズムである。Ｎｂ_ＧＳＴのＣＤＲ２上のＥＬＩＳＡ親和性と正に荷電した残基の数の相関プロットである。Ｎｂ親和性成熟のメカニズムである。２つの代表的な畳み込みＣＤＲ３フィルターの配列ロゴ（高親和性Ｎｂ_ＨＳＡのフィルター１４；深層学習モデルによって学習された低親和性Ｎｂ_ＨＳＡのフィルター３）である。図５Ｋの上部パネルの配列はＳＥＱＩＤＮＯ：２６６１（ＹＸＸＸＸＸＸ、残基２はＹ、Ｌ、Ｄ、Ｒ、またはＩであり得る；残基３はＫまたはＧであり得る；残基４はＲ、Ｙ、Ｔ、またはＤであり得る；残基５はＰ、Ｄ、またはＲであり得る、残基６はＥ、Ｙ、Ｖ、Ｐ、Ｗ、またはＤであり得る；残基７は、Ｇ、Ｗ、Ｄ、またはＰであり得る）である。図５Ｋの下部パネルの配列はＳＥＱＩＤＮＯ：２６６２（ＹＸＸＸＬＸＸ、残基２はＤ、Ｐ、Ｋ、またはＡであり得る；残基３は、Ｆ、Ｐ、Ｄ、またはＡであり得る；残基４はＨ、Ｔ、またはＧであり得る、残基６はＧ、Ｎであり得る；残基７は、Ｒ、Ｐ、Ｄ、またはＹであり得る）である。抗原結合に対するＮｂの優れた汎用性である。Ａは、ＰＤＺドメインの静電ポテンシャル面と支配的なＥ２エピトープ（ＰＤＢ：２ＪＩＫ；Ｅ１：７～８、３５～３６、４３、９９～１００、及びＥ２：２５～２６、４５～４６、４８、７８～７９、８２～８３、８５～８６）である。Ｂは、高親和性Ｎｂ_ＰＤＺＰ１０の長いＣＤＲ３（ディープサーモン）によるドッキングモデルである。Ｃは、ＰＤＺ－ペプチドリガンド複合体の結晶構造（ＰＤＢ：１ＥＢ９）とＰＤＺ－Ｎｂ複合体のドッキングモデルとの比較である。保存されたリガンド結合部位はシアンで示される。ＣＤＲ３とペプチドリガンドの両方の側鎖が示される。Ｄは、１１のＮｂの野生型または変異型（Ｒ４６Ｅ：Ｋ４８Ｄ）ＰＤＺへの結合に対するＥＬＩＳＡ親和性を示すヒートマップである。＊は１０分の１～１００，０００分の１のＥＬＩＳＡ親和性低下を示す。Ｅは、異なるＮｂ（配列データベースの高親和性Ｎｂ_ＨＳＡ、Ｎｂ_ＧＳＴ、Ｎｂ_ＰＤＺ及びＮｂ）のＣＤＲ３長さ（上段）とｐＩ（下段）との両方をプロット比較したものである。データはガウス関数で平滑化されている。Ｆは、異なるＮｂ間のｐＩ及びハイドロパシーの比較である。Ｇは、ＮｂＣＤＲ３ヘッドの上位６つの最も豊富なアミノ酸の円グラフである。Ｈは、Ｎｂによる抗原結合の概略モデルである。ＮＧＳＮｂデータベースの分析と代表的な偽陽性ＣＤＲ３ペプチドの同定である。Ａは、Ｎｂ配列の正規化された変動性である。約５０万の一意のＮｂ配列がＩＭＧＴ番号付けスキームに基づいてアラインメントされ、プロットが生成された。アミノ酸は、その特性（正、負、極性、及び非極性）に基づいてグループ化され、色分けされた。Ｂは、ＰｅｐｔｉｄｅＡｔｌａｓで同定された約１５０万個のヒトタンパク質の質量分布である。Ｃは、異なるプロテアーゼ（ＡｓｐＮ、ＧｌｕＣ、ＬｙｓＣ、トリプシン、及びキモトリプシン）によるＮｂＮＧＳデータベースのインシリコ消化とペプチド質量のプロットである。Ｄは、免疫されたラマのターゲットＮｂ配列データベースと、別のネイティブラマのデコイデータベースとの重複である。各データベースには約５０万の配列が含まれていた。Ｅは、トリプシンＣＤＲ３ペプチドの代表的な低品質ｙ／偽陽性ＭＳ／ＭＳスペクトル（ＨＣＤ）である。Ｆは、キモトリプシンＣＤＲ３ペプチドのものである。スペクトルで一致する高分解能フラグメントイオンはほとんどなかった。図７Ｅの配列は、ＮＴＶＹＬＱＭＮＳＬＫＰＥ（ＳＥＱＩＤＮＯ：２６５８）及びＤＴＳＩＹＹＣＡＡＴＰＶＦＱＳＭＳＴＭＡＴＥＳＶＹＤＹＷＧＱＧＴＱＶＴＶＳＳＥＰＫ（ＳＥＱＩＤＮＯ：２６５９）である。図７Ｆの配列は、ＣＡＡＧＳＧＶＧＬＹ（ＳＥＱＩＤＮＯ：２６６０）である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。情報パイプラインの概略図である。１）ペプチド同定、２）Ｎｂペプチドとタンパク質の品質管理、及び３）定量化と分類を含む３つのモジュールが提示された。Ｎｂプロテオミクスデータは、最初に検索エンジンに対して検索される。検索エンジンを通過した最初の同定には、自動的にアノテーションを付けることができ、ペプチド及びタンパク質レベルでの様々な品質フィルターに基づいて評価できる。品質フィルターを通過した高品質のフィンガープリントペプチドを、定量化及びクラスター化できる。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。ＮｂＣＤＲ３スペクトルとカバー率品質フィルターの図である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。ペプチド分類法の説明図である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。同定されたＮｂ_ＰＤＺの２３０の一意のＣＤＲ３の系統樹及びＷｅｂロゴ分析である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。ラクダ科動物のＢリンパ球からのＨｃＡｂ可変ドメイン（Ｖ_ＨＨ）のＰＣＲ増幅の概略図である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。免疫した骨髄／血液から調製したｃＤＮＡライブラリーからのＶ_ＨＨＰＣＲアンプリコンをＤＮＡゲル電気泳動したものである。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。異なる分画プロトコルに基づく分画Ｎｂ_ＧＳＴのＳＤＳ－ＰＡＧＥ分析である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。Ｎｂ_ＰＤＺのＳＤＳ－ＰＡＧＥ分析である。マルトース結合タンパク質（ＭＢＰ）タグをＰＤＺドメインに融合し、融合タンパク質を分離用の親和性ハンドルとして使用した。ＭＢＰは、定量化のための陰性対照として使用された。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。異なる抗原に対する一意のＮｂ同定である。ＮｂプロテオミクスとＮｂバインダーの検証のための「ＡｕｇｕｒＬｌａｍａ」のインフォマティクスパイプラインである。キモトリプシンまたはトリプシンベースの方法のいずれかによって同定された抗原特異的Ｎｂの比較である。Ｙ軸は、検証のために無作為に選ばれた陽性ヒットの割合である。Ｎｂ_ＧＳＴのプロテオーム定量化、生化学的検証、及び親和性測定である。異なる分画法に基づくＮｂ_ＧＳＴのプロテオーム定量化とヒートマップ分析である。ＮｂＧＳＴのプロテオーム定量化、生化学的検証、及び親和性測定である。異なる分画ＮｂペプチドサンプルのＬＣ保持時間のピアソン相関である。ＮｂＧＳＴのプロテオーム定量化、生化学的検証、及び親和性測定である。代表的なＧＳＴビーズ結合アッセイである。ＧＳＴ結合樹脂を使用して、Ｅ．ｃｏｌｉ溶解から組み換えＮｂを特異的に分離した。赤い矢印は、濃縮されたＮｂを示す。陰性対照には不活化樹脂を使用した。ＮｂＧＳＴのプロテオーム定量化、生化学的検証、及び親和性測定である。１０の代表的なＮｂ_ＧＳＴのＳＰＲ動態測定である。高品質のＨＳＡ及びＰＤＺＮｂの特性評価である。代表的な高親和性Ｎｂ_ＨＳＡのＳＰＲ動態測定である。高品質のＨＳＡ及びＰＤＺＮｂの特性評価である。選択された高品質Ｎｂ_ＰＤＺのビーズ結合アッセイである。組み換えＭＢＰ融合ＰＤＺは、Ｅ．ｃｏｌｉ溶解物からＮｂを単離するための親和性ハンドルとして使用された。ＭＢＰ結合樹脂を陰性対照に使用した。Ｉ：Ｅ．ｃｏｌｉ溶解物入力、Ｂ：ビーズコントロール、Ｐ：ＰＤＺによる親和性プルアウト。ＧＳＴ－Ｎｂ複合体のハイブリッド構造解析である。Ａは、３つの収束したエピトープを示す６４，６７０のＧＳＴ－Ｎｂ複合体の構造ドッキングによるヒートマップ分析である（Ｅ１：７５～８８、１４３～１４８；Ｅ２：３３～４３、１０７～１２７；Ｅ３：１５８～２００、２１３～２２０）。Ｂは、３つの主要なＧＳＴエピトープのリボン表現である。ＧＳＴ二量体は灰色で表示された。Ｅ１、Ｅ２及びＥ３は、それぞれ淡い黄色、オレンジ色、及び濃い青緑色であった。Ｃは、３つの主要なエピトープを持つ静電表面の共局在を示す表面表現である。Ｄは、収束した架橋モデルに基づくＧＳＴエピトープとその存在量（％）を異なる色で表示した。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。高親和性Ｎｂと低親和性Ｎｂとの間のＣＤＲ３ヘッド上のアミノ酸の量の比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。高親和性Ｎｂと低親和性Ｎｂとの間のＣＤＲ３ヘッド上のアミノ酸の量の比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるＮｂのＣＤＲ１とＣＤＲ２との比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるＮｂのＣＤＲ１とＣＤＲ２との比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるＮｂのＣＤＲ１とＣＤＲ２との比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるＮｂのＣＤＲ１とＣＤＲ２との比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。ＧＳＴＮｂのＣＤＲ３ヘッド上のチロシン（Ｙ）、グリシン（Ｇ）、及びセリン（Ｓ）の相対位置の比較である。異なるＮｂのＣＤＲ配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。ヒト血清アルブミンとラマ血清アルブミンの配列アラインメントである。保存されたアミノ酸が強調表示された。異なる抗原エピトープ間の比較である。Ａは、３つの異なる抗原（すなわち、ＰＤＺのＥ２、ＧＳＴ二量体のＥ３、及びＨＳＡのＥ３）の主要なエピトープの形状の比較である。異なるエピトープは、抗原構造上で色分けされた。Ｂは、表面静電ポテンシャルとＰＤＺドメインのＥ１エピトープである。Ｃは、異なるエピトープの溶媒アクセス可能な領域のプロットである。ｙ軸は、平方オングストロームで異なるエピトープの面積を表す。Ｄは、エピトープの正味電荷である。Ｅは、ＣＤＲ３ヘッド上の様々なアミノ酸の相対的存在量である。ＤＢは、ＮＧＳＮｂ配列データベースである。Ｆは、異なる抗原特異的Ｎｂ間のＣＤＲ１とＣＤＲ２とのｐＩの比較である。本開示の特定の実施形態で説明される方法及び手順を実行するコンピューティングシステムの例を示す。Ａ～Ｂは、深層学習アプローチに由来するアミノ酸配列フィルターの結果を示す。配列フィルターを使用して、高親和性結合ＨＳＡＮｂから低親和性結合ＨＳＡＮｂを正確に分離できる。図１５Ａの配列は、ＳＥＱＩＤＮＯ：２６６３（ＬＸＹＲＸＸＸ、残基２はＮ、Ｙ、Ｖ、またはＧであり得る；残基５はＬまたはＷであり得る；残基６は、Ｅ、Ｇ、Ｎ、Ｔ、またはＳであり得る；残基７はＤまたはＥであり得る）である。図１５Ｂのシーケンスは、ＳＥＱＩＤＮＯ：２６６４（ＸＸＸＸＸＸＸ、残基１は、Ｃ、Ｆ、Ｑ、Ｓ、Ｈ、Ｋ、Ｌ、Ｙ、またはＲであり得る；残基２は、Ｇ、Ｐ、Ａ、またはＮであり得る；残基３は、Ｅ、Ｓ、Ｇ、Ｔ、Ｐ、Ｖ、Ｙ、Ｈ、またはＡであり得る；残基４は、Ｃ、Ａ、Ｓ、Ｐ、またはＤであり得る；残基５は、Ｉ、Ｗ、Ｖ、Ｔ、またはＡであり得る；残基６は、Ｍ、Ｑ、またはＨであり得る；残基７は、Ｋ、Ｙ、Ｑ、Ｖ、またはＷであり得る）である。Ａ～Ｃは、深層学習アプローチに由来するアミノ酸配列フィルターの結果を示す。配列フィルターを使用して、高親和性結合ＨＳＡＮｂから低親和性結合ＨＳＡＮｂを正確に分離できる。図１６Ａの配列は、ＳＥＱＩＤＮＯ：２６６５（ＴＸＸＸＬＸＸ；残基２はＤ、Ｐ、Ｋ、またはＡであり得る；残基３は、Ｆ、Ｐ、Ｌ、Ｄ、またはＡであり得る；残基４は、Ｈ、Ｔ、またはＧであり得る；残基６は、Ｇ、Ｅ、Ｎ、またはＲであり得る；残基７は、Ｒ、Ｐ、Ｇ、Ｄ、またはＹであり得る）である。図１６Ｂの配列は、ＳＥＱＩＤＮＯ：２６６６（ＸＸＲＸＸＸＸ；残基１は、Ｅ、Ｇ、Ｗ、Ｄ、またはＩであり得る；残基２は、Ｎ、Ｇ、またはＣであり得る；残基４は、Ａ、Ｈ、またはＤであり得る；残基５は、Ｅ、Ｒ、Ｙ、Ａ、またはＴであり得る；残基６はＧ、Ａ、またはＰであり得る；残基７は、Ｌ、Ｓ、またはＹであり得る）である。図１６Ｃの配列は、ＳＥＱＩＤＮＯ：２６６７（ＸＸＧＡＱＸＷ；残基１はＲまたはＡであり得る；残基２はＫまたはＬであり得る；残基６は、Ｌ、Ｇ、Ｙ、またはＷであり得る）である。

ここで報告されるのは、抗原が関与するＮｂレパートリーの詳細な発見、分類、及びハイスループットの構造特性評価のための統合プロテオームプラットフォームである。本技術の感度及び堅牢性は、ミトコンドリア膜に由来する小さな弱い免疫原性抗原を含む、免疫応答における３桁にわたる抗原を使用して検証された。何万もの非常に多様で特異的なＮｂファミリーが、物理化学的特性に従って明確に同定され定量化された。かなりのフラクションがサブｎＭの親和性を有していた。ハイスループット構造モデリング、構造プロテオミクス、及びディープラーニングを使用して、１００，０００超もの抗原－Ｎｂ複合体が、免疫原性及びＮｂ親和性成熟の理解を大幅に進めるために体系的に調査された。この研究は、哺乳動物の体液性免疫系の驚くべき効率、特異性、多様性、及び多用途性を明らかにした。

用語
本明細書及び特許請求の範囲で使用するとき、単数形「ａ」、「ａｎ」、及び「ｔｈｅ」は、文脈に明らかに別途の指示がない限り、複数の指示対象を含む。例えば、用語「ａｃｅｌｌ」は、それらの混合物を含む複数の細胞を含む。

量、割合など測定可能な値を指すときに本明細書で使用される「約」という用語は、測定可能な値から±２０％、±１０％、±５％、または±１％の変動を包含することを意味する。

被験者への「投与」または「投与すること」には、薬剤を被験者に導入するまたは送達する任意の経路が含まれる。投与は、経口、静脈内、腹腔内、鼻腔内、吸入などを含む任意の適切な経路によって行うことができる。投与としては、自己投与及び他者による投与が挙げられる。

「抗体」という用語は、本明細書では広い意味で使用され、ポリクローナル抗体、モノクローナル抗体、及び二重特異性抗体を含む。無傷の免疫グロブリン分子に加えて、「抗体」という用語にも含まれるのは、それらの免疫グロブリン分子の断片またはポリマー、ならびに免疫グロブリン分子またはその断片のヒト型またはヒト化型である。「抗体」とは、通常、２つの同一の軽（Ｌ）鎖及び２つの同一の重（Ｈ）鎖から構成される約１５０，０００ダルトンのヘテロ四量体糖タンパク質である。各重鎖は、一方の端にある可変ドメイン（Ｖ_Ｈ）と、その後に続く、いくつかの定常ドメインとを有する。各軽鎖は、一端に可変ドメイン（Ｖ_Ｌ）を有し、その他端に定常ドメインを有する。

本明細書で使用する場合、「抗原」または「免疫原」という用語は、被験者に免疫応答を誘導することができる物質、典型的にはタンパク質、核酸、多糖、毒素、または脂質を指すために互換的に使用される。この用語はまた、タンパク質であって、（直接、またはそのタンパク質をコードするヌクレオチド配列もしくはベクターを被験者に投与することによって）被験者に投与されると、そのタンパク質に対する体液性及び／または細胞型の免疫応答を誘発できるという意味で免疫学的に活性なタンパク質を指す。

「抗原決定基」及び「エピトープ」という用語もまた、本明細書では交換可能に使用することができ、（本発明のナノボディなどの）抗原結合分子によって認識される抗原上または標的上の位置を指す。エピトープは、隣接アミノ酸（「直線状エピトープ」）、またはタンパク質の３次折り畳みによって並列した非隣接アミノ酸の両方から形成され得る。後者のエピトープは、少なくともいくつかの不連続なアミノ酸によって作られるものであり、本明細書では「立体構造エピトープ」と記載されている。エピトープは、通常、少なくとも３個、より一般的には、少なくとも５個または８～１０個のアミノ酸を固有の空間構造に含む。エピトープの空間構造を決定する方法としては、例えば、Ｘ線結晶構造解析及び２次元核磁気共鳴が挙げられる。例えば、ＥｐｉｔｏｐｅＭａｐｐｉｎｇＰｒｏｔｏｃｏｌｓｉｎＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ｖｏｌ．６６，ＧｌｅｎｎＥ．Ｍｏｒｒｉｓ，Ｅｄ（１９９６）を参照されたい。

「抗原結合部位」、「結合部位」及び「結合ドメイン」という用語は、抗原決定基またはエピトープに結合する、ナノボディなどのポリペプチドの特定の要素、部分、またはアミノ酸残基を指す。

本明細書で使用される「生物学的サンプル」という用語は、生物組織または生物体液のサンプルを意味する。そのようなサンプルには、動物から単離された組織が含まれるが、これに限定されない。生物学的サンプルには、生検サンプル及び剖検サンプル、組織学的目的のために採取された凍結切片、血液、血漿、血清、喀痰、便、涙、粘液、毛髪、及び皮膚などの組織切片も含まれ得る。生物学的サンプルには、患者組織に由来する外植片、ならびに初代及び／または形質転換細胞培養物も含まれる。生物学的サンプルは、動物から細胞のサンプルを取り出すことによって提供することができるが、以前に単離した（例えば、別の者によって別の時点で、及び／または別の目的のために単離された）細胞を使用することによって、または本明細書に開示される方法をインビボで実施することによって、達成することもできる。治療または転帰履歴を有するような保存組織を使用することもできる。

「ｃＤＮＡライブラリー」という用語は、本明細書では、所与の生物のトランスクリプトームの一部を構成する異なるｃＤＮＡフラグメントの組み合わせを指す。

「ＣＤＲ」及び「相補性決定領域」という用語は、交換可能なようにして使用され、抗原への結合に関与する抗体の可変鎖の一部を指す。したがって、ＣＤＲは「抗原結合部位」の一部であるか、または「抗原結合部位」である。いくつかの実施形態では、ナノボディは、集合的に抗原結合部位を形成する３つのＣＤＲを含む。

本明細書で使用される、「含む（ｃｏｍｐｒｉｓｉｎｇ）」という用語及びその変形は、「含む（ｉｎｃｌｕｄｉｎｇ）」という用語及びその変形と同義で用いられ、オープンな非限定的用語である。「含む（ｃｏｍｐｒｉｓｉｎｇ）」及び「含む（ｉｎｃｌｕｄｉｎｇ）」という用語は、様々な実施形態を説明するために本明細書で使用されているが、「含む（ｃｏｍｐｒｉｓｉｎｇ）」及び「含む（ｉｎｃｌｕｄｉｎｇ）」の代わりに「本質的に～からなる（ｃｏｎｓｉｓｔｉｎｇｅｓｓｅｎｔｉａｌｌｙｏｆ）」及び「～からなる（ｃｏｎｓｉｓｔｉｎｇｏｆ）」という用語を使用して、より具体的な実施形態を提供することがあり、また開示される。

「組成物」は、有益な生物学的効果を有する任意の薬剤を指す。有益な生物学的効果には、例えば、障害または他の望ましくない生理学的状態の治療などの治療効果と、例えば、障害または他の望ましくない生理学的状態の予防などの予防効果との両方が含まれる。これらの用語はまた、細菌、ベクター、ポリヌクレオチド、細胞、塩、エステル、アミド、プロエージェント、活性代謝物、異性体、断片、類似体などを含むが、これらに限定されない、本明細書で具体的に言及される有益な薬剤の薬学的に許容される薬理学的に活性な誘導体を包含する。「組成物」という用語が使用される場合、そして、または特定の組成物が具体的に同定される場合、その用語は、組成物自体、ならびに薬学的に許容される薬理学的に活性なベクター、ポリヌクレオチド、塩、エステル、アミド、プロエージェント、コンジュゲート、活性代謝物、異性体、フラグメント、類似体などを含むことを理解されたい。

「対照」は、比較目的で実験に使用される他の被験者またはサンプルである。対照は「陽性」または「陰性」であり得る。

「有効量」は、限定されないが、医学的状態または医的障害（例えば、がん）の症状または徴候を改善、回復、軽減、予防、または診断できる量を包含する。明確にまたは文脈によって別段の指示がない限り、「有効量」は、状態を改善するのに十分な最小量に限定されない。疾患または障害の重症度、ならびに疾患または障害を予防、治療、または軽減する治療の能力は、バイオマーカーまたは臨床パラメータによって、何の限定を意味することなく、測定することができる。いくつかの実施形態では、用語「組み換えナノボディの有効量」は、がんを予防、治療、または軽減するのに十分な組み換えナノボディの量を指す。

「フラグメント」または「機能性フラグメント」は、フラグメントの活性が、未修飾ペプチドまたは未修飾タンパク質と比較して、著しく変化または低下しない限り、他の配列に結合しているか否かに関わらず、特定の領域または特異的アミノ酸残基の挿入、欠失、置換、または他の選択された修飾を含むことができる。これらの修飾は、ジスルフィド結合が可能なアミノ酸を除去または追加すること、その生物学的寿命を延長すること、その分泌特性を変更することなどのような、いくつかの追加の特性を提供し得る。いずれの場合も、機能性フラグメントは、ＨＳＡへの結合及び／またはがんの改善などの生理活性特性を有する必要がある。

「フラグメント化カバー率の割合」という用語は、次の式を使用して得られる割合のことをいう。
ｆ（ｘ，酵素）は、酵素によって消化されたペプチドのフラグメント化カバー率（％）を計算する関数である。
ｘは、ペプチドがマッピングされたＣＤＲ３の長さである。
ｆ（ｘ，キモトリプシン）＝０．００２３×^２－０．０４９７ｘ＋０．７７２３，ｘ［５，３０］
ｆ（ｘ，トリプシン）＝０．００００６ｘ^２－０．００４４４ｘ＋０．９１９４，ｘ［５，３０］
いくつかの実施形態では、計算されたフラグメント化カバー率の割合の最小値が必要とされる。他の態様またはさらなる態様では、必要とされる最小の計算されたフラグメント化カバー率の割合は約３０％である。いくつかの態様では、トリプシンが酵素である場合、必要とされる最小の計算されたフラグメント化カバー率の割合は約５０％であり、キモトリプシンが酵素である場合、約４０％である。

本明細書で使用される場合、「機能的選択ステップ」は、ナノボディが機能特性に基づいて異なるフラクションまたはグループに分割される方法である。いくつかの実施形態では、機能特性は、ナノボディまたはＣＤ３、ＣＤ２、もしくはＣＤ１領域の抗原親和性である。他の実施形態では、機能特性は、ナノボディの熱安定性である。他の実施形態では、機能特性は、ナノボディの細胞内浸透である。したがって、本発明は、相補性決定領域（ＣＤＲ）３、２または１の領域のナノボディアミノ酸配列（ＣＤＲ３、ＣＤＲ２またはＣＤＲ１配列）群を同定する、減数されたＣＤＲ３、ＣＤＲ２またはＣＤＲ１配列が対照と比較して偽陽性である、方法であって、抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、ライブラリー中の各ｃＤＮＡの配列を同定することと、抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、機能的選択ステップを実行することと、ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、消化産物の質量分析を実行して、質量分析データを取得することと、質量分析データと相関する、ステップｃで同定された配列を選択することと、ステップｇの配列内のＣＤＲ３、ＣＤＲ２またはＣＤＲ１領域の配列を同定することと、ステップｈのＣＤＲ３、ＣＤＲ２またはＣＤＲ１領域の配列から、算出されたフラグメント化カバー率の割合未満の配列を除外することと、を含み、非除外配列が、減数された偽陽性のＣＤＲ３、ＣＤＲ２またはＣＤＲ１配列を有する群を含む、方法を含む。機能的選択ステップに続く方法ステップは、機能選択によって作成された各異なるフラクションまたは群に対して別々に実行できることを理解されたい。

本発明のアミノ酸配列、化合物またはポリペプチドの「半減期」は、一般に、例えば配列または化合物の分解、及び／または自然メカニズムによる配列または化合物のクリアランスまたは隔離のため、アミノ酸配列、化合物またはポリペプチドの血清濃度がインビボで５０％だけ減少するのにかかる時間として定義され得る。本発明のナノボディ、アミノ酸配列、化合物またはポリペプチドのインビボ半減期は、例えば、以下のＫｅｎｎｅｔｈ，Ａｅｔａｌ．，ＣｈｅｍｉｃａｌＳｔａｂｉｌｉｔｙｏｆＰｈａｒｍａｃｅｕｔｉｃａｌｓ：ＡＨａｎｄｂｏｏｋｆｏｒＰｈａｒｍａｃｉｓｔｓ；Ｐｅｔｅｒｓｅｔａｌ．，Ｐｈａｒｍａｃｏｋｉｎｅｔｅａｎａｌｙｓｉｓ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（１９９６）；“Ｐｈａｒｍａｃｏｋｉｎｅｔｉｃｓ”，ＭＧｉｂａｌｄｉ＆ＤＰｅｒｒｏｎ，ｐｕｂｌｉｓｈｅｄｂｙＭａｒｃｅｌＤｅｋｋｅｒ，２ｎｄＲｅｖ．ｅｄｉｔｉｏｎ（１９８２）の薬物動態解析のような既知の任意の方法で決定することができる。

用語「同一性」または「相同性」は、配列全体の最大パーセント同一性を達成するために、必要ならば、配列をアラインメントしギャップを導入した後で、配列同一性の一部として保存的置換を全く考慮せず、比較される対応する配列の塩基または残基と同一である候補配列中のヌクレオチド塩基またはアミノ酸残基の割合を意味すると解釈されるものとする。別の配列に対して特定の割合（例えば、６１％、６２％、６３％、６４％、６５％、６６％、６７％、６８％、６９％、７０％、７１％、７２％、７３％、７４％、７５％、７６％、７７％、７８％、７９％、８０％、８１％、８２％、８３％、８４％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％，９４％、９５％、９６％、９７％、９８％、９９％以上）の「配列同一性」を有するポリヌクレオチドまたはポリヌクレオチド領域（あるいはポリペプチドまたはポリペプチド領域）は、アラインメントされた場合、２つの配列を比較する際に、その割合の塩基（またはアミノ酸）が同じであることを意味する。このアラインメント及びパーセント相同性または配列同一性は、当技術分野で知られているソフトウェアプログラムを使用して決定することができる。このようなアラインメントは、例えば、Ｎｅｅｄｌｅｍａｎｅｔａｌ．（１９７０）Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３－４５３の方法を使用して提供することができ、Ａｌｉｇｎプログラム（ＤＮＡｓｔａｒ，Ｉｎｃ．）などのコンピュータプログラムによって便利に実施される。いくつかの実施形態では、パーセント同一性は、比較される配列の全長に沿って決定される。

本明細書で使用される「増加」または「増加する」という用語は、一般に、静的に有意な量による増加を意味する。誤解を避けるために、「増加した」とは、基準レベルと比較して少なくとも１０％の増加、例えば、少なくとも約２０％、または少なくとも約３０％、または少なくとも約４０％、または少なくとも約５０％、または少なくとも約６０％、または少なくとも約７０％、または少なくとも約８０％、または少なくとも約９０％の増加、または１００％まで（１００％を含む）の増加、または基準レベルと比較して１０～１００％の間の任意の増加、または基準レベルと比較して、少なくとも約２倍、または少なくとも約３倍、または少なくとも約４倍、または少なくとも約５倍、または少なくとも約１０倍の増加、または２倍から１０倍以上の間の任意の増加を意味する。

本明細書で使用される「単離する」という用語は、生物学的サンプル、すなわち、血液、血漿、組織、エキソソーム、または細胞からの単離を指す。本明細書で使用するとき「単離された」という用語は、例えば核酸の文脈で使用される場合、単離前に核酸が結合されていた他の成分を、少なくとも６０％、少なくとも７５％、少なくとも９０％、少なくとも９５％、少なくとも９８％、及びさらに少なくとも９９％含まない目的の核酸を指す。

「質量分析」という用語は、サンプル中に存在する１つ以上の分子の質量対電荷比（ｍ／ｚ）の測定を意味する。「質量分析データ」とは、サンプル中に存在する１つ以上の分子の質量、電荷、質量対電荷比、分子量、及び／またはアミノ酸同一性またはアミノ酸配列のことをいう。いくつかの実施形態では、質量分析データは、サンプル中に存在する分子のアミノ酸配列である。質量分析データと「相関する」、ｃＤＮＡ配列を含む配列は、本方法の質量分析ステップで決定された予想される同一または非常に類似したアミノ酸配列を有する。いくつかの実施形態では、配列は、約８０％、約８５％、約９０％、約９１％、約９２％、約９３％、約９４％、約９５％、約９６％、約９７％、約９８％、または約９９％の類似性または同一性がある場合に質量分析データと相関する。いくつかの実施形態では、配列は、約９０～１００％の類似性または同一性がある場合に質量分析データと相関する。

本明細書で使用するとき、「ナノボディ」、「Ｖ_ＨＨ」、「Ｖ_ＨＨ抗体フラグメント」という用語は、区別なく使用され、参照によりその全体が組み込まれるＰＣＴ公開第ＷＯ９４／０４６７８号に記載されているラクダ科動物に由来するような、軽鎖を全く有しないラクダ科で見られるタイプの抗体の単一重鎖の可変ドメインを指定する。本明細書で使用するとき「単一ドメイン抗体」は、ナノボディ及びＦｃドメインを指す。

本明細書で使用される「核酸」という用語は、ヌクレオチド、例えば、デオキシリボヌクレオチド（ＤＮＡ）またはリボヌクレオチド（ＲＮＡ）から構成されるポリマーを意味する。本明細書で使用される「リボ核酸」及び「ＲＮＡ」という用語は、リボヌクレオチドから構成されるポリマーを意味する。本明細書で使用される「デオキシリボ核酸」及び「ＤＮＡ」という用語は、デオキシリボヌクレオチドから構成されるポリマーを意味する。

本明細書で使用される場合、「作動可能に連結された」とは、単一のポリペプチド鎖内のポリペプチドセグメントの配置を指し、個々のポリペプチドセグメントは、限定されないが、タンパク質、そのフラグメント、連結ペプチド、及び／またはシグナルペプチドであり得る。作動可能に連結されたという用語は、異なるセグメント間にアミノ酸が介在していない単一のポリペプチドまたはそのフラグメント内の異なる個々のポリペプチドの直接融合を指し、さらには個々のポリペプチドが、１つ以上の介在アミノ酸を含む「リンカー」を介して互いに接続されている場合を指すこともある。

本明細書で使用される「減少した」、「減少させる」、「減少」、または「減少する」という用語は、一般に、統計的に有意な量の減少を意味する。ただし、誤解を避けるために、「減少した」とは、基準レベルと比較して少なくとも５％の減少、例えば少なくとも約１０％、または少なくとも約２０％、または少なくとも約３０％、または少なくとも約４０％、または少なくとも約５０％、または少なくとも約６０％、または少なくとも約７０％、または少なくとも約８０％、または少なくとも約９０％の減少、または１００％まで（１００％を含む）の減少（すなわち、基準サンプルと比較して消失レベル）、または基準レベルと比較して１０～１００％の間の任意の減少を意味する。

「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、交換可能なようにして使用され、デオキシリボヌクレオチドもしくはリボヌクレオチドまたはそれらの類似体のいずれかの任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の３次元構造を持つことができ、既知または未知の任意の機能を実行することができる。以下は、ポリヌクレオチドの非限定的な例である。すなわち、遺伝子または遺伝子フラグメント、エキソン、イントロン、メッセンジャーＲＮＡ（ｍＲＮＡ）、トランスファーＲＮＡ、リボソームＲＮＡ、リボザイム、ｃＤＮＡ、組み換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたＤＮＡ、任意の配列の単離されたＲＮＡ、核酸プローブ、及びプライマーである。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。ヌクレオチド構造への修飾は、あるならば、ポリマーの組み立ての前または後に付与することができる。ヌクレオチドの配列は、非ヌクレオチド成分により中断され得る。ポリヌクレオチドは、例えば標識成分との共役により、重合後にさらに修飾され得る。この用語はまた、二本鎖分子及び一本鎖分子の両方に当てはまる。別途明記または要求されない限り、ポリヌクレオチドである本発明の任意の実施形態は、二本鎖形態と、その二本鎖形態を構成することが知られているかまたは予想される２つの相補的な一本鎖形態のそれぞれとの両方を包含する。

「ポリペプチド」という用語は、その最も広い意味で使用されて、２つ以上のサブユニットアミノ酸、アミノ酸類似体、またはペプチド模倣薬の化合物を指す。サブユニットは、ペプチド結合によって連結され得る。別の実施形態では、サブユニットは、他の結合、例えばエステル、エーテルなどによって連結されてもよい。本明細書で使用するとき、用語「アミノ酸」は、グリシン及びＤまたはＬの両方の光学異性体、ならびにアミノ酸類似体及びペプチド模倣薬を含む天然及び／または非天然または合成のアミノ酸のいずれかを指す。アミノ酸が３つ以上のペプチドは、ペプチド鎖が短い場合、一般にオリゴペプチドと呼ばれる。ペプチド鎖が長い場合、ペプチドは一般にポリペプチドまたはタンパク質と呼ばれる。用語「ペプチド」、「タンパク質」、及び「ポリペプチド」は、本明細書では互換性があるようにして使用される。

ポリペプチドに関して使用される「組み換え」は、本明細書では、天然には存在しない２つ以上のポリペプチドの組み合わせを指す。

「特異性」という用語は、特定の抗原結合分子（本発明のナノボディなど）が結合できる抗原または抗原決定基の異なるタイプの数を指す。特異性の低いナノボディは、単一の抗原結合部位または結合ドメインを介して複数の異なるエピトープ（またはポリペプチド領域）に結合するが、特異性の高いナノボディは、単一の抗原結合部位または結合ドメインを介して１つまたは少数のエピトープ（またはポリペプチド領域）に結合する。いくつかの実施形態では、少数のエピトープ（またはポリペプチド領域）は、例えば異種間エピトープなど、類似している、または非常に類似している。本明細書で使用するとき、「特異的に結合する」という用語は、ナノボディに関して本明細書で使用される場合、他のエピトープ（またはポリペプチド領域）と比較して、ナノボディがエピトープ（またはポリペプチド領域）に優先的に結合することを指す。特異的結合は、結合親和性、及び結合が行われる条件のストリンジェンシーに依存し得る。一例では、ストリンジェントな条件下で高親和性結合が存在する場合に、ナノボディはエピトープに特異的に結合する。いくつかの実施形態では、本明細書に記載のＨＳＡ結合ポリペプチドまたはナノボディは、ヒト血清アルブミンに特異的に結合する。

抗原結合分子（例えば、ＨＳＡ結合ポリペプチド、本発明のナノ抗体）の特異性は、親和性及び／または結合活性に基づいて決定できることを理解すべきである。親和性は、抗原と抗原結合分子との解離の平衡定数（Ｋ_Ｄ）で表され、抗原決定基と抗原結合分子上の抗原結合部位との間の結合強度の尺度である。Ｋ_Ｄの値が小さいほど、抗原決定基と抗原結合分子との間の結合強度が強くなる（あるいは、親和性は、親和定数（Ｋ_Ａ）として表すこともでき、これは１／Ｋ_Ｄである）。親和性を決定する方法は、当業者によく知られている。結合活性は、抗原結合分子（ＨＳＡ結合ポリペプチド、及び本発明のナノボディなど）と関連抗原との間の結合強度の尺度である。結合活性は、抗原決定基と抗原結合分子上のその抗原結合部位との間の親和性、及び抗原結合分子上に存在する関連結合部位の数の両方に関連している。典型的には、抗原結合タンパク質（ＨＳＡ結合ポリペプチド、及び本発明のナノボディなど）は、１０^－５～１０^－１２モル／リットル以下、好ましくは１０^－７～１０^－１２モル／リットル以下、より好ましくは１０^－８～１０^－１２モル／リットルの解離定数（Ｋ_Ｄ）（すなわち、１０^５～１０^１２リットル／モル以上、好ましくは１０^７～１０^１２リットル／モル以上、より好ましくは１０^８～１０^１２リットル／モルの結合定数（Ｋ_Ａ））でそれらの抗原に結合する。いくつかの実施形態では、Ｋａ（オンレート、１Ｍｓ）は、約１０^５、１０^６、１０^７、１０^８、１０^９、１０^１０、または１０^１１である。いくつかの実施形態では、Ｋａは約１０^７である。いくつかの実施形態では、Ｋｄ（オフレート、ｓ）は、約１０^－５、１０^－６、１０^－７、１０^－８、１０^－９、１０^－１０、または１０^－１１である。いくつかの実施形態では、Ｋ_Ｄは約１０^－７である。いくつかの実施形態では、本明細書に開示される抗原結合タンパク質は、約１０^－９モル／リットル未満のＫ_Ｄでその抗原に結合する。１０μＭを超えるＫ_Ｄ値は、一般に非特異的結合を示すと見なされる。当業者には明らかであるように、解離定数は、実際の解離定数または見かけの解離定数であり得る。

「被験者」という用語は、本明細書では、霊長類（例えば、ヒト）、ウシ、ヒツジ、ヤギ、ウマ、イヌ、ネコ、ウサギ、ラット、マウスなどを含むがこれらに限定されない哺乳動物などの動物を含むと定義される。いくつかの実施形態では、被験者はヒトである。

組成物及び方法
いくつかの態様において、本明細書には、相補性決定領域（ＣＤＲ）３、２または１の領域のナノボディアミノ酸配列（ＣＤＲ３、ＣＤＲ２またはＣＤＲ１配列）群を同定する、減数されたＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列が対照と比較して偽陽性である、方法が開示される。本明細書における「偽陽性」という用語は、何かが存在しないにもかかわらず、それが存在することを示す結果を指す。本明細書では、「配列は偽陽性である」という表現は、試験抗原に特異的に結合しないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列、または試験抗原に特異的に結合することができないナノボディに含まれるＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列のことをいう。偽陽性ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列の数または量は、フラグメント化フィルターを、トリプシン処理サンプルについては少なくとも約３０％（例えば、少なくとも約３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９９％）に、及び／またはキモトリプシン処理サンプルについては少なくとも約３０％（例えば、少なくとも約３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９９％）に設定して、本明細書に開示の方法を使用して減らすことができることを理解されたい。いくつかの実施例では、偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列は、フラグメント化フィルターを、トリプシン処理サンプルについては約５０％に、及び／またはキモトリプシン処理サンプルについては約４０％に設定して、本明細書に開示される方法を使用して、ほとんど除去することができる。

したがって、開示された、ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列を同定する方法は、対照と比較して偽陽性であるＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列の数を減少させることができる。この減少は、例えば、本明細書に記載の方法を使用せずに同定された偽陽性ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列の数と比較して、少なくとも約２倍、少なくとも約３倍、少なくとも約４倍、少なくとも約５倍、少なくとも約１０倍、少なくとも約２０倍、少なくとも約５０倍、または少なくとも約１００倍の減少になり得る。

いくつかの実施形態では、本方法は、
ａ．抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
ｂ．血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、
ｃ．ｃＤＮＡライブラリー中の各ｃＤＮＡの配列を同定することと、
ｄ．抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、
ｅ．ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
ｆ．消化産物の質量分析を実行して、質量分析データを取得することと、
ｇ．質量分析データと相関する、ステップｃで同定された配列を選択することと、
ｈ．ステップｇの配列内のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列を同定することと、
ｉ．ステップｈのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、選択された配列が、減数された偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列を有する群を含む、選択することと、を含む。

いくつかの実施形態では、本方法は、
ａ．抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
ｂ．血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、
ｃ．ライブラリー中の各ｃＤＮＡの配列を同定することと、
ｄ．抗原の免疫を持つラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、
ｅ．ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
ｆ．消化産物の質量分析を実行して、質量分析データを取得することと、
ｇ．質量分析データと相関する、ステップｃで同定された配列を選択することと、
ｈ．ステップｇの配列内のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列を同定することと、
ｉ．ステップｈのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、フラグメント化カバー率の割合が、ステップｅでキモトリプシンが使用される場合、式ｆ（ｘ，キモトリプシン）＝０．００２３ｘ２－０．０４９７ｘ＋０．７７２３，ｘ［５，３０］によって決定され、またはステップｅでトリプシンが使用される場合、式ｆ（ｘ，トリプシン）＝０．００００６ｘ２－０．００４４４ｘ＋０．９１９４，ｘ［５，３０］によって決定され、ｘは、ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列の長さである、選択することと、を含み、
ｊ．ステップｉの選択された配列が、減数された偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列を有する群を含む。

いくつかの態様において、ステップｉにおける選択されたＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列は、約３０％である最低限必要なフラグメント化カバー率の割合を有する。いくつかの態様において、ステップｉにおける選択されたＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列は、約５０％である最低限必要なフラグメント化カバー率の割合を有し、ステップｅでトリプシンが使用される。いくつかの実施形態において、ステップｉにおける選択されたＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列は、約４０％である最低限必要なフラグメント化カバー率の割合を有し、ステップｅでキモトリプシンが使用される。

ステップｂのナノボディｃＤＮＡライブラリーは、免疫化される被験者の生物学的サンプル（例えば、血液サンプルまたは骨髄）から取得されることを理解されたい。いくつかの実施形態では、ｃＤＮＡライブラリーはＢ細胞から取得される。ｃＤＮＡ（クローン化ｃＤＮＡまたは相補的ＤＮＡ）ライブラリーは、逆転写技術を使用して生物学的サンプル（例えば、血液サンプルまたは骨髄サンプル）中のｍＲＮＡから生成されるｃＤＮＡの組み合わせである。ｃＤＮＡライブラリーを作製する方法は、当技術分野で周知である。したがって、いくつかの実施形態では、ステップｂは、生物学的サンプル（例えば、血液サンプルまたは骨髄サンプル）からｍＲＮＡを単離するステップ、及び／または単離されたｍＲＮＡをｃＤＮＡに逆転写するステップをさらに含む。

次いで、生成されたｃＤＮＡは、ステップｃに記載のように配列決定される。いくつかの実施形態では、ステップｃは、特異的プライマー（例えば、ＳＥＱＩＤＮＯ：２６４６及びＳＥＱＩＤＮＯ：２６４７）を使用して、可変ドメインからＣＨ２ドメインまでのラクダ科動物ＩｇＧ重鎖ｃＤＮＡ配列を増幅するステップ、ＤＮＡゲル電気泳動を用いて、ＣＨ１ドメインを欠くＶ_ＨＨ遺伝子を従来のＩｇＧ（ＣＨ１ドメインを有する）から分離するステップ、セカンドフォワードプライマー（例えば、ＳＥＱＩＤＮＯ：２６４８）及びセカンドリバースプライマー（例えば、ＳＥＱＩＤＮＯ：２６４９）を使用して、フレームワーク１からフレームワーク４までを再増幅するステップ、この第２のＰＣＲのアンプリコンを（例えば、ＰＣＲクリーンアップキットまたは単離キットを使用して）精製するステップ、（例えば、シークエンシング解析のためのフォワードプライマーＳＥＱＩＤＮＯ：２６５０及びリバースプライマーＳＥＱＩＤＮＯ：２６５１を用いて）シークエンシング解析（例えば、ＭｉＳｅｑシークエンシング解析）のためのアダプターを追加するプライマーを用いた別のＰＣＲのステップをさらに含む。シークエンシング解析の方法には、例えば、単一分子リアルタイム（ＳＭＲＴ）シークエンシング、ナノポアＤＮＡシークエンシング、超並列シグネチャーシークエンシング（ＭＰＳＳ）、ポロニーシークエンシング、４５４パイロシークエンシング、Ｉｌｌｕｍｉｎａ（Ｓｏｌｅｘａ）シークエンシング、コンビナトリアルプローブアンカー合成（ｃＰＡＳ）、ＳＯＬｉＤシークエンシング、またはＭｉＳｅｑシークエンシングがあり得る。

上記のステップｄは、ステップａ、ｂ、及び／またはｃと同時に、ステップａ、ｂ、及び／またはｃより前に、またはステップａ、ｂ、及び／またはｃの後に実行することができる。いくつかの実施例では、ステップｄは、血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む。親和性分離法は、例えば、プロテインＧセファロース親和性クロマトグラフィー、プロテインＡセファロース親和性クロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、ゲル電気泳動、または透析を含む、当技術分野で知られている任意の親和性分離法であり得る。プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーの２つは、よく知られた親和性クロマトグラフィー法である（ＧｒｏｄｚｋｉＡ．Ｃ．，ＢｅｒｅｎｓｔｅｉｎＥ．（２０１０）ＡｎｔｉｂｏｄｙＰｕｒｉｆｉｃａｔｉｏｎ：ＡｆｆｉｎｉｔｙＣｈｒｏｍａｔｏｇｒａｐｈｙ－ＰｒｏｔｅｉｎＡａｎｄＰｒｏｔｅｉｎＧＳｅｐｈａｒｏｓｅ．Ｉｎ：ＯｌｉｖｅｒＣ．，ＪａｍｕｒＭ．（ｅｄｓ）ＩｍｍｕｎｏｃｙｔｏｃｈｅｍｉｃａｌＭｅｔｈｏｄｓａｎｄＰｒｏｔｏｃｏｌｓ．ＭｅｔｈｏｄｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（ＭｅｔｈｏｄｓａｎｄＰｒｏｔｏｃｏｌｓ），ｖｏｌ５８８．ＨｕｍａｎａＰｒｅｓｓ．）。この方法は、タンパク質とクロマトグラフマトリックスに固定化された特異的リガンドとの間の可逆的相互作用に依存している。サンプルは、静電的及び疎水性相互作用、ファンデルワールス力、及び／または水素結合の結果として、リガンドへの特異的結合にとって有利に働く条件の下で適用される。結合していない物質を洗い流した後に、緩衝液条件を脱着に適した条件に変更することにより、結合したタンパク質が回収される。プロテインＡセファロース親和性クロマトグラフィーとプロテインＧセファロース親和性クロマトグラフィーとは、抗体のＦｃ領域に対するプロテインＡまたはＧの結合親和性及び特異性が高いため、抗体の精製に一般的に使用されている。いくつかの実施形態では、ステップｄの１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む。

いくつかの実施例では、ステップｄはまた、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップｅからステップｉまでを各フラクションに対して個別に実行し、抗原に対する各異なるステップｉのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の親和性を、それぞれ、ナノボディフラクションのそれぞれにおけるＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、抗原にコンジュゲートされた樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び抗原に結合された樹脂である。

「ストリンジェンシーの程度」という用語は、異なる濃度の塩緩衝液（例えば、中性ｐＨ緩衝液中約０．１Ｍ～約２０ＭのＭｇＣｌ_２、好ましくは中性ｐＨ緩衝液中約１Ｍ～約１０ＭのＭｇＣｌ_２、または好ましくは中性ｐＨ緩衝液中約１Ｍ～約４．５ＭのＭｇＣｌ_２）、異なるｐＨ値のアルカリ性溶液（例えば、１～１００ｍＭＮａＯＨ、ｐＨ約１１、１２及び１３）、異なるｐＨ値の酸性溶液（例えば、０．１Ｍグリシン、ｐＨ約３、２及び１）、またはそれらの組み合わせを指すことが理解され、本明細書において企図されるべきである。「異なるナノボディ画分」または「異なる生化学画分」という用語は、異なる程度のストリンジェンシー下で抗原結合固体支持体（例えば、樹脂）から溶出されるナノボディの異なる画分を指すことも理解されたい。高塩濃度、高酸性または高アルカリ性の条件に最も耐性のあるナノボディは、抗原に対する親和性が最も高くなる。

ステップｅなどの本明細書における「消化産物」という用語は、酵素（例えば、トリプシン、キモトリプシン、ＬｙｓＣ、ＧｌｕＣ、及びＡｓｐＮを含む）による消化ステップ後のペプチドの混合物を指す。いくつかの実施例では、ナノボディは、トリプシン（Ｐｉｅｒｃｅ（商標）トリプシンプロテアーゼ、ＭＳグレード、カタログ番号：９００５７など）、キモトリプシン（Ｐｉｅｒｃｅ（商標）キモトリプシンプロテアーゼ（ＴＬＣＫ処理済み）、ＭＳグレード、カタログ番号：９００５６など）で消化される。９００５６）、ＬｙｓＣ（またはＰｉｅｒｃｅ（商標）Ｌｙｓ－Ｃプロテアーゼ、ＭＳグレード、カタログ番号：９００５１などのＬｙｓ－Ｃプロテアーゼ）、ＧｌｕＣ（またはＰｉｅｒｃｅ（商標）Ｇｌｕ－Ｃプロテアーゼ、ＭＳグレード、カタログ番号：９００５４などのＧｌｕ－Ｃプロテアーゼ）、及び／またはＡｓｐＮ（または、Ｐｉｅｒｃｅ（商標）Ａｓｐ－ＮＰｒｏｔｅａｓｅ、ＭＳグレード、カタログ番号：９００５３などのＡｓｐ－Ｎプロテアーゼ）で消化されて、対応する消化産物が作成される。トリプシン、キモトリプシン、ＬｙｓＣ、ＧｌｕＣ、及びＡｓｐＮは、タンパク質を消化する酵素である。これらの酵素によるナノボディ消化の切断規則は次のとおりである。
トリプシン：Ｃ末端からＫ／Ｒ、Ｐが続かない
キモトリプシン：Ｃ末端からＷ／Ｆ／Ｌ／Ｙ、Ｐが続かない
ＧｌｕＣ：Ｃ末端からＤ／Ｅ、Ｐが続かない
ＡｓｐＮ：Ｎ末端からＤ
ＬｙｓＣ：Ｃ末端からＫ
消化ステップは、約２℃～約６０℃の温度（例えば、約２℃、４℃、６℃、８℃、１０℃、１２℃、１４℃、１６℃、１８℃、２０℃、２２℃、２４℃、２６℃、２８℃、３０℃、３２℃、３４℃、３６℃、３８℃、４０℃、４２℃、４４℃、４６℃、４８℃、５０℃、５２℃、５４℃、５６℃、５８℃、または６０℃）で、約５分間、１０分間、３０分間、４５分間、１時間、２時間、時間、４時間、６時間、８時間、１０時間、１２時間、１４時間、１６時間、１８時間、２０時間、２２時間、２４時間、３６時間、４８時間、または７２時間行うことができる。

ステップｆは、消化産物の質量分析を実行して、質量分析データを取得することを含む。ペプチド分析のために質量分析を使用する方法は、当技術分野で周知である。いくつかの実施形態では、本明細書の質量分析は、ガスクロマトグラフィー（ＧＣ－ＭＳ）、液体クロマトグラフィー（ＬＣ－ＭＳ）、キャピラリー電気泳動（ＣＥ－ＭＳ）、イオン移動度分析－質量分析（ＩＭＳ／ＭＳまたはＩＭＭＳ）、マトリックス支援レーザー脱離イオン化（ＭＡＬＤＩ－ＴＯＦ）、表面増強レーザー脱離イオン化（ＳＥＬＤＩ－ＴＯＦ）、またはタンデムＭＳ（ＭＳ－ＭＳ）と組み合わせて実施される。このステップでは、アミノ酸の質量、及びステップｂのｃＤＮＡライブラリーから翻訳されたポリペプチドのデータベースにおける配列相同性検索に基づいて、サンプル中のナノボディまたはナノボディの一部の配列を同定することができる。いくつかの実施例では、各ナノボディ画分から別々に消化産物のスペクトルの分析及び生成を行うために、質量分析法が使用される。いくつかの実施例では、消化産物のスペクトルは、強度対ｍ／ｚ（質量対電荷比）プロットとして存在する電子イオン化データを表す。

本明細書において、ナノボディの配列決定は質量分析のみに基づくものではないことを理解すべきである。この配列は、質量分析法によって同定された配列を、シークエンシングによって同定されたｃＤＮＡライブラリーの配列と照合／相関させることによって決定される。次に、一致した配列が選択される。したがって、ステップｇは、質量分析データと相関するステップｃで同定された配列を選択することを含み、ステップｈは、ステップｇからの配列中のＣＤＲ３領域の配列を同定することを含む。

ステップｉは、ステップｈのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列から、必要なフラグメント化カバー率の割合以上の配列を選択することを含む。いくつかの実施形態では、フラグメント化カバー率の割合は、トリプシン処理サンプルについては約３０％（例えば、約３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９９％）以上である。いくつかの実施形態では、フラグメント化カバー率の割合は、キモトリプシン処理サンプルについては約３０％（例えば、少なくとも約３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、または９９％）以上である。いくつかの実施形態では、フラグメント化カバー率の割合は、トリプシン処理サンプルについては約５０％であり、キモトリプシン処理サンプルについては約４０％である。

いくつかの実施形態では、本明細書に記載の方法は、ステップｉで同定された配列を有するＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を含むナノボディを作成することをさらに含む。ナノボディ遺伝子はベクターにクローン化し、次いでベクターはナノボディタンパク質の発現、抽出、及び精製のためにコンピテント細胞に変換される。

いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：１～１５７からなる群から選択される配列と少なくとも８０％（例えば、少なくとも約８０％、８５％、９０％、９５％、９８％または９９％）同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：１～１５７からなる群から選択される配列を有する。いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：１５８～２５３６からなる群から選択される配列と少なくとも８０％（例えば、少なくとも約８０％、８５％、９０％、９５％、９８％または９９％）同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：１５８～２５３６からなる群から選択される配列を有する。いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：２６６５～２６６７からなる群から選択される配列と少なくとも８０％（例えば、少なくとも約８０％、８５％、９０％、９５％、９８％または９９％）同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、ＳＥＱＩＤＮＯ：２６６５～２６６７からなる群から選択される配列を有する。

本明細書には、ＳＥＱＩＤＮＯ：１５８～２５３６からなる群から選択されるアミノ酸配列を含むＰＤＺ特異的ナノボディが開示される。本明細書にはまた、ＳＥＱＩＤＮＯ：１４３～１５７からなる群から選択されるアミノ酸配列を含むＰＤＺ特異的ナノボディが開示される。本明細書で使用される場合、「ＰＤＺ」は、ＤＨＲ（Ｄｌｇ相同領域）またはＧＬＧＦ（グリシン－ロイシン－グリシン－フェニルアラニン）ドメインとも呼ばれるシグナル伝達タンパク質に見られる８０～１００のアミノ酸ドメインを指す。ＰＤＺドメインは、他の特異タンパク質のＣ末端の短い領域に結合する。ＰＤＺドメインは、慣例的に、リガンドの化学的性質によって分類される３つの異なるクラスに分けられる。異なるリガンドクラスは、標的タンパク質の末端ＣＯＯＨに見られる最後から２番目の結合残基の違いによって区別される。Ｉ型ドメインは、配列Ｘ－Ｓ／Ｔ－Ｘ－Φ＊（ここでＸ＝任意のアミノ酸、Φ＝疎水性アミノ酸、＊ＣＯＯＨ末端）を認識する。ＩＩ型ドメインは、配列Ｘ－Φ－Ｘ－Φ＊を持つリガンドに結合する。ＩＩＩ型ドメインは、Ｘ－Ｘ－Ｃ＊の配列と相互作用する。各ドメインクラス内の結合特異性は、バリアント（Ｘ）残基、及び標準的な結合モチーフ外側の残基によって付与され得る。さらに、いくつかのＰＤＺドメインは、これらの特異的クラスのいずれにも分類されない。ＰＤＺドメインを含むタンパク質には、エルビン、ＧＲＩＰ、Ｈｔｒａ１、Ｈｔｒａ２、Ｈｔｒａ３、ＰＳＤ－９５、ＳＡＰ９７、ＣＡＲＤ１０、ＣＡＲＤ１１、ＣＡＲＤ１４、ＰＴＰ－ＢＬ、及びＳＹＮＪ２ＢＰが含まれるが、これらに限定されない。いくつかの実施形態では、ＰＤＺドメインはＳＹＮＪ２ＢＰ由来である。

本明細書には、表４のアミノ酸配列を含むＧＳＴ特異的ナノボディが開示される。本明細書にはまた、ＳＥＱＩＤＮＯ：１～９８からなる群から選択されるアミノ酸配列を含むＧＳＴ特異的ナノボディが開示される。「グルタチオンＳ－トランスフェラーゼ」または「ＧＳＴ」は、本明細書では、グルタチオン－Ｓ－トランスフェラーゼ（ＧＳＴ）を指し、これは多種多様な内因性及び外因性の求電子化合物とグルタチオン（ＧＳＨ）との抱合を触媒する第２相解毒酵素のファミリーである。いくつかの実施形態では、ＧＳＴポリペプチドは、ｐＧＥＸ６ｐ－１ベクターのものである。

本明細書には、表５のアミノ酸配列を含むＨＳＡ特異的ナノボディが開示される。本明細書にはまた、ＳＥＱＩＤＮＯ：９９～１４２からなる群から選択されるアミノ酸配列を含むＨＳＡ特異的ナノボディが開示される。「ヒト血清アルブミン」または「ＨＳＡ」は、本明細書では、ＡＬＢ遺伝子によってコードされるポリペプチドを指す。いくつかの実施形態では、ＨＳＡポリペプチドは、１つ以上の公に利用可能なデータベースにおいて以下のように同定されたものである。すなわちＨＧＮＣ：３９９、ＥｎｔｒｅｚＧｅｎｅ：２１３、Ｅｎｓｅｍｂｌ：ＥＮＳＧ０００００１６３６３１、ＯＭＩＭ：１０３６００、ＵｎｉＰｒｏｔＫＢ：Ｐ０２７６８である。いくつかの実施形態では、ＨＳＡポリペプチドは、ＳＥＱＩＤＮＯ：２６６８の配列、またはＳＥＱＩＤＮＯ：２６６８と約８０％、約８５％、約９０％、約９５％、または約９８％の相同性を有するポリペプチド配列、またはＳＥＱＩＤＮＯ：２６６８の一部を含むポリペプチドを含む。ＳＥＱＩＤＮＯ：２６６８のＨＳＡポリペプチドは、成熟ＨＳＡの未成熟形態または前プロセス形態を表し得るため、本明細書には、ＳＥＱＩＤＮＯ：２６６８のＨＳＡポリペプチドの成熟部分またはプロセスされた部分が含まれる。

ここでは、抗原に結合したＮｂプロテオームの大規模な定量分析と、抗原－Ｎｂ複合体のハイスループット構造特性評価に基づくエピトープマッピングとのために、堅牢なプロテオミクスパイプラインが開発された。

本発明の様々な実施形態を以下に示す。
１．相補性決定領域（ＣＤＲ）３、２及び／または１のナノボディアミノ酸配列（ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列）群を同定する、減数された前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列が対照と比較して偽陽性である、方法であって、
ａ．抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
ｂ．前記血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、
ｃ．前記ライブラリー中の前記各ｃＤＮＡの配列を同定することと、
ｄ．前記抗原の免疫を持つ前記ラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、
ｅ．前記ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
ｆ．前記消化産物の質量分析を実行して、質量分析データを取得することと、
ｇ．前記質量分析データと相関する、ステップｃで同定された配列を選択することと、
ｈ．ステップｇの配列内のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列を同定することと、
ｉ．ステップｈの前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、前記フラグメント化カバー率の割合が、ステップｅでキモトリプシンが使用される場合、式ｆ（ｘ，キモトリプシン）＝０．００２３ｘ ^２－０．０４９７ｘ＋０．７７２３，ｘ［５，３０］によって決定され、またはステップｅでトリプシンが使用される場合、式ｆ（ｘ，トリプシン）＝０．００００６ｘ ^２－０．００４４４ｘ＋０．９１９４，ｘ［５，３０］によって決定され、ｘは、それぞれＣＤＲ３、ＣＤＲ２またはＣＤＲ１領域の配列の長さである、前記選択することと、を含み、
ｊ．ステップｉの前記選択された配列が、前記減数された偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列を有する群を含む、前記方法。
２．前記必要なフラグメント化カバー率の割合は約３０％である、上記１に記載の方法。
３．前記必要なフラグメント化カバー率の割合は約５０％であり、ステップｅでトリプシンが使用される、上記１に記載の方法。
４．前記必要なフラグメント化カバー率の割合は約４０％であり、ステップｅでキモトリプシンが使用される、上記１に記載の方法。
５．ステップｄは、前記血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む、上記１～４のいずれかに記載の方法。
６．ステップｄの前記１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む、上記５に記載の方法。
７．ステップｄは、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で前記抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップｅからステップｉまでを各フラクションに対して個別に実行し、前記抗原に対する各異なるステップｉのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の親和性を、それぞれ、前記ナノボディフラクションのそれぞれにおける前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む、上記１～６のいずれかに記載の方法。
８．前記抗原特異的親和性クロマトグラフィーは、前記抗原にコンジュゲートされた樹脂である、上記７に記載の方法。
９．前記抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び前記抗原に結合された樹脂である、上記７に記載の方法。
１０．ステップｉで同定された配列を有するＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１ペプチドを作成することをさらに含む、上記１～９のいずれかに記載の方法。
１１．ステップｉで同定された配列を有するＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を含むナノボディを作成することをさらに含む、上記１～９のいずれかに記載の方法。
１２．ＳＥＱＩＤＮＯ：１～２５３６及びＳＥＱＩＤＮＯ：２６６５～２６６７から選択されるアミノ酸配列を含む、ナノボディ。
１３．コンピュータ実施方法であって、
ナノボディペプチド配列を受け取ることと、
前記ナノボディペプチド配列の複数の相補性決定領域（ＣＤＲ）領域を同定することであって、前記ＣＤＲ領域が、ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を含む、前記同定することと、
フラグメント化フィルターを適用して、前記ナノボディペプチド配列の１つ以上の偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を破棄することと、
前記ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の存在量を定量化することと、
前記ナノボディペプチド配列の前記１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の前記定量化された存在量に基づいて抗原親和性を推測することと、
を含む、前記コンピュータ実施方法。
１４．前記ナノボディペプチド配列の前記１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を、低い抗原親和性、中程度の抗原親和性、または高い抗原親和性を有するものとして分類することをさらに含む、上記１３に記載のコンピュータ実施方法。
１５．前記高い抗原親和性を有すると分類された前記ナノボディペプチド配列の前記１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域をナノボディタンパク質に組み立てることをさらに含む、上記１４に記載のコンピュータ実施方法。
１６．前記フラグメント化フィルターは、最小の計算されたフラグメント化カバー率の割合を要求するように構成される、上記１３～１５のいずれかに記載のコンピュータ実施方法。
１７．前記最小の計算されたフラグメント化カバー率の割合は約３０％である、上記１６に記載のコンピュータ実施方法。
１８．前記最小の計算されたフラグメント化カバー率の割合は、トリプシン処理サンプルについては約５０％であり、キモトリプシン処理サンプルについては約４０％である、上記１７に記載のコンピュータ実施方法。
１９．複数のナノボディペプチド配列を受け取ることと、
前記ナノボディペプチド配列のそれぞれをデータベースと比較して、前記ナノボディペプチド配列を、除外されたサブグループと除外されていないサブグループとに分離することであって、前記除外されたサブグループの前記ナノボディペプチド配列は前記データベースに見つからず、前記ＣＤＲ領域は、前記除外されていないサブグループの前記ナノボディペプチド配列でのみ同定される、前記比較することと、
をさらに含む、上記１３～１８のいずれかに記載のコンピュータ実施方法。
２０．前記ナノボディペプチド配列の前記１つ以上の破棄されていないＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の存在量は、相対ＭＳ１イオンシグナル強度に基づいて定量化される、上記１３～１９のいずれかに記載のコンピュータ実施方法。
２１．前記抗原親和性が、エピトープ類似性に基づくｋ－ｍｅａｎｓクラスタリングを使用して推測される、上記１３～２０のいずれかに記載のコンピュータ実施方法。
２２．深層学習モデルをトレーニングする方法であって、
上記１３～２１のいずれかに記載のコンピュータ実施方法を使用してデータセットを作成することと、
前記データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることであって、前記データセットは、複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含む、前記トレーニングすることと、
を含む、前記方法。
２３．前記深層学習モデルは、畳み込みニューラルネットワークである、上記２２に記載の方法。
２４．ナノボディペプチド配列の抗原親和性を決定するための方法であって、
ナノボディペプチド配列を受け取ることと、
トレーニング済みの深層学習モデルに前記ナノボディペプチド配列を入力することと、
前記トレーニング済みの深層学習モデルを使用して、前記ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、
を含む、前記方法。
２５．前記深層学習モデルは、畳み込みニューラルネットワークである、上記２４に記載の方法。
２６．前記トレーニング済みの深層学習モデルが、上記２２に従ってトレーニングされる、上記２４または上記２５に記載の方法。

実施例１．大規模なＮｂプロテオミクス解析におけるキモトリプシンの優位性
ＨｃＡｂ（Ｖ_ＨＨ／Ｎｂ）ｃＤＮＡライブラリーの可変ドメインを、２つのｌａｍａｇｌａｍａｓのＢリンパ球から増幅し、次世代ゲノムシークエンシング（ＮＧＳ）（ＤｅＫｏｓｋｙ，２０１３）によってデータベース内の１３６０万の一意のＮｂ配列を回収した。約５０万のＮｂ配列をアラインメントして、配列ロゴを生成した（図１Ａ、７Ａ）。ＣＤＲ３ループは、最大の配列多様性及び配列長変化の両方を有し、Ｎｂ同定に対する優れた特異性を提供する（図１Ｂ、１Ｃ）。Ｎｂデータベースのインシリコ分析は、Ｎｂ上のトリプシン切断部位の数が限られているため、トリプシンが主に大きなＣＤＲ３ペプチドを生成することを明らかにした（図１Ａ）。その結果、ＣＤＲ３残基の大部分（７７％）は、２．５ｋＤａを超える大きなトリプシンペプチドによってカバーされており（図１Ｄ、１Ｅ）、したがってプロテオミクス解析には最適ではなかった（図７Ｂ）。比較すると、特異的芳香族及び疎水性残基を切断するプロテオミクスにめったに使用されないキモトリプシンが、より適しているように見える（方法、図１Ａ、７Ｂ）。ＣＤＲ３配列の９１％は、２．５ｋＤａ未満のキモトリプシンペプチドによってカバーされ得る（図１Ｄ、１Ｅ）。無作為選択及びシミュレーションにより、トリプシンよりもキモトリプシンの方が有意に多くのＣＤＲ３配列をカバーできることを確認した（図１Ｆ）。また、２つの酵素間にわずかな重複（約９％）があり、効率的なＮｂ分析のための優れた相補性を示した。

ＣＤＲ３同定の推定の偽発見率（ＦＤＲ）は、データベースのサイズが大きく、Ｎｂ配列構造が異常であるため、かさ上げされる可能性がある。これをテストするために、抗原特異的ＨｃＡｂをトリプシンまたはキモトリプシンでタンパク質分解し、同定のため最先端の検索エンジンを使用し、２つの異なるデータベース、すなわち、免疫化されたラマに由来する特異的「ターゲット」データベース、及び文字通り同一の配列を持たない無関係なラマからの同様のサイズの「デコイ」データベースを使用した（図７Ｄ）。したがって、デコイデータベース検索から同定した全てのＣＤＲ３ペプチドを偽陽性と見なした（Ｅｌｉａｓ，Ｊ．Ｅ．＆Ｇｙｇｉ，Ｓ．Ｐ，２００７）。デコイデータベース検索から、多数の偽陽性ＣＤＲ３ペプチドを非特異的に同定した。これらの偽りのペプチドスペクトルマッチングは、一般に、ＣＤＲ３フィンガープリント配列上のＭＳ／ＭＳフラグメント化が不十分であることがわかった（図７Ｅ、７Ｆ）。これらの誤ったマッチングの大多数（９５％）は、ＭＳ２スペクトル（図１Ｋ、１Ｌ）におけるＣＤＲ３高解像度診断イオンの５０％（トリプシンによる、図１Ｇ）及び４０％（キモトリプシンによる、図１Ｈ）の最小カバー率を必要とする、実装した単純なフラグメント化フィルターを使用することで削除できる。フィルターは、信頼できるＮｂプロテオミクス分析のために新しいオープンソースソフトウェア「ＡｕｇｕｒＬｌａｍａ」（図８Ａ～８Ｃ）に統合する前に、ＣＤＲ３の長さに基づいてさらに最適化した（図１Ｉ、１Ｊ）。

実施例２．Ｎｂの発見及び特性評価のための統合プロテオミクスパイプラインの開発
抗原－Ｎｂ複合体の包括的定量的Ｎｂプロテオミクス及びハイスループット構造特性評価のための堅牢なプラットフォームを本明細書に示す（方法、図２Ａ）。家畜であるラクダ科動物を、対象の抗原で免疫化した。次に、免疫化したラクダ科動物の血液及び／または骨髄から、ＮｂｃＤＮＡライブラリーを調製した（Ｆｒｉｄｙ，２０１４）。ＮＧＳを実行して、１０^７個を超える一意のＮｂタンパク質配列の豊富なデータベースを作成した（図８Ｅ、８Ｆ）。一方、抗原特異的Ｖ_ＨＨを、血清から親和性単離し、塩またはｐＨ緩衝液の段階的勾配を使用して溶出した。高分解能ＭＳと組み合わせたナノフロー液体クロマトグラフィーによる同定及び定量化のために、分画したＨｃＡｂをトリプシンまたはキモトリプシンで効率的に消化して、ＮｂＣＤＲペプチドを遊離させた。データベース検索に合格した最初の候補には、ＣＤＲ識別のためにアノテートした。ＣＤＲ３フィンガープリントをフィルタリングして偽陽性を除去し、これらの様々な生化学的フラクションの存在量を定量化してＮｂ親和性を推測し、Ｎｂタンパク質に組み立てた。上記の全てのステップを、ＡｕｇｕｒＬｌａｍａによって自動化した。このパイプラインにより、前例のない規模の多様で特異的で高品質のＮｂの同定及び特性評価が可能になる。並行して、何万もの抗原－Ｎｂ相互作用の構造解析を可能にするために、ハイスループット計算ドッキング（Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，２００５）、クロスリンキング質量分析（ＣＸＭＳ）（Ｃｈａｉｔ，２０１６；Ｒｏｕｔ，２０１９；Ｙｕ，２０１８；Ｌｅｉｔｎｅｒ，２０１６）、及び突然変異誘発を統合する堅牢な方法を開発している。さらに、Ｎｂレパートリーに関連する潜在的な特徴を学習させるために、深層学習アプローチを開発した。

実施例３．抗原特異的Ｎｂの堅牢で詳細かつ高品質な同定
このパイプラインを検証するために、３つのベンチマーク抗原を選択した。すなわち、グルタチオンＳ－トランスフェラーゼ（ＧＳＴ）、ヒト血清アルブミン（ＨＳＡ）（重要な薬物標的（Ｌａｒｓｅｎ，２０１６））、及びミトコンドリア外膜タンパク質２５由来の小さなＰＤＺドメインである。これらの抗原は、ＰＤＺのみ免疫原性が弱いが３桁の免疫応答に及んでおり（図２Ｂ）、本技術の堅牢性を評価するのに理想的である。

ここでは、６４，６７０の一意のＮｂ_ＧＳＴ配列（３，４５３のＣＤＲ３Ｎｂファミリーからの９，９１５の一意のＣＤＲの組み合わせ）、３４，９７２の一意のＮｂ_ＨＳＡ（２，２８６の一意のＣＤＲ３Ｎｂファミリーからの７，７４９の一意のＣＤＲ）、及びより小さなコホートである２，３７９の高品質Ｎｂ_ＰＤＺ配列（２３０のＣＤＲ３ファミリーからの４９５の一意のＣＤＲ）を同定した（方法、図２Ｃ、８Ｇ）。試験した様々なプロテアーゼから、キモトリプシンがＮｂ同定に最も有用なフィンガープリント情報を提供することを確認した（図２Ｄ、２Ｅ）。Ｎｂレパートリーは、一際優れたＣＤＲ３多様性を示した（図８Ｄ）。

１４６個のＮｂのランダムなセットを、３つの抗原特異的Ｎｂ群から選択し、Ｅ．ｃｏｌｉで発現させた。１３０個のＮｂ群（８９％）は優れた溶解性を示し、容易かつ大量に精製することが可能であった（図２Ｆ）。抗原結合を評価するために、免疫沈降、ＥＬＩＳＡ、及びＳＰＲを含む相補的なアプローチを採用した（方法、図２Ｇ、９Ｃ、９Ｄ、１０、表１～３）。トリプシン及びキモトリプシンによって同定したＮｂは、同等に高品質であった（図８Ｈ）。８６．２％（ＣＩ_９５％：６．８％）、９０．５％（ＣＩ_９５％：１１．５％）、及び１００％の純Ｎｂバインダーを、それぞれＧＳＴ、ＨＳＡ及びＰＤＺについて確認した。これらの結果は、このアプローチの感度及び特異性が高いことを示している。

実施例４．Ｎｂプロテオームの正確な大規模の定量化とクラスタリング
Ｎｂを親和性に基づいて正確に分類するために、様々な戦略を評価した。簡単に言えば、抗原特異的ＨｃＡｂを血清から親和性単離し、段階的な高塩濃度勾配、高ｐＨ緩衝液、または低ｐＨ緩衝液によって溶出した（方法、図８Ｉ、８Ｊ）。異なるＨｃＡｂフラクションは、ラベルフリーの定量的プロテオミクスによって正確に定量化した（Ｚｈｕ，２０１０；Ｃｏｘ，Ｊ．＆Ｍａｎｎ，Ｍ，２００８）。次いで、ＣＤＲ３ペプチド（及び対応するＮｂ）を、それらの相対的イオン強度に基づいて３つのグループにクラスター化した（図３Ａ、３Ｂ、９Ａ、及び９Ｂ）。この分類は、高ｐＨ法により、Ｎｂ_ＧＳＴの３１％及びＮｂ_ＨＳＡの４７％をＣ３高親和性群に割り当てる（図３Ｃ）。各クラスターからの一意のＣＤＲ３配列を持ついくつかのＮｂ_ＧＳＴをランダムに発現させ、それらの親和性をＥＬＩＳＡ及びＳＰＲ（Ｒ^２＝０．８５、図３Ｄ、表１）によって測定して、様々な分画方法を評価した。低ｐＨ法は、異なる親和性群を分離するのに十分な分解能を提供しなかったが、塩勾配法及び特に高ｐＨ法は、Ｎｂの有意かつ再現可能な分離を、それらの親和性に基づいて可能にした（図３Ｅ）。高ｐＨクラスター１及び２（Ｃ１、Ｃ２）からのＮｂは、一般に、それぞれμＭから数十ｎＭまでの低い平凡な親和性を有するが、５０％超のＣ３は、超高親和性のサブｎＭバインダーであった（図３Ｈ、９Ｄ）。この結果をさらに検証するために、２５個のＮｂ_ＨＳＡのランダムなセット（多様なＣＤＲ３を含む）をＣ３から精製し、それらのＥＬＩＳＡ親和性をランク付けした（図３Ｆ、表２）。上位１４のＮｂ_ＨＳＡをＳＰＲ測定用に選択した。そのうちの１１は、多様な結合反応速度を持つ数十から数百のｐＭ親和性を有していた。残りの３つのＮｂ_ＨＳＡは、１桁のｎＭＫ_Ｄを示した（図３Ｉ、１０Ａ）。１３個の可溶性Ｎｂ_ＰＤＺを精製し、それらの高い親和性をＥＬＩＳＡ及び免疫沈降によって確認した（図３Ｇ、１０Ｂ、及び表３）。代表的な高溶解性Ｎｂ_ＰＤＺＰ１０のＫ_Ｄは４．４ｐＭであった（図３Ｊ）。

天然ミトコンドリアの免疫沈降及び蛍光イメージング（Ｎｂ_ＰＤＺ）のための超高親和性Ｎｂ（Ｎｂ_ＧＳＴ）（図３Ｋ、３Ｌ）を、さらに積極的に評価した。定量的アプローチにより、親和性などの望ましい特性に基づいて、Ｎｂプロテオームを大規模かつ正確に分類することができる。

実施例５．統合的構造決定法によって明らかにされた抗原結合Ｎｂプロテオームのランドスケープ
高品質のＮｂの大規模レパートリーの同定及び分類により、抗原が関与する体液性免疫応答の全体的な構造ランドスケープに関する調査が可能になる。３４，９７２個のＮｂ_ＨＳＡの構造的なドッキング及びクラスタリングにより、３つの主要なＨＳＡエピトープを明らかにした（図４Ａ）。豊富な天然血清アルブミン（７６％がＨＳＡと同一、図１２Ｈ）の存在により、ラクダ科動物の体液性免疫の特異性に関する調査が可能になった。２つのアルブミン配列をアラインメントし、それらの変化量をｐＩ及びハイドロパシーに基づいて計算した（方法、図４Ａ）。３つのエピトープは全て、大きな配列の違いに対応するｐＩ及びハイドロパシーの主要なピークと共局在している。この結果は、Ｎｂによる抗原認識の一際優れた特異性を示している。Ｎｂは、安定したらせん二次構造に優先的に結合するようである（図４Ｂ）。エピトープが高度に荷電されていることがわかった。Ｅ２及びＥ３は主に負であった（それぞれ－４及び－５の正味の形式電荷、図１３Ｄ）が、Ｅ１は混合電荷（－２の正味の形式電荷）でより不均一であった（図４Ｃ）。

１９のＨＳＡ－Ｎｂ複合体（Ｓｈｉ，２０１４；Ｋｉｍ，２０１８）を架橋して、ドッキングによって同定されたエピトープを検証した。全体として、架橋の９２％がモデルによって満足され、ＲＭＳＤの中央値は５．６Åであった（図４Ｊ、４Ｋ）。架橋結合によりドッキング結果を確認し、密集した２つのエピトープ（Ｅ２、Ｅ３）（それぞれ６５％及び２０％）を同定した（図４Ｄ、表２）。Ｅ１を、存在量の少ない架橋によって同定した（５％）。架橋結合により、ドッキングによって明らかにされなかった追加の２つのマイナーエピトープも同定した（図４Ｄ）。凸状Ｎｂパラトープ及び凹状ＨＳＡエピトープを含む、ＨＳＡとＮｂとの間に、高い形状相補性を認めた（図４Ｅ～４Ｇ）。主要なＥ２をさらに確認するために、全体的な構造への影響を最小限に抑えて、ＨＳＡに単一点突然変異のＥ４００Ｒを導入した（Ｐｉｒｅｓ，２０１６）。結果として生じる変異は、ラクダ化動物アルブミンのＥ２のオーソロガス位置で正電荷を模倣するように表面電荷を逆転させ、それとＮｂＣＤＲ３のアルギニンとの間に形成される塩橋を破壊する可能性がある（図４Ｈ）。次いで、１９の高親和性バインダーを選択し、ＨＳＡ－Ｎｂ相互作用に関するこの点突然変異をＥＬＩＳＡによって評価した（図４Ｉ、表２）。Ｅ４００Ｒは、テストした１９個のＮｂのうち５個（２６％）の結合をほぼ完全に無効にし、Ｅ２が正真正銘の主要なエピトープであることを示した。

このアプローチを、６４，６７０のＧＳＴ－Ｎｂ複合体のエピトープをマッピングするためにさらに使用した。ＧＳＴ上の３つの主要なエピトープを正確に同定し（図１１Ａ、１１Ｂ、１１Ｆ、１１Ｇ）、それらをＥ１、Ｅ２、及びＥ３について、それぞれ１８．７５％、３１．２５％、及び５０％の相対存在量の架橋によって検証した（図１１Ｄ、１１Ｅ）。Ｅ１及びＥ３は、負に帯電した表面パッチを含む。Ｅ２は、ＧＳＴ二量体化空洞と重なっている（図１１Ｃ）。本明細書に示すモデルでは、Ｅ２Ｎｂは、この空洞にそのＣＤＲ３を挿入する。ＨＳＡと同様に、帯電した表面残基への優先性とＮｂの高い形状相補性とを確認した。まとめると、これらの結果は、Ｎｂが多様なタンパク質表面に結合し、抗原上の高度に帯電した空洞を好むことを示している。

実施例６．Ｎｂ親和性成熟のメカニズムの調査
最も確実に分類された高ｐＨデータセットに基づいて、高親和性（成熟）及び低親和性のＮｂを区別する物理化学的及び構造的特徴を調査した。ＨＳＡ及びＧＳＴそれぞれに対する高親和性バインダーの異なる分布を有するより短いＣＤＲ３（図５Ａ）は、抗原結合のエントロピーを低下させる。低親和性Ｎｂのわずかに酸性から高親和性Ｎｂの比較的塩基性まで、ｐＩの有意な増加を観察した（図５Ｂ）。

ＮｂのｐＩ及びハイドロパシーに対するＣＤＲの寄与を比較し、ＣＤＲ３_ＨＳＡがＮｂ_ＨＳＡにおける極性シフトの主な原因であり、ＣＤＲ１_ＧＳＴ及びＣＤＲ２_ＧＳＴがＮｂ_ＧＳＴの極性シフトの主な原因であると判断した（図５Ｃ）。高親和性Ｎｂは、親水性がわずかに高いことを観測した（図５Ｄ）。

ＣＤＲ３の構造は、最も高い配列可変性からなる「ヘッド」領域と、より低い特異性の「トルソー」領域とを有すると考えることができる（Ｆｉｎｎ，２０１６）（図５Ｅ）。アスパラギン酸及びアルギニン（強力な静電相互作用を形成する）（Ｔｉｌｌｅｒ，２０１７）、グリシン及びセリンの小さく柔軟な残基、アラニン及びロイシンなどの疎水性残基、ならびにチロシンの芳香族残基を含む、特定の残基がＣＤＲ３ヘッドに濃縮された（図５Ｆ、及び図１２）。異なる親和性グループのＮｂを比較したところ、３つの大きな違いが見つかった。まず、高親和性Ｎｂは荷電残基がより豊富であった（Ｍｉｔｃｈｅｌｌ，Ｌ．Ｓ．＆Ｃｏｌｗｅｌｌ，Ｌ．Ｊ，２０１８）（方法、図５Ｇ）。第二に、様々な抗原について複雑な違いを同定した。高親和性Ｎｂ_ＨＳＡは、ＣＤＲ３ヘッド上に正に帯電した残基を増やし（３９％）、負に帯電した残基を減少させる（４６％）ことによって静電気を強化する傾向がある。高親和性Ｎｂ_ＧＳＴは、主に他のＣＤＲの電荷を変えた。ＣＤＲ１とＣＤＲ２とでは、それぞれ、正に帯電した残基の２９．２％及び１１７．２％の増加と、負に帯電した残基の４４．２％及び２１．５％の減少とが見られた。電荷の変化は、Ｎｂとエピトープとの間の物理化学的相補性を高める可能性がある。第三に、チロシン（５１％）、グリシン及びセリン（５８％）は、高親和性Ｎｂ_ＨＳＡのＣＤＲ３ヘッドでより濃縮されていた。高親和性Ｎｂ_ＧＳＴでは、ＣＤＲ３ヘッドでチロシン（７３％）が増加したが、グリシン及びセリンのフラクションはほとんど影響を受けなかった。

ＨＳＡ結合親和性を増強するためのこれらの残基の推定上の役割をさらに調査するために、それらの位置頻度をＣＤＲ３ヘッドに沿って計算した（図５Ｈ）。チロシンは、高親和性Ｎｂ_ＨＳＡのＣＤＲ３ヘッドの中心でより頻繁に見つかり、そのかさばる芳香族側鎖を特異的エピトープポケット（複数可）に挿入できるようにしている（Ｄｅｓｍｙｔｅｒ，１９９６；Ｌｉ，２０１６）。グリシン及びセリンは、ＣＤＲ３の中心から離れて配置される傾向があり、追加の柔軟性を提供し、抗原ポケット内のチロシン側鎖の方向付けを容易にする。これらの結果を、これらの残基群の数と本願の精製ＮｂのＥＬＩＳＡ親和性との間の相関分析によって確認した（図５Ｉ、５Ｊ）。

Ｎｂ親和性分類を可能にする潜在的な特徴を学習させるために、深層学習モデルを開発した（方法）。高親和性バインダー分類のための最も有益なＮｂ_ＨＳＡＣＤＲ３フィルターは、連続したリジン及びアルギニン、チロシン及びグリシンのパターンを明らかにした（図５Ｋ、表４）。低親和性バインダーの場合、最も有益なフィルターは、フェニルアラニン、ヒスチジン、及び２つの連続するアスパラギン酸を優先する。さらに、この分析は、高親和性バインダー及び低親和性バインダーのそれぞれに対して負電荷及び正電荷のペアが連続する傾向を明らかにした。

実施例７．抗原認識のためのＮｂの優れた汎用性と回復力
免疫原性が弱いＰＤＺドメインに対する何百もの分岐した高親和性Ｎｂ_ＣＤＲ３ファミリーの同定により、そのような相互作用の構造的基礎の調査を促した。ドッキングに基づいて、２つの推定エピトープを同定した（図６Ａ、１３Ｂ）。Ｅ２は、正に帯電した大きな表面を有し（図６Ａ、６Ｂ）、αヘリックス及び２つのβストランドでより構造化されているため、主要なエピトープとなり得る。Ｅ２は、多数のＰＤＺ相互作用タンパク質間で共有される保存されたリガンド結合部位と重なり合っていた（Ｓｈｅｎｇ，２００１；Ｄｏｙｌｅ，１９９６）（図６Ｃ）。驚くべきことに、Ｎｂ_ＰＤＺは、天然のＰＤＺリガンドよりも１００，０００倍高い親和性を（μＭの親和性で）獲得している（Ｎｉｅｔｈａｍｍｅｒ，１９９８）（図３Ｊ）。そのような高い親和性は、小さくて浅いエピトープの周りを包む長いＣＤＲ３ループによって達成され、広範な静電的相互作用及び疎水性相互作用を形成する可能性が高かった（図６Ｃ、１３Ａ）。モデリングの結果は、ＰＤＺエピトープの２番目のβストランドのＲ４６及びＫ４８が、Ｎｂ_ＰＤＺの対応する残基と塩橋を形成したことを示した。二重変異ＰＤＺ（Ｒ４６Ｅ：Ｋ４８Ｄ）が生成され、Ｎｂ_ＰＤＺに対するその親和性をＥＬＩＳＡによって評価した。Ｎｂ_ＰＤＺの大部分（８／１１）は、変異体に対する親和性の有意な低下を示し、または親和性を示さず、Ｅ２が実際に主要なエピトープであることを確認した（図６Ｄ）。

Ｎｂ_ＰＤＺについては、他にもいくつかの観察結果がある。まず、ＣＤＲ３ループ長の分布は、１つの主要なピークを形成し、中央値がその自然分布の上限を押し上げる約２０ａａであった（図６Ｅ）。第２に、Ｎｂ_ＰＤＺは、中央値ｐＩが４．９のやや酸性であり（図６Ｆ）、これにはＣＤＲ３が大きく寄与している（図６Ｅ、１３Ｆ）。第３に、それらの酸性の性質にもかかわらず、Ｎｂ_ＰＤＺは、疎水性残基の代償により、ハイドロパシーを感知できるほどに変化させるようには見えなかった（図６Ｇ、１３Ｅ）。最後に、負に帯電したアスパラギン酸と小さなグリシン及びセリンとが大幅に増加し、ＣＤＲ３ヘッド残基の半分を占めた。高親和性Ｎｂ_ＧＳＴ及びＮｂ_ＨＳＡと比較して、かさ高いチロシンの減少も明らかであり、結合のためのＥ２のかなり浅いポケットを反映していた（図７Ｃ、７Ｅ）。まとめると、これらの結果は、抗原結合に対するＮｂの顕著な多用途性を示している。

この研究では、抗原結合Ｎｂプロテオームの分析のためのプロテオミクス、インフォマティクス、及び構造モデリング技術を統合した堅牢なプラットフォームの開発を報告している。パイプラインは、種々の困難な抗原に対する幅広い高品質Ｎｂレパートリーの高感度で信頼性の高い同定を可能にする。また、循環Ｎｂをその物理化学的特性に基づいて正確に分類することもできる。何千もの超高親和性Ｎｂを本技術によって同定した。本研究では、計算論的ドッキングと構造プロテオミクスとを組み合わせて、１０２，６７３の抗原－Ｎｂ複合体を構造的に特徴付け、マッピングし、主要なエピトープを検証した。この「ビッグデータ」分析は、体液性免疫応答の世界規模のプロテオミクス及び構造解析を初めて可能にする。

これらの結果は、前例のない深さで、ラクダ科動物抗体免疫の壮大なランドスケープを共に形成する抗原結合Ｎｂの効率性、特異性、多様性、及び汎用性を明らかにした（図６Ｈ）。

効率性：Ｎｂは、結合のために形状及び静電相補性の両方を効率的に利用する。荷電したアスパラギン酸及びアルギニン、芳香族チロシン、ならびに小さく柔軟なグリシン及びセリンなどの特異残基は、高親和性Ｎｂをもたらすループの柔軟性を可能にする。種々のＣＤＲに対して特異的な複雑で微調整された相互作用を明らかにした。さらに、病原体を効率的に認識するための一般的なメカニズムとして機能する、Ｎｂ結合のための複数の優性エピトープの存在を確認した（Ａｋｒａｍ，Ａ．＆Ｉｎｍａｎ，Ｒ．Ｄ，２０１２）。

特異性及び多様性：特異的で効果的かつ安全な免疫応答を確実にするために、いくつかの最も顕著な配列変異を持つ特異的ＨＳＡ表面ポケットを認識するように進化した、数千もの高度に分岐したＮｂを発見した（図４Ａ）。

汎用性：ＰＤＺなどの免疫応答を回避する傾向がある抗原の場合、Ｎｂは、パラトープのサイズ及び物理化学的特性を大幅に変更して、優れた親和性及び特異性を備えた天然のリガンド結合を模倣できる。この研究は、タンパク質間相互作用の興味深い急速な進化を示している。

Ｎｂは、ウイルス中和と酵素活性の阻害とにおいて非常に強力である（Ｌａｕｗｅｒｅｙｓ，１９９８；Ｄｅｓｍｙｔｅｒ，１９９６；Ａｃｈａｒｙａ，２０１３；Ａｒａｂｉ，２０１７）。これらの発見は、これらの非常に堅牢で効率的なラクダ科動物ＨｃＡｂが、乾燥した自然の生息地と攻撃的な病原性の難題との両方において、生存するために進化的に有利であることを示しているが、そのような信じられないほどの選択と適応との背後にある原動力（複数可）は謎のままである（Ｆｌａｊｎｉｋ，２０１１）。

これらの技術は、がん生物学、脳研究、及びウイルス学などの困難な生物医学アプリケーションにおいて幅広い用途を見つけることができる。Ｎｂプロテオミクス用のこれらのインフォマティクスツールは、研究コミュニティが自由に利用できる。高品質のＮｂデータセットは、抗体抗原を研究するための青写真として機能し、コンピュータによる抗体設計を容易にすることができる（Ｓｉｒｃａｒ，２０１１；Ｂａｒａｎ，２０１７；Ｃｈｅｖａｌｉｅｒ，２０１７）。

実施例８．方法
動物免疫化
２頭のラマを、それぞれＨＳＡ、及びミトコンドリア外膜タンパク質２５（ＯＭＰ２５）のＧＳＴとＧＳＴ融合ＰＤＺドメインとの組み合わせを１ｍｇの初回用量で免疫し、続いて３週間ごとに０．５ｍｇの３回連続ブーストを行った。採血及び骨髄吸引液は、最後の免疫ブーストの１０日後に動物から抽出された。上記の全ての手順を、ＩＡＣＵＣプロトコルに従ってＣａｐｒａｌｏｇｉｃｓ，Ｉｎｃ．によって実行した。

ｍＲＮＡの単離とｃＤＮＡの調製
約１～３×１０^９個の末梢単核細胞を３５０ｍｌの免疫血液から単離し、５～９×１０^７個の形質細胞を、Ｆｉｃｏｌｌ勾配（Ｓｉｇｍａ）を使用して３０ｍｌの骨髄吸引物から単離した。ＲＮｅａｓｙキット（ＮＥＢ）を使用して、それぞれの細胞からｍＲＮＡを単離し、それをＭａｘｉｍａ（商標）ＨＭｉｎｕｓｃＤＮＡ合成マスターミックス（Ｔｈｅｒｍｏ）を使用してｃＤＮＡに逆転写した。可変ドメインからＣＨ２ドメインまでのラクダ科動物ＩｇＧ重鎖ｃＤＮＡ配列を、プライマーＣＡＬＬ００１（ＧＴＣＣＴＧＧＣＴＧＣＴＣＴＴＣＴＡＣＡＡＧＧ、ＳＥＱＩＤＮＯ：２６４６）及びＣＨ２ＦＯＲＴＡ４（ＣＧＣＣＡＴＣＡＡＧＧＴＡＣＣＡＧＴＴＧＡ、ＳＥＱＩＤＮＯ：２６４７）を用いて特異的に増幅した（Ａｂｒａｂｉ，１９９７）。ＣＨ１ドメインを欠くＶ_ＨＨ遺伝子を従来のＩｇＧから分離し、ＤＮＡゲル電気泳動によって精製し（Ｑｉａｇｅｎ）、その後、セカンドフォワード（ＡＴＣＴＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴＮＮＮＮＮＮＮＮＡＴＧＧＣＴ［Ｃ／Ｇ］Ａ［Ｇ／Ｔ］ＧＴＧＣＡＧＣＴＧＧＴＧＧＡＧＴＣＴＧＧ、ＳＥＱＩＤＮＯ：２６４８、ＮはＡ、Ｔ、ＣまたはＧを表す）及びセカンドリバース（ＧＴＧＡＣＴＧＧＡＧＴＴＣＡＧＡＣＧＴＧＴＧＣＴＣＴＴＣＣＧＡＴＣＴＮＮＮＮＮＮＮＮＧＧＡＧＡＣＧＧＴＧＡＣＣＴＧＧＧＴ、ＳＥＱＩＤＮＯ：２６４９、ＮはＡ、Ｔ、ＣまたはＧを表す）を使用して、フレームワーク１からフレームワーク４までを再増幅した。イルミナＭｉＳｅｑのクラスター同定を支援するために、ランダムな８－ｍｅｒ置換アダプター配列を追加した。第２のＰＣＲのアンプリコン（約４５０～５００ｂｐ）を、ＭｏｎａｒｃｈＰＣＲクリーンアップキット（ＮＥＢ）を使用して精製した。プライマーＭｉＳｅｑ－Ｆ（ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＧＡＴＣＴＡＣＡＣＴＣＴＴＴＣＣＣＴＡ、ＳＥＱＩＤＮＯ：２６５０）及びＭｉＳｅｑ－Ｒ（ＣＡＡＧＣＡＧＡＡＧＡＣＧＧＣＡＴＡＣＧＡＧＡＴＴＴＣＴＧＡＡＴＧＴＧＡＣＴＧＧＡＧＴＴＣＡ、ＳＥＱＩＤＮＯ：２６５１）によるＰＣＲの最終ラウンドを行って、ＭｉＳｅｑシークエンシング前のインデックス付きのＰ５／Ｐ７アダプターを追加した。

イルミナＭｉｓｅｑによる次世代シークエンシング
シークエンシングは、３００ｂｐペアードエンドモデルを備えたイルミナＭｉＳｅｑプラットフォームに基づいて実行した。データベースごとに３，０００万を超えるリードが生成された。ＦＡＳＴＱデータの品質チェックと管理には、ＦａｓｔＱＣｖ０．１１．８のリードＱＣツール（ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｆａｓｔｑｃ／）を使用した。生のイルミナリードを、ＢＢＭａｐプロジェクトのソフトウェアツール（ｇｉｔｈｕｂ．ｃｏｍ／ＢｉｏＩｎｆｏＴｏｏｌｓ／ＢＢＭａｐ／）によって処理した。ヌクレオチド配列をアミノ酸配列に変換する前に、重複したリードとＤＮＡバーコード配列とを連続して除去した。

免疫血清からのＶ_ＨＨ抗体の単離と生化学的分画
約１７５ｍｌの血漿を、Ｆｉｃｏｌｌ勾配（Ｓｉｇｍａ）によって３５０ｍｌの免疫化血液から単離した。ラクダ科動物の単鎖Ｖ_ＨＨ抗体は、プロテインＧ及びプロテインＡセファロースビーズ（Ｍａｒｖｅｌｇｅｎｔ）を使用した２段階の精製手順によって血漿上清から単離し、酸で溶出した後に、１×ＰＢＳ緩衝液で中和し、最終濃度０．１～０．３ｍｇ／ｍｌに希釈した。抗原特異的Ｖ_ＨＨ抗体を精製するために、ＧＳＴまたはＨＳＡコンジュゲートされたＣＮＢｒ樹脂をＶ_ＨＨ混合物とともに４℃で１時間インキュベートし、高塩濃度緩衝液（１×ＰＢＳ及び３５０ｍＭＮａＣｌ）で十分に洗浄して非特異的バインダーを除去した。次に、以下の溶出条件の１つを使用して、特異的Ｖ_ＨＨ抗体を樹脂から遊離させた。すなわち、アルカリ性（１～１００ｍＭのＮａＯＨ、ｐＨ１１、１２及び１３）、酸性（０．１Ｍのグリシン、ｐＨ３、２及び１）または塩溶出（中性ｐＨ緩衝液中１Ｍ～４．５ＭのＭｇＣｌ_２）である。ＰＤＺ特異的Ｖ_ＨＨの精製のために、ＭＢＰ－ＰＤＺの融合タンパク質（カップリング後の小さなＰＤＺの立体障害を避けるために、ＰＤＺドメインのＮ末端にマルトース結合タンパク質／ＭＢＰを融合させた）を製造し、親和性ハンドルとして使用した。対照にはＭＢＰ結合樹脂を使用した（図６Ｊ）。プロテオミクス分析の前に、溶出した全てのＶ_ＨＨを中和し、１×ＤＰＢＳに個別に透析した。

抗原特異的Ｎｂのタンパク質分解及び質量分析と組み合わせたナノフロー液体クロマトグラフィー（ｎＬＣ／ＭＳ）分析
ＧＳＴ及びＨＳＡＶ_ＨＨについては、次のプロトコルに従って各溶出を別々に処理した。ＰＤＺ特異的Ｖ_ＨＨについては、最もストリンジェントな生化学的溶出物（すなわち、ｐＨ１３、ｐＨ１、ＭｇＣｌ_２３Ｍ及び４．５Ｍ）及び異なるフラクションからのそれぞれの非特異的ＭＢＰバインダー（陰性対照）のみをタンパク質分解のためにプールした。例えば、ｐＨ１３緩衝液によって溶出されたＰＤＺ特異的Ｖ_ＨＨの場合、非特異的ＭＢＰ結合Ｎｂを、ｐＨ１１、ｐＨ１２及びｐＨ１３のフラクションからプールして、下流ＬＣ／ＭＳ定量化のストリンジェンシーを改善した。Ｖ_ＨＨを８Ｍ尿素緩衝液（５０ｍＭ重炭酸アンモニウム、５ｍＭＴＣＥＰ及びＤＴＴを含む）内で、５７℃で１時間還元し、暗所において３０ｍＭヨードアセトアミドで、室温で３０分間アルキル化した。次に、アルキル化したサンプルを２つに分割し、トリプシンまたはキモトリプシンを使用して溶液中で消化した。トリプシン消化サンプルの場合、１：１００（ｗ／ｗ）トリプシンとＬｙｓ－Ｃとを加え、３７℃で一晩消化し、別の朝に１：１００のトリプシンを追加して、３７℃の水浴で４時間、消化した。キモトリプシン消化サンプルの場合、１：５０（ｗ／ｗ）キモトリプシンを添加し、３７℃で４時間消化した。タンパク質分解後、ペプチド混合物を自己充填ステージチップまたはＳｅｐ－ｐａｋＣ１８カラム（Ｗａｔｅｒｓ）で脱塩し、ＱＥｘａｃｔｉｖｅ（商標）ＨＦ－ＸＨｙｂｒｉｄＱｕａｄｒｕｐｏｌｅＯｒｂｉｔｒａｐ（商標）質量分析計（ＴｈｅｒｍｏＦｉｓｈｅｒ）とオンラインで結合したｎａｎｏ－ＬＣ１２００で分析した。簡単に説明すると、脱塩したＮｂペプチドを分析カラム（Ｃ１８、粒子サイズ１．６μｍ、細孔サイズ１００Å、７５μｍ×２５ｃｍ、ＩｏｎＯｐｔｉｃｋｓ）にロードし、９０分間の液体クロマトグラフィー勾配（５％Ｂ～７％Ｂ、０～１０分；７％Ｂ～３０％Ｂ、１０～６９分；３０％Ｂ～１００％Ｂ、６９～７７分；１００％Ｂ、７７～８２分；１００％Ｂ～５％Ｂ、８２分～８２分１０秒；５％Ｂ、８２分１０秒～９０分；移動相Ａは０．１％ギ酸（ＦＡ）から構成され、移動相Ｂは８０％アセトニトリル（ＡＣＮ）中の０．１％ＦＡから構成される）を使用して溶出した。流量は３００ｎｌ／ｍｉｎであった。ＱＥＨＦ－Ｘ装置は、データ依存モードで操作され、上位１２個の最も豊富なイオン（質量範囲３５０～２，０００、荷電状態２～８）を高エネルギー衝突解離（ＨＣＤ）によってフラグメント化した。目標分解能を、ＭＳについては１２０，０００、タンデムＭＳ（ＭＳ／ＭＳ）分析については７，５００とした。四重極単離ウィンドウは１．６Ｔｈであり、ＭＳ／ＭＳの最大注入時間を８０ｍｓに設定した。

ＮｂＤＮＡの合成とクローニングＮｂ遺伝子をＥｓｃｈｅｒｉｃｈｉａｃｏｌｉでの発現のためにコドン最適化し、ヌクレオチドをインビトロで合成した（Ｓｙｎｂｉｏｔｅｃｈ）。サンガーシークエンシングによる検証後、Ｎｂ遺伝子をｐＥＴ－２１ｂ（＋）のＢａｍＨＩ及びＸｈｏＩ（ＧＳＴＮｂの場合）、またはＥｃｏＲＩ及びＮｏｔＩ制限部位（ＨＳＡ及びＰＤＺＮｂの場合）にクローニングした。

組み換えタンパク質の精製
製造元の指示に従ってＤＮＡ構築物をＢＬ２１（ＤＥ３）コンピテント細胞に形質転換し、５０μｇ／ｍｌアンピシリンを含む寒天培地に３７℃で一晩プレーティングした。３７℃で一晩培養するために、単一コロニーを、アンピシリンを含むＬＢ培地に接種した。その後、培養物を新鮮なＬＢ培地に１：１００（ｖ／ｖ）で接種し、Ｏ．Ｄ．６００ｎｍが０．４～０．６に達するまで３７℃で振とうした。ＧＳＴ、ＧＳＴ－ＰＤＺ及びＮｂを０．５ｍＭのＩＰＴＧで誘導し、ＭＢＰ及びＭＢＰ－ＰＤＺを０．１ｍＭのＩＰＴＧで誘導した。誘導は、１６℃で一晩行った。次いで、細胞を採取し、簡単に超音波処理し、氷上で溶解緩衝液（１×ＰＢＳ、１５０ｍＭＮａＣｌ、プロテアーゼ阻害剤を含む０．２％ＴＸ－１００）で溶解した。溶解後、可溶性タンパク質抽出物を１５，０００×ｇで１０分間収集した。ＧＳＴ及びＧＳＴ－ＰＤＺは、ＧＳＨ樹脂を使用して精製し、グルタチオンによって溶出した。ＭＢＰ（マルトース結合タンパク質）及びＭＢＰ－ＰＤＺ融合タンパク質は、アミロース樹脂を使用することによって精製し、製造元の指示に従ってマルトースによって溶出した。ＮｂをＨｉｓ－コバルト樹脂によって精製し、イミダゾールを使用して溶出した。続いて、溶出したタンパク質を透析緩衝液（例えば、１×ＤＰＢＳ、ｐＨ７．４）で透析し、使用するまで－８０℃で保存した。

Ｎｂ免疫沈降アッセイ
Ｎｂ誘導及び細胞溶解後、細胞溶解物をＳＤＳ－ＰＡＧＥにかけて、Ｎｂ発現レベルを推定した。細胞溶解中の組み換えＮｂを、１×ＤＰＢＳ（ｐＨ７．４）で最終濃度約５μＭ（ＧＳＴＮｂの場合）及び約５０ｎＭ（ＰＤＺＮｂの場合）に希釈した。Ｎｂと抗原との特異的な相互作用をテストするために、様々な抗原をＣＮＢｒ樹脂に結合させた。対照には、不活化またはＭＢＰ結合ＣＮＢｒ樹脂を使用した。抗原結合樹脂または対照樹脂をＮｂ溶解物とともに４℃で３０分間インキュベートした。次いで、樹脂を洗浄緩衝液（１５０ｍＭＮａＣｌ及び０．０５％Ｔｗｅｅｎ２０を含む１×ＤＰＢＳ）で３回洗浄して、非特異的結合を除去した。次いで、特異的抗原結合Ｎｂを、２０ｍＭＤＴＴを含有する熱ＬＤＳ緩衝液によって樹脂から溶出し、ＳＤＳ－ＰＡＧＥにかけた。ゲル上のＮｂの強度を、抗原特異的シグナルと対照シグナルとの間で比較して、偽陽性結合を導出した。

ＥＬＩＳＡ（酵素結合免疫吸着アッセイ）
抗原のラクダ科動物免疫応答を評価し、抗原特異的Ｎｂの相対的親和性を定量化するために、間接ＥＬＩＳＡを行った。抗原を９６ウェルＥＬＩＳＡプレート（Ｒ＆Ｄｓｙｓｔｅｍ）に、１ウェルあたり約１～１０ｎｇの量で、コーティング緩衝液（１５ｍＭ炭酸ナトリウム、３５ｍＭ重炭酸ナトリウム、ｐＨ９．６）中で４℃にて一晩コーティングした。次に、ウェル表面をブロッキング緩衝液（ＤＰＢＳ、０．０５％Ｔｗｅｅｎ２０、５％牛乳）で、室温で２時間ブロッキングした。免疫応答をテストするために、免疫化した血清をブロッキング緩衝液で連続的に５倍に希釈した。希釈血清を、室温で２時間、抗原被覆ウェルと共にインキュベートした。ラマＦｃ（Ｂｅｔｈｙｌ）に対するＨＲＰコンジュゲートされた二次抗体をブロッキング緩衝液中で１：１０，０００に希釈し、各ウェルとともに室温で１時間インキュベートした。Ｎｂ親和性テストでは、目的の抗原に結合しないスクランブルＮｂを陰性対照に使用した。テスト及びスクランブル陰性対照の両方の特異的バインダーのＮｂを、ブロッキング緩衝液で１０μＭから１ｐＭまで連続的に１０倍希釈した。Ｈｉｓタグ（Ｇｅｎｓｃｒｉｐｔ）またはＴ７タグ（Ｔｈｅｒｍｏ）に対するＨＲＰコンジュゲート二次抗体を、緩衝液中で１：５，０００または１：１０，０００に希釈し、室温で１時間インキュベートした。インキュベーション間で非特異的吸光度を除去するために、１×ＰＢＳＴ（ＤＰＢＳ、０．０５％Ｔｗｅｅｎ２０）による３回の洗浄を行った。最後の洗浄後、サンプルを新たに調製したｗ３，３′，５，５′－テトラメチルベンジジン（ＴＭＢ）基質と共に暗所にて室温で１０分間さらにインキュベートして、シグナルを発現させた。停止液（Ｒ＆Ｄシステム）後、プレートリーダー（ＭｕｌｔｉｓｋａｎＧＯ、ＴｈｅｒｍｏＦｉｓｈｅｒ）で複数の波長（４５０ｎｍ及び５５０ｎｍ）でプレートを読み取った。次の２つの基準のいずれかが満たされた場合、偽陽性のＮｂバインダーであると定義した。ｉ）ＥＬＩＳＡシグナルは１０μＭの濃度でのみ検出でき、１μＭの濃度では検出不足であった。ｉｉ）１μＭの濃度では、１０μＭの信号と比較して顕著な信号の減少（１０分の１以下）が検出されたが、より低濃度では信号を検出できなかった。生データをＰｒｉｓｍ７（ＧｒａｐｈＰａｄ）によって処理して４ＰＬ曲線にフィットさせ、ｌｏｇＩＣ５０を計算した。

ＳＰＲによるＮｂ親和性測定
表面プラズモン共鳴（ＳＰＲ、Ｂｉａｃｏｒｅ３０００システム、ＧＥＨｅａｌｔｈｃａｒｅ）を使用して、Ｎｂ親和性を測定した。次のステップにより、活性化されたＣＭ５センサーチップに、抗原タンパク質を固定化した。タンパク質分析物を、１０ｍＭ酢酸ナトリウム、ｐＨ４．５で１０～３０μｇ／ｍｌに希釈し、ＳＰＲシステムに５μｌ／分で４２０秒間注入した。次に、センサーの表面を１Ｍエタノールアミン－ＨＣｌ（ｐＨ８．５）でブロックした。各Ｎｂ検体について、２ｍＭＤＴＴを含むＨＢＳ－ＥＰ＋ランニング緩衝液（ＧＥ－Ｈｅａｌｔｈｃａｒｅ）に一連の希釈液（３桁にわたる）を２０～３０μｌ／分の流速で１２０～１８０秒間注入し、解離速度に基づいて５～２０分の解離時間を継続させた。各注入の間に、１０ｍＭグリシン－ＨＣｌ（ｐＨ１．５～２．５）を含む低ｐＨ緩衝液、または２０～４０ｍＭＮａＯＨ（ｐＨ１２～１３）の高ｐＨ緩衝液でセンサーチップ表面を再生した。再生は４０～５０μｌ／分の流量で３０秒間実行した。測定を２重に行い、再現性の高いデータのみを分析に使用した。各Ｎｂの結合センサーグラムを処理し、ＢＩＡｅｖａｌｕａｔｉｏｎを使用して、１：１ラングミュアモデルまたは物質移動を伴う１：１ラングミュアモデルでフィッティングすることにより分析した。

抗原ナノボディ複合体の架橋及び質量分析
架橋結合の前に、異なるＮｂを、アミンを含まない緩衝液（２ｍＭＤＴＴを含む１×ＤＰＢＳなど）中、４℃で等モル濃度の目的の抗原とともに１～２時間インキュベートした。アミン特異的スベリン酸ジサクシンイミジル（ＤＳＳ）またはヘテロ二機能性リンカーである１－エチル－３－（３－ジメチルアミノプロピル）カルボジイミド塩酸塩（ＥＤＣ）を、それぞれ１ｍＭまたは２ｍＭの最終濃度で抗原－Ｎｂ複合体に添加した。ＤＳＳ架橋結合のために、反応は２３℃で２５分間、絶えず攪拌しながら行った。ＥＤＣ架橋結合のために、反応を２３℃で６０分間行った。室温で１０分間、５０ｍＭＴｒｉｓ－ＨＣｌ（ｐＨ８．０）によって反応をクエンチした。タンパク質の還元及びアルキル化の後、架橋されたサンプルを４～１２％のＳＤＳ－ＰＡＧＥゲル（ＮｕＰＡＧＥ、ＴｈｅｒｍｏＦｉｓｈｅｒ）によって分離した。架橋種に対応する領域を切断し、前述のようにトリプシン及びＬｙｓ－Ｃでゲル内消化した（Ｓｈｉ，２０１４；Ｓｈｉ，２０１５）。タンパク質分解後、ペプチド混合物を脱塩し、ＱＥｘａｃｔｉｖｅ（商標）ＨＦ－ＸＨｙｂｒｉｄＱｕａｄｒｕｐｏｌｅ－Ｏｒｂｉｔｒａｐ（商標）質量分析計（ＴｈｅｒｍｏＦｉｓｈｅｒ）に連結したｎａｎｏ－ＬＣ１２００（ＴｈｅｒｍｏＦｉｓｈｅｒ）で分析した。架橋ペプチドをピコチップカラム（Ｃ１８、粒子サイズ３μｍ、細孔サイズ３００Å、５０μｍ×１０．５ｃｍ、ＮｅｗＯｂｊｅｃｔｉｖｅ）にロードし、６０分のＬＣ勾配（５％Ｂ～８％Ｂ、０～５分；８％Ｂ～３２％Ｂ、５～４５分；３２％Ｂ～１００％Ｂ、４５～４９分；１００％Ｂ、４９～５４分；１００％Ｂ～５％Ｂ、５４分～５４分１０秒；５％Ｂ、５４分１０秒～６０分１０秒；移動相Ａは０．１％ギ酸（ＦＡ）から構成され、移動相Ｂは８０％アセトニトリル（ＡＣＮ）中の０．１％ＦＡから構成される）を使用して溶出した。ＱＥＨＦ－Ｘ装置は、データ依存モードで操作され、上位８個の最も豊富なイオン（質量範囲３８０～２，０００、荷電状態３～７）を高エネルギー衝突解離（正規化された衝突エネルギー２７）によってフラグメント化した。目標分解能を、ＭＳについては１２０，０００、ＭＳ／ＭＳ分析については１５，０００とした。四重極単離ウィンドウは１．８Ｔｈであり、ＭＳ／ＭＳの最大注入時間を１２０ｍｓに設定した。ＭＳ分析の後、データを架橋ペプチドの同定のためにｐＬｉｎｋ２によって検索した（Ｃｈｅｎ，２０１９）。質量精度は、ＭＳ及びＭＳ／ＭＳについて、それぞれ１０及び２０ｐ．ｐ．ｍ．と指定した。他の検索パラメータには、固定修飾としてのシステインのカルバミドメチル化と、可変修飾としてのメチオニンの酸化とを含めた。最大３つのトリプシン未切断部位を許容した。最初の検索結果は、デフォルトの５％の偽発見率を使用して取得し、ターゲットデコイ検索戦略を使用して推定した。次に、架橋スペクトルを手動でチェックして、本質的に前述のように偽陽性の同定を除去した（Ｓｈｉ，２０１４；Ｋｉｍ，２０１８；Ｓｈｉ，２０１５）。

部位特異的突然変異誘発法
ＨＳＡの哺乳類発現プラスミドをＡｄｄｇｅｎｅから取得した。Ｅ４００Ｒ点突然変異は、プライマーＨＳＡ－Ｆ（ＧＧＴＧＴＴＣＧＡＣＣＧＧＴＴＣＡＡＧＣＣＴＣＴＧＧ、ＳＥＱＩＤＮＯ：２６５２）及びＨＳＡ－Ｒ（ＴＴＧＧＣＧＴＡＧＣＡＣＴＣＧＴＧＡ、ＳＥＱＩＤＮＯ：２６５３）を使用して、Ｑ５部位特異的突然変異誘発キット（ＮＥＢ）によってＨＳＡ配列に導入した。サンガーシークエンシングによる配列検証後、製造元のプロトコルに従って、Ｌｉｐｏｆｅｃｔａｍｉｎｅ３０００トランスフェクションキット（Ｔｈｅｒｍｏ）及びＯｐｔｉ－ＭＥＭ（Ｇｉｂｃｏ）を使用して、野生型ＨＳＡ及び変異体を含むプラスミドをＨｅＬａ細胞にトランスフェクトした。細胞を一晩培養した後、培地を、ＦＢＳ添加物を含まないＤＭＥＭに交換してＢＳＡを除去した。３７℃、５％ＣＯ_２で４８時間培養後、ＨＳＡを発現している培地を収集し、－２０℃で保存した。培地をＳＤＳ－ＰＡＧＥ及びウェスタンブロット法で分析して、タンパク質発現を確認した。

ＰＤＺドメイン（ｐＧＥＸ６ｐ－１ベクター内）は、ＧｅｎｅｒａｌＢｉｏｓｙｓｔｅｍｓから入手した。ＰＤＺの二点変異体（すなわち、Ｒ４６Ｅ：Ｋ４８Ｄ）を、ＰＤＺ－Ｆ（ＴＧＡＴＧＡＡＡＡＴＧＧＣＧＣＡＧＣＣＧＣＣ、ＳＥＱＩＤＮＯ：２６５４）及びＰＤＺ－Ｒ（ＡＴＴＴＣＡＣＴＣＡＣＡＴＡＧＡＴＡＣＣＡＣＴＡＴＣＡＴＴＡＣＴＡＡＣＡＴＡＣ、ＳＥＱＩＤＮＯ：２６５５）の特異的プライマーを使用して、Ｑ５部位特異的突然変異誘発キットによって導入した。サンガーシークエンシングによる検証後、変異ベクターをＢＬ２１（ＤＥ３）細胞に形質転換して発現させた。ＧＳＴ融合ＰＤＺ変異体タンパク質を、以前に記載しているようにＧＳＨ樹脂によって精製した。

蛍光顕微鏡
ＣＯＳ－７細胞をガラス底皿に６０～７０％の初期コンフルエンスでプレーティングし、一晩培養して細胞を皿に付着させた。細胞をＭｉｔｏＴｒａｃｋｅｒＯｒａｎｇｅＣＭＴＭＲｏｓ（１：４０００）とともに３７℃で３０分間、ＰＢＳで１回洗浄し、予め冷やしたメタノール／エタノール（１：１）で１０分間固定した。ＰＢＳで洗浄した後、５％ＢＳＡで細胞を１時間ブロッキングした。次いでＡｌｅｘａＦｌｕｏｒ（商標）６４７コンジュゲートＮｂ（１：１００）を細胞に加え、室温で１５分間インキュベートした。２色の広視野蛍光画像を、５６１ｎｍ及び６４２ｎｍ励起レーザー（ＭＰＢＣｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｐｏｉｎｔｅ－Ｃｌａｉｒｅ，Ｑｕｅｂｅｃ，Ｃａｎａｄａ）と１００Ｘ油浸対物レンズ（ＮＡ＝１．４，ＵＰＬＳＡＰＯ１００ＸＯ；Ｏｌｙｍｐｕｓ）とを備えたオリンパスＩＸ７１倒立顕微鏡フレームにカスタム構築したシステムを使用して取得した。

テキストベースのＣＤＲ（相補性決定領域）アノテーション
ＣＤＲアノテーション法は（Ｆｒｉｄｙ，２０１４）から変更された。［＊］は、任意の残基を意味する。

ＣＤＲ１アノテーション：Ｎｂ配列の残基２０～残基２６の間に局在する短い配列モチーフ「ＳＣ」を最初に検索した。ＣＤＲ１配列の開始は、「ＳＣ」モチーフが続く５番目の残基と定義される。最初の残基を特定すると、次にＮｂ残基３２～残基４０間に局在する別の配列モチーフ「Ｗ［＊］Ｒ」を探し、ＣＤＲ１配列の終端を「Ｗ［＊］Ｒ」モチーフの前の最初の残基と定義する。

ＣＤＲ２アノテーション：ＣＤＲ２配列の開始は、「Ｗ［＊］Ｒ」モチーフが続く１４番目の残基と定義される。最初の残基を特定すると、次にＮｂ残基６３～残基７２の間に局在するモチーフ「ＲＦ」を特定し、ＣＤＲ２配列の終端を「ＲＦ」モチーフの前の８番目の残基と定義した。

ＣＤＲ３アノテーション：まず、Ｎｂ残基９０～残基１０５間に局在する「Ｙ［＊］Ｃ」または「ＹＹ［＊］」というモチーフを検索した。ＣＤＲ３配列の開始は、「Ｙ［＊］Ｃ」または「ＹＹ［＊］」モチーフが続く３番目の残基と定義される。ＣＤＲ３の最初の残基を特定すると、次に以下の配列モチーフ（「ＷＧ［＊］Ｇ」、「ＷＧＱ［＊］」、「Ｗ［＊］Ｑ［＊］」、「［＊］ＧＱＧ」、「［＊］［＊］ＧＱ」及び「ＷＧ［＊］［＊］」）のいずれかを使用して、ＣＤＲ３の終端を特定した。これらのモチーフは、Ｃ末端Ｎｂ配列の最後の１４残基内に位置している。ＣＤＲ３は、配列モチーフの１残基前で終了する。詳細については、ＡｕｇｕｒＬｌａｍａスクリプトで確認することができる。

様々なプロテアーゼによるＮｂのインシリコ消化の切断規則：
トリプシン：Ｃ末端からＫ／Ｒ、Ｐが続かない
キモトリプシン：Ｃ末端からＷ／Ｆ／Ｌ／Ｙ、Ｐが続かない
ＧｌｕＣ：Ｃ末端からＤ／Ｅ、Ｐが続かない
ＡｓｐＮ：Ｎ末端からＤ
ＬｙｓＣ：Ｃ末端からＫ

Ｎｂデータベースの配列アラインメント：Ｎｂの配列を、ソフトウェアＡＮＡＲＣＩ（Ｄｕｎｂａｒ，Ｊ．＆Ｄｅａｎｅ，Ｃ．Ｍ，２０１６）を用いてアライメントした。３つのＣＤＲ（ＣＤＲ１～ＣＤＲ３）と４つのフレームワーク配列（ＦＲ１～ＦＲ４）とを、ＩＭＧＴ番号付けスキーム（Ｌｅｆｒａｎｃ，２００３）に従ってアノテートした。しきい値１００未満のｅ値のアラインメントは削除し、残りの配列をＷｅｂＬｏｇｏ（Ｃｒｏｏｋｓ，２００４）によってプロットした。

異なるプロテアーゼによるＮｂデータベースのインシリコ消化とＮｂＣＤＲ３マッピングの分析
約５０万の一意のＮｂ配列を含む高品質のデータベースを、上記の切断規則に従って、トリプシン、キモトリプシン、ＬｙｓＣ、ＧｌｕＣ、及びＡｓｐＮを含む様々な酵素を使用してインシリコで消化した。ＣＤＲ３含有ペプチドを取得して、配列カバー率を計算した。次いで、ＣＤＲ３カバー率を合計して、図１Ｄ及び図７Ｂを生成した。ＣＤＲ３ペプチド長分布（トリプシン及びキモトリプシンによる）をプロットして、図１Ｅを作成した。

Ｎｂのトリプシン及びキモトリプシン支援ＭＳマッピングのシミュレーション
一意のＣＤＲ３フィンガープリント配列を持つ１０，０００のＮｂ配列を、データベースからランダムに選択した。次に、選択したＮｂを、トリプシンまたはキモトリプシンのいずれかによってインシリコで消化して（非切断部位が許可されていない）、ＣＤＲ３ペプチドを生成した。ＭＳによるＮｂ同定をより適切にシミュレートするために、次の基準をこれらのペプチドに適用した。１）ボトムアッププロテオミクスに適したサイズ（８５０～３，０００Ｄａ）のペプチドを最初に選択した。２）高度に保存されたＷＧＱＧＱＶＴＳのＣ末端ＦＲ４モチーフを含むペプチドをさらに廃棄した。観察に基づいて、そのようなペプチドは、Ｃ末端のｙイオンのフラグメント化が支配的であるが、明確なＣＤＲ３ペプチド同定に不可欠なＣＤＲ３配列上のイオンのフラグメント化が不十分なことがよくある。３）Ｎｂフィンガープリント情報が限られているＣＤＲ３ペプチド（３０％未満のＣＤＲ３配列カバー率を含む）を除去した。結果として、２，１１１のユニークなトリプシンペプチドと５，１５４の一意のキモトリプシンペプチドとを取得した。次に、これらのペプチドを使用して、Ｎｂタンパク質をマッピングした。タンパク質の組み立て後、十分に高いＣＤＲ３フィンガープリント配列カバー率（≧６０％）を持つＮｂ同定のみを使用して、図１Ｆのベン図を生成した。

ＮｂＣＤＲ３配列の系統解析
系統樹は、一意のＮｂＣＤＲ３配列と、アラインメントを補助するための追加のフランキング配列（すなわち、ＣＤＲ３配列のＮ末端にＹＹＣＡＡ、Ｃ末端にＷＧＱＧ）とを入力したＣｌｕｓｔａｌＯｍｅｇａ（Ｓｉｅｖｅｒｓ，２０１４）によって作成した。データを、ＩＴｏｌ（ＩｎｔｅｒａｃｔｉｖｅＴｒｅｅｏｆＬｉｆｅ）（Ｌｅｔｕｎｉｃ，Ｉ．＆Ｂｏｒｋ，Ｐ，２００７）によってプロットした。ＢｉｏＰｙｔｈｏｎライブラリーを使用して、ＮｂＣＤＲ３の等電点と疎水性とを計算した。配列アラインメントを、Ｊａｌｖｉｅｗ（Ｗａｔｅｒｈｏｕｓｅ，２００９年）によって視覚化した。

Ｎｂペプチド定量化の再現性の評価
異なるＬＣ実行間で共有されたペプチド同定を使用して、ラベルフリーの定量化法の再現性を評価した。典型的な９０分のＬＣ勾配では、ペプチドのピーク幅または半値全幅（ＦＷＨＭ）は一般に５秒未満であった。異なるＬＣ実行間のペプチド保持時間の差を計算して、図３Ｂのカーネル密度推定プロットを作成した。異なるＬＣ実行からのペプチド保持時間を使用して、ピアソン相関を計算し、図９Ｂにプロットした。

ＨＳＡ及びラマ血清アルブミンの配列アラインメント及び配列分析
ラマ（ＣａｍｅｌｕｓＦｅｒｕｓ）血清アルブミン配列を取得し、ｔｂｌａｓｔｎ（ＮＣＢＩ）によってＨＳＡとアラインメントさせた。個々のアミノ酸の等電点（ｐＩ）及びハイドロパシー値は、（ｗｗｗ．ｐｅｐｔｉｄｅ２．ｃｏｍ／Ｎ＿ｐｅｐｔｉｄｅ＿ｈｙｄｒｏｐｈｏｂｉｃｉｔｙ＿ｈｙｄｒｏｐｈｉｌｉｃｉｔｙ．ｐｈｐ）からオンラインで取得した。これらの値を０～１．０の間で正規化し、２つのアルブミン間の配列の変動（ｐＩ及びハイドロパシーのペアごとの差）を、アラインメントした位置ごとに計算した。特定のアラインメントされた残基位置について、値０は２つの配列の間に同一の残基が見つかったことを示し、１．０はＨＳＡの負に帯電した残基グルタミン酸４００からラクダ科アルブミンの対応するアラインメント位置の正に帯電した残基アルギニンへの電荷反転など、最大の配列変動を示す。アミノ酸の挿入または欠失を確認した位置に０．５の値を割り当てた。このようにして、ＨＳＡとラマ血清アルブミンとの間のｐＩ及びヒドロパシーの両方の配列変動をプロットした。プロットを、ガウス関数によってさらに平滑化して、図４Ａを生成した。

ＮｂＣＤＲ上のアミノ酸の相対存在量の分析
各ＣＤＲ（ＣＤＲ１、ＣＤＲ２及びＣＤＲ３ヘッドを含む）におけるアミノ酸頻度を計算し、正規化して、図６、７、１２及び１３の棒グラフ及び円グラフを作成した。ＣＤＲ３ヘッド配列は、ＣＤＲ３の半保存されたＣ末端の４残基を除去することによって取得した。高親和性及び低親和性Ｎｂの両方のＣＤＲ残基頻度を、各親和性群のＣＤＲ残基の合計に基づいて正規化した。

ＣＤＲ３ヘッド上のアミノ酸位置の分析
ＣＤＲ３ヘッド上の残基の相対位置を計算した。ここで、値０はＣＤＲ３ヘッドのまさにＮ末端を示し、１．０は最後の残基を示す。次に、ＣＤＲ３ヘッド配列を、ビン幅０．０５の２０個のビンにスライスした。各ビン内で、特定の型のアミノ酸（チロシン、グリシン、またはセリンなど）の出現をカウントし、ＣＤＲ３ヘッド上の残基の合計に対して正規化した。それらの相対位置及び存在量を含む異なるアミノ酸の分布を図５Ｈ及び１２Ｇにプロットした。

Ｎｂペプチド候補のプロテオミクスデータベース
検索生のＭＳデータを、ＰｒｏｔｅｏｍｅＤｉｓｃｏｖｅｒｅｒ２．１（ＴｈｅｒｍｏＦｉｓｈｅｒ）に埋め込まれたＳｅｑｕｅｓｔＨＴにより、ＦＤＲ推定のための標準的なターゲットデコイ戦略を使用して、組織内で生成されたＮｂ配列データベースに対して検索を行った。質量精度は、ＭＳ１及びＭＳ２に対して、それぞれ１０ｐｐｍ及び０．０２Ｄａと指定した。他の検索パラメータには、固定修飾としてのシステインのカルバミドメチル化と、可変修飾としてのメチオニンの酸化とを含めた。トリプシン及びキモトリプシンで処理されたサンプルには、それぞれ最大１つまたは２つの未切断部位を許容させた。最初の検索結果を、ｑ値に基づいて０．０１（厳密）のＦＤＲのパーコレーターによってフィルター処理した（Ｋａｌｌ，２００７）。データベース検索の後、ＡｕｇｕｒＬｌａｍａにより次の手順で、ペプチドスペクトルマッチング（ＰＳＭ）のエクスポート、処理及び分析を行った。

ａ．ナノボディの同定
ｉ）ＣＤＲ３フィンガープリントの品質評価
ペプチド候補を、最初にＣＤＲペプチドまたはＦＲペプチドのいずれかであるとアノテートした。ＣＤＲ３フィンガープリントペプチドを明確に同定するために、ＰＳＭにおける高分解能ＣＤＲ３フラグメントイオンの十分なカバー率を必要とするフィルター／アルゴリズムを実装した（図８Ｂの説明図を参照）。フィルターは、約５０万の一意のＮｂ配列を含むターゲット配列データベースと、同様のサイズの重複しないデコイデータベースとを使用して評価した。本明細書で使用するターゲット及びデコイのＮｂ配列データベースは、異なるラマから取得した。デコイデータベースからのペプチド同定は、偽陽性と見なした。ＦＤＲは、ターゲットデータベースからのペプチド同定と比較したデコイデータベースからのペプチド同定の割合に基づいて定義した。ＣＤＲ３の長さもまた、感度の高いＣＤＲ３ペプチドフィルターの開発を可能にするために考慮した。ＣＤＲ３フラグメント化カバー率は、質量精度ウィンドウ内でフラグメントイオン（ｂイオンまたはｙイオンのいずれか）によってマッチしたＣＤＲ３残基の割合として定義した。評価のために同じペプチドのスペクトルを組み合わせた。このフィルター（５％ＦＤＲ）を通過したＣＤＲ３ペプチドのみを、下流のＮｂ組み立てのために選択した。

ｉｉ）ナノボディ配列組み立て
信頼できるＣＤＲ３ペプチドを含むＣＤＲペプチドを、Ｎｂタンパク質組み立てに使用した。Ｎｂを同定するには、さらに２つの基準をマッチさせる必要がある。これらには以下が含まれる。１）ＣＤＲ１ペプチド及びＣＤＲ２ペプチドの両方がＮｂ組み立てに利用可能でなければならない。２）任意のＮｂ同定について、最低５０％の複合のＣＤＲカバー率が義務付けられた。

ｂ．抗原特異的Ｎｂレパートリーの定量化と分類
ＭＳの生データは、ＭＳＦｉｌｅＲｅａｄｅｒ３．１ＳＰ４（ＴｈｅｒｍｏＦｉｓｈｅｒ）、及びｐｙｍｓｆｉｌｅｒｅａｄｅｒのｐｙｔｈｏｎライブラリー（ｇｉｔｈｕｂ．ｃｏｍ／ｆｒａｌｌａｉｎ／ｐｙｍｓｆｉｌｅｒｅａｄｅｒ）によってアクセスした。品質フィルターを通過した信頼性の高いＣＤＲ３ペプチドを、ラベルフリーＬＣ／ＭＳによって定量化した。

ｉ）ＣＤＲ３ペプチドの定量化
ＣＤＲ３ペプチド同定の正確なラベルフリー定量化を異なるＬＣ実行にわたって可能にするために、ペプチドピーク抽出のための異なる保持時間ウィンドウを指定した。ＭＳ／ＭＳスペクトルに基づいて検索エンジンで直接同定できるペプチドについては、ピーク抽出に、＋／－０．５分の保持時間（ＲＴ）シフトの小さな定量化ウィンドウを使用した。特定のＬＣ実行から直接同定しなかったペプチド（ペプチド及び確率論的イオンサンプリングの複雑さのため）については、それらのＲＴを隣接するＬＣのＲＴに基づいて予測し、２つのＬＣ実行間の一般的に同定されたペプチドの中央値のＲＴ差を使用して調整した。この場合、ペプチドピークの抽出を容易にするために、同定された全てのペプチドの約９５％が２つのＬＣ実行間で一致する＋／－２．０分（典型的な９０分のＬＣ勾配の場合）の緩和されたＲＴウィンドウを適用した。質量精度ウィンドウを＋／－１０ｐｐｍにして、ペプチドのｍ／ｚ及びｚの両方を使用してピークを抽出した。ペプチドのピークを抽出し、ガウス関数を使用して平滑化した。それらのＡＵＣ（曲線下面積）を計算し、複製されたＬＣ実行からのＡＵＣを平均して、ＣＤＲ３ペプチド強度を推測した。

ｉｉ）Ｎｂの分類
例えばＮｂ親和性に基づく正確な分類を可能にするために、３つの異なる生化学的に分画されたＮｂサンプル（Ｆ１、Ｆ２及びＦ３）間のＣＤＲ３フィンガープリントペプチドの相対イオン強度（ＡＵＣ）をＩ１、Ｉ２及びＩ３として定量化した。定量化結果に基づいて、ＣＤＲ３ペプチドは、次の基準を使用して３つのクラスター（Ｃ１、Ｃ２、及びＣ３）に任意に分類した。

１）Ｃ３（高親和性）クラスターの場合：Ｉ３＞Ｉ１＋Ｉ２（ＮｂがＦ３により特異的であることを示す）
２）Ｃ２（中程度の親和性）クラスターの場合：Ｉ２＞Ｉ１＋Ｉ３（ＮｂがＦ２により特異的であることを示す）
３）Ｃ１（低親和性）クラスターの場合：
Ｉ１＞Ｉ２＋Ｉ３（ＮｂがＦ１に対してより特異的であるか、非特異的バインダーの可能性が高いことを示す）、代わりに、Ｉ１＜Ｉ２＋Ｉ３及びＩ２＜Ｉ１＋Ｉ３及びＩ３＜Ｉ１＋Ｉ２の場合、これらのＮｂ同定は非特異的に同定された可能性が高く、Ｃ１にもグループ化された。図８Ｃを参照されたい。

上記の方法を使用して、ＨＳＡ及びＧＳＴＮｂを分類した。高親和性ＰＤＺＮｂの定量化と特徴付けとのために、いくつかの変更を行った。具体的には、ＭＢＰ相互作用Ｎｂの追加の対照「Ｆ＿ｃｏｎｔｒｏｌ」（Ｉ＿ｃｏｎｔｒｏｌのイオン強度）を定量化のために含めた。ＮｂＣＤＲ３ペプチドのＩ２とＩ３との強度の合計がＩ＿ｃｏｎｔｒｏｌの２０倍よりも高い場合に（すなわち、２０＊Ｉ＿ｃｏｎｔｒｏｌ＜Ｉ２＋Ｉ３）、高親和性クラスターＮｂ（それらの一意のＣＤＲ３ペプチドによって表される）を定義した。複数の一意のＣＤＲ３ペプチドを定量化に使用したＮｂの場合、同じＮｂからの異なるＣＤＲ３ペプチド間の分類結果は一貫している必要があり、そうでない場合は、最終結果が報告される前に削除された。

ＣＤＲ３ペプチドの相対強度のヒートマップ分析
同定したＣＤＲ３ペプチドを、それらの相対的なＭＳ１イオン強度に基づいて定量化し、その後、ＡｕｇｕｒＬｌａｍａのスクリプトを使用してクラスター化した。Ｚスコアを、相対イオン強度に基づいて計算し、視覚化のための図３Ａのヒートマップを生成するために使用した。

抗原－Ｎｂ複合体の構造モデリングＮｂの構造モデルを、ＭＯＤＥＬＬＥＲ（Ｗｅｂｂ，Ｂ．＆Ｓａｌｉ，Ａ，２０１４）のマルチテンプレート比較モデリングプロトコルを用いて取得した。次に、ＣＤＲ３ループを改良し、下流のドッキング用に上位５つのスコアリングループ構造を選択する。次いで、各Ｎｂモデルを、ＣＤＲ検索に焦点を当てたＰａｔｃｈＤｏｃｋソフトウェアの抗体－抗原ドッキングプロトコルによって、それぞれの抗原にドッキングさせる（Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，２００５）。モデルはその後、統計的ポテンシャルＳＯＡＰ（Ｄｏｎｇ，２０１３）によって再スコアリングする。ＳＯＡＰスコアによる１０個の最良のスコアリングモデルの中の抗原界面残基（Ｎｂ原子からの距離＜ＸÅ）を使用して、エピトープを決定した。エピトープを定義した後、ｋ－ｍｅａｎｓクラスタリングを使用して、エピトープの類似性に基づいてＮｂをクラスタリングした。クラスターは、抗原上の最も免疫原性の高い表面パッチを明らかにする。ＣＸＭＳデータを含む抗原－Ｎｂ複合体は、拘束の達成を最適化する距離拘束ベースのＰａｔｃｈＤｏｃｋプロトコルによってモデル化した（Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，２０２０；Ｒｕｓｓｅｌ，２０１２）。架橋された残基間のＣａ－Ｃａ距離が、ＤＳＳ及びＥＤＣ架橋剤でそれぞれ２５Å及び２０Å以内である場合、拘束が達成されていると見なした（Ｓｈｉ，２０１４；Ｆｅｒｎａｎｄｅｚ－Ｍａｒｔｉｎｅｚ，２０１６）。ＧＳＴダイマーなどのあいまいな制約の場合、架橋の１つが成立している必要がある。

Ｎｂレパートリーの機械学習分析
ディープニューラルネットワークを、正確な高ｐＨ分画法及び定量的プロテオミクスによって特徴付けられた低親和性Ｎｂと高親和性Ｎｂとを区別するようにトレーニングした。このモデルは、バッチ正規化及びＲｅＬＵ活性化機能を備えた１つの畳み込み層と、その後に続く、完全接続層で終わる最大プーリング層とで構成されて、抽出された特徴を、分類子予測につながるロジット層に統合する。畳み込み層は２０個の１Ｄフィルターで構成され、関連するＣＤＲをキャプチャするのに十分に長く、データのオーバーフィッティングを回避するのに十分に短い、ウィンドウサイズ７アミノ酸の局所受容野を構成する。フォワードパスの間、各フィルターは、固定ストライドでタンパク質配列に沿ってスライドし、現在の配列ウィンドウとの要素ごとの乗算を実行し、その後、それを合計してフィルター応答を生成するに至る。モデルの分類精度は９２％であった。

低親和性バインダーと高親和性バインダーとを区別するためにネットワークによって学習された物理化学的特徴を理解するために、ネットワークを介して、予測から活性化フィルターまでの活性化パスを計算した。バックプロパゲーションアルゴリズムと同様に、完全接続ネットワークの最後の２つの層からバックワードが繰り返され、シーケンスごとに出力信号を抽出し、分類に最も重みを与える最高のピークを探す。同様に、これらのピークに対する各フィルターの寄与を上流側で計算した。さらに、ＣＤＲのフィルターアクティビティを分析して、領域固有のドミナントフィルターを抽出した。このネットワーク解釈のプロセスにより、１シーケンスあたりフィルターごとに一意の寄与が得られる。各フィルターは、最大プーリング層でダウンサンプリングされた配列に沿ってアクティブ化される。各フィルターについて、その最高ピークを選択し、それが分類につながった。最後に、配列ごとに最も寄与するフィルターを決定したところ、それらの関心領域で３０％以上の寄与を持つ興味深いフィルターも得られた。

コンピュータで実施された方法
様々な図に関して本明細書で説明した論理的操作は、（１）コンピューティングデバイス（例えば、図１４で説明したコンピューティングデバイス）上で実行されるコンピュータ実施行為またはプログラムモジュール（すなわち、ソフトウェア）のシーケンス、（２）コンピューティングデバイス内の相互接続された機械論理回路または回路モジュール（すなわち、ハードウェア）、（３）コンピューティングデバイスのソフトウェアとハードウェアの組み合わせとして実施され得ることを理解されたい。したがって、本明細書で説明する論理演算は、ハードウェアとソフトウェアとの特定の組合せに限定されない。実装は、コンピューティングデバイスのパフォーマンスなどの要件に依存する選択の問題である。したがって、本明細書で説明する論理操作は、演算、構造デバイス、行為、またはモジュールと様々に呼ばれる。これらの操作、構造デバイス、行為、及びモジュールは、ソフトウェア、ファームウェア、専用デジタル論理、及びそれらの任意の組み合わせで実装することができる。図に示され、本明細書で説明されるよりも多くのまたは少ない動作が実行されてもよいことも理解されたい。これらの操作は、本明細書で説明したものとは異なる順序で実行することもできる。

図１４を参照すると、本明細書に記載の方法を実施できる例示的なコンピューティングデバイス５００が示されている。例示的なコンピューティングデバイス５００は、本明細書で説明する方法を実装できる適切なコンピューティング環境の一例に過ぎないことを理解されたい。任意選択的に、コンピューティングデバイス５００は、パーソナルコンピュータ、サーバ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、ネットワークパーソナルコンピュータ（ＰＣ）、ミニコンピュータ、メインフレームコンピュータ、組み込みシステム、及び／または上記のシステムまたはデバイスのいずれかを複数含む分散コンピューティング環境を含むがこれらに限定されない周知のコンピューティングシステムであってもよい。分散コンピューティング環境では、通信ネットワークまたはその他のデータ伝送媒体に接続されたリモートコンピューティングデバイスが様々なタスクを実行することができる。分散コンピューティング環境では、プログラムモジュール、アプリケーション、及びその他のデータが、ローカル及び／またはリモートコンピュータの記憶媒体に格納され得る。

その最も基本的な構成では、コンピューティングデバイス５００は、通常、少なくとも１つの処理ユニット５０６及びシステムメモリ５０４を含む。コンピューティングデバイスの正確な構成及びタイプに応じて、システムメモリ５０４は、揮発性（ランダムアクセスメモリ（ＲＡＭ）など）、不揮発性（読み取り専用メモリ（ＲＯＭ）、フラッシュメモリなど）、またはその２つの組み合わせのいずれかであってもよい。この最も基本的な構成が、図１４に破線５０２によって示されている。処理ユニット５０６は、コンピューティングデバイス５００の動作に必要な算術演算及び論理演算を実行する標準のプログラマブルプロセッサであってもよい。コンピューティングデバイス５００はまた、コンピューティングデバイス５００の様々な構成要素間で情報を通信するためのバスまたは他の通信機構を含み得る。

コンピューティングデバイス５００は、追加の特徴／機能を有してもよい。例えば、コンピューティングデバイス５００は、磁気もしくは光ディスクまたはテープを含むがこれらに限定されないリムーバブルストレージ５０８及び非リムーバブルストレージ５１０などの追加のストレージを含むことができる。コンピューティングデバイス５００は、デバイスが他のデバイスと通信できるようにするネットワーク接続（複数可）５１６を含むこともできる。コンピューティングデバイス５００はまた、キーボード、マウス、タッチスクリーンなどの入力デバイス（複数可）５１４を有することができる。ディスプレイ、スピーカー、プリンタなどの出力デバイス（複数可）５１２を含むこともできる。コンピューティングデバイス５００の構成要素間のデータ通信を容易にするために、追加のデバイスをバスに接続することができる。これらの装置は全て当技術分野で周知であり、ここで詳しく説明する必要はない。

処理ユニット５０６は、有形のコンピュータ可読媒体に符号化されたプログラムコードを実行するように構成され得る。有形のコンピュータ可読媒体とは、コンピューティングデバイス５００（すなわち機械）に特定の方法で動作させるデータを提供できる任意の媒体を指す。実行のため処理ユニット５０６に命令を提供するために、様々なコンピュータ可読媒体を利用することができる。有形のコンピュータ可読媒体の例には、コンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータなどの情報を格納するための任意の方法または技術で実装された揮発性媒体、不揮発性媒体、取り外し可能媒体及び取り外し不可能媒体が挙げられるが、これらに限定されない。システムメモリ５０４、リムーバブルストレージ５０８、及び非リムーバブルストレージ５１０は、全て有形のコンピュータ記憶媒体の例である。有形のコンピュータ可読記録媒体の例には、集積回路（例えば、フィールドプログラマブルゲートアレイまたは特定用途向けＩＣ）、ハードディスク、光ディスク、光磁気ディスク、フロッピーディスク、磁気テープ、ホログラフィック記憶媒体、ソリッドステートデバイス、ＲＡＭ、ＲＯＭ、電気的消去可能プログラム読み取り専用メモリ（ＥＥＰＲＯＭ）、フラッシュメモリまたは他のメモリ技術、ＣＤ－ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）またはその他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気記憶デバイスが挙げられるが、これらに限定されない。

例示的な実装では、処理ユニット５０６は、システムメモリ５０４に格納されたプログラムコードを実行することができる。例えば、バスは、システムメモリ５０４にデータを運ぶことができ、そこから処理ユニット５０６が命令を受け取り実行する。システムメモリ５０４によって受信されたデータは、処理ユニット５０６による実行の前または後に、リムーバブルストレージ５０８または非リムーバブルストレージ５１０に任意選択で格納され得る。

本明細書で説明される様々な技法は、ハードウェアまたはソフトウェアに関連して、または適切な場合にはそれらの組み合わせに関連して実施され得ることを理解されたい。したがって、現在開示されている主題の方法及び装置、またはその特定の態様もしくは部分は、フロッピーディスク、ＣＤ－ＲＯＭ、ハードドライブ、または任意の他の機械可読記憶媒体などの有形媒体に具現化されたプログラムコード（すなわち、命令）の形態をとることができ、プログラムコードがコンピューティングデバイスなどの機械にロードされて実行されると、機械は、現在開示されている主題を実践するための装置となる。プログラマブルコンピュータでプログラムコードを実行する場合、コンピューティングデバイスは一般に、プロセッサ、プロセッサによって読み取り可能な記憶媒体（揮発性及び不揮発性メモリ及び／またはストレージ要素を含む）、少なくとも１つの入力デバイス、及び少なくとも１つの出力デバイスを含む。１つ以上のプログラムは、例えば、アプリケーションプログラミングインターフェース（ＡＰＩ）、再利用可能なコントロールなどの使用を通じて、本開示の主題に関連して説明されるプロセスを実装または利用することができる。そのようなプログラムは、コンピュータシステムと通信するために、高レベルの手続き型またはオブジェクト指向型のプログラミング言語で実装することができる。ただし、必要に応じて、アセンブリ言語または機械語でプログラム（複数可）を実装できる。いずれにせよ、言語はコンパイル言語またはインタプリタ言語である可能性があり、ハードウェア実装と組み合わせることができる。

上述のように、本明細書に記載の論理演算、例えば実施例８に記載の論理演算は、ハードウェア、ソフトウェア、または必要に応じてそれらの組み合わせで実装することができる。例えば、論理演算は、図１４のコンピューティングデバイス５００などの１つ以上のコンピューティングデバイスを使用して実施することができる。実施例８に記載の論理演算には、ナノボディペプチド配列の抗原親和性を決定する方法、深層学習モデルをトレーニングする方法、及びナノボディペプチド配列の抗原親和性を推測する深層学習ベースの方法が含まれるが、これらに限定されない。これらの操作については、上記で詳しく説明している。

いくつかの実施形態では、コンピュータ実施方法は、
ナノボディペプチド配列を受け取ることと、
ナノボディペプチド配列の複数のＣＤＲ領域を同定することであって、ＣＤＲ領域がＣＤＲ３領域を含む、同定することと、
フラグメント化フィルターを適用して、ナノボディペプチド配列の１つ以上の偽陽性のＣＤＲ３領域を破棄することと、
ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３領域の存在量を定量化することと、
ナノボディペプチド配列の１つ以上の破棄されていないＣＤＲ３領域の定量化された存在量に基づいて抗原親和性を推測することと、を含む。

いくつかの実施形態では、深層学習モデルをトレーニングするための方法は、
複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含むデータセットを作成することと、
データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることと、を含む。

いくつかの実施形態では、ナノボディペプチド配列の抗原親和性を決定するための方法は、
ナノボディペプチド配列を受け取ることと、
トレーニング済みの深層学習モデルにナノボディペプチド配列を入力することと、
トレーニング済みの深層学習モデルを使用して、ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、を含む。

参考文献
１．Ｍｕｙｌｄｅｒｍａｎｓ，Ｓ．Ｎａｎｏｂｏｄｉｅｓ：ｎａｔｕｒａｌｓｉｎｇｌｅ－ｄｏｍａｉｎａｎｔｉｂｏｄｉｅｓ．ＡｎｎｕＲｅｖＢｉｏｃｈｅｍ８２，７７５－７９７（２０１３）．
２．Ｂｅｇｈｅｉｎ，Ｅ．＆Ｇｅｔｔｅｍａｎｓ，Ｊ．ＮａｎｏｂｏｄｙＴｅｃｈｎｏｌｏｇｙ：ＡＶｅｒｓａｔｉｌｅＴｏｏｌｋｉｔｆｏｒＭｉｃｒｏｓｃｏｐｉｃＩｍａｇｉｎｇ，Ｐｒｏｔｅｉｎ－ＰｒｏｔｅｉｎＩｎｔｅｒａｃｔｉｏｎＡｎａｌｙｓｉｓ，ａｎｄＰｒｏｔｅｉｎＦｕｎｃｔｉｏｎＥｘｐｌｏｒａｔｉｏｎ．ＦｒｏｎｔＩｍｍｕｎｏｌ８，７７１（２０１７）．
３．Ｒａｓｍｕｓｓｅｎ，Ｓ．Ｇ．ｅｔａｌ．Ｓｔｒｕｃｔｕｒｅｏｆａｎａｎｏｂｏｄｙ－ｓｔａｂｉｌｉｚｅｄａｃｔｉｖｅｓｔａｔｅｏｆｔｈｅｂｅｔａ（２）ａｄｒｅｎｏｃｅｐｔｏｒ．Ｎａｔｕｒｅ４６９，１７５－１８０（２０１１）．
４．Ｊｏｖｃｅｖｓｋａ，Ｉ．＆Ｍｕｙｌｄｅｒｍａｎｓ，Ｓ．ＴｈｅＴｈｅｒａｐｅｕｔｉｃＰｏｔｅｎｔｉａｌｏｆＮａｎｏｂｏｄｉｅｓ．ＢｉｏＤｒｕｇｓ３４，１１－２６（２０２０）．
５．Ｌａｕｗｅｒｅｙｓ，Ｍ．ｅｔａｌ．Ｐｏｔｅｎｔｅｎｚｙｍｅｉｎｈｉｂｉｔｏｒｓｄｅｒｉｖｅｄｆｒｏｍｄｒｏｍｅｄａｒｙｈｅａｖｙ－ｃｈａｉｎａｎｔｉｂｏｄｉｅｓ．ＴｈｅＥＭＢＯｊｏｕｒｎａｌ１７，３５１２－３５２０（１９９８）．
６．Ｐａｒｄｏｎ，Ｅ．ｅｔａｌ．ＡｇｅｎｅｒａｌｐｒｏｔｏｃｏｌｆｏｒｔｈｅｇｅｎｅｒａｔｉｏｎｏｆＮａｎｏｂｏｄｉｅｓｆｏｒｓｔｒｕｃｔｕｒａｌｂｉｏｌｏｇｙ．Ｎａｔｕｒｅｐｒｏｔｏｃｏｌｓ９，６７４－６９３（２０１４）．
７．ＭｃＭａｈｏｎ，Ｃ．ｅｔａｌ．Ｙｅａｓｔｓｕｒｆａｃｅｄｉｓｐｌａｙｐｌａｔｆｏｒｍｆｏｒｒａｐｉｄｄｉｓｃｏｖｅｒｙｏｆｃｏｎｆｏｒｍａｔｉｏｎａｌｌｙｓｅｌｅｃｔｉｖｅｎａｎｏｂｏｄｉｅｓ．Ｎａｔｕｒｅｓｔｒｕｃｔｕｒａｌ＆ｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ２５，２８９－２９６（２０１８）．
８．Ｅｇｌｏｆｆ，Ｐ．ｅｔａｌ．Ｅｎｇｉｎｅｅｒｅｄｐｅｐｔｉｄｅｂａｒｃｏｄｅｓｆｏｒｉｎ－ｄｅｐｔｈａｎａｌｙｓｅｓｏｆｂｉｎｄｉｎｇｐｒｏｔｅｉｎｌｉｂｒａｒｉｅｓ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ１６，４２１－４２８（２０１９）．
９．Ｆｒｉｄｙ，Ｐ．Ｃ．ｅｔａｌ．Ａｒｏｂｕｓｔｐｉｐｅｌｉｎｅｆｏｒｒａｐｉｄｐｒｏｄｕｃｔｉｏｎｏｆｖｅｒｓａｔｉｌｅｎａｎｏｂｏｄｙｒｅｐｅｒｔｏｉｒｅｓ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ１１，１２５３－１２６０（２０１４）．
１０．Ｓａｖｉｔｓｋｉ，Ｍ．Ｍ．，Ｗｉｌｈｅｌｍ，Ｍ．，Ｈａｈｎｅ，Ｈ．，Ｋｕｓｔｅｒ，Ｂ．＆Ｂａｎｔｓｃｈｅｆｆ，Ｍ．ＡＳｃａｌａｂｌｅＡｐｐｒｏａｃｈｆｏｒＰｒｏｔｅｉｎＦａｌｓｅＤｉｓｃｏｖｅｒｙＲａｔｅＥｓｔｉｍａｔｉｏｎｉｎＬａｒｇｅＰｒｏｔｅｏｍｉｃＤａｔａＳｅｔｓ．Ｍｏｌｅｃｕｌａｒ＆ｃｅｌｌｕｌａｒｐｒｏｔｅｏｍｉｃｓ：ＭＣＰ１４，２３９４－２４０４（２０１５）．
１１．ＤｅＫｏｓｋｙ，Ｂ．Ｊ．ｅｔａｌ．Ｈｉｇｈ－ｔｈｒｏｕｇｈｐｕｔｓｅｑｕｅｎｃｉｎｇｏｆｔｈｅｐａｉｒｅｄｈｕｍａｎｉｍｍｕｎｏｇｌｏｂｕｌｉｎｈｅａｖｙａｎｄｌｉｇｈｔｃｈａｉｎｒｅｐｅｒｔｏｉｒｅ．Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ３１，１６６－１６９（２０１３）．
１２．Ｅｌｉａｓ，Ｊ．Ｅ．＆Ｇｙｇｉ，Ｓ．Ｐ．Ｔａｒｇｅｔ－ｄｅｃｏｙｓｅａｒｃｈｓｔｒａｔｅｇｙｆｏｒｉｎｃｒｅａｓｅｄｃｏｎｆｉｄｅｎｃｅｉｎｌａｒｇｅ－ｓｃａｌｅｐｒｏｔｅｉｎｉｄｅｎｔｉｆｉｃａｔｉｏｎｓｂｙｍａｓｓｓｐｅｃｔｒｏｍｅｔｒｙ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ４，２０７－２１４（２００７）．
１３．Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，Ｄ．，Ｉｎｂａｒ，Ｙ．，Ｎｕｓｓｉｎｏｖ，Ｒ．＆Ｗｏｌｆｓｏｎ，Ｈ．Ｊ．ＰａｔｃｈＤｏｃｋａｎｄＳｙｍｍＤｏｃｋ：ｓｅｒｖｅｒｓｆｏｒｒｉｇｉｄａｎｄｓｙｍｍｅｔｒｉｃｄｏｃｋｉｎｇ．Ｎｕｃｌｅｉｃａｃｉｄｓｒｅｓｅａｒｃｈ３３，Ｗ３６３－Ｗ３６７（２００５）．
１４．Ｃｈａｉｔ，Ｂ．Ｔ．，Ｃａｄｅｎｅ，Ｍ．，Ｏｌｉｎａｒｅｓ，Ｐ．Ｄ．，Ｒｏｕｔ，Ｍ．Ｐ．＆Ｓｈｉ，Ｙ．ＲｅｖｅａｌｉｎｇＨｉｇｈｅｒＯｒｄｅｒＰｒｏｔｅｉｎＳｔｒｕｃｔｕｒｅＵｓｉｎｇＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ．ＪｏｕｒｎａｌｏｆｔｈｅＡｍｅｒｉｃａｎＳｏｃｉｅｔｙｆｏｒＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ２７，９５２－９６５（２０１６）．
１５．Ｒｏｕｔ，Ｍ．Ｐ．＆Ｓａｌｉ，Ａ．ＰｒｉｎｃｉｐｌｅｓｆｏｒＩｎｔｅｇｒａｔｉｖｅＳｔｒｕｃｔｕｒａｌＢｉｏｌｏｇｙＳｔｕｄｉｅｓ．Ｃｅｌｌ１７７，１３８４－１４０３（２０１９）．
１６．Ｙｕ，Ｃ．＆Ｈｕａｎｇ，Ｌ．Ｃｒｏｓｓ－ＬｉｎｋｉｎｇＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ：ＡｎＥｍｅｒｇｉｎｇＴｅｃｈｎｏｌｏｇｙｆｏｒＩｎｔｅｒａｃｔｏｍｉｃｓａｎｄＳｔｒｕｃｔｕｒａｌＢｉｏｌｏｇｙ．ＡｎａｌｙｔｉｃａｌＣｈｅｍｉｓｔｒｙ９０，１４４－１６５（２０１８）．
１７．Ｌｅｉｔｎｅｒ，Ａ．，Ｆａｉｎｉ，Ｍ．，Ｓｔｅｎｇｅｌ，Ｆ．＆Ａｅｂｅｒｓｏｌｄ，Ｒ．ＣｒｏｓｓｌｉｎｋｉｎｇａｎｄＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ：ＡｎＩｎｔｅｇｒａｔｅｄＴｅｃｈｎｏｌｏｇｙｔｏＵｎｄｅｒｓｔａｎｄｔｈｅＳｔｒｕｃｔｕｒｅａｎｄＦｕｎｃｔｉｏｎｏｆＭｏｌｅｃｕｌａｒＭａｃｈｉｎｅｓ．Ｔｒｅｎｄｓｉｎｂｉｏｃｈｅｍｉｃａｌｓｃｉｅｎｃｅｓ４１，２０－３２（２０１６）．
１８．Ｌａｒｓｅｎ，Ｍ．Ｔ．，Ｋｕｈｌｍａｎｎ，Ｍ．，Ｈｖａｍ，Ｍ．Ｌ．＆Ｈｏｗａｒｄ，Ｋ．Ａ．Ａｌｂｕｍｉｎ－ｂａｓｅｄｄｒｕｇｄｅｌｉｖｅｒｙ：ｈａｒｎｅｓｓｉｎｇｎａｔｕｒｅｔｏｃｕｒｅｄｉｓｅａｓｅ．ＭｏｌＣｅｌｌＴｈｅｒ４，３（２０１６）．
１９．Ｚｈｕ，Ｗ．Ｈ．，Ｓｍｉｔｈ，Ｊ．Ｗ．＆Ｈｕａｎｇ，Ｃ．Ｍ．ＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ－ＢａｓｅｄＬａｂｅｌ－ＦｒｅｅＱｕａｎｔｉｔａｔｉｖｅＰｒｏｔｅｏｍｉｃｓ．ＪＢｉｏｍｅｄＢｉｏｔｅｃｈｎｏｌ（２０１０）．
２０．Ｃｏｘ，Ｊ．＆Ｍａｎｎ，Ｍ．ＭａｘＱｕａｎｔｅｎａｂｌｅｓｈｉｇｈｐｅｐｔｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｒａｔｅｓ，ｉｎｄｉｖｉｄｕａｌｉｚｅｄｐ．ｐ．ｂ．－ｒａｎｇｅｍａｓｓａｃｃｕｒａｃｉｅｓａｎｄｐｒｏｔｅｏｍｅ－ｗｉｄｅｐｒｏｔｅｉｎｑｕａｎｔｉｆｉｃａｔｉｏｎ．Ｎａｔｕｒｅｂｉｏｔｅｃｈｎｏｌｏｇｙ２６，１３６７－１３７２（２００８）．
２１．Ｓｈｉ，Ｙ．ｅｔａｌ．Ｓｔｒｕｃｔｕｒａｌｃｈａｒａｃｔｅｒｉｚａｔｉｏｎｂｙｃｒｏｓｓ－ｌｉｎｋｉｎｇｒｅｖｅａｌｓｔｈｅｄｅｔａｉｌｅｄａｒｃｈｉｔｅｃｔｕｒｅｏｆａｃｏａｔｏｍｅｒ－ｒｅｌａｔｅｄｈｅｐｔａｍｅｒｉｃｍｏｄｕｌｅｆｒｏｍｔｈｅｎｕｃｌｅａｒｐｏｒｅｃｏｍｐｌｅｘ．Ｍｏｌｅｃｕｌａｒ＆ｃｅｌｌｕｌａｒｐｒｏｔｅｏｍｉｃｓ：ＭＣＰ１３，２９２７－２９４３（２０１４）．
２２．Ｋｉｍ，Ｓ．Ｊ．ｅｔａｌ．Ｉｎｔｅｇｒａｔｉｖｅｓｔｒｕｃｔｕｒｅａｎｆｕｎｃｔｉｏｎａｌａｎａｔｏｍｙｏｆａｎｕｃｌｅａｒｐｏｒｅｃｏｍｐｌｅｘ．Ｎａｔｕｒｅ５５５，４７５－４８２（２０１８）．
２３．Ｐｉｒｅｓ，Ｄ．Ｅ．Ｖ．，Ａｓｃｈｅｒ，Ｄ．Ｂ．＆Ｂｌｕｎｄｅｌｌ，Ｔ．Ｌ．ｍＣＳＭ：ｐｒｅｄｉｃｔｉｎｇｔｈｅｅｆｆｅｃｔｓｏｆｍｕｔａｔｉｏｎｓｉｎｐｒｏｔｅｉｎｓｕｓｉｎｇｇｒａｐｈ－ｂａｓｅｄｓｉｇｎａｔｕｒｅｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（Ｏｘｆｏｒｄ，Ｅｎｇｌａｎｄ）３０，３３５－３４２（２０１４）．
２４．Ｆｉｎｎ，Ｊ．Ａ．ｅｔａｌ．ＩｍｐｒｏｖｉｎｇＬｏｏｐＭｏｄｅｌｉｎｇｏｆｔｈｅＡｎｔｉｂｏｄｙＣｏｍｐｌｅｍｅｎｔａｒｉｔｙ－ＤｅｔｅｒｍｉｎｉｎｇＲｅｇｉｏｎ３ＵｓｉｎｇＫｎｏｗｌｅｄｇｅ－ＢａｓｅｄＲｅｓｔｒａｉｎｔｓ．ＰｌｏＳｏｎｅ１１，ｅ０１５４８１１（２０１６）．
２５．Ｔｉｌｌｅｒ，Ｋ．Ｅ．ｅｔａｌ．Ａｒｇｉｎｉｎｅｍｕｔａｔｉｏｎｓｉｎａｎｔｉｂｏｄｙｃｏｍｐｌｅｍｅｎｔａｒｉｔｙ－ｄｅｔｅｒｍｉｎｉｎｇｒｅｇｉｏｎｓｄｉｓｐｌａｙｃｏｎｔｅｘｔ－ｄｅｐｅｎｄｅｎｔａｆｆｉｎｉｔｙ／ｓｐｅｃｉｆｉｃｉｔｙｔｒａｄｅ－ｏｆｆｓ．ＴｈｅＪｏｕｒｎａｌｏｆｂｉｏｌｏｇｉｃａｌｃｈｅｍｉｓｔｒｙ２９２，１６６３８－１６６５２（２０１７）．
２６．Ｍｉｔｃｈｅｌｌ，Ｌ．Ｓ．＆Ｃｏｌｗｅｌｌ，Ｌ．Ｊ．Ａｎａｌｙｓｉｓｏｆｎａｎｏｂｏｄｙｐａｒａｔｏｐｅｓｒｅｖｅａｌｓｇｒｅａｔｅｒｄｉｖｅｒｓｉｔｙｔｈａｎｃｌａｓｓｉｃａｌａｎｔｉｂｏｄｉｅｓ．ＰｒｏｔｅｉｎＥｎｇＤｅｓＳｅｌ３１，２６７－２７５（２０１８）．
２７．Ｄｅｓｍｙｔｅｒ，Ａ．ｅｔａｌ．Ｃｒｙｓｔａｌｓｔｒｕｃｔｕｒｅｏｆａｃａｍｅｌｓｉｎｇｌｅ－ｄｏｍａｉｎＶＨａｎｔｉｂｏｄｙｆｒａｇｍｅｎｔｉｎｃｏｍｐｌｅｘｗｉｔｈｌｙｓｏｚｙｍｅ．ＮａｔＳｔｒｕｃｔＢｉｏｌ３，８０３－８１１（１９９６）．
２８．Ｌｉ，Ｔ．ｅｔａｌ．Ｉｍｍｕｎｏ－ｔａｒｇｅｔｉｎｇｔｈｅｍｕｌｔｉｆｕｎｃｔｉｏｎａｌＣＤ３８ｕｓｉｎｇｎａｎｏｂｏｄｙ．Ｓｃｉｅｎｔｉｆｉｃｒｅｐｏｒｔｓ６（２０１６）．
２９．Ｓｈｅｎｇ，Ｍ．＆Ｓａｌａ，Ｃ．ＰＤＺｄｏｍａｉｎｓａｎｄｔｈｅｏｒｇａｎｉｚａｔｉｏｎｏｆｓｕｐｒａｍｏｌｅｃｕｌａｒｃｏｍｐｌｅｘｅｓ．ＡｎｎｕＲｅｖＮｅｕｒｏｓｃｉ２４，１－２９（２００１）．
３０．Ｄｏｙｌｅ，Ｄ．Ａ．ｅｔａｌ．Ｃｒｙｓｔａｌｓｔｒｕｃｔｕｒｅｓｏｆａｃｏｍｐｌｅｘｅｄａｎｄｐｅｐｔｉｄｅ－ｆｒｅｅｍｅｍｂｒａｎｅｐｒｏｔｅｉｎ－ｂｉｎｄｉｎｇｄｏｍａｉｎ：ＭｏｌｅｃｕｌａｒｂａｓｉｓｏｆｐｅｐｔｉｄｅｒｅｃｏｇｎｉｔｉｏｎｂｙＰＤＺ．Ｃｅｌｌ８５，１０６７－１０７６（１９９６）．
３１．Ｎｉｅｔｈａｍｍｅｒ，Ｍ．ｅｔａｌ．ＣＲＩＰＴ，ａｎｏｖｅｌｐｏｓｔｓｙｎａｐｔｉｃｐｒｏｔｅｉｎｔｈａｔｂｉｎｄｓｔｏｔｈｅｔｈｉｒｄＰＤＺｄｏｍａｉｎｏｆＰＳＤ－９５／ＳＡＰ９０．Ｎｅｕｒｏｎ２０，６９３－７０７（１９９８）．
３２．Ａｋｒａｍ，Ａ．＆Ｉｎｍａｎ，Ｒ．Ｄ．Ｉｍｍｕｎｏｄｏｍｉｎａｎｃｅ：Ａｐｉｖｏｔａｌｐｒｉｎｃｉｐｌｅｉｎｈｏｓｔｒｅｓｐｏｎｓｅｔｏｖｉｒａｌｉｎｆｅｃｔｉｏｎｓ．ＣｌｉｎＩｍｍｕｎｏｌ１４３，９９－１１５（２０１２）．
３３．Ｂａｒ－Ｏｎ，Ｙ．Ｍ．，Ｐｈｉｌｌｉｐｓ，Ｒ．＆Ｍｉｌｏ，Ｒ．ＴｈｅｂｉｏｍａｓｓｄｉｓｔｒｉｂｕｔｉｏｎｏｎＥａｒｔｈ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１１５，６５０６－６５１１（２０１８）．
３４．Ｃｈａｐｌｉｎ，Ｄ．Ｄ．Ｏｖｅｒｖｉｅｗｏｆｔｈｅｉｍｍｕｎｅｒｅｓｐｏｎｓｅ．ＪＡｌｌｅｒｇｙＣｌｉｎＩｍｍｕｎ１２５，Ｓ３－Ｓ２３（２０１０）．
３５．Ａｃｈａｒｙａ，Ｐ．ｅｔａｌ．Ｈｅａｖｙｃｈａｉｎ－ｏｎｌｙＩｇＧ２ｂｌｌａｍａａｎｔｉｂｏｄｙｅｆｆｅｃｔｓｎｅａｒ－ｐａｎＨＩＶ－１ｎｅｕｔｒａｌｉｚａｔｉｏｎｂｙｒｅｃｏｇｎｉｚｉｎｇａＣＤ４－ｉｎｄｕｃｅｄｅｐｉｔｏｐｅｔｈａｔｉｎｃｌｕｄｅｓｅｌｅｍｅｎｔｓｏｆｃｏｒｅｃｅｐｔｏｒ－ａｎｄＣＤ４－ｂｉｎｄｉｎｇｓｉｔｅｓ．ＪＶｉｒｏｌ８７，１０１７３－１０１８１（２０１３）．
３６．Ａｒａｂｉ，Ｙ．Ｍ．ｅｔａｌ．ＭｉｄｄｌｅＥａｓｔＲｅｓｐｉｒａｔｏｒｙＳｙｎｄｒｏｍｅ．ＮｅｗＥｎｇｌＪＭｅｄ３７６，５８４－５９４（２０１７）．
３７．Ｆｌａｊｎｉｋ，Ｍ．Ｆ．，Ｄｅｓｃｈａｃｈｔ，Ｎ．＆Ｍｕｙｌｄｅｒｍａｎｓ，Ｓ．ＡＣａｓｅＯｆＣｏｎｖｅｒｇｅｎｃｅ：ＷｈｙＤｉｄａＳｉｍｐｌｅＡｌｔｅｒｎａｔｉｖｅｔｏＣａｎｏｎｉｃａｌＡｎｔｉｂｏｄｉｅｓＡｒｉｓｅｉｎＳｈａｒｋｓａｎｄＣａｍｅｌｓ？ＰＬｏＳｂｉｏｌｏｇｙ９（２０１１）．
３８．Ｓｉｒｃａｒ，Ａ．，Ｓａｎｎｉ，Ｋ．Ａ．，Ｓｈｉ，Ｊ．＆Ｇｒａｙ，Ｊ．Ｊ．Ａｎａｌｙｓｉｓａｎｄｍｏｄｅｌｉｎｇｏｆｔｈｅｖａｒｉａｂｌｅｒｅｇｉｏｎｏｆｃａｍｅｌｉｄｓｉｎｇｌｅ－ｄｏｍａｉｎａｎｔｉｂｏｄｉｅｓ．ＪＩｍｍｕｎｏｌ１８６，６３５７－６３６７（２０１１）．
３９．Ｂａｒａｎ，Ｄ．ｅｔａｌ．Ｐｒｉｎｃｉｐｌｅｓｆｏｒｃｏｍｐｕｔａｔｉｏｎａｌｄｅｓｉｇｎｏｆｂｉｎｄｉｎｇａｎｔｉｂｏｄｉｅｓ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ１１４，１０９００－１０９０５（２０１７）．
４０．Ｃｈｅｖａｌｉｅｒ，Ａ．ｅｔａｌ．Ｍａｓｓｉｖｅｌｙｐａｒａｌｌｅｌｄｅｎｏｖｏｐｒｏｔｅｉｎｄｅｓｉｇｎｆｏｒｔａｒｇｅｔｅｄｔｈｅｒａｐｅｕｔｉｃｓ．Ｎａｔｕｒｅ５５０，７４－７９（２０１７）．
４１．ＡｒｂａｂｉＧｈａｈｒｏｕｄｉ，Ｍ．，Ｄｅｓｍｙｔｅｒ，Ａ．，Ｗｙｎｓ，Ｌ．，Ｈａｍｅｒｓ，Ｒ．＆Ｍｕｙｌｄｅｒｍａｎｓ，Ｓ．Ｓｅｌｅｃｔｉｏｎａｎｄｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｓｉｎｇｌｅｄｏｍａｉｎａｎｔｉｂｏｄｙｆｒａｇｍｅｎｔｓｆｒｏｍｃａｍｅｌｈｅａｖｙ－ｃｈａｉｎａｎｔｉｂｏｄｉｅｓ．ＦＥＢＳｌｅｔｔｅｒｓ４１４，５２１－５２６（１９９７）．
４２．Ｓｈｉ，Ｙ．ｅｔａｌ．Ａｓｔｒａｔｅｇｙｆｏｒｄｉｓｓｅｃｔｉｎｇｔｈｅａｒｃｈｉｔｅｃｔｕｒｅｓｏｆｎａｔｉｖｅｍａｃｒｏｍｏｌｅｃｕｌａｒａｓｓｅｍｂｌｉｅｓ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ１２，１１３５－１１３８（２０１５）．
４３．Ｃｈｅｎ，Ｚ．Ｌ．ｅｔａｌ．Ａｈｉｇｈ－ｓｐｅｅｄｓｅａｒｃｈｅｎｇｉｎｅｐＬｉｎｋ２ｗｉｔｈｓｙｓｔｅｍａｔｉｃｅｖａｌｕａｔｉｏｎｆｏｒｐｒｏｔｅｏｍｅ－ｓｃａｌｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｃｒｏｓｓ－ｌｉｎｋｅｄｐｅｐｔｉｄｅｓ．Ｎａｔｕｒｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ１０，３４０４（２０１９）．
４４．Ｄｕｎｂａｒ，Ｊ．＆Ｄｅａｎｅ，Ｃ．Ｍ．ＡＮＡＲＣＩ：ａｎｔｉｇｅｎｒｅｃｅｐｔｏｒｎｕｍｂｅｒｉｎｇａｎｄｒｅｃｅｐｔｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（Ｏｘｆｏｒｄ，Ｅｎｇｌａｎｄ）３２，２９８－３００（２０１６）．
４５．Ｌｅｆｒａｎｃ，Ｍ．Ｐ．ｅｔａｌ．ＩＭＧＴｕｎｉｑｕｅｎｕｍｂｅｒｉｎｇｆｏｒｉｍｍｕｎｏｇｌｏｂｕｌｉｎａｎｄＴｃｅｌｌｒｅｃｅｐｔｏｒｖａｒｉａｂｌｅｄｏｍａｉｎｓａｎｄＩｇｓｕｐｅｒｆａｍｉｌｙＶ－ｌｉｋｅｄｏｍａｉｎｓ．ＤｅｖＣｏｍｐＩｍｍｕｎｏｌ２７，５５－７７（２００３）．
４６．Ｃｒｏｏｋｓ，Ｇ．Ｅ．，Ｈｏｎ，Ｇ．，Ｃｈａｎｄｏｎｉａ，Ｊ．Ｍ．＆Ｂｒｅｎｎｅｒ，Ｓ．Ｅ．ＷｅｂＬｏｇｏ：ａｓｅｑｕｅｎｃｅｌｏｇｏｇｅｎｅｒａｔｏｒ．Ｇｅｎｏｍｅｒｅｓｅａｒｃｈ１４，１１８８－１１９０（２００４）．
４７．Ｓｉｅｖｅｒｓ，Ｆ．＆Ｈｉｇｇｉｎｓ，Ｄ．Ｇ．ＣｌｕｓｔａｌＯｍｅｇａ，ａｃｃｕｒａｔｅａｌｉｇｎｍｅｎｔｏｆｖｅｒｙｌａｒｇｅｎｕｍｂｅｒｓｏｆｓｅｑｕｅｎｃｅｓ．Ｍｅｔｈｏｄｓｉｎｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ１０７９，１０５－１１６（２０１４）．
４８．Ｌｅｔｕｎｉｃ，Ｉ．＆Ｂｏｒｋ，Ｐ．ＩｎｔｅｒａｃｔｉｖｅＴｒｅｅＯｆＬｉｆｅ（ｉＴＯＬ）：ａｎｏｎｌｉｎｅｔｏｏｌｆｏｒｐｈｙｌｏｇｅｎｅｔｉｃｔｒｅｅｄｉｓｐｌａｙａｎｄａｎｎｏｔａｔｉｏｎ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（Ｏｘｆｏｒｄ，Ｅｎｇｌａｎｄ）２３，１２７－１２８（２００７）．
４９．Ｗａｔｅｒｈｏｕｓｅ，Ａ．Ｍ．，Ｐｒｏｃｔｅｒ，Ｊ．Ｂ．，Ｍａｒｔｉｎ，Ｄ．Ｍ．，Ｃｌａｍｐ，Ｍ．＆Ｂａｒｔｏｎ，Ｇ．Ｊ．ＪａｌｖｉｅｗＶｅｒｓｉｏｎ２－－ａｍｕｌｔｉｐｌｅｓｅｑｕｅｎｃｅａｌｉｇｎｍｅｎｔｅｄｉｔｏｒａｎｄａｎａｌｙｓｉｓｗｏｒｋｂｅｎｃｈ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（Ｏｘｆｏｒｄ，Ｅｎｇｌａｎｄ）２５，１１８９－１１９１（２００９）．
５０．Ｋａｌｌ，Ｌ．，Ｃａｎｔｅｒｂｕｒｙ，Ｊ．Ｄ．，Ｗｅｓｔｏｎ，Ｊ．，Ｎｏｂｌｅ，Ｗ．Ｓ．＆ＭａｃＣｏｓｓ，Ｍ．Ｊ．Ｓｅｍｉ－ｓｕｐｅｒｖｉｓｅｄｌｅａｒｎｉｎｇｆｏｒｐｅｐｔｉｄｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｆｒｏｍｓｈｏｔｇｕｎｐｒｏｔｅｏｍｉｃｓｄａｔａｓｅｔｓ．Ｎａｔｕｒｅｍｅｔｈｏｄｓ４，９２３－９２５（２００７）．
５１．Ｗｅｂｂ，Ｂ．＆Ｓａｌｉ，Ａ．ＣｏｍｐａｒａｔｉｖｅＰｒｏｔｅｉｎＳｔｒｕｃｔｕｒｅＭｏｄｅｌｉｎｇＵｓｉｎｇＭＯＤＥＬＬＥＲ．ＣｕｒｒＰｒｏｔｏｃＢｉｏｉｎｆｏｒｍａｔｉｃｓ４７，５６１－３２（２０１４）．
５２．Ｄｏｎｇ，Ｇ．Ｑ．，Ｆａｎ，Ｈ．，Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，Ｄ．，Ｗｅｂｂ，Ｂ．＆Ｓａｌｉ，Ａ．Ｏｐｔｉｍｉｚｅｄａｔｏｍｉｃｓｔａｔｉｓｔｉｃａｌｐｏｔｅｎｔｉａｌｓ：ａｓｓｅｓｓｍｅｎｔｏｆｐｒｏｔｅｉｎｉｎｔｅｒｆａｃｅｓａｎｄｌｏｏｐｓ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ（Ｏｘｆｏｒｄ，Ｅｎｇｌａｎｄ）２９，３１５８－３１６６（２０１３）．
５３．Ｓｃｈｎｅｉｄｍａｎ－Ｄｕｈｏｖｎｙ，Ｄ．＆Ｗｏｌｆｓｏｎ，Ｈ．Ｊ．ＭｏｄｅｌｉｎｇｏｆＭｕｌｔｉｍｏｌｅｃｕｌａｒＣｏｍｐｌｅｘｅｓ．Ｍｅｔｈｏｄｓｉｎｍｏｌｅｃｕｌａｒｂｉｏｌｏｇｙ２１１２，１６３－１７４（２０２０）．
５４．Ｒｕｓｓｅｌ，Ｄ．ｅｔａｌ．Ｐｕｔｔｉｎｇｔｈｅｐｉｅｃｅｓｔｏｇｅｔｈｅｒ：ｉｎｔｅｇｒａｔｉｖｅｍｏｄｅｌｉｎｇｐｌａｔｆｏｒｍｓｏｆｔｗａｒｅｆｏｒｓｔｒｕｃｔｕｒｅｄｅｔｅｒｍｉｎａｔｉｏｎｏｆｍａｃｒｏｍｏｌｅｃｕｌａｒａｓｓｅｍｂｌｉｅｓ．ＰＬｏＳｂｉｏｌｏｇｙ１０，ｅ１００１２４４（２０１２）．
５５．Ｆｅｒｎａｎｄｅｚ－Ｍａｒｔｉｎｅｚ，Ｊ．ｅｔａｌ．ＳｔｒｕｃｔｕｒｅａｎｄＦｕｎｃｔｉｏｎｏｆｔｈｅＮｕｃｌｅａｒＰｏｒｅＣｏｍｐｌｅｘＣｙｔｏｐｌａｓｍｉｃｍＲＮＡＥｘｐｏｒｔＰｌａｔｆｏｒｍ．Ｃｅｌｌ１６７，１２１５－１２２８ｅ１２２５（２０１６）．

Claims

相補性決定領域（ＣＤＲ）３、２及び／または１のナノボディアミノ酸配列（ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列）群を同定する方法であって、前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列の偽陽性の数が対照と比較して減少しており、前記方法が、
ａ．抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
ｂ．前記血液サンプルを使用して、ナノボディのｃＤＮＡライブラリーを取得することと、
ｃ．前記ライブラリー中の各ｃＤＮＡのヌクレオチド配列に対応するアミノ酸配列を同定することと、
ｄ．前記抗原の免疫を持つ前記ラクダ科動物からの同じまたは第２の血液サンプルからナノボディを単離することと、
ｅ．前記ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
ｆ．前記消化産物の質量分析を実行して、質量分析データを取得することと、
ｇ．前記質量分析データと相関する、ステップｃで同定されたアミノ酸配列を選択することと、
ｈ．ステップｇの配列内のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域のアミノ酸配列を同定することと、
ｉ．ステップｈの前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、前記フラグメント化カバー率の割合が、ステップｅでキモトリプシンが使用される場合、式ｆ（ｘ，キモトリプシン）＝０．００２３ｘ^２－０．０４９７ｘ＋０．７７２３，ｘ［５，２５］によって決定され、またはステップｅでトリプシンが使用される場合、式ｆ（ｘ，トリプシン）＝０．００００６ｘ^２－０．００４４４ｘ＋０．９１９４，ｘ［５，３０］によって決定され、ｘは、それぞれＣＤＲ３、ＣＤＲ２またはＣＤＲ１領域の配列のアミノ酸長である、前記選択することと、を含み、
ｊ．ステップｉの前記選択されたアミノ酸配列が、偽陽性のＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１配列の数が減少した群を含む、前記方法。
前記必要なフラグメント化カバー率の割合は約３０％である、請求項１に記載の方法。
前記必要なフラグメント化カバー率の割合は約５０％であり、ステップｅでトリプシンが使用される、請求項１に記載の方法。
前記必要なフラグメント化カバー率の割合は約４０％であり、ステップｅでキモトリプシンが使用される、請求項１に記載の方法。
ステップｄは、前記血液サンプルから血漿を取得することと、１つ以上の親和性単離法を使用してナノボディを単離することと、を含む、請求項１～４のいずれか１項に記載の方法。
ステップｄの前記１つ以上の親和性単離法は、プロテインＧセファロース親和性クロマトグラフィー及びプロテインＡセファロース親和性クロマトグラフィーのうちの１つ以上を含む、請求項５に記載の方法。
ステップｄは、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で前記抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップｅからステップｉまでを各フラクションに対して個別に実行し、前記抗原に対する各異なるステップｉのＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の親和性を、それぞれ、前記ナノボディフラクションのそれぞれにおける前記ＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む、請求項１～６のいずれか１項に記載の方法。
前記抗原特異的親和性クロマトグラフィーは、前記抗原にコンジュゲートされた樹脂である、請求項７に記載の方法。
前記抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び前記抗原に結合された樹脂である、請求項７に記載の方法。
ステップｉで同定された配列を有するＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１ペプチドを作成することをさらに含む、請求項１～９のいずれか１項に記載の方法。
ステップｉで同定された配列を有するＣＤＲ３、ＣＤＲ２及び／またはＣＤＲ１領域を含むナノボディを作成することをさらに含む、請求項１～９のいずれか１項に記載の方法。