[go: up one dir, main page]

JP7765090B2 - ナノボディ及びナノボディ親和性を同定するための組成物及び方法 - Google Patents

ナノボディ及びナノボディ親和性を同定するための組成物及び方法

Info

Publication number
JP7765090B2
JP7765090B2 JP2022566362A JP2022566362A JP7765090B2 JP 7765090 B2 JP7765090 B2 JP 7765090B2 JP 2022566362 A JP2022566362 A JP 2022566362A JP 2022566362 A JP2022566362 A JP 2022566362A JP 7765090 B2 JP7765090 B2 JP 7765090B2
Authority
JP
Japan
Prior art keywords
cdr3
antigen
sequences
sequence
affinity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022566362A
Other languages
English (en)
Other versions
JP2023524719A (ja
Inventor
シ,イ
シャン,ユーフェイ
サン,ジェ
Original Assignee
ユニバーシティ オブ ピッツバーグ -オブ ザ コモンウェルス システム オブ ハイヤー エデュケイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティ オブ ピッツバーグ -オブ ザ コモンウェルス システム オブ ハイヤー エデュケイション filed Critical ユニバーシティ オブ ピッツバーグ -オブ ザ コモンウェルス システム オブ ハイヤー エデュケイション
Publication of JP2023524719A publication Critical patent/JP2023524719A/ja
Application granted granted Critical
Publication of JP7765090B2 publication Critical patent/JP7765090B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • G01N33/6857Antibody fragments
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/565Complementarity determining region [CDR]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/90Immunoglobulins specific features characterized by (pharmaco)kinetic aspects or by stability of the immunoglobulin
    • C07K2317/92Affinity (KD), association rate (Ka), dissociation rate (Kd) or EC50 value
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/948Hydrolases (3) acting on peptide bonds (3.4)
    • G01N2333/976Trypsin; Chymotrypsin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Library & Information Science (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Theoretical Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Organic Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)

Description

関連出願の相互参照
本出願は、2020年5月1日に出願された米国仮出願第63/018,559号の利益を主張するものであり、この米国仮出願の全体を参照により本明細書に明示的に援用する。
ナノボディ(Nb)は、ラクダ科動物の重鎖抗体(HcAb)のVHドメインに由来する天然の抗原結合性フラグメントである。Nbは、その小さなサイズと卓越した構造的堅牢性、優れた溶解性及び安定性、生物工学及び製造の容易さ、ヒトにおける低免疫原性、ならびに迅速な組織透過性という性質を持っている。これらの理由によって、Nbは、最先端の生物医学、診断、及び治療への応用のための有望な薬剤として浮上している(Muyldermans, 2013;Beghein, 2017;Rasmussen, 2011;Jovcevska, I. & Muyldermans, S, 2020)。
Nb発見のためにディスプレイベースの技術が開発されている(Lauwereys, 1998;Pardon, 2014;McMahon, 2018;Egloff, 2019)。これらの方法では、通常、特定の標的に中程度の親和性で結合する少数の標的合成Nbを産出し、自然に循環する抗原特異的HcAb/Nbレパートリーを直接分析しない。最近、質量分析に基づくプロテオミクスが、Nb発見の有望な手法として浮上している(Fridy, 2014)。ただし、少なくともいくつかの理由により、抗原特異的Nbプロテオームの大規模、高感度、及び高信頼性の分析に向けた重要な課題が残っている。(a)循環抗体の多様性及びダイナミックレンジは、どの細胞プロテオームよりも桁違いに高い。(b)免疫化されたラクダ科動物から得られたNb配列データベースには、通常、正確なデータベース検索に課題をもたらす何百万もの一意の配列が含まれている(Savitski, 2015)。(c)この大規模なデータベースは、保存されたNbフレームワーク配列が大きな比率を占めており、同定に対する特異性をほとんど提供しない。特異性は主に相補性決定領域(CDR)によって決定されるが、その中でもCDR3ループは長くなる可能性があり、信頼できるMS分析が困難になる。(d)現在の方法は、大規模なNbレパートリーの正確な定量化及び分類を可能にする効率的なプロトコル及びインフォマティクスの利用可能性によって制限されている。
本明細書に提供されるのは、相補性決定領域(CDR)3、2、及び/または1のナノボディアミノ酸配列(CDR3、CDR2及び/またはCDR1配列)群を同定する、減数されたCDR3、CDR2及び/またはCDR1配列が対照と比較して偽陽性である、方法であって、(a)抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、(b)血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、(c)ライブラリー中の各cDNAの配列を同定することと、(d)抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、(e)ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、(f)消化産物の質量分析を実行して、質量分析データを取得することと、(g)質量分析データと相関する、ステップcで同定された配列を選択することと、(h)ステップgの配列内のCDR3、CDR2及び/またはCDR1領域の配列を同定することと、(i)ステップhのCDR3、CDR2及び/またはCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ(i)の選択された配列が、減数された偽陽性のCDR3、CDR2及び/またはCDR1配列を有する群を含む、方法である。いくつかの実施形態では、ステップ(d)は、血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ(d)の1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む。いくつかの態様では、ステップ(d)は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ(e)からステップ(i)までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ(i)のCDR3、CDR2及び/またはCDR1領域配列の親和性を、それぞれ、ナノボディフラクションのそれぞれにおけるCDR3、CDR2及び/またはCDR1領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。
いくつかの実施形態では、相補性決定領域(CDR)3のナノボディアミノ酸配列(CDR2配列)群を同定する、減数されたCDR3配列が対照と比較して偽陽性である、方法であって、(a)抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、(b)血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、(c)ライブラリー中の各cDNAの配列を同定することと、(d)抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、(e)ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、(f)消化産物の質量分析を実行して、質量分析データを取得することと、(g)質量分析データと相関する、ステップcで同定された配列を選択することと、(h)ステップgの配列内のCDR3領域の配列を同定することと、(i)ステップhのCDR3領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ(i)の選択された配列が、減数された偽陽性のCDR3配列を有する群を含む、方法である。いくつかの実施形態では、ステップ(d)は、血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ(d)の1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む。いくつかの態様では、ステップ(d)は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ(e)からステップ(i)までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ(i)のCDR3領域配列の親和性を、ナノボディフラクションのそれぞれにおけるCDR3領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。
いくつかの実施形態では、相補性決定領域(CDR)2のナノボディアミノ酸配列(CDR2配列)群を同定する、減数されたCDR2配列が対照と比較して偽陽性である、方法であって、(a)抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、(b)血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、(c)ライブラリー中の各cDNAの配列を同定することと、(d)抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、(e)ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、(f)消化産物の質量分析を実行して、質量分析データを取得することと、(g)質量分析データと相関する、ステップcで同定された配列を選択することと、(h)ステップgの配列内のCDR2領域の配列を同定することと、(i)ステップhのCDR2領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ(i)の選択された配列が、減数された偽陽性のCDR2配列を有する群を含む、方法である。いくつかの実施形態では、ステップ(d)は、血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ(d)の1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む。いくつかの態様では、ステップ(d)は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ(e)からステップ(i)までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ(i)のCDR2領域配列の親和性を、ナノボディフラクションのそれぞれにおけるCDR2領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。
いくつかの実施形態では、相補性決定領域(CDR)1のナノボディアミノ酸配列(CDR1配列)群を同定する、減数されたCDR1配列が対照と比較して偽陽性である、方法であって、(a)抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、(b)血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、(c)ライブラリー中の各cDNAの配列を同定することと、(d)抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、(e)ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、(f)消化産物の質量分析を実行して、質量分析データを取得することと、(g)質量分析データと相関する、ステップcで同定された配列を選択することと、(h)ステップgの配列内のCDR1領域の配列を同定することと、(i)ステップhのCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することと、を含み、ステップ(i)の選択された配列が、減数された偽陽性のCDR1配列を有する群を含む、方法である。いくつかの実施形態では、ステップ(d)は、血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む。いくつかの態様では、ステップ(d)の1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む。いくつかの態様では、ステップ(d)は、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップ(e)からステップ(i)までを各フラクションに対して個別に実行し、抗原に対する各異なるステップ(i)のCDR1領域配列の親和性を、ナノボディフラクションのそれぞれにおけるCDR1領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。
いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、抗原にコンジュゲートされた樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、タンパク質タグ及び抗原に結合された樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び抗原に結合された樹脂である。
いくつかの態様は、ステップ(i)で同定された配列を有するCDR3、CDR2、またはCDR1ペプチドを作成することをさらに含む。いくつかの態様は、ステップ(i)で同定された配列を有するCDR3、CDR2、及び/またはCDR1領域を含むナノボディを作成することをさらに含む。
本明細書にはまた、SEQ ID NO:1~2536及びSEQ ID NO:2665~2667から選択されるアミノ酸配列を含むナノボディが含まれる。
本明細書においてさらに提供されるのは、コンピュータ実施方法であって、(a)ナノボディペプチド配列を受け取ることと、(b)ナノボディペプチド配列の複数の相補性決定領域(CDR)領域を同定することであって、CDR領域が、CDR3、CDR2及び/またはCDR1領域を含む、同定することと、(c)フラグメント化フィルターを適用して、ナノボディペプチド配列の1つ以上の偽陽性のCDR3、CDR2及び/またはCDR1領域を破棄することと、(d)ナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の存在量を定量化することと、(e)ナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の定量化された存在量に基づいて抗原親和性を推測することと、を含む、コンピュータ実施方法である。
いくつかの実施形態では、コンピュータ実施方法は、ナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域を、低い抗原親和性、中程度の抗原親和性、または高い抗原親和性を有するものとして分類することをさらに含む。
いくつかの実施形態では、コンピュータ実施方法は、高い抗原親和性を有すると分類されたナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域をナノボディタンパク質に組み立てることをさらに含む。
コンピュータ実施方法のいくつかの態様では、フラグメント化フィルターは、最小の計算されたフラグメント化カバー率の割合を要求するように構成される。他の態様またはさらなる態様では、最小の計算されたフラグメント化カバー率の割合は約30%である。いくつかの態様では、最小の計算されたフラグメント化カバー率の割合は、トリプシン処理サンプルについては約50%であり、キモトリプシン処理サンプルについては約40%である。
いくつかの実施形態では、コンピュータ実施方法は、複数のナノボディペプチド配列を受け取ることと、ナノボディペプチド配列のそれぞれをデータベースと比較して、ナノボディペプチド配列を、除外されたサブグループと除外されていないサブグループとに分離することをさらに含み、除外されたサブグループのナノボディペプチド配列はデータベースに見つからず、CDR領域は、除外されていないサブグループのナノボディペプチド配列でのみ同定される。
コンピュータ実施方法のいくつかの実施形態では、ナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の存在量は、相対MS1イオンシグナル強度に基づいて定量化される。いくつかの実施形態では、抗原親和性が、エピトープ類似性に基づくk-meansクラスタリングを使用して推測される。
本明細書にはまた、深層学習モデルをトレーニングする方法であって、上記のコンピュータ実施方法を使用してデータセットを作成することと、データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることであって、データセットは、複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含む、トレーニングすることと、を含む、方法が提供される。いくつかの実施形態では、深層学習モデルは、畳み込みニューラルネットワークである。
本明細書ではさらに、ナノボディペプチド配列の抗原親和性を決定するための方法であって、ナノボディペプチド配列を受け取ることと、トレーニング済みの深層学習モデルにナノボディペプチド配列を入力することと、トレーニング済みの深層学習モデルを使用して、ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、を含む、方法が提供される。いくつかの実施形態では、深層学習モデルは、畳み込みニューラルネットワークである。いくつかの実施形態では、トレーニング済みの深層学習モデルが、上記の深層学習モデルをトレーニングする方法に従ってトレーニングされる。
NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。Nb結晶構造(PDB:4QGY)である。CDRループは色分けされている。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。データベースのCDRの配列長分布である。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。2つのプロテアーゼによるNbデータベースのインシリコ消化、及び対応するペプチド質量の累積プロットである。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。トリプシン及びキモトリプシンで消化されたCDR3ペプチドの長さの分布である。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。シミュレーションに基づくNbマッピングのトリプシン及びキモトリプシンの相補性である。一意のCDR3配列を持つ10,000個のNbがランダムに選択され、インシリコで消化されてCDR3ペプチドが生成された。分子量が0.8~3kDaで、十分なCDR3カバー率(≧30%)のペプチドがNbマッピングに使用された。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。MS/MSスペクトルで一致したCDR3フラグメントイオンの割合に基づく一意のCDR3ペプチド同定(1F:トリプシン;1G:キモトリプシン)の評価である。CDR3ペプチドは、「ターゲット」データベース(サーモン)または「デコイ」データベース(グレー)のいずれかを使用したデータベース検索によって同定された。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。MS/MSスペクトルで一致したCDR3フラグメントイオンの割合に基づく一意のCDR3ペプチド同定(1F:トリプシン;1G:キモトリプシン)の評価である。CDR3ペプチドは、「ターゲット」データベース(サーモン)または「デコイ」データベース(グレー)のいずれかを使用したデータベース検索によって同定された。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたCDR3ペプチド同定、CDR3フラグメントの割合、及びCDR3長の3Dプロットである。FDRは、偽発見率である。CDR3同定のFDRは、3Dプロット上で色付けされている。カラーバーはFDRのスケールを示す。5%未満のFDRは、赤のグラデーションで表示される(1H:トリプシンによる解析;1I:キモトリプシンによる解析)。J~Lは、トリプシン及びキモトリプシンで消化されたCDR3ペプチドの代表的な高品質MS/MSスペクトルである。図1Kの配列は、NTVYLEMNSLKPEDTAVYSCAAGVSDYGCYR(配列ID番号2656)である。図1Lの配列は、YCAAAEGLASGSY(配列ID番号2657)である。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたCDR3ペプチド同定、CDR3フラグメントの割合、及びCDR3長の3Dプロットである。FDRは、偽発見率である。CDR3同定のFDRは、3Dプロット上で色付けされている。カラーバーはFDRのスケールを示す。5%未満のFDRは、赤のグラデーションで表示される(1H:トリプシンによる解析;1I:キモトリプシンによる解析)。J~Lは、トリプシン及びキモトリプシンで消化されたCDR3ペプチドの代表的な高品質MS/MSスペクトルである。図1Kの配列は、NTVYLEMNSLKPEDTAVYSCAAGVSDYGCYR(配列ID番号2656)である。図1Lの配列は、YCAAAEGLASGSY(配列ID番号2657)である。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたCDR3ペプチド同定、CDR3フラグメントの割合、及びCDR3長の3Dプロットである。FDRは、偽発見率である。CDR3同定のFDRは、3Dプロット上で色付けされている。カラーバーはFDRのスケールを示す。5%未満のFDRは、赤のグラデーションで表示される(1H:トリプシンによる解析;1I:キモトリプシンによる解析)。J~Lは、トリプシン及びキモトリプシンで消化されたCDR3ペプチドの代表的な高品質MS/MSスペクトルである。図1Kの配列は、NTVYLEMNSLKPEDTAVYSCAAGVSDYGCYR(配列ID番号2656)である。図1Lの配列は、YCAAAEGLASGSY(配列ID番号2657)である。 NGS Nbデータベースのインシリコ解析により、Nbプロテオミクスに対するキモトリプシンの優位性が明らかにされる。ターゲットデータベース検索からの正規化されたCDR3ペプチド同定、CDR3フラグメントの割合、及びCDR3長の3Dプロットである。FDRは、偽発見率である。CDR3同定のFDRは、3Dプロット上で色付けされている。カラーバーはFDRのスケールを示す。5%未満のFDRは、赤のグラデーションで表示される(1H:トリプシンによる解析;1I:キモトリプシンによる解析)。J~Lは、トリプシン及びキモトリプシンで消化されたCDR3ペプチドの代表的な高品質MS/MSスペクトルである。図1Kの配列は、NTVYLEMNSLKPEDTAVYSCAAGVSDYGCYR(配列ID番号2656)である。図1Lの配列は、YCAAAEGLASGSY(配列ID番号2657)である。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。Nbプロテオミクスのためのパイプラインの概略図である。パイプラインは、ラクダ科動物の免疫化及び抗原特異的Nbの精製と、Nbのプロテオミクス解析(専用ソフトウェアAugur Llama及び深層学習によって促進される)と、抗原-Nb複合体のハイスループット統合構造解析との3つの主要構成要素で構成されている。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。GST、HSA及びPDZの3つの抗原のラクダ科動物免疫応答のELISA測定である。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。異なる抗原に対する一意のCDRの組み合わせ及び一意のCDR3配列の同定である。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。高品質NbGSTのCDR3マッピングについてのトリプシンとキモトリプシンとの比較である。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。3つの異なるプロテアーゼ(gluC、トリプシン、及びキモトリプシン)によるNbGSTCDR3同定の比較である。結果は、3つの独立した実験に基づいている。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。ランダムに選択された抗原特異的Nbの溶解度である。 抗原結合Nbプロテオームの信頼性の高い詳細な分析のためのハイブリッドプロテオミクスパイプラインの概略図である。抗原結合のための選択されたNbの検証である。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。キモトリプシンによるCDR3GSTフィンガープリントのラベルフリーMS定量化及びヒートマップ分析である。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。キモトリプシンによるラベルフリーCDR3GSTペプチド定量化の再現性と精度である。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。定量的プロテオミクスによって分類された異なるNb親和性クラスターの割合である。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。Nb ELISA親和性(O.D.450nmのLogIC50)とSPRK測定との線形相関(R=0.85)のである。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。異なるNbクラスターのELISA親和性の箱ひげ図である。p値は、スチューデントのt検定に基づいて計算された。*はp値<0.05、**はp値<0.01、***はp値<0.001、****はp値<0.0001を示し、nsは有意ではない、を示す。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。25のNbHSA(円)のELISA親和性をまとめたプロットであり、O.D.は450nmである。ELISAによってランク付けされた上位14のNbのK親和性は、SPRによって測定された(三角形)。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。11の可溶性NbPDZのELISA親和性をまとめたプロットである。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。3つの異なる親和性クラスターからの代表的なNbGSTのSPR動態解析である。G60(C1)の場合、Ka(1/Ms)=4.9e3、Kd(1/s)=5.9e-3、K=1.3μM;G95(C2)の場合、Ka(1/Ms)=1.4e4、Kd(1/s)=1.1e-3、K=77nM;G13(C3)の場合、Ka(1/Ms)=4.74e5、Kd(1/s)=1.7e-4、K=360pMである。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。高親和性NbHSAの代表的なSPR動態測定である。H14の場合、Ka(1/Ms)=2.5e5、Kd(1/s)=5.75e-6、K=22.3pMである。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。NbPDZP10のSPR動態測定である。P10の場合、Ka(1/Ms)=2.06e6、Kd(1/s)=9.03e-6、K=4.4pMである。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。異なるNb結合ダイナビーズ及びGSH樹脂によるGST(1nM)の免疫沈降である。 GST、HSA、及びPDZ結合のためのNbレパートリーの分類である。哺乳類のミトコンドリア外膜タンパク質25のPDZドメインの概略図である。NbPDZP10の蛍光顕微鏡分析である。Nbは、COS-7細胞株のネイティブミトコンドリア免疫染色のために、Alexa Fluor647によってコンジュゲートされた。Mitotrackerは、陽性対照のために使用された。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。ヒトとラクダの血清アルブミン間のpI及びハイドロパシーの配列変化である(上のパネル)。構造ドッキングによってマッピングされた主要なエピトープのヒートマップである(下のパネル)。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。4つの優勢なHSAエピトープのリボン表現である。HSAは灰色で表示される。E1、E2及びE3はそれぞれサーモン、オレンジ及びシアンである。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。静電ポテンシャル表面と3つの主要なエピトープとの共局在を示す表面表現である。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。収束架橋モデルに基づくHSAエピトープとそのフラクション(%)である(E1:残基57~62、135~169;E2:322~331、335、356~365、395~410;E3:29~37、86~91、117~123、252~290;E4:566~585、595、598~606及びE5:188~208、300~306、463~468)。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。HSA-Nb複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくDSSまたはEDC架橋は、青い棒として表示される。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。HSA-Nb複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくDSSまたはEDC架橋は、青い棒として表示される。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。HSA-Nb複合体の代表的な架橋モデルである。最高のスコアリングモデルが提示された。満足のいくDSSまたはEDC架橋は、青い棒として表示される。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。NbCDR3のグルタミン酸400(HSA)とアルギニン108との間の推定塩橋が示される。HSAとラクダ科動物アルブミンと間のローカル配列アラインメントが示される。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。野生型HSA及び点変異体(E400R)への結合に関する19の異なるNbのELISA親和性スクリーニング(ヒートマップ)である。*は親和性の低下を示す。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。HSA-Nb架橋モデルのRMSD(平均二乗偏差)のプロットである。 統合的構造手法によって明らかにされたHSA特異的Nbプロテオームの構造ランドスケープである。モデルを満たすHSA-Nbの全てのDSS及びEDC架橋の割合を示すバープロットである。 Nb親和性成熟のメカニズムである。高親和性(暗い)及び低親和性(明るい)のNbGST及びNbHSAのCDR3長分布である。 Nb親和性成熟のメカニズムである。異なるNbのpIの比較である。 Nb親和性成熟のメカニズムである。異なるNb間のCDRのpI及びハイドロパシーの比較である。 Nb親和性成熟のメカニズムである。異なるNb間のCDRのpI及びハイドロパシーの比較である。 Nb親和性成熟のメカニズムである。CDR3配列のプロットである。アラインメントは、15残基の長さが同じである1,000個の一意のCDR3配列のランダムな選択に基づいている。CDR3アーキテクチャの概略図:超可変「ヘッド」は濃い灰色であり、半可変の「トルソー」は淡い灰色である。 Nb親和性成熟のメカニズムである。CDR3ヘッド(NbGST及びNbHSA)及びCDR2(NbGST)のアミノ酸組成の円グラフである。上位6つの豊富な残基のみが表示される。 Nb親和性成熟のメカニズムである。NbGSTとNbHSAの両方のCDR3ヘッドに豊富にあるアミノ酸の相対的な変化である。K(リジン)/R(アルギニン)/H(ヒスチジン)の正電荷残基、D(アスパラギン酸)/E(グルタミン酸)の負電荷残基、Y(チロシン)の芳香族残基、G(グリシン)/S(セリン)の小さな柔軟アミノ酸が示される。 Nb親和性成熟のメカニズムである。高親和性NbHSAと低親和性NbHSAとの間のCDR3ヘッド上のY、G、及びSの相対量の比較である。それらの相対存在量は、それぞれの残基の相対位置の関数としてプロットされる。CDR3ヘッドの2つのチロシンを示す抗原-Nb複合体の代表的な構造(PDB:5F1O)は、抗原の深いポケットに挿入される。 Nb親和性成熟のメカニズムである。NbHSAのCDR3ヘッド上のELISA親和性と特定のアミノ酸の数の相関プロットである。ピアソン相関係数と統計値が表示される。 Nb親和性成熟のメカニズムである。NbGSTのCDR2上のELISA親和性と正に荷電した残基の数の相関プロットである。 Nb親和性成熟のメカニズムである。2つの代表的な畳み込みCDR3フィルターの配列ロゴ(高親和性NbHSAのフィルター14;深層学習モデルによって学習された低親和性NbHSAのフィルター3)である。図5Kの上部パネルの配列はSEQ ID NO:2661(YXXXXXX、残基2はY、L、D、R、またはIであり得る;残基3はKまたはGであり得る;残基4はR、Y、T、またはDであり得る;残基5はP、D、またはRであり得る、残基6はE、Y、V、P、W、またはDであり得る;残基7は、G、W、D、またはPであり得る)である。図5Kの下部パネルの配列はSEQ ID NO:2662(YXXXLXX、残基2はD、P、K、またはAであり得る;残基3は、F、P、D、またはAであり得る;残基4はH、T、またはGであり得る、残基6はG、Nであり得る;残基7は、R、P、D、またはYであり得る)である。 抗原結合に対するNbの優れた汎用性である。Aは、PDZドメインの静電ポテンシャル面と支配的なE2エピトープ(PDB:2JIK;E1:7~8、35~36、43、99~100、及びE2:25~26、45~46、48、78~79、82~83、85~86)である。Bは、高親和性NbPDZP10の長いCDR3(ディープサーモン)によるドッキングモデルである。Cは、PDZ-ペプチドリガンド複合体の結晶構造(PDB:1EB9)とPDZ-Nb複合体のドッキングモデルとの比較である。保存されたリガンド結合部位はシアンで示される。CDR3とペプチドリガンドの両方の側鎖が示される。Dは、11のNbの野生型または変異型(R46E:K48D)PDZへの結合に対するELISA親和性を示すヒートマップである。*は10分の1~100,000分の1のELISA親和性低下を示す。Eは、異なるNb(配列データベースの高親和性NbHSA、NbGST、NbPDZ及びNb)のCDR3長さ(上段)とpI(下段)との両方をプロット比較したものである。データはガウス関数で平滑化されている。Fは、異なるNb間のpI及びハイドロパシーの比較である。Gは、Nb CDR3ヘッドの上位6つの最も豊富なアミノ酸の円グラフである。Hは、Nbによる抗原結合の概略モデルである。 NGS Nbデータベースの分析と代表的な偽陽性CDR3ペプチドの同定である。Aは、Nb配列の正規化された変動性である。約50万の一意のNb配列がIMGT番号付けスキームに基づいてアラインメントされ、プロットが生成された。アミノ酸は、その特性(正、負、極性、及び非極性)に基づいてグループ化され、色分けされた。Bは、PeptideAtlasで同定された約150万個のヒトタンパク質の質量分布である。Cは、異なるプロテアーゼ(AspN、GluC、LysC、トリプシン、及びキモトリプシン)によるNbNGSデータベースのインシリコ消化とペプチド質量のプロットである。Dは、免疫されたラマのターゲットNb配列データベースと、別のネイティブラマのデコイデータベースとの重複である。各データベースには約50万の配列が含まれていた。Eは、トリプシンCDR3ペプチドの代表的な低品質y/偽陽性MS/MSスペクトル(HCD)である。Fは、キモトリプシンCDR3ペプチドのものである。スペクトルで一致する高分解能フラグメントイオンはほとんどなかった。図7Eの配列は、NTVYLQMNSLKPE(SEQ ID NO:2658)及びDTSIYYCAATPVFQSMSTMATESVYDYWGQGTQVTVSSEPK(SEQ ID NO:2659)である。図7Fの配列は、CAAGSGVGLY(SEQ ID NO:2660)である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。情報パイプラインの概略図である。1)ペプチド同定、2)Nbペプチドとタンパク質の品質管理、及び3)定量化と分類を含む3つのモジュールが提示された。Nbプロテオミクスデータは、最初に検索エンジンに対して検索される。検索エンジンを通過した最初の同定には、自動的にアノテーションを付けることができ、ペプチド及びタンパク質レベルでの様々な品質フィルターに基づいて評価できる。品質フィルターを通過した高品質のフィンガープリントペプチドを、定量化及びクラスター化できる。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。Nb CDR3スペクトルとカバー率品質フィルターの図である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。ペプチド分類法の説明図である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。同定されたNbPDZの230の一意のCDR3の系統樹及びWebロゴ分析である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。ラクダ科動物のBリンパ球からのHcAb可変ドメイン(VH)のPCR増幅の概略図である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。免疫した骨髄/血液から調製したcDNAライブラリーからのVH PCRアンプリコンをDNAゲル電気泳動したものである。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。異なる分画プロトコルに基づく分画NbGSTのSDS-PAGE分析である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。NbPDZのSDS-PAGE分析である。マルトース結合タンパク質(MBP)タグをPDZドメインに融合し、融合タンパク質を分離用の親和性ハンドルとして使用した。MBPは、定量化のための陰性対照として使用された。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。異なる抗原に対する一意のNb同定である。 NbプロテオミクスとNbバインダーの検証のための「Augur Llama」のインフォマティクスパイプラインである。キモトリプシンまたはトリプシンベースの方法のいずれかによって同定された抗原特異的Nbの比較である。Y軸は、検証のために無作為に選ばれた陽性ヒットの割合である。 NbGSTのプロテオーム定量化、生化学的検証、及び親和性測定である。異なる分画法に基づくNbGSTのプロテオーム定量化とヒートマップ分析である。 NbGSTのプロテオーム定量化、生化学的検証、及び親和性測定である。異なる分画NbペプチドサンプルのLC保持時間のピアソン相関である。 NbGSTのプロテオーム定量化、生化学的検証、及び親和性測定である。代表的なGSTビーズ結合アッセイである。GST結合樹脂を使用して、E.coli溶解から組み換えNbを特異的に分離した。赤い矢印は、濃縮されたNbを示す。陰性対照には不活化樹脂を使用した。 NbGSTのプロテオーム定量化、生化学的検証、及び親和性測定である。10の代表的なNbGSTのSPR動態測定である。 高品質のHSA及びPDZ Nbの特性評価である。代表的な高親和性NbHSAのSPR動態測定である。 高品質のHSA及びPDZ Nbの特性評価である。選択された高品質NbPDZのビーズ結合アッセイである。組み換えMBP融合PDZは、E.coli溶解物からNbを単離するための親和性ハンドルとして使用された。MBP結合樹脂を陰性対照に使用した。I:E.coli溶解物入力、B:ビーズコントロール、P:PDZによる親和性プルアウト。 GST-Nb複合体のハイブリッド構造解析である。Aは、3つの収束したエピトープを示す64,670のGST-Nb複合体の構造ドッキングによるヒートマップ分析である(E1:75~88、143~148;E2:33~43、107~127;E3:158~200、213~220)。Bは、3つの主要なGSTエピトープのリボン表現である。GST二量体は灰色で表示された。E1、E2及びE3は、それぞれ淡い黄色、オレンジ色、及び濃い青緑色であった。Cは、3つの主要なエピトープを持つ静電表面の共局在を示す表面表現である。Dは、収束した架橋モデルに基づくGSTエピトープとその存在量(%)を異なる色で表示した。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。高親和性Nbと低親和性Nbとの間のCDR3ヘッド上のアミノ酸の量の比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。高親和性Nbと低親和性Nbとの間のCDR3ヘッド上のアミノ酸の量の比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるNbのCDR1とCDR2との比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるNbのCDR1とCDR2との比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるNbのCDR1とCDR2との比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。異なるNbのCDR1とCDR2との比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。GST NbのCDR3ヘッド上のチロシン(Y)、グリシン(G)、及びセリン(S)の相対位置の比較である。 異なるNbのCDR配列の分析と、ラクダ科動物及びヒトアルブミンの配列保存である。ヒト血清アルブミンとラマ血清アルブミンの配列アラインメントである。保存されたアミノ酸が強調表示された。 異なる抗原エピトープ間の比較である。Aは、3つの異なる抗原(すなわち、PDZのE2、GST二量体のE3、及びHSAのE3)の主要なエピトープの形状の比較である。異なるエピトープは、抗原構造上で色分けされた。Bは、表面静電ポテンシャルとPDZドメインのE1エピトープである。Cは、異なるエピトープの溶媒アクセス可能な領域のプロットである。y軸は、平方オングストロームで異なるエピトープの面積を表す。Dは、エピトープの正味電荷である。Eは、CDR3ヘッド上の様々なアミノ酸の相対的存在量である。DBは、NGS Nb配列データベースである。Fは、異なる抗原特異的Nb間のCDR1とCDR2とのpIの比較である。 本開示の特定の実施形態で説明される方法及び手順を実行するコンピューティングシステムの例を示す。 A~Bは、深層学習アプローチに由来するアミノ酸配列フィルターの結果を示す。配列フィルターを使用して、高親和性結合HSA Nbから低親和性結合HSA Nbを正確に分離できる。図15Aの配列は、SEQ ID NO:2663(LXYRXXX、残基2はN、Y、V、またはGであり得る;残基5はLまたはWであり得る;残基6は、E、G、N、T、またはSであり得る;残基7はDまたはEであり得る)である。図15Bのシーケンスは、SEQ ID NO:2664(XXXXXXX、残基1は、C、F、Q、S、H、K、L、Y、またはRであり得る;残基2は、G、P、A、またはNであり得る;残基3は、E、S、G、T、P、V、Y、H、またはAであり得る;残基4は、C、A、S、P、またはDであり得る;残基5は、I、W、V、T、またはAであり得る;残基6は、M、Q、またはHであり得る;残基7は、K、Y、Q、V、またはWであり得る)である。 A~Cは、深層学習アプローチに由来するアミノ酸配列フィルターの結果を示す。配列フィルターを使用して、高親和性結合HSA Nbから低親和性結合HSA Nbを正確に分離できる。図16Aの配列は、SEQ ID NO:2665(TXXXLXX;残基2はD、P、K、またはAであり得る;残基3は、F、P、L、D、またはAであり得る;残基4は、H、T、またはGであり得る;残基6は、G、E、N、またはRであり得る;残基7は、R、P、G、D、またはYであり得る)である。図16Bの配列は、SEQ ID NO:2666(XXRXXXX;残基1は、E、G、W、D、またはIであり得る;残基2は、N、G、またはCであり得る;残基4は、A、H、またはDであり得る;残基5は、E、R、Y、A、またはTであり得る;残基6はG、A、またはPであり得る;残基7は、L、S、またはYであり得る)である。図16Cの配列は、SEQ ID NO:2667(XXGAQXW;残基1はRまたはAであり得る;残基2はKまたはLであり得る;残基6は、L、G、Y、またはWであり得る)である。
ここで報告されるのは、抗原が関与するNbレパートリーの詳細な発見、分類、及びハイスループットの構造特性評価のための統合プロテオームプラットフォームである。本技術の感度及び堅牢性は、ミトコンドリア膜に由来する小さな弱い免疫原性抗原を含む、免疫応答における3桁にわたる抗原を使用して検証された。何万もの非常に多様で特異的なNbファミリーが、物理化学的特性に従って明確に同定され定量化された。かなりのフラクションがサブnMの親和性を有していた。ハイスループット構造モデリング、構造プロテオミクス、及びディープラーニングを使用して、100,000超もの抗原-Nb複合体が、免疫原性及びNb親和性成熟の理解を大幅に進めるために体系的に調査された。この研究は、哺乳動物の体液性免疫系の驚くべき効率、特異性、多様性、及び多用途性を明らかにした。
用語
本明細書及び特許請求の範囲で使用するとき、単数形「a」、「an」、及び「the」は、文脈に明らかに別途の指示がない限り、複数の指示対象を含む。例えば、用語「a cell」は、それらの混合物を含む複数の細胞を含む。
量、割合など測定可能な値を指すときに本明細書で使用される「約」という用語は、測定可能な値から±20%、±10%、±5%、または±1%の変動を包含することを意味する。
被験者への「投与」または「投与すること」には、薬剤を被験者に導入するまたは送達する任意の経路が含まれる。投与は、経口、静脈内、腹腔内、鼻腔内、吸入などを含む任意の適切な経路によって行うことができる。投与としては、自己投与及び他者による投与が挙げられる。
「抗体」という用語は、本明細書では広い意味で使用され、ポリクローナル抗体、モノクローナル抗体、及び二重特異性抗体を含む。無傷の免疫グロブリン分子に加えて、「抗体」という用語にも含まれるのは、それらの免疫グロブリン分子の断片またはポリマー、ならびに免疫グロブリン分子またはその断片のヒト型またはヒト化型である。「抗体」とは、通常、2つの同一の軽(L)鎖及び2つの同一の重(H)鎖から構成される約150,000ダルトンのヘテロ四量体糖タンパク質である。各重鎖は、一方の端にある可変ドメイン(V)と、その後に続く、いくつかの定常ドメインとを有する。各軽鎖は、一端に可変ドメイン(V)を有し、その他端に定常ドメインを有する。
本明細書で使用する場合、「抗原」または「免疫原」という用語は、被験者に免疫応答を誘導することができる物質、典型的にはタンパク質、核酸、多糖、毒素、または脂質を指すために互換的に使用される。この用語はまた、タンパク質であって、(直接、またはそのタンパク質をコードするヌクレオチド配列もしくはベクターを被験者に投与することによって)被験者に投与されると、そのタンパク質に対する体液性及び/または細胞型の免疫応答を誘発できるという意味で免疫学的に活性なタンパク質を指す。
「抗原決定基」及び「エピトープ」という用語もまた、本明細書では交換可能に使用することができ、(本発明のナノボディなどの)抗原結合分子によって認識される抗原上または標的上の位置を指す。エピトープは、隣接アミノ酸(「直線状エピトープ」)、またはタンパク質の3次折り畳みによって並列した非隣接アミノ酸の両方から形成され得る。後者のエピトープは、少なくともいくつかの不連続なアミノ酸によって作られるものであり、本明細書では「立体構造エピトープ」と記載されている。エピトープは、通常、少なくとも3個、より一般的には、少なくとも5個または8~10個のアミノ酸を固有の空間構造に含む。エピトープの空間構造を決定する方法としては、例えば、X線結晶構造解析及び2次元核磁気共鳴が挙げられる。例えば、Epitope Mapping Protocols in Methods in Molecular Biology, Vol. 66, Glenn E. Morris, Ed (1996)を参照されたい。
「抗原結合部位」、「結合部位」及び「結合ドメイン」という用語は、抗原決定基またはエピトープに結合する、ナノボディなどのポリペプチドの特定の要素、部分、またはアミノ酸残基を指す。
本明細書で使用される「生物学的サンプル」という用語は、生物組織または生物体液のサンプルを意味する。そのようなサンプルには、動物から単離された組織が含まれるが、これに限定されない。生物学的サンプルには、生検サンプル及び剖検サンプル、組織学的目的のために採取された凍結切片、血液、血漿、血清、喀痰、便、涙、粘液、毛髪、及び皮膚などの組織切片も含まれ得る。生物学的サンプルには、患者組織に由来する外植片、ならびに初代及び/または形質転換細胞培養物も含まれる。生物学的サンプルは、動物から細胞のサンプルを取り出すことによって提供することができるが、以前に単離した(例えば、別の者によって別の時点で、及び/または別の目的のために単離された)細胞を使用することによって、または本明細書に開示される方法をインビボで実施することによって、達成することもできる。治療または転帰履歴を有するような保存組織を使用することもできる。
「cDNAライブラリー」という用語は、本明細書では、所与の生物のトランスクリプトームの一部を構成する異なるcDNAフラグメントの組み合わせを指す。
「CDR」及び「相補性決定領域」という用語は、交換可能なようにして使用され、抗原への結合に関与する抗体の可変鎖の一部を指す。したがって、CDRは「抗原結合部位」の一部であるか、または「抗原結合部位」である。いくつかの実施形態では、ナノボディは、集合的に抗原結合部位を形成する3つのCDRを含む。
本明細書で使用される、「含む(comprising)」という用語及びその変形は、「含む(including)」という用語及びその変形と同義で用いられ、オープンな非限定的用語である。「含む(comprising)」及び「含む(including)」という用語は、様々な実施形態を説明するために本明細書で使用されているが、「含む(comprising)」及び「含む(including)」の代わりに「本質的に~からなる(consisting essentially of )」及び「~からなる(consisting of)」という用語を使用して、より具体的な実施形態を提供することがあり、また開示される。
「組成物」は、有益な生物学的効果を有する任意の薬剤を指す。有益な生物学的効果には、例えば、障害または他の望ましくない生理学的状態の治療などの治療効果と、例えば、障害または他の望ましくない生理学的状態の予防などの予防効果との両方が含まれる。これらの用語はまた、細菌、ベクター、ポリヌクレオチド、細胞、塩、エステル、アミド、プロエージェント、活性代謝物、異性体、断片、類似体などを含むが、これらに限定されない、本明細書で具体的に言及される有益な薬剤の薬学的に許容される薬理学的に活性な誘導体を包含する。「組成物」という用語が使用される場合、そして、または特定の組成物が具体的に同定される場合、その用語は、組成物自体、ならびに薬学的に許容される薬理学的に活性なベクター、ポリヌクレオチド、塩、エステル、アミド、プロエージェント、コンジュゲート、活性代謝物、異性体、フラグメント、類似体などを含むことを理解されたい。
「対照」は、比較目的で実験に使用される他の被験者またはサンプルである。対照は「陽性」または「陰性」であり得る。
「有効量」は、限定されないが、医学的状態または医的障害(例えば、がん)の症状または徴候を改善、回復、軽減、予防、または診断できる量を包含する。明確にまたは文脈によって別段の指示がない限り、「有効量」は、状態を改善するのに十分な最小量に限定されない。疾患または障害の重症度、ならびに疾患または障害を予防、治療、または軽減する治療の能力は、バイオマーカーまたは臨床パラメータによって、何の限定を意味することなく、測定することができる。いくつかの実施形態では、用語「組み換えナノボディの有効量」は、がんを予防、治療、または軽減するのに十分な組み換えナノボディの量を指す。
「フラグメント」または「機能性フラグメント」は、フラグメントの活性が、未修飾ペプチドまたは未修飾タンパク質と比較して、著しく変化または低下しない限り、他の配列に結合しているか否かに関わらず、特定の領域または特異的アミノ酸残基の挿入、欠失、置換、または他の選択された修飾を含むことができる。これらの修飾は、ジスルフィド結合が可能なアミノ酸を除去または追加すること、その生物学的寿命を延長すること、その分泌特性を変更することなどのような、いくつかの追加の特性を提供し得る。いずれの場合も、機能性フラグメントは、HSAへの結合及び/またはがんの改善などの生理活性特性を有する必要がある。
「フラグメント化カバー率の割合」という用語は、次の式を使用して得られる割合のことをいう。
f(x,酵素)は、酵素によって消化されたペプチドのフラグメント化カバー率(%)を計算する関数である。
xは、ペプチドがマッピングされたCDR3の長さである。
f(x,キモトリプシン)=0.0023×-0.0497x+0.7723, x[5,30]
f(x,トリプシン)=0.00006x-0.00444x+0.9194, x[5,30]
いくつかの実施形態では、計算されたフラグメント化カバー率の割合の最小値が必要とされる。他の態様またはさらなる態様では、必要とされる最小の計算されたフラグメント化カバー率の割合は約30%である。いくつかの態様では、トリプシンが酵素である場合、必要とされる最小の計算されたフラグメント化カバー率の割合は約50%であり、キモトリプシンが酵素である場合、約40%である。
本明細書で使用される場合、「機能的選択ステップ」は、ナノボディが機能特性に基づいて異なるフラクションまたはグループに分割される方法である。いくつかの実施形態では、機能特性は、ナノボディまたはCD3、CD2、もしくはCD1領域の抗原親和性である。他の実施形態では、機能特性は、ナノボディの熱安定性である。他の実施形態では、機能特性は、ナノボディの細胞内浸透である。したがって、本発明は、相補性決定領域(CDR)3、2または1の領域のナノボディアミノ酸配列(CDR3、CDR2またはCDR1配列)群を同定する、減数されたCDR3、CDR2またはCDR1配列が対照と比較して偽陽性である、方法であって、抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、ライブラリー中の各cDNAの配列を同定することと、抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、機能的選択ステップを実行することと、ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、消化産物の質量分析を実行して、質量分析データを取得することと、質量分析データと相関する、ステップcで同定された配列を選択することと、ステップgの配列内のCDR3、CDR2またはCDR1領域の配列を同定することと、ステップhのCDR3、CDR2またはCDR1領域の配列から、算出されたフラグメント化カバー率の割合未満の配列を除外することと、を含み、非除外配列が、減数された偽陽性のCDR3、CDR2またはCDR1配列を有する群を含む、方法を含む。機能的選択ステップに続く方法ステップは、機能選択によって作成された各異なるフラクションまたは群に対して別々に実行できることを理解されたい。
本発明のアミノ酸配列、化合物またはポリペプチドの「半減期」は、一般に、例えば配列または化合物の分解、及び/または自然メカニズムによる配列または化合物のクリアランスまたは隔離のため、アミノ酸配列、化合物またはポリペプチドの血清濃度がインビボで50%だけ減少するのにかかる時間として定義され得る。本発明のナノボディ、アミノ酸配列、化合物またはポリペプチドのインビボ半減期は、例えば、以下のKenneth, A et al., Chemical Stability of Pharmaceuticals: A Handbook for Pharmacists;Peters et al., Pharmacokinete analysis: A Practical Approach (1996);“Pharmacokinetics”, M Gibaldi & D Perron, published by Marcel Dekker, 2nd Rev. edition (1982)の薬物動態解析のような既知の任意の方法で決定することができる。
用語「同一性」または「相同性」は、配列全体の最大パーセント同一性を達成するために、必要ならば、配列をアラインメントしギャップを導入した後で、配列同一性の一部として保存的置換を全く考慮せず、比較される対応する配列の塩基または残基と同一である候補配列中のヌクレオチド塩基またはアミノ酸残基の割合を意味すると解釈されるものとする。別の配列に対して特定の割合(例えば、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%,94%、95%、96%、97%、98%、99%以上)の「配列同一性」を有するポリヌクレオチドまたはポリヌクレオチド領域(あるいはポリペプチドまたはポリペプチド領域)は、アラインメントされた場合、2つの配列を比較する際に、その割合の塩基(またはアミノ酸)が同じであることを意味する。このアラインメント及びパーセント相同性または配列同一性は、当技術分野で知られているソフトウェアプログラムを使用して決定することができる。このようなアラインメントは、例えば、Needleman et al. (1970) J. Mol. Biol. 48: 443-453の方法を使用して提供することができ、Alignプログラム(DNAstar,Inc.)などのコンピュータプログラムによって便利に実施される。いくつかの実施形態では、パーセント同一性は、比較される配列の全長に沿って決定される。
本明細書で使用される「増加」または「増加する」という用語は、一般に、静的に有意な量による増加を意味する。誤解を避けるために、「増加した」とは、基準レベルと比較して少なくとも10%の増加、例えば、少なくとも約20%、または少なくとも約30%、または少なくとも約40%、または少なくとも約50%、または少なくとも約60%、または少なくとも約70%、または少なくとも約80%、または少なくとも約90%の増加、または100%まで(100%を含む)の増加、または基準レベルと比較して10~100%の間の任意の増加、または基準レベルと比較して、少なくとも約2倍、または少なくとも約3倍、または少なくとも約4倍、または少なくとも約5倍、または少なくとも約10倍の増加、または2倍から10倍以上の間の任意の増加を意味する。
本明細書で使用される「単離する」という用語は、生物学的サンプル、すなわち、血液、血漿、組織、エキソソーム、または細胞からの単離を指す。本明細書で使用するとき「単離された」という用語は、例えば核酸の文脈で使用される場合、単離前に核酸が結合されていた他の成分を、少なくとも60%、少なくとも75%、少なくとも90%、少なくとも95%、少なくとも98%、及びさらに少なくとも99%含まない目的の核酸を指す。
「質量分析」という用語は、サンプル中に存在する1つ以上の分子の質量対電荷比(m/z)の測定を意味する。「質量分析データ」とは、サンプル中に存在する1つ以上の分子の質量、電荷、質量対電荷比、分子量、及び/またはアミノ酸同一性またはアミノ酸配列のことをいう。いくつかの実施形態では、質量分析データは、サンプル中に存在する分子のアミノ酸配列である。質量分析データと「相関する」、cDNA配列を含む配列は、本方法の質量分析ステップで決定された予想される同一または非常に類似したアミノ酸配列を有する。いくつかの実施形態では、配列は、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、または約99%の類似性または同一性がある場合に質量分析データと相関する。いくつかの実施形態では、配列は、約90~100%の類似性または同一性がある場合に質量分析データと相関する。
本明細書で使用するとき、「ナノボディ」、「VH」、「VH抗体フラグメント」という用語は、区別なく使用され、参照によりその全体が組み込まれるPCT公開第WO94/04678号に記載されているラクダ科動物に由来するような、軽鎖を全く有しないラクダ科で見られるタイプの抗体の単一重鎖の可変ドメインを指定する。本明細書で使用するとき「単一ドメイン抗体」は、ナノボディ及びFcドメインを指す。
本明細書で使用される「核酸」という用語は、ヌクレオチド、例えば、デオキシリボヌクレオチド(DNA)またはリボヌクレオチド(RNA)から構成されるポリマーを意味する。本明細書で使用される「リボ核酸」及び「RNA」という用語は、リボヌクレオチドから構成されるポリマーを意味する。本明細書で使用される「デオキシリボ核酸」及び「DNA」という用語は、デオキシリボヌクレオチドから構成されるポリマーを意味する。
本明細書で使用される場合、「作動可能に連結された」とは、単一のポリペプチド鎖内のポリペプチドセグメントの配置を指し、個々のポリペプチドセグメントは、限定されないが、タンパク質、そのフラグメント、連結ペプチド、及び/またはシグナルペプチドであり得る。作動可能に連結されたという用語は、異なるセグメント間にアミノ酸が介在していない単一のポリペプチドまたはそのフラグメント内の異なる個々のポリペプチドの直接融合を指し、さらには個々のポリペプチドが、1つ以上の介在アミノ酸を含む「リンカー」を介して互いに接続されている場合を指すこともある。
本明細書で使用される「減少した」、「減少させる」、「減少」、または「減少する」という用語は、一般に、統計的に有意な量の減少を意味する。ただし、誤解を避けるために、「減少した」とは、基準レベルと比較して少なくとも5%の減少、例えば少なくとも約10%、または少なくとも約20%、または少なくとも約30%、または少なくとも約40%、または少なくとも約50%、または少なくとも約60%、または少なくとも約70%、または少なくとも約80%、または少なくとも約90%の減少、または100%まで(100%を含む)の減少(すなわち、基準サンプルと比較して消失レベル)、または基準レベルと比較して10~100%の間の任意の減少を意味する。
「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、交換可能なようにして使用され、デオキシリボヌクレオチドもしくはリボヌクレオチドまたはそれらの類似体のいずれかの任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の3次元構造を持つことができ、既知または未知の任意の機能を実行することができる。以下は、ポリヌクレオチドの非限定的な例である。すなわち、遺伝子または遺伝子フラグメント、エキソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、組み換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブ、及びプライマーである。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。ヌクレオチド構造への修飾は、あるならば、ポリマーの組み立ての前または後に付与することができる。ヌクレオチドの配列は、非ヌクレオチド成分により中断され得る。ポリヌクレオチドは、例えば標識成分との共役により、重合後にさらに修飾され得る。この用語はまた、二本鎖分子及び一本鎖分子の両方に当てはまる。別途明記または要求されない限り、ポリヌクレオチドである本発明の任意の実施形態は、二本鎖形態と、その二本鎖形態を構成することが知られているかまたは予想される2つの相補的な一本鎖形態のそれぞれとの両方を包含する。
「ポリペプチド」という用語は、その最も広い意味で使用されて、2つ以上のサブユニットアミノ酸、アミノ酸類似体、またはペプチド模倣薬の化合物を指す。サブユニットは、ペプチド結合によって連結され得る。別の実施形態では、サブユニットは、他の結合、例えばエステル、エーテルなどによって連結されてもよい。本明細書で使用するとき、用語「アミノ酸」は、グリシン及びDまたはLの両方の光学異性体、ならびにアミノ酸類似体及びペプチド模倣薬を含む天然及び/または非天然または合成のアミノ酸のいずれかを指す。アミノ酸が3つ以上のペプチドは、ペプチド鎖が短い場合、一般にオリゴペプチドと呼ばれる。ペプチド鎖が長い場合、ペプチドは一般にポリペプチドまたはタンパク質と呼ばれる。用語「ペプチド」、「タンパク質」、及び「ポリペプチド」は、本明細書では互換性があるようにして使用される。
ポリペプチドに関して使用される「組み換え」は、本明細書では、天然には存在しない2つ以上のポリペプチドの組み合わせを指す。
「特異性」という用語は、特定の抗原結合分子(本発明のナノボディなど)が結合できる抗原または抗原決定基の異なるタイプの数を指す。特異性の低いナノボディは、単一の抗原結合部位または結合ドメインを介して複数の異なるエピトープ(またはポリペプチド領域)に結合するが、特異性の高いナノボディは、単一の抗原結合部位または結合ドメインを介して1つまたは少数のエピトープ(またはポリペプチド領域)に結合する。いくつかの実施形態では、少数のエピトープ(またはポリペプチド領域)は、例えば異種間エピトープなど、類似している、または非常に類似している。本明細書で使用するとき、「特異的に結合する」という用語は、ナノボディに関して本明細書で使用される場合、他のエピトープ(またはポリペプチド領域)と比較して、ナノボディがエピトープ(またはポリペプチド領域)に優先的に結合することを指す。特異的結合は、結合親和性、及び結合が行われる条件のストリンジェンシーに依存し得る。一例では、ストリンジェントな条件下で高親和性結合が存在する場合に、ナノボディはエピトープに特異的に結合する。いくつかの実施形態では、本明細書に記載のHSA結合ポリペプチドまたはナノボディは、ヒト血清アルブミンに特異的に結合する。
抗原結合分子(例えば、HSA結合ポリペプチド、本発明のナノ抗体)の特異性は、親和性及び/または結合活性に基づいて決定できることを理解すべきである。親和性は、抗原と抗原結合分子との解離の平衡定数(K)で表され、抗原決定基と抗原結合分子上の抗原結合部位との間の結合強度の尺度である。Kの値が小さいほど、抗原決定基と抗原結合分子との間の結合強度が強くなる(あるいは、親和性は、親和定数(K)として表すこともでき、これは1/Kである)。親和性を決定する方法は、当業者によく知られている。結合活性は、抗原結合分子(HSA結合ポリペプチド、及び本発明のナノボディなど)と関連抗原との間の結合強度の尺度である。結合活性は、抗原決定基と抗原結合分子上のその抗原結合部位との間の親和性、及び抗原結合分子上に存在する関連結合部位の数の両方に関連している。典型的には、抗原結合タンパク質(HSA結合ポリペプチド、及び本発明のナノボディなど)は、10-5~10-12モル/リットル以下、好ましくは10-7~10-12モル/リットル以下、より好ましくは10-8~10-12モル/リットルの解離定数(K)(すなわち、10~1012リットル/モル以上、好ましくは10~1012リットル/モル以上、より好ましくは10~1012リットル/モルの結合定数(K))でそれらの抗原に結合する。いくつかの実施形態では、Ka(オンレート、1Ms)は、約10、10、10、10、10、1010、または1011である。いくつかの実施形態では、Kaは約10である。いくつかの実施形態では、Kd(オフレート、s)は、約10-5、10-6、10-7、10-8、10-9、10-10、または10-11である。いくつかの実施形態では、Kは約10-7である。いくつかの実施形態では、本明細書に開示される抗原結合タンパク質は、約10-9モル/リットル未満のKでその抗原に結合する。10μMを超えるK値は、一般に非特異的結合を示すと見なされる。当業者には明らかであるように、解離定数は、実際の解離定数または見かけの解離定数であり得る。
「被験者」という用語は、本明細書では、霊長類(例えば、ヒト)、ウシ、ヒツジ、ヤギ、ウマ、イヌ、ネコ、ウサギ、ラット、マウスなどを含むがこれらに限定されない哺乳動物などの動物を含むと定義される。いくつかの実施形態では、被験者はヒトである。
組成物及び方法
いくつかの態様において、本明細書には、相補性決定領域(CDR)3、2または1の領域のナノボディアミノ酸配列(CDR3、CDR2またはCDR1配列)群を同定する、減数されたCDR3、CDR2及び/またはCDR1配列が対照と比較して偽陽性である、方法が開示される。本明細書における「偽陽性」という用語は、何かが存在しないにもかかわらず、それが存在することを示す結果を指す。本明細書では、「配列は偽陽性である」という表現は、試験抗原に特異的に結合しないCDR3、CDR2及び/またはCDR1配列、または試験抗原に特異的に結合することができないナノボディに含まれるCDR3、CDR2及び/またはCDR1配列のことをいう。偽陽性CDR3、CDR2及び/またはCDR1配列の数または量は、フラグメント化フィルターを、トリプシン処理サンプルについては少なくとも約30%(例えば、少なくとも約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%)に、及び/またはキモトリプシン処理サンプルについては少なくとも約30%(例えば、少なくとも約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%)に設定して、本明細書に開示の方法を使用して減らすことができることを理解されたい。いくつかの実施例では、偽陽性のCDR3、CDR2及び/またはCDR1配列は、フラグメント化フィルターを、トリプシン処理サンプルについては約50%に、及び/またはキモトリプシン処理サンプルについては約40%に設定して、本明細書に開示される方法を使用して、ほとんど除去することができる。
したがって、開示された、CDR3、CDR2及び/またはCDR1配列を同定する方法は、対照と比較して偽陽性であるCDR3、CDR2及び/またはCDR1配列の数を減少させることができる。この減少は、例えば、本明細書に記載の方法を使用せずに同定された偽陽性CDR3、CDR2及び/またはCDR1配列の数と比較して、少なくとも約2倍、少なくとも約3倍、少なくとも約4倍、少なくとも約5倍、少なくとも約10倍、少なくとも約20倍、少なくとも約50倍、または少なくとも約100倍の減少になり得る。
いくつかの実施形態では、本方法は、
a.抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
b.血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、
c.cDNAライブラリー中の各cDNAの配列を同定することと、
d.抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、
e.ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
f.消化産物の質量分析を実行して、質量分析データを取得することと、
g.質量分析データと相関する、ステップcで同定された配列を選択することと、
h.ステップgの配列内のCDR3、CDR2及び/またはCDR1領域の配列を同定することと、
i.ステップhのCDR3、CDR2及び/またはCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、選択された配列が、減数された偽陽性のCDR3、CDR2及び/またはCDR1配列を有する群を含む、選択することと、を含む。
いくつかの実施形態では、本方法は、
a.抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
b.血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、
c.ライブラリー中の各cDNAの配列を同定することと、
d.抗原の免疫を持つラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、
e.ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
f.消化産物の質量分析を実行して、質量分析データを取得することと、
g.質量分析データと相関する、ステップcで同定された配列を選択することと、
h.ステップgの配列内のCDR3、CDR2及び/またはCDR1領域の配列を同定することと、
i.ステップhのCDR3、CDR2及び/またはCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、フラグメント化カバー率の割合が、ステップeでキモトリプシンが使用される場合、式f(x,キモトリプシン)=0.0023x2-0.0497x+0.7723,x[5,30]によって決定され、またはステップeでトリプシンが使用される場合、式f(x,トリプシン)=0.00006x2-0.00444x+0.9194, x[5,30]によって決定され、xは、CDR3、CDR2及び/またはCDR1領域の配列の長さである、選択することと、を含み、
j.ステップiの選択された配列が、減数された偽陽性のCDR3、CDR2及び/またはCDR1配列を有する群を含む。
いくつかの態様において、ステップiにおける選択されたCDR3、CDR2及び/またはCDR1領域配列は、約30%である最低限必要なフラグメント化カバー率の割合を有する。いくつかの態様において、ステップiにおける選択されたCDR3、CDR2及び/またはCDR1領域配列は、約50%である最低限必要なフラグメント化カバー率の割合を有し、ステップeでトリプシンが使用される。いくつかの実施形態において、ステップiにおける選択されたCDR3、CDR2及び/またはCDR1領域配列は、約40%である最低限必要なフラグメント化カバー率の割合を有し、ステップeでキモトリプシンが使用される。
ステップbのナノボディcDNAライブラリーは、免疫化される被験者の生物学的サンプル(例えば、血液サンプルまたは骨髄)から取得されることを理解されたい。いくつかの実施形態では、cDNAライブラリーはB細胞から取得される。cDNA(クローン化cDNAまたは相補的DNA)ライブラリーは、逆転写技術を使用して生物学的サンプル(例えば、血液サンプルまたは骨髄サンプル)中のmRNAから生成されるcDNAの組み合わせである。cDNAライブラリーを作製する方法は、当技術分野で周知である。したがって、いくつかの実施形態では、ステップbは、生物学的サンプル(例えば、血液サンプルまたは骨髄サンプル)からmRNAを単離するステップ、及び/または単離されたmRNAをcDNAに逆転写するステップをさらに含む。
次いで、生成されたcDNAは、ステップcに記載のように配列決定される。いくつかの実施形態では、ステップcは、特異的プライマー(例えば、SEQ ID NO:2646及びSEQ ID NO:2647)を使用して、可変ドメインからCH2ドメインまでのラクダ科動物IgG重鎖cDNA配列を増幅するステップ、DNAゲル電気泳動を用いて、CH1ドメインを欠くVH遺伝子を従来のIgG(CH1ドメインを有する)から分離するステップ、セカンドフォワードプライマー(例えば、SEQ ID NO:2648)及びセカンドリバースプライマー(例えば、SEQ ID NO:2649)を使用して、フレームワーク1からフレームワーク4までを再増幅するステップ、この第2のPCRのアンプリコンを(例えば、PCRクリーンアップキットまたは単離キットを使用して)精製するステップ、(例えば、シークエンシング解析のためのフォワードプライマーSEQ ID NO:2650及びリバースプライマーSEQ ID NO:2651を用いて)シークエンシング解析(例えば、MiSeqシークエンシング解析)のためのアダプターを追加するプライマーを用いた別のPCRのステップをさらに含む。シークエンシング解析の方法には、例えば、単一分子リアルタイム(SMRT)シークエンシング、ナノポアDNAシークエンシング、超並列シグネチャーシークエンシング(MPSS)、ポロニーシークエンシング、454パイロシークエンシング、Illumina(Solexa)シークエンシング、コンビナトリアルプローブアンカー合成(cPAS)、SOLiDシークエンシング、またはMiSeqシークエンシングがあり得る。
上記のステップdは、ステップa、b、及び/またはcと同時に、ステップa、b、及び/またはcより前に、またはステップa、b、及び/またはcの後に実行することができる。いくつかの実施例では、ステップdは、血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む。親和性分離法は、例えば、プロテインGセファロース親和性クロマトグラフィー、プロテインAセファロース親和性クロマトグラフィー、ヒドロキシルアパタイトクロマトグラフィー、ゲル電気泳動、または透析を含む、当技術分野で知られている任意の親和性分離法であり得る。プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーの2つは、よく知られた親和性クロマトグラフィー法である(Grodzki A.C., Berenstein E. (2010) Antibody Purification: Affinity Chromatography - Protein A and Protein G Sepharose. In: Oliver C., Jamur M. (eds) Immunocytochemical Methods and Protocols. Methods in Molecular Biology (Methods and Protocols), vol 588. Humana Press.)。この方法は、タンパク質とクロマトグラフマトリックスに固定化された特異的リガンドとの間の可逆的相互作用に依存している。サンプルは、静電的及び疎水性相互作用、ファンデルワールス力、及び/または水素結合の結果として、リガンドへの特異的結合にとって有利に働く条件の下で適用される。結合していない物質を洗い流した後に、緩衝液条件を脱着に適した条件に変更することにより、結合したタンパク質が回収される。プロテインAセファロース親和性クロマトグラフィーとプロテインGセファロース親和性クロマトグラフィーとは、抗体のFc領域に対するプロテインAまたはGの結合親和性及び特異性が高いため、抗体の精製に一般的に使用されている。いくつかの実施形態では、ステップdの1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む。
いくつかの実施例では、ステップdはまた、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップeからステップiまでを各フラクションに対して個別に実行し、抗原に対する各異なるステップiのCDR3、CDR2及び/またはCDR1領域配列の親和性を、それぞれ、ナノボディフラクションのそれぞれにおけるCDR3、CDR2及び/またはCDR1領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、抗原にコンジュゲートされた樹脂である。いくつかの実施形態では、抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び抗原に結合された樹脂である。
「ストリンジェンシーの程度」という用語は、異なる濃度の塩緩衝液(例えば、中性pH緩衝液中約0.1M~約20MのMgCl、好ましくは中性pH緩衝液中約1M~約10MのMgCl、または好ましくは中性pH緩衝液中約1M~約4.5MのMgCl)、異なるpH値のアルカリ性溶液(例えば、1~100mMNaOH、pH約11、12及び13)、異なるpH値の酸性溶液(例えば、0.1Mグリシン、pH約3、2及び1)、またはそれらの組み合わせを指すことが理解され、本明細書において企図されるべきである。「異なるナノボディ画分」または「異なる生化学画分」という用語は、異なる程度のストリンジェンシー下で抗原結合固体支持体(例えば、樹脂)から溶出されるナノボディの異なる画分を指すことも理解されたい。高塩濃度、高酸性または高アルカリ性の条件に最も耐性のあるナノボディは、抗原に対する親和性が最も高くなる。
ステップeなどの本明細書における「消化産物」という用語は、酵素(例えば、トリプシン、キモトリプシン、LysC、GluC、及びAspNを含む)による消化ステップ後のペプチドの混合物を指す。いくつかの実施例では、ナノボディは、トリプシン(Pierce(商標)トリプシンプロテアーゼ、MSグレード、カタログ番号:90057など)、キモトリプシン(Pierce(商標)キモトリプシンプロテアーゼ(TLCK処理済み)、MSグレード、カタログ番号:90056など)で消化される。90056)、LysC(またはPierce(商標)Lys-Cプロテアーゼ、MSグレード、カタログ番号:90051などのLys-Cプロテアーゼ)、GluC(またはPierce(商標)Glu-Cプロテアーゼ、MSグレード、カタログ番号:90054などのGlu-Cプロテアーゼ)、及び/またはAspN(または、Pierce(商標)Asp-NProtease、MSグレード、カタログ番号:90053などのAsp-Nプロテアーゼ)で消化されて、対応する消化産物が作成される。トリプシン、キモトリプシン、LysC、GluC、及びAspNは、タンパク質を消化する酵素である。これらの酵素によるナノボディ消化の切断規則は次のとおりである。
トリプシン:C末端からK/R、Pが続かない
キモトリプシン:C末端からW/F/L/Y、Pが続かない
GluC:C末端からD/E、Pが続かない
AspN:N末端からD
LysC:C末端からK
消化ステップは、約2℃~約60℃の温度(例えば、約2℃、4℃、6℃、8℃、10℃、12℃、14℃、16℃、18℃、20℃、22℃、24℃、26℃、28℃、30℃、32℃、34℃、36℃、38℃、40℃、42℃、44℃、46℃、48℃、50℃、52℃、54℃、56℃、58℃、または60℃)で、約5分間、10分間、30分間、45分間、1時間、2時間、時間、4時間、6時間、8時間、10時間、12時間、14時間、16時間、18時間、20時間、22時間、24時間、36時間、48時間、または72時間行うことができる。

ステップfは、消化産物の質量分析を実行して、質量分析データを取得することを含む。ペプチド分析のために質量分析を使用する方法は、当技術分野で周知である。いくつかの実施形態では、本明細書の質量分析は、ガスクロマトグラフィー(GC-MS)、液体クロマトグラフィー(LC-MS)、キャピラリー電気泳動(CE-MS)、イオン移動度分析-質量分析(IMS/MSまたはIMMS)、マトリックス支援レーザー脱離イオン化(MALDI-TOF)、表面増強レーザー脱離イオン化(SELDI-TOF)、またはタンデムMS(MS-MS)と組み合わせて実施される。このステップでは、アミノ酸の質量、及びステップbのcDNAライブラリーから翻訳されたポリペプチドのデータベースにおける配列相同性検索に基づいて、サンプル中のナノボディまたはナノボディの一部の配列を同定することができる。いくつかの実施例では、各ナノボディ画分から別々に消化産物のスペクトルの分析及び生成を行うために、質量分析法が使用される。いくつかの実施例では、消化産物のスペクトルは、強度対m/z(質量対電荷比)プロットとして存在する電子イオン化データを表す。
本明細書において、ナノボディの配列決定は質量分析のみに基づくものではないことを理解すべきである。この配列は、質量分析法によって同定された配列を、シークエンシングによって同定されたcDNAライブラリーの配列と照合/相関させることによって決定される。次に、一致した配列が選択される。したがって、ステップgは、質量分析データと相関するステップcで同定された配列を選択することを含み、ステップhは、ステップgからの配列中のCDR3領域の配列を同定することを含む。
ステップiは、ステップhのCDR3、CDR2及び/またはCDR1領域配列から、必要なフラグメント化カバー率の割合以上の配列を選択することを含む。いくつかの実施形態では、フラグメント化カバー率の割合は、トリプシン処理サンプルについては約30%(例えば、約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%)以上である。いくつかの実施形態では、フラグメント化カバー率の割合は、キモトリプシン処理サンプルについては約30%(例えば、少なくとも約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、または99%)以上である。いくつかの実施形態では、フラグメント化カバー率の割合は、トリプシン処理サンプルについては約50%であり、キモトリプシン処理サンプルについては約40%である。
いくつかの実施形態では、本明細書に記載の方法は、ステップiで同定された配列を有するCDR3、CDR2及び/またはCDR1領域を含むナノボディを作成することをさらに含む。ナノボディ遺伝子はベクターにクローン化し、次いでベクターはナノボディタンパク質の発現、抽出、及び精製のためにコンピテント細胞に変換される。
いくつかの実施形態では、ナノボディは、SEQ ID NO:1~157からなる群から選択される配列と少なくとも80%(例えば、少なくとも約80%、85%、90%、95%、98%または99%)同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、SEQ ID NO:1~157からなる群から選択される配列を有する。いくつかの実施形態では、ナノボディは、SEQ ID NO:158~2536からなる群から選択される配列と少なくとも80%(例えば、少なくとも約80%、85%、90%、95%、98%または99%)同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、SEQ ID NO:158~2536からなる群から選択される配列を有する。いくつかの実施形態では、ナノボディは、SEQ ID NO:2665~2667からなる群から選択される配列と少なくとも80%(例えば、少なくとも約80%、85%、90%、95%、98%または99%)同一であるアミノ酸配列を含む。いくつかの実施形態では、ナノボディは、SEQ ID NO:2665~2667からなる群から選択される配列を有する。
本明細書には、SEQ ID NO:158~2536からなる群から選択されるアミノ酸配列を含むPDZ特異的ナノボディが開示される。本明細書にはまた、SEQ ID NO:143~157からなる群から選択されるアミノ酸配列を含むPDZ特異的ナノボディが開示される。本明細書で使用される場合、「PDZ」は、DHR(Dlg相同領域)またはGLGF(グリシン-ロイシン-グリシン-フェニルアラニン)ドメインとも呼ばれるシグナル伝達タンパク質に見られる80~100のアミノ酸ドメインを指す。PDZドメインは、他の特異タンパク質のC末端の短い領域に結合する。PDZドメインは、慣例的に、リガンドの化学的性質によって分類される3つの異なるクラスに分けられる。異なるリガンドクラスは、標的タンパク質の末端COOHに見られる最後から2番目の結合残基の違いによって区別される。I型ドメインは、配列X-S/T-X-Φ*(ここでX=任意のアミノ酸、Φ=疎水性アミノ酸、*COOH末端)を認識する。II型ドメインは、配列X-Φ-X-Φ*を持つリガンドに結合する。III型ドメインは、X-X-C*の配列と相互作用する。各ドメインクラス内の結合特異性は、バリアント(X)残基、及び標準的な結合モチーフ外側の残基によって付与され得る。さらに、いくつかのPDZドメインは、これらの特異的クラスのいずれにも分類されない。PDZドメインを含むタンパク質には、エルビン、GRIP、Htra1、Htra2、Htra3、PSD-95、SAP97、CARD10、CARD11、CARD14、PTP-BL、及びSYNJ2BPが含まれるが、これらに限定されない。いくつかの実施形態では、PDZドメインはSYNJ2BP由来である。
本明細書には、表4のアミノ酸配列を含むGST特異的ナノボディが開示される。本明細書にはまた、SEQ ID NO:1~98からなる群から選択されるアミノ酸配列を含むGST特異的ナノボディが開示される。「グルタチオンS-トランスフェラーゼ」または「GST」は、本明細書では、グルタチオン-S-トランスフェラーゼ(GST)を指し、これは多種多様な内因性及び外因性の求電子化合物とグルタチオン(GSH)との抱合を触媒する第2相解毒酵素のファミリーである。いくつかの実施形態では、GSTポリペプチドは、pGEX6p-1ベクターのものである。
本明細書には、表5のアミノ酸配列を含むHSA特異的ナノボディが開示される。本明細書にはまた、SEQ ID NO:99~142からなる群から選択されるアミノ酸配列を含むHSA特異的ナノボディが開示される。「ヒト血清アルブミン」または「HSA」は、本明細書では、ALB遺伝子によってコードされるポリペプチドを指す。いくつかの実施形態では、HSAポリペプチドは、1つ以上の公に利用可能なデータベースにおいて以下のように同定されたものである。すなわちHGNC:399、Entrez Gene:213、Ensembl:ENSG00000163631、OMIM:103600、UniProtKB:P02768である。いくつかの実施形態では、HSAポリペプチドは、SEQ ID NO:2668の配列、またはSEQ ID NO:2668と約80%、約85%、約90%、約95%、または約98%の相同性を有するポリペプチド配列、またはSEQ ID NO:2668の一部を含むポリペプチドを含む。SEQ ID NO:2668のHSAポリペプチドは、成熟HSAの未成熟形態または前プロセス形態を表し得るため、本明細書には、SEQ ID NO:2668のHSAポリペプチドの成熟部分またはプロセスされた部分が含まれる。
ここでは、抗原に結合したNbプロテオームの大規模な定量分析と、抗原-Nb複合体のハイスループット構造特性評価に基づくエピトープマッピングとのために、堅牢なプロテオミクスパイプラインが開発された。

本発明の様々な実施形態を以下に示す。
1.相補性決定領域(CDR)3、2及び/または1のナノボディアミノ酸配列(CDR3、CDR2及び/またはCDR1配列)群を同定する、減数された前記CDR3、CDR2及び/またはCDR1配列が対照と比較して偽陽性である、方法であって、
a.抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
b.前記血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、
c.前記ライブラリー中の前記各cDNAの配列を同定することと、
d.前記抗原の免疫を持つ前記ラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、
e.前記ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
f.前記消化産物の質量分析を実行して、質量分析データを取得することと、
g.前記質量分析データと相関する、ステップcで同定された配列を選択することと、
h.ステップgの配列内のCDR3、CDR2及び/またはCDR1領域の配列を同定することと、
i.ステップhの前記CDR3、CDR2及び/またはCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、前記フラグメント化カバー率の割合が、ステップeでキモトリプシンが使用される場合、式f(x,キモトリプシン)=0.0023x -0.0497x+0.7723,x[5,30]によって決定され、またはステップeでトリプシンが使用される場合、式f(x,トリプシン)=0.00006x -0.00444x+0.9194,x[5,30]によって決定され、xは、それぞれCDR3、CDR2またはCDR1領域の配列の長さである、前記選択することと、を含み、
j.ステップiの前記選択された配列が、前記減数された偽陽性のCDR3、CDR2及び/またはCDR1配列を有する群を含む、前記方法。
2.前記必要なフラグメント化カバー率の割合は約30%である、上記1に記載の方法。
3.前記必要なフラグメント化カバー率の割合は約50%であり、ステップeでトリプシンが使用される、上記1に記載の方法。
4.前記必要なフラグメント化カバー率の割合は約40%であり、ステップeでキモトリプシンが使用される、上記1に記載の方法。
5.ステップdは、前記血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む、上記1~4のいずれかに記載の方法。
6.ステップdの前記1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む、上記5に記載の方法。
7.ステップdは、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で前記抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップeからステップiまでを各フラクションに対して個別に実行し、前記抗原に対する各異なるステップiのCDR3、CDR2及び/またはCDR1領域配列の親和性を、それぞれ、前記ナノボディフラクションのそれぞれにおける前記CDR3、CDR2及び/またはCDR1領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む、上記1~6のいずれかに記載の方法。
8.前記抗原特異的親和性クロマトグラフィーは、前記抗原にコンジュゲートされた樹脂である、上記7に記載の方法。
9.前記抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び前記抗原に結合された樹脂である、上記7に記載の方法。
10.ステップiで同定された配列を有するCDR3、CDR2及び/またはCDR1ペプチドを作成することをさらに含む、上記1~9のいずれかに記載の方法。
11.ステップiで同定された配列を有するCDR3、CDR2及び/またはCDR1領域を含むナノボディを作成することをさらに含む、上記1~9のいずれかに記載の方法。
12.SEQ ID NO:1~2536及びSEQ ID NO:2665~2667から選択されるアミノ酸配列を含む、ナノボディ。
13.コンピュータ実施方法であって、
ナノボディペプチド配列を受け取ることと、
前記ナノボディペプチド配列の複数の相補性決定領域(CDR)領域を同定することであって、前記CDR領域が、CDR3、CDR2及び/またはCDR1領域を含む、前記同定することと、
フラグメント化フィルターを適用して、前記ナノボディペプチド配列の1つ以上の偽陽性のCDR3、CDR2及び/またはCDR1領域を破棄することと、
前記ナノボディペプチド配列の1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の存在量を定量化することと、
前記ナノボディペプチド配列の前記1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の前記定量化された存在量に基づいて抗原親和性を推測することと、
を含む、前記コンピュータ実施方法。
14.前記ナノボディペプチド配列の前記1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域を、低い抗原親和性、中程度の抗原親和性、または高い抗原親和性を有するものとして分類することをさらに含む、上記13に記載のコンピュータ実施方法。
15.前記高い抗原親和性を有すると分類された前記ナノボディペプチド配列の前記1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域をナノボディタンパク質に組み立てることをさらに含む、上記14に記載のコンピュータ実施方法。
16.前記フラグメント化フィルターは、最小の計算されたフラグメント化カバー率の割合を要求するように構成される、上記13~15のいずれかに記載のコンピュータ実施方法。
17.前記最小の計算されたフラグメント化カバー率の割合は約30%である、上記16に記載のコンピュータ実施方法。
18.前記最小の計算されたフラグメント化カバー率の割合は、トリプシン処理サンプルについては約50%であり、キモトリプシン処理サンプルについては約40%である、上記17に記載のコンピュータ実施方法。
19.複数のナノボディペプチド配列を受け取ることと、
前記ナノボディペプチド配列のそれぞれをデータベースと比較して、前記ナノボディペプチド配列を、除外されたサブグループと除外されていないサブグループとに分離することであって、前記除外されたサブグループの前記ナノボディペプチド配列は前記データベースに見つからず、前記CDR領域は、前記除外されていないサブグループの前記ナノボディペプチド配列でのみ同定される、前記比較することと、
をさらに含む、上記13~18のいずれかに記載のコンピュータ実施方法。
20.前記ナノボディペプチド配列の前記1つ以上の破棄されていないCDR3、CDR2及び/またはCDR1領域の存在量は、相対MS1イオンシグナル強度に基づいて定量化される、上記13~19のいずれかに記載のコンピュータ実施方法。
21.前記抗原親和性が、エピトープ類似性に基づくk-meansクラスタリングを使用して推測される、上記13~20のいずれかに記載のコンピュータ実施方法。
22.深層学習モデルをトレーニングする方法であって、
上記13~21のいずれかに記載のコンピュータ実施方法を使用してデータセットを作成することと、
前記データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることであって、前記データセットは、複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含む、前記トレーニングすることと、
を含む、前記方法。
23.前記深層学習モデルは、畳み込みニューラルネットワークである、上記22に記載の方法。
24.ナノボディペプチド配列の抗原親和性を決定するための方法であって、
ナノボディペプチド配列を受け取ることと、
トレーニング済みの深層学習モデルに前記ナノボディペプチド配列を入力することと、
前記トレーニング済みの深層学習モデルを使用して、前記ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、
を含む、前記方法。
25.前記深層学習モデルは、畳み込みニューラルネットワークである、上記24に記載の方法。
26.前記トレーニング済みの深層学習モデルが、上記22に従ってトレーニングされる、上記24または上記25に記載の方法。
実施例1.大規模なNbプロテオミクス解析におけるキモトリプシンの優位性
HcAb(VH/Nb)cDNAライブラリーの可変ドメインを、2つのlama glamasのBリンパ球から増幅し、次世代ゲノムシークエンシング(NGS)(DeKosky, 2013)によってデータベース内の1360万の一意のNb配列を回収した。約50万のNb配列をアラインメントして、配列ロゴを生成した(図1A、7A)。CDR3ループは、最大の配列多様性及び配列長変化の両方を有し、Nb同定に対する優れた特異性を提供する(図1B、1C)。Nbデータベースのインシリコ分析は、Nb上のトリプシン切断部位の数が限られているため、トリプシンが主に大きなCDR3ペプチドを生成することを明らかにした(図1A)。その結果、CDR3残基の大部分(77%)は、2.5kDaを超える大きなトリプシンペプチドによってカバーされており(図1D、1E)、したがってプロテオミクス解析には最適ではなかった(図7B)。比較すると、特異的芳香族及び疎水性残基を切断するプロテオミクスにめったに使用されないキモトリプシンが、より適しているように見える(方法、図1A、7B)。CDR3配列の91%は、2.5kDa未満のキモトリプシンペプチドによってカバーされ得る(図1D、1E)。無作為選択及びシミュレーションにより、トリプシンよりもキモトリプシンの方が有意に多くのCDR3配列をカバーできることを確認した(図1F)。また、2つの酵素間にわずかな重複(約9%)があり、効率的なNb分析のための優れた相補性を示した。
CDR3同定の推定の偽発見率(FDR)は、データベースのサイズが大きく、Nb配列構造が異常であるため、かさ上げされる可能性がある。これをテストするために、抗原特異的HcAbをトリプシンまたはキモトリプシンでタンパク質分解し、同定のため最先端の検索エンジンを使用し、2つの異なるデータベース、すなわち、免疫化されたラマに由来する特異的「ターゲット」データベース、及び文字通り同一の配列を持たない無関係なラマからの同様のサイズの「デコイ」データベースを使用した(図7D)。したがって、デコイデータベース検索から同定した全てのCDR3ペプチドを偽陽性と見なした(Elias, J.E. & Gygi, S.P, 2007)。デコイデータベース検索から、多数の偽陽性CDR3ペプチドを非特異的に同定した。これらの偽りのペプチドスペクトルマッチングは、一般に、CDR3フィンガープリント配列上のMS/MSフラグメント化が不十分であることがわかった(図7E、7F)。これらの誤ったマッチングの大多数(95%)は、MS2スペクトル(図1K、1L)におけるCDR3高解像度診断イオンの50%(トリプシンによる、図1G)及び40%(キモトリプシンによる、図1H)の最小カバー率を必要とする、実装した単純なフラグメント化フィルターを使用することで削除できる。フィルターは、信頼できるNbプロテオミクス分析のために新しいオープンソースソフトウェア「Augur Llama」(図8A~8C)に統合する前に、CDR3の長さに基づいてさらに最適化した(図1I、1J)。
実施例2.Nbの発見及び特性評価のための統合プロテオミクスパイプラインの開発
抗原-Nb複合体の包括的定量的Nbプロテオミクス及びハイスループット構造特性評価のための堅牢なプラットフォームを本明細書に示す(方法、図2A)。家畜であるラクダ科動物を、対象の抗原で免疫化した。次に、免疫化したラクダ科動物の血液及び/または骨髄から、Nb cDNAライブラリーを調製した(Fridy, 2014)。NGSを実行して、10個を超える一意のNbタンパク質配列の豊富なデータベースを作成した(図8E、8F)。一方、抗原特異的VHを、血清から親和性単離し、塩またはpH緩衝液の段階的勾配を使用して溶出した。高分解能MSと組み合わせたナノフロー液体クロマトグラフィーによる同定及び定量化のために、分画したHcAbをトリプシンまたはキモトリプシンで効率的に消化して、Nb CDRペプチドを遊離させた。データベース検索に合格した最初の候補には、CDR識別のためにアノテートした。CDR3フィンガープリントをフィルタリングして偽陽性を除去し、これらの様々な生化学的フラクションの存在量を定量化してNb親和性を推測し、Nbタンパク質に組み立てた。上記の全てのステップを、Augur Llamaによって自動化した。このパイプラインにより、前例のない規模の多様で特異的で高品質のNbの同定及び特性評価が可能になる。並行して、何万もの抗原-Nb相互作用の構造解析を可能にするために、ハイスループット計算ドッキング(Schneidman-Duhovny, 2005)、クロスリンキング質量分析(CXMS)(Chait, 2016;Rout, 2019;Yu, 2018;Leitner, 2016)、及び突然変異誘発を統合する堅牢な方法を開発している。さらに、Nbレパートリーに関連する潜在的な特徴を学習させるために、深層学習アプローチを開発した。
実施例3.抗原特異的Nbの堅牢で詳細かつ高品質な同定
このパイプラインを検証するために、3つのベンチマーク抗原を選択した。すなわち、グルタチオンS-トランスフェラーゼ(GST)、ヒト血清アルブミン(HSA)(重要な薬物標的(Larsen, 2016))、及びミトコンドリア外膜タンパク質25由来の小さなPDZドメインである。これらの抗原は、PDZのみ免疫原性が弱いが3桁の免疫応答に及んでおり(図2B)、本技術の堅牢性を評価するのに理想的である。
ここでは、64,670の一意のNbGST配列(3,453のCDR3 Nbファミリーからの9,915の一意のCDRの組み合わせ)、34,972の一意のNbHSA(2,286の一意のCDR3 Nbファミリーからの7,749の一意のCDR)、及びより小さなコホートである2,379の高品質NbPDZ配列(230のCDR3ファミリーからの495の一意のCDR)を同定した(方法、図2C、8G)。試験した様々なプロテアーゼから、キモトリプシンがNb同定に最も有用なフィンガープリント情報を提供することを確認した(図2D、2E)。Nbレパートリーは、一際優れたCDR3多様性を示した(図8D)。
146個のNbのランダムなセットを、3つの抗原特異的Nb群から選択し、E.coliで発現させた。130個のNb群(89%)は優れた溶解性を示し、容易かつ大量に精製することが可能であった(図2F)。抗原結合を評価するために、免疫沈降、ELISA、及びSPRを含む相補的なアプローチを採用した(方法、図2G、9C、9D、10、表1~3)。トリプシン及びキモトリプシンによって同定したNbは、同等に高品質であった(図8H)。86.2%(CI95%:6.8%)、90.5%(CI95%:11.5%)、及び100%の純Nbバインダーを、それぞれGST、HSA及びPDZについて確認した。これらの結果は、このアプローチの感度及び特異性が高いことを示している。
実施例4.Nbプロテオームの正確な大規模の定量化とクラスタリング
Nbを親和性に基づいて正確に分類するために、様々な戦略を評価した。簡単に言えば、抗原特異的HcAbを血清から親和性単離し、段階的な高塩濃度勾配、高pH緩衝液、または低pH緩衝液によって溶出した(方法、図8I、8J)。異なるHcAbフラクションは、ラベルフリーの定量的プロテオミクスによって正確に定量化した(Zhu, 2010;Cox, J. & Mann, M, 2008)。次いで、CDR3ペプチド(及び対応するNb)を、それらの相対的イオン強度に基づいて3つのグループにクラスター化した(図3A、3B、9A、及び9B)。この分類は、高pH法により、NbGSTの31%及びNbHSAの47%をC3高親和性群に割り当てる(図3C)。各クラスターからの一意のCDR3配列を持ついくつかのNbGSTをランダムに発現させ、それらの親和性をELISA及びSPR(R=0.85、図3D、表1)によって測定して、様々な分画方法を評価した。低pH法は、異なる親和性群を分離するのに十分な分解能を提供しなかったが、塩勾配法及び特に高pH法は、Nbの有意かつ再現可能な分離を、それらの親和性に基づいて可能にした(図3E)。高pHクラスター1及び2(C1、C2)からのNbは、一般に、それぞれμMから数十nMまでの低い平凡な親和性を有するが、50%超のC3は、超高親和性のサブnMバインダーであった(図3H、9D)。この結果をさらに検証するために、25個のNbHSAのランダムなセット(多様なCDR3を含む)をC3から精製し、それらのELISA親和性をランク付けした(図3F、表2)。上位14のNbHSAをSPR測定用に選択した。そのうちの11は、多様な結合反応速度を持つ数十から数百のpM親和性を有していた。残りの3つのNbHSAは、1桁のnMKを示した(図3I、10A)。13個の可溶性NbPDZを精製し、それらの高い親和性をELISA及び免疫沈降によって確認した(図3G、10B、及び表3)。代表的な高溶解性NbPDZP10のKは4.4pMであった(図3J)。
天然ミトコンドリアの免疫沈降及び蛍光イメージング(NbPDZ)のための超高親和性Nb(NbGST)(図3K、3L)を、さらに積極的に評価した。定量的アプローチにより、親和性などの望ましい特性に基づいて、Nbプロテオームを大規模かつ正確に分類することができる。
実施例5.統合的構造決定法によって明らかにされた抗原結合Nbプロテオームのランドスケープ
高品質のNbの大規模レパートリーの同定及び分類により、抗原が関与する体液性免疫応答の全体的な構造ランドスケープに関する調査が可能になる。34,972個のNbHSAの構造的なドッキング及びクラスタリングにより、3つの主要なHSAエピトープを明らかにした(図4A)。豊富な天然血清アルブミン(76%がHSAと同一、図12H)の存在により、ラクダ科動物の体液性免疫の特異性に関する調査が可能になった。2つのアルブミン配列をアラインメントし、それらの変化量をpI及びハイドロパシーに基づいて計算した(方法、図4A)。3つのエピトープは全て、大きな配列の違いに対応するpI及びハイドロパシーの主要なピークと共局在している。この結果は、Nbによる抗原認識の一際優れた特異性を示している。Nbは、安定したらせん二次構造に優先的に結合するようである(図4B)。エピトープが高度に荷電されていることがわかった。E2及びE3は主に負であった(それぞれ-4及び-5の正味の形式電荷、図13D)が、E1は混合電荷(-2の正味の形式電荷)でより不均一であった(図4C)。
19のHSA-Nb複合体(Shi, 2014;Kim, 2018)を架橋して、ドッキングによって同定されたエピトープを検証した。全体として、架橋の92%がモデルによって満足され、RMSDの中央値は5.6Åであった(図4J、4K)。架橋結合によりドッキング結果を確認し、密集した2つのエピトープ(E2、E3)(それぞれ65%及び20%)を同定した(図4D、表2)。E1を、存在量の少ない架橋によって同定した(5%)。架橋結合により、ドッキングによって明らかにされなかった追加の2つのマイナーエピトープも同定した(図4D)。凸状Nbパラトープ及び凹状HSAエピトープを含む、HSAとNbとの間に、高い形状相補性を認めた(図4E~4G)。主要なE2をさらに確認するために、全体的な構造への影響を最小限に抑えて、HSAに単一点突然変異のE400Rを導入した(Pires, 2016)。結果として生じる変異は、ラクダ化動物アルブミンのE2のオーソロガス位置で正電荷を模倣するように表面電荷を逆転させ、それとNb CDR3のアルギニンとの間に形成される塩橋を破壊する可能性がある(図4H)。次いで、19の高親和性バインダーを選択し、HSA-Nb相互作用に関するこの点突然変異をELISAによって評価した(図4I、表2)。E400Rは、テストした19個のNbのうち5個(26%)の結合をほぼ完全に無効にし、E2が正真正銘の主要なエピトープであることを示した。
このアプローチを、64,670のGST-Nb複合体のエピトープをマッピングするためにさらに使用した。GST上の3つの主要なエピトープを正確に同定し(図11A、11B、11F、11G)、それらをE1、E2、及びE3について、それぞれ18.75%、31.25%、及び50%の相対存在量の架橋によって検証した(図11D、11E)。E1及びE3は、負に帯電した表面パッチを含む。E2は、GST二量体化空洞と重なっている(図11C)。本明細書に示すモデルでは、E2 Nbは、この空洞にそのCDR3を挿入する。HSAと同様に、帯電した表面残基への優先性とNbの高い形状相補性とを確認した。まとめると、これらの結果は、Nbが多様なタンパク質表面に結合し、抗原上の高度に帯電した空洞を好むことを示している。
実施例6.Nb親和性成熟のメカニズムの調査
最も確実に分類された高pHデータセットに基づいて、高親和性(成熟)及び低親和性のNbを区別する物理化学的及び構造的特徴を調査した。HSA及びGSTそれぞれに対する高親和性バインダーの異なる分布を有するより短いCDR3(図5A)は、抗原結合のエントロピーを低下させる。低親和性Nbのわずかに酸性から高親和性Nbの比較的塩基性まで、pIの有意な増加を観察した(図5B)。
NbのpI及びハイドロパシーに対するCDRの寄与を比較し、CDR3HSAがNbHSAにおける極性シフトの主な原因であり、CDR1GST及びCDR2GSTがNbGSTの極性シフトの主な原因であると判断した(図5C)。高親和性Nbは、親水性がわずかに高いことを観測した(図5D)。
CDR3の構造は、最も高い配列可変性からなる「ヘッド」領域と、より低い特異性の「トルソー」領域とを有すると考えることができる(Finn, 2016)(図5E)。アスパラギン酸及びアルギニン(強力な静電相互作用を形成する)(Tiller, 2017)、グリシン及びセリンの小さく柔軟な残基、アラニン及びロイシンなどの疎水性残基、ならびにチロシンの芳香族残基を含む、特定の残基がCDR3ヘッドに濃縮された(図5F、及び図12)。異なる親和性グループのNbを比較したところ、3つの大きな違いが見つかった。まず、高親和性Nbは荷電残基がより豊富であった(Mitchell, L.S. & Colwell, L.J, 2018)(方法、図5G)。第二に、様々な抗原について複雑な違いを同定した。高親和性NbHSAは、CDR3ヘッド上に正に帯電した残基を増やし(39%)、負に帯電した残基を減少させる(46%)ことによって静電気を強化する傾向がある。高親和性NbGSTは、主に他のCDRの電荷を変えた。CDR1とCDR2とでは、それぞれ、正に帯電した残基の29.2%及び117.2%の増加と、負に帯電した残基の44.2%及び21.5%の減少とが見られた。電荷の変化は、Nbとエピトープとの間の物理化学的相補性を高める可能性がある。第三に、チロシン(51%)、グリシン及びセリン(58%)は、高親和性NbHSAのCDR3ヘッドでより濃縮されていた。高親和性NbGSTでは、CDR3ヘッドでチロシン(73%)が増加したが、グリシン及びセリンのフラクションはほとんど影響を受けなかった。
HSA結合親和性を増強するためのこれらの残基の推定上の役割をさらに調査するために、それらの位置頻度をCDR3ヘッドに沿って計算した(図5H)。チロシンは、高親和性NbHSAのCDR3ヘッドの中心でより頻繁に見つかり、そのかさばる芳香族側鎖を特異的エピトープポケット(複数可)に挿入できるようにしている(Desmyter, 1996;Li, 2016)。グリシン及びセリンは、CDR3の中心から離れて配置される傾向があり、追加の柔軟性を提供し、抗原ポケット内のチロシン側鎖の方向付けを容易にする。これらの結果を、これらの残基群の数と本願の精製NbのELISA親和性との間の相関分析によって確認した(図5I、5J)。
Nb親和性分類を可能にする潜在的な特徴を学習させるために、深層学習モデルを開発した(方法)。高親和性バインダー分類のための最も有益なNbHSACDR3フィルターは、連続したリジン及びアルギニン、チロシン及びグリシンのパターンを明らかにした(図5K、表4)。低親和性バインダーの場合、最も有益なフィルターは、フェニルアラニン、ヒスチジン、及び2つの連続するアスパラギン酸を優先する。さらに、この分析は、高親和性バインダー及び低親和性バインダーのそれぞれに対して負電荷及び正電荷のペアが連続する傾向を明らかにした。
実施例7.抗原認識のためのNbの優れた汎用性と回復力
免疫原性が弱いPDZドメインに対する何百もの分岐した高親和性NbCDR3ファミリーの同定により、そのような相互作用の構造的基礎の調査を促した。ドッキングに基づいて、2つの推定エピトープを同定した(図6A、13B)。E2は、正に帯電した大きな表面を有し(図6A、6B)、αヘリックス及び2つのβストランドでより構造化されているため、主要なエピトープとなり得る。E2は、多数のPDZ相互作用タンパク質間で共有される保存されたリガンド結合部位と重なり合っていた(Sheng, 2001;Doyle, 1996)(図6C)。驚くべきことに、NbPDZは、天然のPDZリガンドよりも100,000倍高い親和性を(μMの親和性で)獲得している(Niethammer, 1998)(図3J)。そのような高い親和性は、小さくて浅いエピトープの周りを包む長いCDR3ループによって達成され、広範な静電的相互作用及び疎水性相互作用を形成する可能性が高かった(図6C、13A)。モデリングの結果は、PDZエピトープの2番目のβストランドのR46及びK48が、NbPDZの対応する残基と塩橋を形成したことを示した。二重変異PDZ(R46E:K48D)が生成され、NbPDZに対するその親和性をELISAによって評価した。NbPDZの大部分(8/11)は、変異体に対する親和性の有意な低下を示し、または親和性を示さず、E2が実際に主要なエピトープであることを確認した(図6D)。
NbPDZについては、他にもいくつかの観察結果がある。まず、CDR3ループ長の分布は、1つの主要なピークを形成し、中央値がその自然分布の上限を押し上げる約20aaであった(図6E)。第2に、NbPDZは、中央値pIが4.9のやや酸性であり(図6F)、これにはCDR3が大きく寄与している(図6E、13F)。第3に、それらの酸性の性質にもかかわらず、NbPDZは、疎水性残基の代償により、ハイドロパシーを感知できるほどに変化させるようには見えなかった(図6G、13E)。最後に、負に帯電したアスパラギン酸と小さなグリシン及びセリンとが大幅に増加し、CDR3ヘッド残基の半分を占めた。高親和性NbGST及びNbHSAと比較して、かさ高いチロシンの減少も明らかであり、結合のためのE2のかなり浅いポケットを反映していた(図7C、7E)。まとめると、これらの結果は、抗原結合に対するNbの顕著な多用途性を示している。
この研究では、抗原結合Nbプロテオームの分析のためのプロテオミクス、インフォマティクス、及び構造モデリング技術を統合した堅牢なプラットフォームの開発を報告している。パイプラインは、種々の困難な抗原に対する幅広い高品質Nbレパートリーの高感度で信頼性の高い同定を可能にする。また、循環Nbをその物理化学的特性に基づいて正確に分類することもできる。何千もの超高親和性Nbを本技術によって同定した。本研究では、計算論的ドッキングと構造プロテオミクスとを組み合わせて、102,673の抗原-Nb複合体を構造的に特徴付け、マッピングし、主要なエピトープを検証した。この「ビッグデータ」分析は、体液性免疫応答の世界規模のプロテオミクス及び構造解析を初めて可能にする。
これらの結果は、前例のない深さで、ラクダ科動物抗体免疫の壮大なランドスケープを共に形成する抗原結合Nbの効率性、特異性、多様性、及び汎用性を明らかにした(図6H)。
効率性:Nbは、結合のために形状及び静電相補性の両方を効率的に利用する。荷電したアスパラギン酸及びアルギニン、芳香族チロシン、ならびに小さく柔軟なグリシン及びセリンなどの特異残基は、高親和性Nbをもたらすループの柔軟性を可能にする。種々のCDRに対して特異的な複雑で微調整された相互作用を明らかにした。さらに、病原体を効率的に認識するための一般的なメカニズムとして機能する、Nb結合のための複数の優性エピトープの存在を確認した(Akram, A. & Inman, R.D, 2012)。
特異性及び多様性:特異的で効果的かつ安全な免疫応答を確実にするために、いくつかの最も顕著な配列変異を持つ特異的HSA表面ポケットを認識するように進化した、数千もの高度に分岐したNbを発見した(図4A)。
汎用性:PDZなどの免疫応答を回避する傾向がある抗原の場合、Nbは、パラトープのサイズ及び物理化学的特性を大幅に変更して、優れた親和性及び特異性を備えた天然のリガンド結合を模倣できる。この研究は、タンパク質間相互作用の興味深い急速な進化を示している。
Nbは、ウイルス中和と酵素活性の阻害とにおいて非常に強力である(Lauwereys, 1998;Desmyter, 1996;Acharya, 2013;Arabi, 2017)。これらの発見は、これらの非常に堅牢で効率的なラクダ科動物HcAbが、乾燥した自然の生息地と攻撃的な病原性の難題との両方において、生存するために進化的に有利であることを示しているが、そのような信じられないほどの選択と適応との背後にある原動力(複数可)は謎のままである(Flajnik, 2011)。
これらの技術は、がん生物学、脳研究、及びウイルス学などの困難な生物医学アプリケーションにおいて幅広い用途を見つけることができる。Nbプロテオミクス用のこれらのインフォマティクスツールは、研究コミュニティが自由に利用できる。高品質のNbデータセットは、抗体抗原を研究するための青写真として機能し、コンピュータによる抗体設計を容易にすることができる(Sircar, 2011;Baran, 2017;Chevalier, 2017)。
実施例8.方法
動物免疫化
2頭のラマを、それぞれHSA、及びミトコンドリア外膜タンパク質25(OMP25)のGSTとGST融合PDZドメインとの組み合わせを1mgの初回用量で免疫し、続いて3週間ごとに0.5mgの3回連続ブーストを行った。採血及び骨髄吸引液は、最後の免疫ブーストの10日後に動物から抽出された。上記の全ての手順を、IACUCプロトコルに従ってCapralogics, Inc.によって実行した。
mRNAの単離とcDNAの調製
約1~3×10個の末梢単核細胞を350mlの免疫血液から単離し、5~9×10個の形質細胞を、Ficoll勾配(Sigma)を使用して30mlの骨髄吸引物から単離した。RNeasyキット(NEB)を使用して、それぞれの細胞からmRNAを単離し、それをMaxima(商標)H Minus cDNA合成マスターミックス(Thermo)を使用してcDNAに逆転写した。可変ドメインからCH2ドメインまでのラクダ科動物IgG重鎖cDNA配列を、プライマーCALL001(GTCCTGGCTGCTCTTCTACAAGG、SEQ ID NO:2646)及びCH2FORTA4(CGCCATCAAGGTACCAGTTGA、SEQ ID NO:2647)を用いて特異的に増幅した(Abrabi, 1997)。CH1ドメインを欠くVH遺伝子を従来のIgGから分離し、DNAゲル電気泳動によって精製し(Qiagen)、その後、セカンドフォワード(ATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNNATGGCT[C/G]A[G/T]GTGCAGCTGGTGGAGTCTGG、SEQ ID NO:2648、NはA、T、CまたはGを表す)及びセカンドリバース(GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNGGAGACGGTGACCTGGGT、SEQ ID NO:2649、NはA、T、CまたはGを表す)を使用して、フレームワーク1からフレームワーク4までを再増幅した。イルミナMiSeqのクラスター同定を支援するために、ランダムな8-mer置換アダプター配列を追加した。第2のPCRのアンプリコン(約450~500bp)を、Monarch PCRクリーンアップキット(NEB)を使用して精製した。プライマーMiSeq-F(AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTA、SEQ ID NO:2650)及びMiSeq-R(CAAGCAGAAGACGGCATACGAGATTTCTGAATGTGACTGGAGTTCA、SEQ ID NO:2651)によるPCRの最終ラウンドを行って、MiSeqシークエンシング前のインデックス付きのP5/P7アダプターを追加した。
イルミナMiseqによる次世代シークエンシング
シークエンシングは、300bpペアードエンドモデルを備えたイルミナMiSeqプラットフォームに基づいて実行した。データベースごとに3,000万を超えるリードが生成された。FASTQデータの品質チェックと管理には、FastQC v0.11.8のリードQCツール(www.bioinformatics.babraham.ac.uk/projects/fastqc/)を使用した。生のイルミナリードを、BBMapプロジェクトのソフトウェアツール(github.com/BioInfoTools/BBMap/)によって処理した。ヌクレオチド配列をアミノ酸配列に変換する前に、重複したリードとDNAバーコード配列とを連続して除去した。
免疫血清からのVH抗体の単離と生化学的分画
約175mlの血漿を、Ficoll勾配(Sigma)によって350mlの免疫化血液から単離した。ラクダ科動物の単鎖VH抗体は、プロテインG及びプロテインAセファロースビーズ(Marvelgent)を使用した2段階の精製手順によって血漿上清から単離し、酸で溶出した後に、1×PBS緩衝液で中和し、最終濃度0.1~0.3mg/mlに希釈した。抗原特異的VH抗体を精製するために、GSTまたはHSAコンジュゲートされたCNBr樹脂をVH混合物とともに4℃で1時間インキュベートし、高塩濃度緩衝液(1×PBS及び350mM NaCl)で十分に洗浄して非特異的バインダーを除去した。次に、以下の溶出条件の1つを使用して、特異的VH抗体を樹脂から遊離させた。すなわち、アルカリ性(1~100mMのNaOH、pH11、12及び13)、酸性(0.1Mのグリシン、pH3、2及び1)または塩溶出(中性pH緩衝液中1M~4.5MのMgCl)である。PDZ特異的VHの精製のために、MBP-PDZの融合タンパク質(カップリング後の小さなPDZの立体障害を避けるために、PDZドメインのN末端にマルトース結合タンパク質/MBPを融合させた)を製造し、親和性ハンドルとして使用した。対照にはMBP結合樹脂を使用した(図6J)。プロテオミクス分析の前に、溶出した全てのVHを中和し、1×DPBSに個別に透析した。
抗原特異的Nbのタンパク質分解及び質量分析と組み合わせたナノフロー液体クロマトグラフィー(nLC/MS)分析
GST及びHSA VHについては、次のプロトコルに従って各溶出を別々に処理した。PDZ特異的VHについては、最もストリンジェントな生化学的溶出物(すなわち、pH13、pH1、MgCl3M及び4.5M)及び異なるフラクションからのそれぞれの非特異的MBPバインダー(陰性対照)のみをタンパク質分解のためにプールした。例えば、pH13緩衝液によって溶出されたPDZ特異的VHの場合、非特異的MBP結合Nbを、pH11、pH12及びpH13のフラクションからプールして、下流LC/MS定量化のストリンジェンシーを改善した。VHを8M尿素緩衝液(50mM重炭酸アンモニウム、5mMTCEP及びDTTを含む)内で、57℃で1時間還元し、暗所において30mMヨードアセトアミドで、室温で30分間アルキル化した。次に、アルキル化したサンプルを2つに分割し、トリプシンまたはキモトリプシンを使用して溶液中で消化した。トリプシン消化サンプルの場合、1:100(w/w)トリプシンとLys-Cとを加え、37℃で一晩消化し、別の朝に1:100のトリプシンを追加して、37℃の水浴で4時間、消化した。キモトリプシン消化サンプルの場合、1:50(w/w)キモトリプシンを添加し、37℃で4時間消化した。タンパク質分解後、ペプチド混合物を自己充填ステージチップまたはSep-pak C18カラム(Waters)で脱塩し、Q Exactive(商標)HF-X Hybrid Quadrupole Orbitrap(商標)質量分析計(Thermo Fisher)とオンラインで結合したnano-LC 1200で分析した。簡単に説明すると、脱塩したNbペプチドを分析カラム(C18、粒子サイズ1.6μm、細孔サイズ100Å、75μm×25cm、IonOpticks)にロードし、90分間の液体クロマトグラフィー勾配(5%B~7%B、0~10分;7%B~30%B、10~69分;30%B~100%B、69~77分;100%B、77~82分;100%B~5%B、82分~82分10秒;5%B、82分10秒~90分;移動相Aは0.1%ギ酸(FA)から構成され、移動相Bは80%アセトニトリル(ACN)中の0.1%FAから構成される)を使用して溶出した。流量は300nl/minであった。QE HF-X装置は、データ依存モードで操作され、上位12個の最も豊富なイオン(質量範囲350~2,000、荷電状態2~8)を高エネルギー衝突解離(HCD)によってフラグメント化した。目標分解能を、MSについては120,000、タンデムMS(MS/MS)分析については7,500とした。四重極単離ウィンドウは1.6Thであり、MS/MSの最大注入時間を80msに設定した。
Nb DNAの合成とクローニングNb遺伝子をEscherichia coliでの発現のためにコドン最適化し、ヌクレオチドをインビトロで合成した(Synbiotech)。サンガーシークエンシングによる検証後、Nb遺伝子をpET-21b(+)のBamHI及びXhoI(GST Nbの場合)、またはEcoRI及びNotI制限部位(HSA及びPDZ Nbの場合)にクローニングした。
組み換えタンパク質の精製
製造元の指示に従ってDNA構築物をBL21(DE3)コンピテント細胞に形質転換し、50μg/mlアンピシリンを含む寒天培地に37℃で一晩プレーティングした。37℃で一晩培養するために、単一コロニーを、アンピシリンを含むLB培地に接種した。その後、培養物を新鮮なLB培地に1:100(v/v)で接種し、O.D.600nmが0.4~0.6に達するまで37℃で振とうした。GST、GST-PDZ及びNbを0.5mMのIPTGで誘導し、MBP及びMBP-PDZを0.1mMのIPTGで誘導した。誘導は、16℃で一晩行った。次いで、細胞を採取し、簡単に超音波処理し、氷上で溶解緩衝液(1×PBS、150mM NaCl、プロテアーゼ阻害剤を含む0.2%TX-100)で溶解した。溶解後、可溶性タンパク質抽出物を15,000×gで10分間収集した。GST及びGST-PDZは、GSH樹脂を使用して精製し、グルタチオンによって溶出した。MBP(マルトース結合タンパク質)及びMBP-PDZ融合タンパク質は、アミロース樹脂を使用することによって精製し、製造元の指示に従ってマルトースによって溶出した。NbをHis-コバルト樹脂によって精製し、イミダゾールを使用して溶出した。続いて、溶出したタンパク質を透析緩衝液(例えば、1×DPBS、pH7.4)で透析し、使用するまで-80℃で保存した。
Nb免疫沈降アッセイ
Nb誘導及び細胞溶解後、細胞溶解物をSDS-PAGEにかけて、Nb発現レベルを推定した。細胞溶解中の組み換えNbを、1×DPBS(pH7.4)で最終濃度約5μM(GST Nbの場合)及び約50nM(PDZ Nbの場合)に希釈した。Nbと抗原との特異的な相互作用をテストするために、様々な抗原をCNBr樹脂に結合させた。対照には、不活化またはMBP結合CNBr樹脂を使用した。抗原結合樹脂または対照樹脂をNb溶解物とともに4℃で30分間インキュベートした。次いで、樹脂を洗浄緩衝液(150mM NaCl及び0.05% Tween20を含む1×DPBS)で3回洗浄して、非特異的結合を除去した。次いで、特異的抗原結合Nbを、20mM DTTを含有する熱LDS緩衝液によって樹脂から溶出し、SDS-PAGEにかけた。ゲル上のNbの強度を、抗原特異的シグナルと対照シグナルとの間で比較して、偽陽性結合を導出した。
ELISA(酵素結合免疫吸着アッセイ)
抗原のラクダ科動物免疫応答を評価し、抗原特異的Nbの相対的親和性を定量化するために、間接ELISAを行った。抗原を96ウェルELISAプレート(R&D system)に、1ウェルあたり約1~10ngの量で、コーティング緩衝液(15mM炭酸ナトリウム、35mM重炭酸ナトリウム、pH9.6)中で4℃にて一晩コーティングした。次に、ウェル表面をブロッキング緩衝液(DPBS、0.05%Tween20、5%牛乳)で、室温で2時間ブロッキングした。免疫応答をテストするために、免疫化した血清をブロッキング緩衝液で連続的に5倍に希釈した。希釈血清を、室温で2時間、抗原被覆ウェルと共にインキュベートした。ラマFc(Bethyl)に対するHRPコンジュゲートされた二次抗体をブロッキング緩衝液中で1:10,000に希釈し、各ウェルとともに室温で1時間インキュベートした。Nb親和性テストでは、目的の抗原に結合しないスクランブルNbを陰性対照に使用した。テスト及びスクランブル陰性対照の両方の特異的バインダーのNbを、ブロッキング緩衝液で10μMから1pMまで連続的に10倍希釈した。Hisタグ(Genscript)またはT7タグ(Thermo)に対するHRPコンジュゲート二次抗体を、緩衝液中で1:5,000または1:10,000に希釈し、室温で1時間インキュベートした。インキュベーション間で非特異的吸光度を除去するために、1×PBST(DPBS、0.05%Tween20)による3回の洗浄を行った。最後の洗浄後、サンプルを新たに調製したw3,3′,5,5′-テトラメチルベンジジン(TMB)基質と共に暗所にて室温で10分間さらにインキュベートして、シグナルを発現させた。停止液(R&Dシステム)後、プレートリーダー(Multiskan GO、Thermo Fisher)で複数の波長(450nm及び550nm)でプレートを読み取った。次の2つの基準のいずれかが満たされた場合、偽陽性のNbバインダーであると定義した。i)ELISAシグナルは10μMの濃度でのみ検出でき、1μMの濃度では検出不足であった。ii)1μMの濃度では、10μMの信号と比較して顕著な信号の減少(10分の1以下)が検出されたが、より低濃度では信号を検出できなかった。生データをPrism 7(GraphPad)によって処理して4PL曲線にフィットさせ、logIC50を計算した。
SPRによるNb親和性測定
表面プラズモン共鳴(SPR、Biacore 3000システム、GE Healthcare)を使用して、Nb親和性を測定した。次のステップにより、活性化されたCM5センサーチップに、抗原タンパク質を固定化した。タンパク質分析物を、10mM酢酸ナトリウム、pH4.5で10~30μg/mlに希釈し、SPRシステムに5μl/分で420秒間注入した。次に、センサーの表面を1Mエタノールアミン-HCl(pH8.5)でブロックした。各Nb検体について、2mMDTTを含むHBS-EP+ランニング緩衝液(GE-Healthcare)に一連の希釈液(3桁にわたる)を20~30μl/分の流速で120~180秒間注入し、解離速度に基づいて5~20分の解離時間を継続させた。各注入の間に、10mMグリシン-HCl(pH1.5~2.5)を含む低pH緩衝液、または20~40mM NaOH(pH12~13)の高pH緩衝液でセンサーチップ表面を再生した。再生は40~50μl/分の流量で30秒間実行した。測定を2重に行い、再現性の高いデータのみを分析に使用した。各Nbの結合センサーグラムを処理し、BIAevaluationを使用して、1:1ラングミュアモデルまたは物質移動を伴う1:1ラングミュアモデルでフィッティングすることにより分析した。
抗原ナノボディ複合体の架橋及び質量分析
架橋結合の前に、異なるNbを、アミンを含まない緩衝液(2mM DTTを含む1×DPBSなど)中、4℃で等モル濃度の目的の抗原とともに1~2時間インキュベートした。アミン特異的スベリン酸ジサクシンイミジル(DSS)またはヘテロ二機能性リンカーである1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド塩酸塩(EDC)を、それぞれ1mMまたは2mMの最終濃度で抗原-Nb複合体に添加した。DSS架橋結合のために、反応は23℃で25分間、絶えず攪拌しながら行った。EDC架橋結合のために、反応を23℃で60分間行った。室温で10分間、50mM Tris-HCl(pH8.0)によって反応をクエンチした。タンパク質の還元及びアルキル化の後、架橋されたサンプルを4~12%のSDS-PAGEゲル(NuPAGE、Thermo Fisher)によって分離した。架橋種に対応する領域を切断し、前述のようにトリプシン及びLys-Cでゲル内消化した(Shi, 2014;Shi, 2015)。タンパク質分解後、ペプチド混合物を脱塩し、Q Exactive(商標)HF-X Hybrid Quadrupole-Orbitrap(商標)質量分析計(Thermo Fisher)に連結したnano-LC1200(Thermo Fisher)で分析した。架橋ペプチドをピコチップカラム(C18、粒子サイズ3μm、細孔サイズ300Å、50μm×10.5cm、New Objective)にロードし、60分のLC勾配(5%B~8%B、0~5分;8%B~32%B、5~45分;32%B~100%B、45~49分;100%B、49~54分;100%B~5%B、54分~54分10秒;5%B、54分10秒~60分10秒;移動相Aは0.1%ギ酸(FA)から構成され、移動相Bは80%アセトニトリル(ACN)中の0.1%FAから構成される)を使用して溶出した。QE HF-X装置は、データ依存モードで操作され、上位8個の最も豊富なイオン(質量範囲380~2,000、荷電状態3~7)を高エネルギー衝突解離(正規化された衝突エネルギー27)によってフラグメント化した。目標分解能を、MSについては120,000、MS/MS分析については15,000とした。四重極単離ウィンドウは1.8Thであり、MS/MSの最大注入時間を120msに設定した。MS分析の後、データを架橋ペプチドの同定のためにpLink2によって検索した(Chen, 2019)。質量精度は、MS及びMS/MSについて、それぞれ10及び20p.p.m.と指定した。他の検索パラメータには、固定修飾としてのシステインのカルバミドメチル化と、可変修飾としてのメチオニンの酸化とを含めた。最大3つのトリプシン未切断部位を許容した。最初の検索結果は、デフォルトの5%の偽発見率を使用して取得し、ターゲットデコイ検索戦略を使用して推定した。次に、架橋スペクトルを手動でチェックして、本質的に前述のように偽陽性の同定を除去した(Shi, 2014;Kim, 2018;Shi, 2015)。
部位特異的突然変異誘発法
HSAの哺乳類発現プラスミドをAddgeneから取得した。E400R点突然変異は、プライマーHSA-F(GGTGTTCGACCGGTTCAAGCCTCTGG、SEQ ID NO:2652)及びHSA-R(TTGGCGTAGCACTCGTGA、SEQ ID NO:2653)を使用して、Q5部位特異的突然変異誘発キット(NEB)によってHSA配列に導入した。サンガーシークエンシングによる配列検証後、製造元のプロトコルに従って、Lipofectamine 3000トランスフェクションキット(Thermo)及びOpti-MEM(Gibco)を使用して、野生型HSA及び変異体を含むプラスミドをHeLa細胞にトランスフェクトした。細胞を一晩培養した後、培地を、FBS添加物を含まないDMEMに交換してBSAを除去した。37℃、5%COで48時間培養後、HSAを発現している培地を収集し、-20℃で保存した。培地をSDS-PAGE及びウェスタンブロット法で分析して、タンパク質発現を確認した。
PDZドメイン(pGEX6p-1ベクター内)は、General Biosystemsから入手した。PDZの二点変異体(すなわち、R46E:K48D)を、PDZ-F(TGATGAAAATGGCGCAGCCGCC、SEQ ID NO:2654)及びPDZ-R(ATTTCACTCACATAGATACCACTATCATTACTAACATAC、SEQ ID NO:2655)の特異的プライマーを使用して、Q5部位特異的突然変異誘発キットによって導入した。サンガーシークエンシングによる検証後、変異ベクターをBL21(DE3)細胞に形質転換して発現させた。GST融合PDZ変異体タンパク質を、以前に記載しているようにGSH樹脂によって精製した。
蛍光顕微鏡
COS-7細胞をガラス底皿に60~70%の初期コンフルエンスでプレーティングし、一晩培養して細胞を皿に付着させた。細胞をMitoTracker Orange CMTMRos(1:4000)とともに37℃で30分間、PBSで1回洗浄し、予め冷やしたメタノール/エタノール(1:1)で10分間固定した。PBSで洗浄した後、5%BSAで細胞を1時間ブロッキングした。次いでAlexaFluor(商標)647コンジュゲートNb(1:100)を細胞に加え、室温で15分間インキュベートした。2色の広視野蛍光画像を、561nm及び642nm励起レーザー(MPB Communications, Pointe-Claire, Quebec, Canada)と100X油浸対物レンズ(NA=1.4, UPLSAPO 100XO;Olympus)とを備えたオリンパスIX71倒立顕微鏡フレームにカスタム構築したシステムを使用して取得した。
テキストベースのCDR(相補性決定領域)アノテーション
CDRアノテーション法は(Fridy, 2014)から変更された。[*]は、任意の残基を意味する。
CDR1アノテーション:Nb配列の残基20~残基26の間に局在する短い配列モチーフ「SC」を最初に検索した。CDR1配列の開始は、「SC」モチーフが続く5番目の残基と定義される。最初の残基を特定すると、次にNb残基32~残基40間に局在する別の配列モチーフ「W[*]R」を探し、CDR1配列の終端を「W[*]R」モチーフの前の最初の残基と定義する。
CDR2アノテーション:CDR2配列の開始は、「W[*]R」モチーフが続く14番目の残基と定義される。最初の残基を特定すると、次にNb残基63~残基72の間に局在するモチーフ「RF」を特定し、CDR2配列の終端を「RF」モチーフの前の8番目の残基と定義した。
CDR3アノテーション:まず、Nb残基90~残基105間に局在する「Y[*]C」または「YY[*]」というモチーフを検索した。CDR3配列の開始は、「Y[*]C」または「YY[*]」モチーフが続く3番目の残基と定義される。CDR3の最初の残基を特定すると、次に以下の配列モチーフ(「WG[*]G」、「WGQ[*]」、「W[*]Q[*]」、「[*]GQG」、「[*][*]GQ」及び「WG[*][*]」)のいずれかを使用して、CDR3の終端を特定した。これらのモチーフは、C末端Nb配列の最後の14残基内に位置している。CDR3は、配列モチーフの1残基前で終了する。詳細については、Augur Llamaスクリプトで確認することができる。
様々なプロテアーゼによるNbのインシリコ消化の切断規則:
トリプシン:C末端からK/R、Pが続かない
キモトリプシン:C末端からW/F/L/Y、Pが続かない
GluC:C末端からD/E、Pが続かない
AspN:N末端からD
LysC:C末端からK
Nbデータベースの配列アラインメント:Nbの配列を、ソフトウェアANARCI(Dunbar, J. & Deane, C.M, 2016)を用いてアライメントした。3つのCDR(CDR1~CDR3)と4つのフレームワーク配列(FR1~FR4)とを、IMGT番号付けスキーム(Lefranc, 2003)に従ってアノテートした。しきい値100未満のe値のアラインメントは削除し、残りの配列をWebLogo(Crooks, 2004)によってプロットした。
異なるプロテアーゼによるNbデータベースのインシリコ消化とNb CDR3マッピングの分析
約50万の一意のNb配列を含む高品質のデータベースを、上記の切断規則に従って、トリプシン、キモトリプシン、LysC、GluC、及びAspNを含む様々な酵素を使用してインシリコで消化した。CDR3含有ペプチドを取得して、配列カバー率を計算した。次いで、CDR3カバー率を合計して、図1D及び図7Bを生成した。CDR3ペプチド長分布(トリプシン及びキモトリプシンによる)をプロットして、図1Eを作成した。
Nbのトリプシン及びキモトリプシン支援MSマッピングのシミュレーション
一意のCDR3フィンガープリント配列を持つ10,000のNb配列を、データベースからランダムに選択した。次に、選択したNbを、トリプシンまたはキモトリプシンのいずれかによってインシリコで消化して(非切断部位が許可されていない)、CDR3ペプチドを生成した。MSによるNb同定をより適切にシミュレートするために、次の基準をこれらのペプチドに適用した。1)ボトムアッププロテオミクスに適したサイズ(850~3,000Da)のペプチドを最初に選択した。2)高度に保存されたWGQGQVTSのC末端FR4モチーフを含むペプチドをさらに廃棄した。観察に基づいて、そのようなペプチドは、C末端のyイオンのフラグメント化が支配的であるが、明確なCDR3ペプチド同定に不可欠なCDR3配列上のイオンのフラグメント化が不十分なことがよくある。3)Nbフィンガープリント情報が限られているCDR3ペプチド(30%未満のCDR3配列カバー率を含む)を除去した。結果として、2,111のユニークなトリプシンペプチドと5,154の一意のキモトリプシンペプチドとを取得した。次に、これらのペプチドを使用して、Nbタンパク質をマッピングした。タンパク質の組み立て後、十分に高いCDR3フィンガープリント配列カバー率(≧60%)を持つNb同定のみを使用して、図1Fのベン図を生成した。
Nb CDR3配列の系統解析
系統樹は、一意のNb CDR3配列と、アラインメントを補助するための追加のフランキング配列(すなわち、CDR3配列のN末端にYYCAA、C末端にWGQG)とを入力したClustal Omega(Sievers, 2014)によって作成した。データを、ITol(Interactive Tree of Life)(Letunic, I. & Bork, P, 2007)によってプロットした。BioPythonライブラリーを使用して、Nb CDR3の等電点と疎水性とを計算した。配列アラインメントを、Jalview(Waterhouse, 2009年)によって視覚化した。
Nbペプチド定量化の再現性の評価
異なるLC実行間で共有されたペプチド同定を使用して、ラベルフリーの定量化法の再現性を評価した。典型的な90分のLC勾配では、ペプチドのピーク幅または半値全幅(FWHM)は一般に5秒未満であった。異なるLC実行間のペプチド保持時間の差を計算して、図3Bのカーネル密度推定プロットを作成した。異なるLC実行からのペプチド保持時間を使用して、ピアソン相関を計算し、図9Bにプロットした。
HSA及びラマ血清アルブミンの配列アラインメント及び配列分析
ラマ(Camelus Ferus)血清アルブミン配列を取得し、tblastn(NCBI)によってHSAとアラインメントさせた。個々のアミノ酸の等電点(pI)及びハイドロパシー値は、(www.peptide2.com/N_peptide_hydrophobicity_hydrophilicity.php)からオンラインで取得した。これらの値を0~1.0の間で正規化し、2つのアルブミン間の配列の変動(pI及びハイドロパシーのペアごとの差)を、アラインメントした位置ごとに計算した。特定のアラインメントされた残基位置について、値0は2つの配列の間に同一の残基が見つかったことを示し、1.0はHSAの負に帯電した残基グルタミン酸400からラクダ科アルブミンの対応するアラインメント位置の正に帯電した残基アルギニンへの電荷反転など、最大の配列変動を示す。アミノ酸の挿入または欠失を確認した位置に0.5の値を割り当てた。このようにして、HSAとラマ血清アルブミンとの間のpI及びヒドロパシーの両方の配列変動をプロットした。プロットを、ガウス関数によってさらに平滑化して、図4Aを生成した。
Nb CDR上のアミノ酸の相対存在量の分析
各CDR(CDR1、CDR2及びCDR3ヘッドを含む)におけるアミノ酸頻度を計算し、正規化して、図6、7、12及び13の棒グラフ及び円グラフを作成した。CDR3ヘッド配列は、CDR3の半保存されたC末端の4残基を除去することによって取得した。高親和性及び低親和性Nbの両方のCDR残基頻度を、各親和性群のCDR残基の合計に基づいて正規化した。
CDR3ヘッド上のアミノ酸位置の分析
CDR3ヘッド上の残基の相対位置を計算した。ここで、値0はCDR3ヘッドのまさにN末端を示し、1.0は最後の残基を示す。次に、CDR3ヘッド配列を、ビン幅0.05の20個のビンにスライスした。各ビン内で、特定の型のアミノ酸(チロシン、グリシン、またはセリンなど)の出現をカウントし、CDR3ヘッド上の残基の合計に対して正規化した。それらの相対位置及び存在量を含む異なるアミノ酸の分布を図5H及び12Gにプロットした。
Nbペプチド候補のプロテオミクスデータベース
検索生のMSデータを、Proteome Discoverer 2.1(Thermo Fisher)に埋め込まれたSequest HTにより、FDR推定のための標準的なターゲットデコイ戦略を使用して、組織内で生成されたNb配列データベースに対して検索を行った。質量精度は、MS1及びMS2に対して、それぞれ10ppm及び0.02Daと指定した。他の検索パラメータには、固定修飾としてのシステインのカルバミドメチル化と、可変修飾としてのメチオニンの酸化とを含めた。トリプシン及びキモトリプシンで処理されたサンプルには、それぞれ最大1つまたは2つの未切断部位を許容させた。最初の検索結果を、q値に基づいて0.01(厳密)のFDRのパーコレーターによってフィルター処理した(Kall, 2007)。データベース検索の後、Augur Llamaにより次の手順で、ペプチドスペクトルマッチング(PSM)のエクスポート、処理及び分析を行った。
a.ナノボディの同定
i)CDR3フィンガープリントの品質評価
ペプチド候補を、最初にCDRペプチドまたはFRペプチドのいずれかであるとアノテートした。CDR3フィンガープリントペプチドを明確に同定するために、PSMにおける高分解能CDR3フラグメントイオンの十分なカバー率を必要とするフィルター/アルゴリズムを実装した(図8Bの説明図を参照)。フィルターは、約50万の一意のNb配列を含むターゲット配列データベースと、同様のサイズの重複しないデコイデータベースとを使用して評価した。本明細書で使用するターゲット及びデコイのNb配列データベースは、異なるラマから取得した。デコイデータベースからのペプチド同定は、偽陽性と見なした。FDRは、ターゲットデータベースからのペプチド同定と比較したデコイデータベースからのペプチド同定の割合に基づいて定義した。CDR3の長さもまた、感度の高いCDR3ペプチドフィルターの開発を可能にするために考慮した。CDR3フラグメント化カバー率は、質量精度ウィンドウ内でフラグメントイオン(bイオンまたはyイオンのいずれか)によってマッチしたCDR3残基の割合として定義した。評価のために同じペプチドのスペクトルを組み合わせた。このフィルター(5%FDR)を通過したCDR3ペプチドのみを、下流のNb組み立てのために選択した。
ii)ナノボディ配列組み立て
信頼できるCDR3ペプチドを含むCDRペプチドを、Nbタンパク質組み立てに使用した。Nbを同定するには、さらに2つの基準をマッチさせる必要がある。これらには以下が含まれる。1)CDR1ペプチド及びCDR2ペプチドの両方がNb組み立てに利用可能でなければならない。2)任意のNb同定について、最低50%の複合のCDRカバー率が義務付けられた。
b.抗原特異的Nbレパートリーの定量化と分類
MSの生データは、MSFileReader 3.1 SP4(ThermoFisher)、及びpymsfilereaderのpythonライブラリー(github.com/frallain/pymsfilereader)によってアクセスした。品質フィルターを通過した信頼性の高いCDR3ペプチドを、ラベルフリーLC/MSによって定量化した。
i)CDR3ペプチドの定量化
CDR3ペプチド同定の正確なラベルフリー定量化を異なるLC実行にわたって可能にするために、ペプチドピーク抽出のための異なる保持時間ウィンドウを指定した。MS/MSスペクトルに基づいて検索エンジンで直接同定できるペプチドについては、ピーク抽出に、+/-0.5分の保持時間(RT)シフトの小さな定量化ウィンドウを使用した。特定のLC実行から直接同定しなかったペプチド(ペプチド及び確率論的イオンサンプリングの複雑さのため)については、それらのRTを隣接するLCのRTに基づいて予測し、2つのLC実行間の一般的に同定されたペプチドの中央値のRT差を使用して調整した。この場合、ペプチドピークの抽出を容易にするために、同定された全てのペプチドの約95%が2つのLC実行間で一致する+/-2.0分(典型的な90分のLC勾配の場合)の緩和されたRTウィンドウを適用した。質量精度ウィンドウを+/-10ppmにして、ペプチドのm/z及びzの両方を使用してピークを抽出した。ペプチドのピークを抽出し、ガウス関数を使用して平滑化した。それらのAUC(曲線下面積)を計算し、複製されたLC実行からのAUCを平均して、CDR3ペプチド強度を推測した。
ii)Nbの分類
例えばNb親和性に基づく正確な分類を可能にするために、3つの異なる生化学的に分画されたNbサンプル(F1、F2及びF3)間のCDR3フィンガープリントペプチドの相対イオン強度(AUC)をI1、I2及びI3として定量化した。定量化結果に基づいて、CDR3ペプチドは、次の基準を使用して3つのクラスター(C1、C2、及びC3)に任意に分類した。
1)C3(高親和性)クラスターの場合:I3>I1+I2(NbがF3により特異的であることを示す)
2)C2(中程度の親和性)クラスターの場合:I2>I1+I3(NbがF2により特異的であることを示す)
3)C1(低親和性)クラスターの場合:
I1>I2+I3(NbがF1に対してより特異的であるか、非特異的バインダーの可能性が高いことを示す)、代わりに、I1<I2+I3及びI2<I1+I3及びI3<I1+I2の場合、これらのNb同定は非特異的に同定された可能性が高く、C1にもグループ化された。図8Cを参照されたい。
上記の方法を使用して、HSA及びGST Nbを分類した。高親和性PDZ Nbの定量化と特徴付けとのために、いくつかの変更を行った。具体的には、MBP相互作用Nbの追加の対照「F_control」(I_controlのイオン強度)を定量化のために含めた。Nb CDR3ペプチドのI2とI3との強度の合計がI_controlの20倍よりも高い場合に(すなわち、20*I_control<I2+I3)、高親和性クラスターNb(それらの一意のCDR3ペプチドによって表される)を定義した。複数の一意のCDR3ペプチドを定量化に使用したNbの場合、同じNbからの異なるCDR3ペプチド間の分類結果は一貫している必要があり、そうでない場合は、最終結果が報告される前に削除された。
CDR3ペプチドの相対強度のヒートマップ分析
同定したCDR3ペプチドを、それらの相対的なMS1イオン強度に基づいて定量化し、その後、Augur Llamaのスクリプトを使用してクラスター化した。Zスコアを、相対イオン強度に基づいて計算し、視覚化のための図3Aのヒートマップを生成するために使用した。
抗原-Nb複合体の構造モデリングNbの構造モデルを、MODELLER(Webb, B. & Sali, A, 2014)のマルチテンプレート比較モデリングプロトコルを用いて取得した。次に、CDR3ループを改良し、下流のドッキング用に上位5つのスコアリングループ構造を選択する。次いで、各Nbモデルを、CDR検索に焦点を当てたPatchDockソフトウェアの抗体-抗原ドッキングプロトコルによって、それぞれの抗原にドッキングさせる(Schneidman-Duhovny, 2005)。モデルはその後、統計的ポテンシャルSOAP(Dong, 2013)によって再スコアリングする。SOAPスコアによる10個の最良のスコアリングモデルの中の抗原界面残基(Nb原子からの距離<XÅ)を使用して、エピトープを決定した。エピトープを定義した後、k-meansクラスタリングを使用して、エピトープの類似性に基づいてNbをクラスタリングした。クラスターは、抗原上の最も免疫原性の高い表面パッチを明らかにする。CXMSデータを含む抗原-Nb複合体は、拘束の達成を最適化する距離拘束ベースのPatchDockプロトコルによってモデル化した(Schneidman-Duhovny, 2020;Russel, 2012)。架橋された残基間のCa-Ca距離が、DSS及びEDC架橋剤でそれぞれ25Å及び20Å以内である場合、拘束が達成されていると見なした(Shi, 2014;Fernandez-Martinez, 2016)。GSTダイマーなどのあいまいな制約の場合、架橋の1つが成立している必要がある。
Nbレパートリーの機械学習分析
ディープニューラルネットワークを、正確な高pH分画法及び定量的プロテオミクスによって特徴付けられた低親和性Nbと高親和性Nbとを区別するようにトレーニングした。このモデルは、バッチ正規化及びReLU活性化機能を備えた1つの畳み込み層と、その後に続く、完全接続層で終わる最大プーリング層とで構成されて、抽出された特徴を、分類子予測につながるロジット層に統合する。畳み込み層は20個の1Dフィルターで構成され、関連するCDRをキャプチャするのに十分に長く、データのオーバーフィッティングを回避するのに十分に短い、ウィンドウサイズ7アミノ酸の局所受容野を構成する。フォワードパスの間、各フィルターは、固定ストライドでタンパク質配列に沿ってスライドし、現在の配列ウィンドウとの要素ごとの乗算を実行し、その後、それを合計してフィルター応答を生成するに至る。モデルの分類精度は92%であった。
低親和性バインダーと高親和性バインダーとを区別するためにネットワークによって学習された物理化学的特徴を理解するために、ネットワークを介して、予測から活性化フィルターまでの活性化パスを計算した。バックプロパゲーションアルゴリズムと同様に、完全接続ネットワークの最後の2つの層からバックワードが繰り返され、シーケンスごとに出力信号を抽出し、分類に最も重みを与える最高のピークを探す。同様に、これらのピークに対する各フィルターの寄与を上流側で計算した。さらに、CDRのフィルターアクティビティを分析して、領域固有のドミナントフィルターを抽出した。このネットワーク解釈のプロセスにより、1シーケンスあたりフィルターごとに一意の寄与が得られる。各フィルターは、最大プーリング層でダウンサンプリングされた配列に沿ってアクティブ化される。各フィルターについて、その最高ピークを選択し、それが分類につながった。最後に、配列ごとに最も寄与するフィルターを決定したところ、それらの関心領域で30%以上の寄与を持つ興味深いフィルターも得られた。
コンピュータで実施された方法
様々な図に関して本明細書で説明した論理的操作は、(1)コンピューティングデバイス(例えば、図14で説明したコンピューティングデバイス)上で実行されるコンピュータ実施行為またはプログラムモジュール(すなわち、ソフトウェア)のシーケンス、(2)コンピューティングデバイス内の相互接続された機械論理回路または回路モジュール(すなわち、ハードウェア)、(3)コンピューティングデバイスのソフトウェアとハードウェアの組み合わせとして実施され得ることを理解されたい。したがって、本明細書で説明する論理演算は、ハードウェアとソフトウェアとの特定の組合せに限定されない。実装は、コンピューティングデバイスのパフォーマンスなどの要件に依存する選択の問題である。したがって、本明細書で説明する論理操作は、演算、構造デバイス、行為、またはモジュールと様々に呼ばれる。これらの操作、構造デバイス、行為、及びモジュールは、ソフトウェア、ファームウェア、専用デジタル論理、及びそれらの任意の組み合わせで実装することができる。図に示され、本明細書で説明されるよりも多くのまたは少ない動作が実行されてもよいことも理解されたい。これらの操作は、本明細書で説明したものとは異なる順序で実行することもできる。
図14を参照すると、本明細書に記載の方法を実施できる例示的なコンピューティングデバイス500が示されている。例示的なコンピューティングデバイス500は、本明細書で説明する方法を実装できる適切なコンピューティング環境の一例に過ぎないことを理解されたい。任意選択的に、コンピューティングデバイス500は、パーソナルコンピュータ、サーバ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、ネットワークパーソナルコンピュータ(PC)、ミニコンピュータ、メインフレームコンピュータ、組み込みシステム、及び/または上記のシステムまたはデバイスのいずれかを複数含む分散コンピューティング環境を含むがこれらに限定されない周知のコンピューティングシステムであってもよい。分散コンピューティング環境では、通信ネットワークまたはその他のデータ伝送媒体に接続されたリモートコンピューティングデバイスが様々なタスクを実行することができる。分散コンピューティング環境では、プログラムモジュール、アプリケーション、及びその他のデータが、ローカル及び/またはリモートコンピュータの記憶媒体に格納され得る。
その最も基本的な構成では、コンピューティングデバイス500は、通常、少なくとも1つの処理ユニット506及びシステムメモリ504を含む。コンピューティングデバイスの正確な構成及びタイプに応じて、システムメモリ504は、揮発性(ランダムアクセスメモリ(RAM)など)、不揮発性(読み取り専用メモリ(ROM)、フラッシュメモリなど)、またはその2つの組み合わせのいずれかであってもよい。この最も基本的な構成が、図14に破線502によって示されている。処理ユニット506は、コンピューティングデバイス500の動作に必要な算術演算及び論理演算を実行する標準のプログラマブルプロセッサであってもよい。コンピューティングデバイス500はまた、コンピューティングデバイス500の様々な構成要素間で情報を通信するためのバスまたは他の通信機構を含み得る。
コンピューティングデバイス500は、追加の特徴/機能を有してもよい。例えば、コンピューティングデバイス500は、磁気もしくは光ディスクまたはテープを含むがこれらに限定されないリムーバブルストレージ508及び非リムーバブルストレージ510などの追加のストレージを含むことができる。コンピューティングデバイス500は、デバイスが他のデバイスと通信できるようにするネットワーク接続(複数可)516を含むこともできる。コンピューティングデバイス500はまた、キーボード、マウス、タッチスクリーンなどの入力デバイス(複数可)514を有することができる。ディスプレイ、スピーカー、プリンタなどの出力デバイス(複数可)512を含むこともできる。コンピューティングデバイス500の構成要素間のデータ通信を容易にするために、追加のデバイスをバスに接続することができる。これらの装置は全て当技術分野で周知であり、ここで詳しく説明する必要はない。
処理ユニット506は、有形のコンピュータ可読媒体に符号化されたプログラムコードを実行するように構成され得る。有形のコンピュータ可読媒体とは、コンピューティングデバイス500(すなわち機械)に特定の方法で動作させるデータを提供できる任意の媒体を指す。実行のため処理ユニット506に命令を提供するために、様々なコンピュータ可読媒体を利用することができる。有形のコンピュータ可読媒体の例には、コンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータなどの情報を格納するための任意の方法または技術で実装された揮発性媒体、不揮発性媒体、取り外し可能媒体及び取り外し不可能媒体が挙げられるが、これらに限定されない。システムメモリ504、リムーバブルストレージ508、及び非リムーバブルストレージ510は、全て有形のコンピュータ記憶媒体の例である。有形のコンピュータ可読記録媒体の例には、集積回路(例えば、フィールドプログラマブルゲートアレイまたは特定用途向けIC)、ハードディスク、光ディスク、光磁気ディスク、フロッピーディスク、磁気テープ、ホログラフィック記憶媒体、ソリッドステートデバイス、RAM、ROM、電気的消去可能プログラム読み取り専用メモリ(EEPROM)、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)またはその他の光ストレージ、磁気カセット、磁気テープ、磁気ディスクストレージまたは他の磁気記憶デバイスが挙げられるが、これらに限定されない。
例示的な実装では、処理ユニット506は、システムメモリ504に格納されたプログラムコードを実行することができる。例えば、バスは、システムメモリ504にデータを運ぶことができ、そこから処理ユニット506が命令を受け取り実行する。システムメモリ504によって受信されたデータは、処理ユニット506による実行の前または後に、リムーバブルストレージ508または非リムーバブルストレージ510に任意選択で格納され得る。
本明細書で説明される様々な技法は、ハードウェアまたはソフトウェアに関連して、または適切な場合にはそれらの組み合わせに関連して実施され得ることを理解されたい。したがって、現在開示されている主題の方法及び装置、またはその特定の態様もしくは部分は、フロッピーディスク、CD-ROM、ハードドライブ、または任意の他の機械可読記憶媒体などの有形媒体に具現化されたプログラムコード(すなわち、命令)の形態をとることができ、プログラムコードがコンピューティングデバイスなどの機械にロードされて実行されると、機械は、現在開示されている主題を実践するための装置となる。プログラマブルコンピュータでプログラムコードを実行する場合、コンピューティングデバイスは一般に、プロセッサ、プロセッサによって読み取り可能な記憶媒体(揮発性及び不揮発性メモリ及び/またはストレージ要素を含む)、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスを含む。1つ以上のプログラムは、例えば、アプリケーションプログラミングインターフェース(API)、再利用可能なコントロールなどの使用を通じて、本開示の主題に関連して説明されるプロセスを実装または利用することができる。そのようなプログラムは、コンピュータシステムと通信するために、高レベルの手続き型またはオブジェクト指向型のプログラミング言語で実装することができる。ただし、必要に応じて、アセンブリ言語または機械語でプログラム(複数可)を実装できる。いずれにせよ、言語はコンパイル言語またはインタプリタ言語である可能性があり、ハードウェア実装と組み合わせることができる。
上述のように、本明細書に記載の論理演算、例えば実施例8に記載の論理演算は、ハードウェア、ソフトウェア、または必要に応じてそれらの組み合わせで実装することができる。例えば、論理演算は、図14のコンピューティングデバイス500などの1つ以上のコンピューティングデバイスを使用して実施することができる。実施例8に記載の論理演算には、ナノボディペプチド配列の抗原親和性を決定する方法、深層学習モデルをトレーニングする方法、及びナノボディペプチド配列の抗原親和性を推測する深層学習ベースの方法が含まれるが、これらに限定されない。これらの操作については、上記で詳しく説明している。
いくつかの実施形態では、コンピュータ実施方法は、
ナノボディペプチド配列を受け取ることと、
ナノボディペプチド配列の複数のCDR領域を同定することであって、CDR領域がCDR3領域を含む、同定することと、
フラグメント化フィルターを適用して、ナノボディペプチド配列の1つ以上の偽陽性のCDR3領域を破棄することと、
ナノボディペプチド配列の1つ以上の破棄されていないCDR3領域の存在量を定量化することと、
ナノボディペプチド配列の1つ以上の破棄されていないCDR3領域の定量化された存在量に基づいて抗原親和性を推測することと、を含む。
いくつかの実施形態では、深層学習モデルをトレーニングするための方法は、
複数のナノボディペプチド配列及び対応する抗原親和性ラベルを含むデータセットを作成することと、
データセットを使用して、低抗原親和性を有するナノボディペプチド配列と高抗原親和性を有するナノボディペプチド配列とを分類するように深層学習モデルをトレーニングすることと、を含む。
いくつかの実施形態では、ナノボディペプチド配列の抗原親和性を決定するための方法は、
ナノボディペプチド配列を受け取ることと、
トレーニング済みの深層学習モデルにナノボディペプチド配列を入力することと、
トレーニング済みの深層学習モデルを使用して、ナノボディペプチド配列を低抗原親和性または高抗原親和性を有するものとして分類することと、を含む。








































参考文献
1.Muyldermans,S.Nanobodies:natural single-domainantibodies.Annu Rev Biochem82,775-797(2013).
2.Beghein,E.& Gettemans,J.NanobodyTechnology:A Versatile Toolkit for Microscopic Imaging,Protein-Protein Interaction Analysis,and Protein Function Exploration.Front Immunol 8,771(2017).
3.Rasmussen,S.G.et al.Structure of a nanobody-stabilized active state of the beta(2)adrenoceptor.Nature 469,175-180(2011).
4.Jovcevska,I.& Muyldermans,S.The Therapeutic Potential of Nanobodies.BioDrugs34,11-26(2020).
5.Lauwereys,M.etal.Potent enzyme inhibitors derived from dromedary heavy-chain antibodies.The EMBO journa l17,3512-3520(1998).
6.Pardon,E.etal.Ageneral protocol for the generation of Nanobodies for structural biology.Nature protocols 9,674-693(2014).
7.McMahon,C.et al.Yeast surface display platform for rapid discovery of conformationally selective nanobodies.Nature structural & molecular biology 25,289-296(2018).
8.Egloff,P.etal.Engineered peptide barcodes for in-depth analyses of binding protein libraries.Nature methods 16,421-428(2019).
9.Fridy,P.C.etal.A robust pipeline for rapid production of versatile nanobody repertoires.Nature methods 11,1253-1260(2014).
10.Savitski,M.M.,Wilhelm,M.,Hahne,H.,Kuster,B.& Bantscheff,M.A Scalable Approach for Protein False Discovery Rate Estimation in Large Proteomic Data Sets.Molecular & cellular proteomics:MCP14,2394-2404(2015).
11.DeKosky,B.J.et al.High-throughput sequencing of the paired human immunoglobulin heavy and light chain repertoire.Nature biotechnology 31,166-169(2013).
12.Elias,J.E.& Gygi,S.P.Target-decoy search strategy for increased confidence in large-scale protein identifications by mass spectrometry.Nature methods 4,207-214(2007).
13.Schneidman-Duhovny,D.,Inbar,Y.,Nussinov,R.& Wolfson,H.J.PatchDock and SymmDock:servers for rigid and symmetric docking.Nucleic acids research 33,W363-W367(2005).
14.Chait,B.T.,Cadene,M.,Olinares,P.D.,Rout,M.P.& Shi,Y.Revealing Higher Order Protein Structure Using Mass Spectrometry.Journal of the American Society for Mass Spectrometry 27,952-965(2016).
15.Rout,M.P.& Sali,A.Principles for Integrative Structural Biology Studies.Cell 177,1384-1403(2019).
16.Yu,C.& Huang,L.Cross-Linking Mass Spectrometry:An Emerging Technology for Interactomics and Structural Biology.Analytical Chemistry 90,144-165(2018).
17.Leitner,A.,Faini,M.,Stengel,F.& Aebersold,R.Cross linking and Mass Spectrometry:An Integrated Technology to Understand the Structure and Function of Molecular Machines.Trends in biochemical sciences 41,20-32(2016).
18.Larsen,M.T.,Kuhlmann,M.,Hvam,M.L.&Howard,K.A.Albumin-based drug delivery:harnessing nature to cure disease.Mol Cell Ther 4,3(2016).
19.Zhu,W.H.,Smith,J.W.& Huang,C.M.Mass Spectrometry-Based Label-Free Quantitative Proteomics.J Biomed Biotechnol(2010).
20.Cox,J.& Mann,M.MaxQuant enables high peptide identification rates,individualizedp.p.b.-range mass accuracies and proteome-wide protein quantification.Nature biotechnology 26,1367-1372(2008).
21.Shi,Y.et al.Structural characterizationby cross-linking reveals the detailed architecture of a coatomer-related heptameric module from the nuclear pore complex.Molecular & cellular proteomics:MCP13,2927-2943(2014).
22.Kim,S.J.et al.Integrative structure an functional anatomy of a nuclear pore complex.Nature555,475-482(2018).
23.Pires,D.E.V.,Ascher,D.B.& Blundell,T.L.mCSM:predicting the effects of mutations in proteins using graph-based signatures.Bio informatics(Oxford,England)30,335-342(2014).
24.Finn,J.A.et al.Improving Loop Modeling of the Antibody Complementarity-Determining Region 3 Using Knowledge-Based Restraints.PloS one11,e0154811(2016).
25.Tiller,K.E.et al.Arginine mutations in antibody complementarity-determining regions display context-dependent affinity/specificity trade-offs.The Journal of biological chemistry 292,16638-16652(2017).
26.Mitchell,L.S.& Colwell,L.J.Analysis of nanobody paratopes reveals greater diversity than classical antibodies.Protein Eng Des Sel 31,267-275(2018).
27.Desmyter,A.etal.Crystal structure of a camel single-domain VH antibody fragment in complex with lysozyme.Nat Struct Biol3,803-811(1996).
28.Li,T.et al.Immuno-targeting the multifunctional CD38 using nanobody.Scientific reports 6(2016).
29.Sheng,M.& Sala,C.PDZ domains and the organization of supramolecular complexes.Annu Rev Neurosci 24,1-29(2001).
30.Doyle,D.A.et al.Crystal structures of acomplexed and peptide-free membrane protein-binding domain:Molecular basis of peptide recognition by PDZ.Cell 85,1067-1076(1996).
31.Niethammer,M.et al.CRIPT,a novel postsynaptic protein that binds to the third PDZ domain of PSD-95/SAP90.Neuron 20,693-707(1998).
32.Akram,A.& Inman,R.D.Immunodominance:Apivotal principle in host response to viral infections.Clin Immunol 143,99-115(2012).
33.Bar-On,Y.M.,Phillips,R.& Milo,R.The biomass distribution on Earth.Proceedings of the National Academy of Sciences of the United States of America 115,6506-6511(2018).
34.Chaplin,D.D.Overview of the immune response.J Allergy Clin Immun125,S3-S23(2010).
35.Acharya,P.et al.Heavy chain-only IgG2b llama antibody effects near-pan HIV-1 neutralization by recognizing a CD4-induced epitope that includes elements of coreceptor-and CD4-binding sites.J Virol87,10173-10181(2013).
36.Arabi,Y.M.et al.Middle East RespiratorySyndrome.New Engl J Med 376,584-594(2017).
37.Flajnik,M.F.,Deschacht,N.& Muyldermans,S.A Case Of Convergence:Why Did a Simple Alternative to Canonical Antibodies Arise in Sharks and Camels? PLoS biology 9(2011).
38.Sircar,A.,Sanni,K.A.,Shi,J.& Gray,J.J.Analysis and modeling of the variable region of camelid single-domain antibodies.J Immunol 186,6357-6367(2011).
39.Baran,D.et al.Principles for computational design of binding antibodies.Proceedings of the National Academy of Sciences of the United States of America 114,10900-10905(2017).
40.Chevalier,A.et al.Massively parallel denovo protein design for targeted therapeutics.Nature 550,74-79(2017).
41.Arbabi Ghahroudi,M.,Desmyter,A.,Wyns,L.,Hamers,R.& Muyldermans,S.Selection and identification of single domain antibody fragments from camel heavy-chain antibodies.FEBS letters 414,521-526(1997).
42.Shi,Y.et al.A strategy for dissecting the architectures of native macromolecularassemblies.Nature methods 12,1135-1138(2015).
43.Chen,Z.L.etal.A high-speed search engine pLink 2 with systematic evaluation for proteome-scale identification of cross-linked peptides.Nature communications 10,3404(2019).
44.Dunbar,J.& Deane,C.M.ANARCI:antigen receptor numbering and receptor classification.Bioinformatics(Oxford,England)32,298-300(2016).
45.Lefranc,M.P.et al.IMGT unique numberingfor immunoglobulin and T cell receptor variable domains and Ig superfamily V-like domains.Dev Comp Immunol 27,55-77(2003).
46.Crooks,G.E.,Hon,G.,Chandonia,J.M.& Brenner,S.E.WebLogo:a sequence logo generator.Genome research 14,1188-1190(2004).
47.Sievers,F.& Higgins,D.G.Clustal Omega,accurate alignment of very large numbers of sequences.Methods in molecular biology 1079,105-116(2014).
48.Letunic,I.& Bork,P.Interactive Tree Of Life(iTOL):an online tool for phylogenetic tree display and annotation.Bioinformatics(Oxford,England)23,127-128(2007).
49.Waterhouse,A.M.,Procter,J.B.,Martin,D.M.,Clamp,M.& Barton,G.J.Jalview Version2--a multiple sequence alignment editor and analysis workbench.Bioinformatics(Oxford,England)25,1189-1191(2009).
50.Kall,L.,Canterbury,J.D.,Weston,J.,Noble,W.S.& MacCoss,M.J.Semi-supervised learning for peptide identification from shotgun proteomics datasets.Nature methods 4,923-925(2007).
51.Webb,B.& Sali,A.Comparative Protein Structure Modeling Using MODELLER.Curr Protoc Bioinformatics 47,561-32(2014).
52.Dong,G.Q.,Fan,H.,Schneidman-Duhovny,D.,Webb,B.& Sali,A.Optimized atomic statistical potentials:assessment of protein interfaces and loops.Bioinformatics(Oxford,England)29,3158-3166(2013).
53.Schneidman-Duhovny,D.& Wolfson,H.J.Modeling of Multimolecular Complexes.Methods in molecular biology 2112,163-174(2020).
54.Russel,D.et al.Putting the pieces together:integrative modeling platform software for structure determination of macromolecular assemblies.PLoS biology10,e1001244(2012).
55.Fernandez-Martinez,J.et al.Structure and Function of the Nuclear Pore Complex Cytoplasmic mRNA Export Platform.Cell 167,1215-1228 e1225(2016).

Claims (11)

  1. 相補性決定領域(CDR)3、2及び/または1のナノボディアミノ酸配列(CDR3、CDR2及び/またはCDR1配列)群を同定する方法であって、前記CDR3、CDR2及び/またはCDR1配列の偽陽性の数が対照と比較して減少しており、前記方法が、
    a.抗原の免疫を持つラクダ科動物から血液サンプルを取得することと、
    b.前記血液サンプルを使用して、ナノボディのcDNAライブラリーを取得することと、
    c.前記ライブラリー中の各cDNAのヌクレオチド配列に対応するアミノ酸配列を同定することと、
    d.前記抗原の免疫を持つ前記ラクダ科動物からの同じまたは第2の血液サンプルからナノボディを単離することと、
    e.前記ナノボディをトリプシンまたはキモトリプシンで消化して、消化産物群を作成することと、
    f.前記消化産物の質量分析を実行して、質量分析データを取得することと、
    g.前記質量分析データと相関する、ステップcで同定されたアミノ酸配列を選択することと、
    h.ステップgの配列内のCDR3、CDR2及び/またはCDR1領域のアミノ酸配列を同定することと、
    i.ステップhの前記CDR3、CDR2及び/またはCDR1領域の配列から、必要なフラグメント化カバー率の割合以上の配列を選択することであって、前記フラグメント化カバー率の割合が、ステップeでキモトリプシンが使用される場合、式f(x,キモトリプシン)=0.0023x-0.0497x+0.7723,x[5,25]によって決定され、またはステップeでトリプシンが使用される場合、式f(x,トリプシン)=0.00006x-0.00444x+0.9194,x[5,30]によって決定され、xは、それぞれCDR3、CDR2またはCDR1領域の配列のアミノ酸長である、前記選択することと、を含み、
    j.ステップiの前記選択されたアミノ酸配列が、偽陽性のCDR3、CDR2及び/またはCDR1配列の数が減少した群を含む、前記方法。
  2. 前記必要なフラグメント化カバー率の割合は約30%である、請求項1に記載の方法。
  3. 前記必要なフラグメント化カバー率の割合は約50%であり、ステップeでトリプシンが使用される、請求項1に記載の方法。
  4. 前記必要なフラグメント化カバー率の割合は約40%であり、ステップeでキモトリプシンが使用される、請求項1に記載の方法。
  5. ステップdは、前記血液サンプルから血漿を取得することと、1つ以上の親和性単離法を使用してナノボディを単離することと、を含む、請求項1~4のいずれか1項に記載の方法。
  6. ステップdの前記1つ以上の親和性単離法は、プロテインGセファロース親和性クロマトグラフィー及びプロテインAセファロース親和性クロマトグラフィーのうちの1つ以上を含む、請求項5に記載の方法。
  7. ステップdは、抗原特異的親和性クロマトグラフィーを使用して抗原特異的ナノボディを選択することと、様々な程度のストリンジェンシー下で前記抗原特異的ナノボディを溶出し、それによって異なるナノボディフラクションを作成することと、を含み、ステップeからステップiまでを各フラクションに対して個別に実行し、前記抗原に対する各異なるステップiのCDR3、CDR2及び/またはCDR1領域配列の親和性を、それぞれ、前記ナノボディフラクションのそれぞれにおける前記CDR3、CDR2及び/またはCDR1領域配列の相対存在量に基づいて推定する、機能的選択ステップをさらに含む、請求項1~6のいずれか1項に記載の方法。
  8. 前記抗原特異的親和性クロマトグラフィーは、前記抗原にコンジュゲートされた樹脂である、請求項7に記載の方法。
  9. 前記抗原特異的親和性クロマトグラフィーは、マルトース結合タンパク質及び前記抗原に結合された樹脂である、請求項7に記載の方法。
  10. ステップiで同定された配列を有するCDR3、CDR2及び/またはCDR1ペプチドを作成することをさらに含む、請求項1~9のいずれか1項に記載の方法。
  11. ステップiで同定された配列を有するCDR3、CDR2及び/またはCDR1領域を含むナノボディを作成することをさらに含む、請求項1~9のいずれか1項に記載の方法。
JP2022566362A 2020-05-01 2021-04-29 ナノボディ及びナノボディ親和性を同定するための組成物及び方法 Active JP7765090B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063018559P 2020-05-01 2020-05-01
US63/018,559 2020-05-01
PCT/US2021/029869 WO2021222546A1 (en) 2020-05-01 2021-04-29 Compositions and methods for identifying nanobodies and nanobody affinities

Publications (2)

Publication Number Publication Date
JP2023524719A JP2023524719A (ja) 2023-06-13
JP7765090B2 true JP7765090B2 (ja) 2025-11-06

Family

ID=78332206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566362A Active JP7765090B2 (ja) 2020-05-01 2021-04-29 ナノボディ及びナノボディ親和性を同定するための組成物及び方法

Country Status (6)

Country Link
US (1) US20230176070A1 (ja)
EP (1) EP4143582A4 (ja)
JP (1) JP7765090B2 (ja)
CN (1) CN116457368A (ja)
CA (1) CA3177089A1 (ja)
WO (1) WO2021222546A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12248524B2 (en) * 2022-04-21 2025-03-11 Glean Technologies, Inc. System, method, and computer program for monitoring and optimizing enterprise knowledge management platform using non-personally-identifiable information in logs
CN114805578B (zh) * 2022-05-06 2022-12-06 浙江大学 一种白细胞免疫球蛋白样受体亚家族b成员2的羊驼纳米抗体、制备方法及其应用
US12437980B2 (en) * 2022-05-20 2025-10-07 Sapient Bioanalytics, Llc Mass spectrometry retrieving of stray samples
EP4612501A1 (en) * 2022-11-02 2025-09-10 Zhejiang Nanomab Technology Center Co. Ltd. Selection of nanobodies using sequence features
WO2025035107A2 (en) * 2023-08-09 2025-02-13 Curadh Mtr, Inc. Trophoblast glycoprotein antibody compositions and methods of use
WO2025081106A2 (en) * 2023-10-12 2025-04-17 Vanderbilt University Nanobody vaccine compositions
CN119798426B (zh) * 2025-03-12 2025-05-23 南京大学 一种靶向金黄色葡萄球菌的纳米抗体及其制备方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170226566A1 (en) 2014-08-07 2017-08-10 Bgi Shenzhen Co., Limited Method and system for screening nanobody
US20190391159A1 (en) 2014-06-25 2019-12-26 The Rockefeller University Compositions and methods for rapid production of versatile nanobody repertoires

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1621554T4 (da) 1992-08-21 2012-12-17 Univ Bruxelles Immunoglobuliner blottet for lette kæder
AU2012225310B2 (en) * 2011-03-09 2017-08-03 Cell Signaling Technology, Inc. Methods and reagents for creating monoclonal antibodies
US20140206579A1 (en) * 2012-08-21 2014-07-24 Syndecion, LLC Dna libraries encoding frameworks with synthetic cdr regions
CN104109207B (zh) * 2013-04-17 2017-12-12 上海市肺科医院 肺靶向性抗肺泡表面活性蛋白a的纳米抗体及其制备方法
EP2989204B1 (en) * 2013-04-23 2019-03-20 The University Court of The University of Aberdeen Isolation of therapeutic target specific vnar domains to icosl
EP3549606A1 (en) * 2015-05-28 2019-10-09 Bio-rad Laboratories, Inc. Affinity ligands and methods relating thereto
WO2017210104A1 (en) * 2016-06-02 2017-12-07 Pierce Biotechnology Inc. Antibody validation using ip-mass spectrometry

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190391159A1 (en) 2014-06-25 2019-12-26 The Rockefeller University Compositions and methods for rapid production of versatile nanobody repertoires
US20170226566A1 (en) 2014-08-07 2017-08-10 Bgi Shenzhen Co., Limited Method and system for screening nanobody

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Peter C. Fridy, et al.,A robust pipeline for rapid production of versatile nanobody repertoires,Nature Methods[online],Vol.11, No. 12,2015年01月,pp.1253-1260,https://pmc.ncbi.nlm.nih.gov/articles/PMC4272012/pdf/nihms634673.pdf,[doi:10.1038/nmeth.3170.]全文、全図。[検索日2025年3月19日]

Also Published As

Publication number Publication date
EP4143582A4 (en) 2024-09-25
US20230176070A1 (en) 2023-06-08
CN116457368A (zh) 2023-07-18
CA3177089A1 (en) 2021-11-04
EP4143582A1 (en) 2023-03-08
JP2023524719A (ja) 2023-06-13
WO2021222546A1 (en) 2021-11-04

Similar Documents

Publication Publication Date Title
JP7765090B2 (ja) ナノボディ及びナノボディ親和性を同定するための組成物及び方法
Xiang et al. Integrative proteomics identifies thousands of distinct, multi-epitope, and high-affinity nanobodies
US11866785B2 (en) Tumor specific antibodies and T-cell receptors and methods of identifying the same
EP2572203B1 (en) Determination of antigen-specific antibody sequences in blood circulation
Akter et al. Broad-spectrum noncompetitive immunocomplex immunoassay for cyanobacterial peptide hepatotoxins (microcystins and nodularins)
WO2013078455A2 (en) Proteomic identification of antibodies
CN102333790A (zh) 检测维生素d的分析方法及用于其的抗体
JP7439108B2 (ja) ヒト心筋トロポニンiに対する組換え抗体
JP2025026923A (ja) 操作されたcd25ポリペプチドおよびその使用
CN106854244B (zh) 一种针对her3的纳米抗体及其临床应用
US20140051586A1 (en) High-throughput methods to produce, validate and characterize mmabs
Le Bihan et al. De novo protein sequencing of antibodies for identification of neutralizing antibodies in human plasma post SARS-CoV-2 vaccination
CN117720650A (zh) 抗人呼吸道合胞病毒抗体及其应用
JP2007502837A (ja) 小型エピトープ抗体を使用するサンプルの複雑さを低減するための方法
CN111018974A (zh) 一种抗人心肌肌钙蛋白i的重组抗体
Lei et al. High-affinity VNARs targeting human hemoglobin: Screening, stability and binding analysis
US12037706B2 (en) Methods and compositions for protein detection
Xiang et al. Integrative proteomics reveals exceptional diversity and versatility of mammalian humoral immunity
Le Bihan et al. de Novo Sequencing of Antibodies for Identification of Neutralizing Antibodies in Human Plasma Post SARS-CoV-2 Vaccination
US20240117070A1 (en) Recombinant antibodies, kits comprising the same, and uses thereof
CN106854246B (zh) 一种针对pi3k的纳米抗体及其临床应用
TWI881667B (zh) 用於預測乳癌預後情形的抗體暨其核酸編碼序列及應用
Sang AI-Guided Computational Tools for Nanobody Discovery and Bioengineering
Levine et al. Origin-1: a generative AI platform for de novo antibody design against novel epitopes
CN111018977A (zh) 一种抗人心肌肌钙蛋白i的重组抗体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250401

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20250627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251017

R150 Certificate of patent or registration of utility model

Ref document number: 7765090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150