スペクトル中心方式のDIA解析の展望
弊社では現在DIAデータの分析のため、汎用的でスペクトル中心方式に基づく「Mascot DIA」の開発を進めています。このソリューションのプレビューは、当社が開催した「ASMS 2025 Breakfast ミーティング」で発表され、そのときに使用したスライドは無料でダウンロード可能です。さて、私たちがキーワードとしている「スペクトル中心方式の検索」とはどういったものか?どのような問題を解決するのか? このブログ記事にてご紹介していきます。
補完的なアプローチ
「ペプチド中心方式」と「スペクトル中心方式」は、主に検索エンジン開発者が興味を持つような広義の技術用語です。これらはボトムアップLC-MS/MSデータの分析における相補的な手法です。以下に、簡潔ながら有用な定義を示します:
ペプチド中心方式
ペプチド中心方式の解析では、LC-MS/MSの測定において理論的なプリカーサー(ペプチド)の根拠を見つけることです。
ほとんどのペプチド中心方式のプログラムは、クロマトグラムライブラリ、スペクトルライブラリ、またはFASTAファイルから始まり、各溶出時間において理論上のプリカーサー(ペプチド)のリストを作成します。そしてそれを実現するため、機械学習モデルによる予測保持時間、あるいはDDA測定から得られた保持時間データを利用します。各時間点で検出可能な潜在的なプリカーサーに対して、ペプチド中心方式のプログラムはMS/MSスキャンにおけるその断片ピークを追跡します。高い相関をもつ、十分な数のフラグメントの存在が検出された時、プリカーサーは同定されたとみなされます。
スペクトル中心方式
スペクトル中心方式が重視するのは、MS/MSスペクトル内の可能な限り多くのピークのマッチングを説明づける事です。
ほとんどのスペクトル中心方式のプログラムはFASTAファイルから解析を始めます。タンパク質配列データベースをin silicoで消化して理論上のプリカーサー(ペプチド)のリストを作成します。このリストはプリカーサーの質量でフィルタリングされ、観測されたプリカーサー質量に対してあらかじめ指定した許容誤差範囲内のペプチドのみがin silico断片化の対象となります。各候補断片はスペクトルと照合されます。理論上の断片ピークが観測されたピークと十分に一致する場合、プリカーサーは同定されたものとみなされます。
スペクトル中心方式の特徴
どちらの手法においても、最終的に同定されたペプチドのリストを生成し、そのペプチドと紐づいているタンパク質について、固有のペプチド配列が存在するかどうかを考慮しながらタンパク質を同定します。
スペクトル中心方式はペプチド中心方式より優れているか?これは同定する対象によって異なります。以下に、スペクトル中心方式の特徴を一部ご紹介します。
1. 同定に正確なプリカーサー質量が必要
候補ペプチドのリストはプリカーサー質量のフィルタリングに基づいて作成されるため、スペクトル中心方式による同定ではプリカーサーイオンがしっかりと検出可能である事が求められます。DDA解析におけるプリカーサー質量は主にMS1(サーベイ)スキャンから決定されます。しかしDIA解析においてプリカーサー質量をMS/MSスペクトルから推論することも可能です。一方、ペプチド中心方式の同定はプリカーサー質量の証拠が十分でなくても同定が可能で、これは各溶出時間におけるフラグメントピークを追跡する仕組みに依存しています。
2. プロダクトイオンが少ないプリカーサーを誤って同定する事はありません
スペクトル中心方式による同定は、3つ~5つのフラグメントのみに基づいてペプチドを「検出」することはありません。確信度の高い同定には、b/yイオンの良好な測定と十分な配列のカバー率が必要であるため、スペクトル中心方式の同定は本質的に信頼性がより高いといえます。逆にペプチド中心方式の解析はスペクトル以外の情報を組み込んでペプチドの同定を行う事に優れています。例えば、連続して行われるMS/MSスキャンにおいて追跡可能な独自のフラグメント質量を数個生成するようなプレカーサーは、ペプチド中心方式の解析でも十分に検出可能です。
3. MS/MSスペクトルのすべての情報を利用できます
スペクトル中心方式のペプチド同定は、b/yイオンだけでなく、フラグメントのニュートラルロスや二次イオンシリーズ(例:y-H2O)も考慮する必要があります。リン酸化のような多くの可変修飾は特徴的なニュートラルロスピークを有し、修飾の組み合わせを探す際、その違いは1つのフラグメントピークのみ、というようなケースもあります。こういった場合ペプチド中心方式では非常に処理が困難です。しかしスペクトル中心方式なら関連ピークの様々な情報を探すことができる、修飾部位の特定においてはまさに最良の方法です。
4. スペクトル中心方式の解析は保持時間予測に依存しません
LC分離(および/またはイオンモビリティー分離)はDIAにおいて不可欠で、MS/MSスペクトルの複雑さを軽減します。ただし、基本解析単位がMS/MSスペクトルである場合、LC-MS/MS測定における数千から数百万のスペクトルは独立して解析され、クロマトグラムライブラリを取得する必要はありません。使用するカラムや、モデル予測と異なる順序でペプチドが検出されても問題ありません。
5. スペクトル中心方式の解析は、フラグメント強度予測に依存しません
特に、Mascotの確率ベースのスコアリングの部分において、予測されたフラグメント強度情報を使用していません。トレーニングされた機械学習モデルを持たない装置から取得したDIAスペクトルを解析したり、様々な要因でスペクトルライブラリや機械学習予測が利用できないプリカーサーを同定する事ができます。
Mascot DIAが解決を目指す課題
Mascot DIAはスペクトル中心方式のプログラムです。Mascot DistillerはDIA測定データからプリカーサー質量とピークリストを抽出し、これらをMascot Serverに送信します。結果はDistillerに取り込まれ、定量計算が実行されます。
スペクトル中心方式は、ペプチド中心方式が苦戦する複数の応用領域で有効です:翻訳後修飾;内因性ペプチドの同定;トリプシン以外の酵素による半特異的切断;ヒトや酵母以外の種からのサンプル;およびSILAC、18O、(シンプルなLFQではない)代謝ラベルリングのようなプリカーサー質量シフトに基づくMS1定量化手法への応用など。
MS/MSスキャンからのプリカーサー検出とノイズ耐性確率スコアリングに関する詳細は、今後のブログ記事で詳しく説明します。
Keywords: DIA, modification, site analysis