著者 : Ville Koskinen   2023年9月18日 投稿のブログ記事 (元の英文記事へのリンク)

Mascot Distiller 20周年

今年はMatrix Scienceの25周年(英語版日本語版)、Mascot Serverの25周年であると同時に、Mascot Distillerの20周年でもあります。 Mascot Distiller 1.0は2003年6月にリリースされ、現在も活発に開発が続けられています。Distillerはネイティブ(raw, binary)の質量分析データファイルを開いてその中身を確認したり、スペクトルデータからピーク抽出したりするためのGUIアプリケーションとしてスタートしました。今回はその経緯についてご説明する記事となります。

Distillerを発表したASMS2003の発表資料には、昔のスクリーンショットが多く掲載されています。開発に至った歴史的な背景についても紹介されています。Distillerが開発された目的、それはrawデータを処理するための単一のユーザーインターフェースを提供することでした。多くのラボでは当時も現在も複数のベンダーの装置、あるいは装置メーカーは同じでも異なるデータシステムを持つ装置を使っているケースが多いです。ユーザーインターフェース、マウス操作、用語、アイコンは様々であり、それぞれのシステムでこれらの要素が異なるというのはユーザーにとって大きな負担です。

Distillerは、すべての主要な装置メーカーのフォーマットに対応したデータ変換機能を備えています。同様に重要なことは、Distillerに採用されているピーク抽出アルゴリズムが、どの装置からのスペクトルにも対応するということです。計算された同位体分布に各ピークをフィットさせることで、フラグメントピークを正確に検出し、ノイズを無視し、モノアイソトピック抽出と電荷計算を自動的に行います。

最初のリリースから20年、現在では各装置メーカーが様々なピーク抽出方法を提供しています。またProteoWizard msconvertはよく知られたソリューションで、フリーソフトウェアとしてバンドルされていることが多いです。しかし、装置メーカーに依存しないピーク抽出、rawデータのブラウジング、データベース検索結果と結び付けた可視化、de novo検索、を1つのパッケージにまとめたソリューションは多くありません。Mascot Distillerはそれができるソフトウェアの1つなのです。

下図は2005年11月のDistiller 2.0のスクリーンショットです。主なGUI要素は現在とあまり変わっていませんが、これはむしろ意図的にそのようにしています。私たちの基本コンセプトとして、何か特段の理由がない限り変更する事を避けたいと考えています。ユーザーインターフェースが大きく変わってしまうと、利用者はアプリケーションを勉強し直さなければならなくなるからです。


(click to enlarge)

上図に対し、以下の図は20年後のDistiller 2.8のスクリーンショットです。LFQ(訳者注:Label Free Quantitation)の解析結果で、Mascotの検索結果と4成分の抽出イオンクロマトグラム(XIC,eXtracted Ion Chromatograms)を示しています。


(click to enlarge)

Mascot Distillerはピーク抽出をするだけではありません。オプションの各種Toolboxによって様々な機能が追加されてきました。

DaemonToolbox:Distiller 1.0より登場。Distillerの処理を自動化するためにMascot Daemonを使用します。当初はDaemonがDistillerをデータインポートフィルターとして使用し、ピーク抽出を自動化するだけでした。しかしその後DistillerにおいてSearch ToolboxとQuantitationToolboxが導入された事により、ユーザーはDaemonを使って、タンパク質の同定や各タンパク質の定量計算など全処理をすべて自動化できるようになりました。

Developer Toolbox:Distiller 1.0より登場。様々なWindowsアプリケーションからDistillerピーク抽出計算モジュールを呼び出すことができます。 Developer Toolboxによりユーザーは開発時間を大幅に削減し、すべてのrawファイル形式に対して統一されたアプリケーションプログラマインタフェースを利用する事ができます。

Search Toolbox:2005年にリリースされたDistiller 2.0で登場。de novo検索機能、並びにMascot Serverで行われた検索結果とrawデータ/ピーク抽出データとの統合機能を提供します。統合は双方向です:まず、Distiller上でピークを抽出し、Mascot Server へ検索が投げられます。Server 上で検索が終了すると、結果をDistiller GUIにインポートし、MS/MSスペクトルにマッチしたペプチドの理論ピークを重ねた表示をします。この可視化によりマッチの質を素早く評価する事が可能で、説明困難なフラグメントピーク/誤差/ノイズレベル、などがないか、特定・検証する事ができます。

Quantitation Toolbox:2008年にDistiller 2.2でリリースされ、当初は18O、SILAC、代謝標識のようなアイソバリックな定量法をサポート対象としていました。その後2009年のDistiller 2.3でラベルフリー定量法が追加されました。 Distillerは当初から可視化を重視してきました。TIC情報の表示、データ階層を掘り下げていきながらMSやMS/MSスペクトルを確認できるようなまとめ方、XIC情報の表示、定量フィルターを変更した場合の影響のチェック、などです。このような点にフォーカスを当てたソフトウェアは15年前には珍しいもので、現在でもまだそれほど多くはありません。

Distillerは機能、利便性、速度、定量解析のスケール化など、長年にわたり確実に進歩をしてきました。最初の数バージョンは32ビットのWindowsアプリケーションでしたがメモリの最大使用量が3~4GBと少なく、複数ファイルを同時に扱うのに不向きでした。その後Distillerのコンポーネントは徐々に64ビットに移植され、Distiller 2.4で64ビットを完全サポートするようになりました。 現在では64GBや128GBのRAMを搭載したワークステーションも珍しくなく、数十のフラクション(英語版日本語版)や繰り返し実験を含むラベルフリー定量計算を行う事ができます。 Distiller 2.8からは、以前に比べレポート機能(英語版日本語版)も大幅に改善されています。

今回新たに弊社WEBページにて「release history」ページを追加しました。より詳しい情報を得るため関連コンテンツへのリンクもあります。またDistillerのテクニカルサポートページも、どの情報がどのバージョンに関連するのかを簡単に確認できるように再構築いたしました。是非ご覧ください。


Keywords: , ,