著者 : Ville Koskinen   2023年2月24日投稿のブログ記事 (元の英文記事へのリンク)

創立25年を迎えたマトリックスサイエンス

マトリックスサイエンス(英国本社)は設立から25年が経過いたしました。 1998年にJohn CottrellとDavid Creasyが会社を設立して以来様々な技術的発見があり、今日のプロテオミクスは当時の科学の最先端の内容とは全く異なっています。弊社のここまでの活動は、長きにわたりご利用頂いているお客様なしでは存在し得えませんでした。過去四半世紀に渡るご愛顧、バグの報告、新機能アイデアのご提案、フィードバック、カスタマイズを含む利用、に心より感謝いたします。

データベース検索によるタンパク質の同定は、マトリックスサイエンス社設立より数年前に生まれたアイデアです。

1998年に英国Imperial Cancer Research FundからMOWSEのライセンスを受け、「Mascot Server」としてソフトウェア開発をしたのが弊社の始まりです。その後も製品は継続的に改良され、Mascot Server内にオリジナルのMOWSEソースコードの痕跡を見つけるのは困難です。多岐にわたるヘルプページのインデックスを見ても、長年にわたって導入された新機能による広がりが感じられます。

Mascot Serverは1998年11月に公開を開始しました。当時は無料サービスのみが存在し、小規模なデータベース検索に利用可能でした。最新のMascotをご利用頂いておりました。サービス開始以来、2700万件以上のデータベース検索が実施されています。これにin houseの製品版MASCOT Serverでの検索を加えれば、膨大な数のMascotの検索結果が実施されたことになります。

どの程度が「小規模」なのかという基準はこれまで何度か引き上げられてきました。無料サービスを開始した当初は1度の検索で同時クエリー数300MS/MSスペクトルを上限としていました。その後、プロテオミクス実験の規模が大きくなるにつれ基準が見直され、現在では無料サービスの上限は20,000 MS/MSスペクトルとなっています。製品版Mascotにはこのデータ数による制限はありません。検索可能なデータ数の上限に関係がありそうな要素としてはハードウェアスペックがありますが、それ以外の制約はありません。数百万のタンパク質配列のデータベースに対する数百万のクエリーの検索といった、非常に大規模な検索を行う事も可能です。

2000年から2006年にかけて、Mascot ServerはWindowsとLinuxに加えて、いくつかのプロセッサ・アーキテクチャとオペレーティング・システムをサポートしていました。IBM AIX (PowerPC), Sun Solaris (SPARC), HP Tru64 Unix (Compaq Alpha), SGI IRIX (MIPS) などですがこれらを覚えている読者はどれくらいいるでしょうか。 2003年にAMDが64ビットx86アーキテクチャを発表し、その数年後にはマルチコアx86プロセッサが主流となると、ワークステーションやサーバー市場から他のアーキテクチャが徐々に消えていきました。MASCOT ver.2.2くらいになると、Mascot ServerはWindows版とLinux版をx86でご利用頂くユーザーがほぼすべてとなりました。

2000年にリリースされたMascot Server 1.5には、Mascot Serverに同梱される自動検索クライアントソフトウェアであるMascot Daemonが始めて含まれるようになりました。またMascot ParserはMascotの検索結果へのAPIを提供するソフトウェアライブラリですが、こちらは2002年に最初のリリースが行われました。以来、DaemonおよびParserのメジャーバージョンはMascot Serverのリリースに連動し、新機能が追加された場合には適宜更新されています。ParserはMascotバージョン1.0の検索結果ファイルでも読み込むことができ、下位互換性に非常に優れています。

Mascot Distillerは、ネイティブ(バイナリ)質量分析データファイルをブラウズして処理するためのGUIアプリケーションとしてスタートし、2003年にバージョン1.0が登場しました。その後、Mascot Serverやde novo sequencingの解析結果と組合わせたタンパク質やペプチドの同定、さらにはアイソトピック/アイソバリック、ラベルフリーの定量を行うためのソリューションに成長しました。Mascot Daemonとの統合により、rawデータから定量までのワークフローが完全に自動化されました。

2003年11月に田中 直樹と宇佐見 至が日本法人マトリックスサイエンス株式会社を設立しました。来年はMSKKの20周年になります。おめでとうございます。MSKKはマトリックスサイエンス製品の日本総代理店であり、トレーニングやサポートも行っています。 また他にも長年にわたりThermo、Bruker、Waters、SCIEX、島津製作所と提携し、装置購入時の組み合わせの一部としてMascot Serverを提供しています。

Mascot Server、Daemon、Parser、Distillerはまだ健在ですが、それ以外に存在していた3つの製品が現在は製造中止になっています。Mascot WizardはPMF検索を行うためのフリーウェアのツールで、Mascot Daemonの簡易版のようなものでした。Mascot Wizardは、PMFがMS/MSにほぼ取って代わられた2007年、実質的にDaemonと機能が大幅に重複していると判断して廃止しました。

Mascot Integraは、LabVantage社のLIMSパッケージをベースに、プロテオミクスデータのサンプル管理を行う初期の試みでしたが、2010年に製造中止となりました。Mascot Serverを使用していたユーザーの大半がLIMSソリューションを望んでいなかったためです。Integraが目指したものはMascot Insightに引き継がれました。IntegraもInsightもサーバーアプリケーションでしたが、InsightはLIMS機能のほとんどを削除し、データのレポートと可視化機能に特化させました。しかし残念ながらinsightも2015年に開発終了となりました。その機能はさらに別製品に引き継がれ、現在では主にMascot Distillerに、insightの時と同様のレポート機能が実装されています。今後、PythonをベースとしたDistillerのレポート機能は改良が加えられる予定です。

Mascot関連製品の今後の展望について、最後に触れたいと思います。Mascot関連製品の目標は、日常的な解析における、あらゆる機器に対応し信頼性が高く高性能なデータ解析ソリューションを提供することです。Data Independent Acquisition(DIA)が普及し始めて久しいですが、まだMASCOT関連製品ではDIAに対応するソリューションはありません。「機械学習」は今日の流行りの言葉ですが、MascotにはPercolatorをバージョン2.3から付属しているものの、保持時間やMS/MSスペクトルの予測など最新のイノベーションといえる技術をMascotに活用する事ができていません。また、データセットの大きさが拡大し続けているため、スケーラビリティ、スピード、大規模データセットの解析の容易さに対しても継続的に注意を払ってより良い状況を目指しています。 現在および将来のプロテオミクスの課題に対応するため、様々なコンセプトの製品の開発やリリースを検討しています。

このブログは2012年にスタートし、ニューズレターは2014年から毎月配信しています。これらの情報で、Mascotのニュースや製品リリースの動向をいち早く知ることができます。購読は無料で、メールアドレスを他の目的に使用することはありません。 最後に、マトリックスサイエンスは2001年からASMSでユーザーミーティングやブレックファストミーティングを開催し、パンデミックの時期を除いて毎年継続しています。皆様とASMS2023でお会いできることを願っています!


Keywords: ,