著者 : Richard Jacob   2020年12月22日投稿のブログ記事 (元の英文記事へのリンク)

Mascot Server のライセンス数:いくつ必要か?

 新規に購入を検討されるお客様からのよくある質問の一つに、Mascot ServerにはいくつのCPUライセンスが必要ですか?というものがあります。この質問への回答には2つの要素があります。コンピュータにいくつのCPUとコアを持たせるかと、MASCOTでいくつのコアを計算に利用するか、です。まず、MascotのライセンスはCPUライセンスであり、かつ1 CPUライセンスで4コアまで使用できます(訳者注:日本でのみ、 ver.2.7から1CPUあたり6コアまで使用できるよう特別に変更しています)。コンピュータは複数のプロセッサを持つことができ、各プロセッサは4コア以上のコアを持つことができますが、ライセンス数に応じたコア数だけが検索に使用可能です。一般的に、ライセンス数を2倍にして計算に利用されるコア数が2倍になると、他のすべての要素が同じに保たれている場合検索時間は半分になります。再び2倍にすると検索時間は4分の1になります。

 質量分析計測定を完了する時間するよりも早く検索エンジンがデータを分析し終わるのが理想的な状況です。測定で得られた各データの検索時間は、コンピュータのハードウェアと検索パラメータの両方に依存します。過去のブログ記事において、"How long should a search take?"と題した一連の投稿で説明していますのでそちらも併せてご参照ください。

 エントリーレベルとしては1CPUライセンスをお勧めいたします。1台の質量分析計を使い始めたばかりのラボや、共同研究者やコアラボから得たデータを使って独自の分析を行う必要があるラボに適しています。ラボがサービスラボやコアラボである場合、または24時間365日装置を稼働させているような場合は2-4 CPUライセンスの方が適しているかもしれません。

 各サンプルを同じ条件で大量に検索しなければならないプロジェクトでは、Mascot Daemonのリアルタイムモニター機能を使って質量分析計から出てくるデータを自動的に検索することができます。(訳者注:Daemonのリアルタイムモニター機能は、特定のフォルダに新たに生成されるrawデータをその都度認識して、あらかじめ指定した検索条件で自動的に検索にかける事ができる機能です。) 夜中の間に測定されたデータが自動的に検索にかけられ朝には検索結果があなたを待っています。ただしリアルタイムモニター機能はいつも使えるわけでなく、例えば分画されたサンプルを1つの検索にマージする用途には使用できません。また、異なる検索条件を準備する必要がある複数のプロジェクトからのサンプルも同様に適用できません。こういったケースでは、24時間分の測定データでも8~9時間で検索しなければならないかと思います。

 5つ以上のCPUライセンスを搭載したMascot Serverは、大規模なコアラボや複数の質量分析装置を運用しているラボに適しています。これらのシステムはデータを大量に処理することができます。2つのプロセッサを搭載しそれぞれが多数のコアを持つコンピュータや、複数台のPCで構成されるクラスターシステムが必要です。

 必要な CPUライセンス数を決定する最良の方法は、試しにいくつかのサンプルファイルをどこかのMASCOT Serverシステムで検索し、それがどのくらい時間がかかるかを確認することです。これらファイルの入手先としては、購入を検討している新しい装置や既存の装置のデモセッションから得られたファイルや、PRIDEjPOSTのようなリポジトリで公開されているデータセットなどが考えられます。弊社でも結果や検索時間を確認するためのテスト検索を行う事ができますので、ご希望の方はご遠慮なくお申し付けください。また先日、CPTACプロジェクトのデータを使ってテスト解析を実施いたしました。プロジェクトに含まれているhumanRefSeqデータベースとUniprot human proteome databaseに対して、公開されて情報と同じパラメータを使って検索しました。検索には1CPUライセンスのMascot Serverを使用しましたが、1フラクションあたり2~3分で完了しました。プロジェクトの全データセット、測定に7日を要したデータが、8時間以内で検索できました。

 サンプルの種類を変えた際、思いがけず検索に時間がかかってしまうことがあります。例えばサンプルが未知の細菌種からのもので、NCBIprotまたはUniRef100のすべての細菌配列に照合した検索を行う必要がある場合などです。先ほどのCPTACの解析例と同じくらいのデータサイズと仮定したうえで、検索対象のエントリーが10倍になると仮定すれば、1フラクションの解析に20~30分、プロジェクト全体では3~4日かかる事になります。このようなケースでは2または3CPUライセンスの方が良いかもしれません。

 分析するサンプル数が増えるなど、より高速な分析が必要になった場合はどうすればよいでしょうか?後日、CPUライセンス数を追加して頂くことで対応可能です。ライセンスの変更は、新しいプロダクトキーを登録し直すだけの簡単な作業です。あるいは同じタイミングでMascot をハイスペックなコンピュータに移動する必要がある場合、そのために必要な手順をご案内いたします。(訳者注:日本法人では、保守にご加入のお客様の場合、弊社技術担当が訪問して移設作業を行う事も可能です。) 一方で、必要以上に多いライセンスを購入してしまうと、初期のライセンス費用とコンピュータの価格だけでなく、ソフトウェアの年間のメンテナンス費用も高くなってしまうのであまりお勧めできません。


Keywords: , , , ,