今月のブログは、fastaファイル提供が停止しているNCBI nrのタンパク質データベースについてです。
今月の論文は、妊娠中の免疫の調節に関する研究のご紹介です。
今月の小技は、Linux上でMascot Serverをシステムサービスとして設定するのに便利なsystemd ユニットファイルについてです 。
Mascotニューズレターのバックナンバーはこのページ(英語版、日本語版)からご覧いただけます。ご一読の上、ご意見・ご質問等ございましたら、お気軽にお問い合わせください。
NCBI nrは米国国立生物工学情報センター(National Center for Biotechnology Information , NCBI)が提供する非同一(non-identical), 包括的なタンパク質配列データベースです。このデータベースの設定は長い期間、Mascot ServerにPredefined設定「NCBIprot」として同梱されてきました。しかしFASTAファイルはひっそりと廃止された模様で、最終更新日が2024年2月のまま停止しています。
BLAST自体は廃止されていないため、データベースをローカルでコンパイルしFASTAファイルを手元で作成することは現在でも可能です。実施には、NCBIのblast+パッケージとPerlのインストールが必要です。blast+コマンドのupdate_blastdb.plは圧縮された小分けファイル単位でBLASTをダウンロードします。このブログ記事執筆時点では合計ファイルサイズが約354GBです。得られた小分けファイルは解凍する必要があります(約600GBに展開)。その後、blastdbcmdを使用してFASTA形式のデータベースをnr.fastaとして抽出できますが、これにはさらに450GBのディスク容量が必要です。
NCBI nrのコンパイルと設定の詳細な手順はこちらのブログ記事(英語版、日本語版)をご覧ください。
NCBI nrは膨大なサイズのため、検索対象としては最後の選択肢としてのご利用を推奨してきました。NCBIprotに代わるデータベースのご提案としては、UniProt TrEMBLデータベースが挙げられます。2026年2月リリース予定のUniProtではTrEMBLの再編成が行われ、「reference proteome」(参照プロテオーム)データの数が増加し、未注釈または注釈不足の配列が減ります。これにより生物の系統樹全体を網羅する包括的なデータに近づき、NCBI nrの使用用途の代替にふさわしい状況になります。
Justyna Szczykutowicz, Mariusz Zimmer, Magdalena Orczyk-Pawiłowicz
Scientific Reports 15:32966, 2025
妊娠中、母体と胎児の免疫系は、病原体からの防御と胎児拒絶の回避を両立させなければなりません。著者らは、マクロファージ・ガラクトース型 C 型レクチン(MGL)と羊水糖タンパク質の相互作用を調べました。これらが過剰な炎症や自己免疫疾患からの保護に寄与すると考えられているためです。著者らは、ムチン、ムチン様タンパク質、ウロモジュリンを含む複数の MGL リガンドを明らかにし、妊娠期におけるMGLを介した免疫恒常性維持という仮説を支持しています。
分娩時の羊水サンプルをプールして MGL プルダウンアッセイを行い、Ca2+で活性化した MGLと陰性対照(GalNAc で飽和させた MGL)を比較しました。一次元ゲル分離、通常のアルキル化処理、トリプシン消化の後、試料を LC-MS/MS(Evosep One/Orbitrap Exploris 480)で解析しました。データは Mascot Distiller で処理し、ヒトプロテオームに対する検索を行いました。その際O 結合型糖鎖リガンドを同定するため、HexNAc(S/T)を可変修飾として設定しています。バイオインフォマティクス解析には、STRING(タンパク質間相互作用)、Gene Ontology、Reactome 経路解析を用いました。
Mascot ServerはMascot Monitor(ms-monitor.exe)と呼ばれるバックグラウンドサービスを実行しています。Monitorサービスは配列データベースの管理を担当し、検索エンジンを実行するにはこのサービスが稼働している必要があります。
Windowsでは、Mascot Serverインストーラーが自動的に適切なシステムサービスを設定します。一方私たちはLinux向けに、手順を簡略化するための新しいsystemdユニットファイルを作成いたしました。
新しいヘルプページの手順に従い、systemdユニットファイルをダウンロードして適切な場所にコピーしてください。必要な設定はMascot Serverのインストールパスだけです。ユニットファイルが有効化されると、標準のsystemctlユーティリティでサービスを制御できます。
マトリックスサイエンス株式会社
〒110-0015
東京都台東区東上野1-6-10 ARTビル1F
電話:03-5807-7895
ファクシミリ:03-5807-7896