2024年2月号 (#111)

今月のブログは、狭いウィンドウ幅のDIAデータから想定外の修正を特定するためにMASCOTを適用した事例についてです。

今月の論文は、レーザー・マイクロダイセクションを用いて子宮体癌腫瘍の空間的不均一性に関して調べた研究です。

今月の小技は、MASCOTから削除された配列データベースの定義についてです。

Mascotニューズレターのバックナンバーはこのページ(英語版日本語版)からご覧いただけます。ご一読の上、ご意見・ご質問等ございましたら、お気軽にお問い合わせください。

MASCOT : 25年間にわたり信頼を受けてきた、質量分析によるタンパク質同定のリファレンススタンダード

狭いウィンドウ幅のDIAデータから、想定外の修飾を見つける

現在のほとんどのDIAソフトウェアはペプチド中心(peptide-centric)の検索手法で、ペプチド同定のためにスペクトルライブラリーを必要とします。その場合、対応できるタンパク質配列の最大数、可変修飾、ミス切断が制限される事になります。一方Mascotのようなスペクトル中心の検索手法にはそのような制約はありません。特に、MascotのオプションであるError Tolerant(ET)検索は、狭いウィンドウ幅のDIAデータの解析で想定外の配列バリアント・修飾・非特異的な酵素切断産物を同定する強力なアプローチとなる可能性があります。

その可能性について検証するため、レポジトリサイトPRIDEから取得した前立腺がんデータセットに対してET検索を実施しました。スペクトルは8 m/zの分離ウィンドウを持つDIAモードで取得されたデータです。今回行うET検索というのは2段階のプロセスで構成されています。最初の検索は、検索画面で指定したパラメーターを使用して通常通り実行されます。そして2段階目の検索では、1回目の検索で同定基準を超えたタンパク質のみに検索対象を絞り、化学的修飾および翻訳後修飾、アミノ酸残基置換を考慮し、酵素特異性を緩和するといった、検索空間を広げた2回目の検索を行います。

今回のテストではET検索により追加で6835個の有意なPSMと1072個のペプチド配列が見つかりました(1% PSM FDR)。これら追加されたペプチドは、アミノ酸配列の置換のほか、非特異的切断、脱アミド化、リン酸化、グリコシル化などのペプチドが含まれていました。

詳しくは私たちのブログ(英語版日本語版)をご覧ください。

多領域マイクロサンプリングによる子宮漿液性癌の3次元的腫瘍内プロテオーム不均一性のマッピング

Mapping three-dimensional intratumor proteomic heterogeneity in uterine serous carcinoma by multiregion microsampling

Allison L. Hunt, Nicholas W. Bateman, Waleed Barakat, Sasha C. Makohon-Moore, Tamara Abulez, Jordan A. Driscoll, Joshua P. Schaaf, Brian L. Hood, Kelly A. Conrads, Ming Zhou, Valerie Calvert, Mariaelena Pierobon, Jeremy Loffredo, Katlin N. Wilson, Tracy J. Litzi, Pang-Ning Teng, Julie Oliver, Dave Mitchell, Glenn Gist, Christine Rojas, Brian Blanton, Kathleen M. Darcy, Uma N. M. Rao, Emanuel F. Petricoin, Neil T. Phippen, G. Larry Maxwell & Thomas P. Conrads

Clinical Proteomics volume 21, Article number: 4 (2024)

著者らは、子宮漿液性癌(uterine serous carcinoma,USC)の腫瘍の微小環境レベルでの3次元的不均一性を調べました。著者らは、空間的な分離を可能にするレーザー・マイクロダイセクション(laser microdissection , LMD)を用いて、9人の患者の腫瘍組織標本から細胞亜集団を選択しました。

標本ブロックをクライオトームで連続した10µmの組織切片に切り出し、LMDを用いて、標本ブロックの空間的に異なる5つのレベルに濃縮された腫瘍上皮(ET)細胞または腫瘍浸潤間質(ES)細胞を分離しました。LMD組織をトリプシン消化し、1サンプルあたり5μgのトリプシンペプチドを16-plexのタンデムマスタグで標識しました。 サンプルはLC-MS/MSの前に塩基性逆相LCで分画しました。最低2つのPSMがアサインされているタンパク質においてそれらPSMのTMTレポーターイオン比からタンパク質の定量計算をしました。

LC-MS/MSにより、各患者に特異的な平均9548±450個のタンパク質が定量解析され、そのうち9人の患者全体で共通して定量解析できたのは合計6503個のタンパク質でした。その中の351個の変動タンパク質(絶対偏差の中央値>1)を教師なし階層的クラスター分析する事により、ESから独立したETのクラスターとなる、2つの優勢な枝分かれが明らかになりました。また逆相タンパク質アレイのデータのうち160は、MSと共定量されました。

著者らはまた、今回のUSC研究によるETとESの間で有意に変化したタンパク質について、以前の卵巣がんデータセットの解析と比較したところ、ETとESの間で共通して変化し同じ変動傾向を示したタンパク質が合計313個見つかりました。

Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

廃止されたデータベース定義の削除

Illustration for Mascot Tip

Mascot Serverでは、設定ファイルdatabases_1.xmlに配列データベース用の定義済みの設定が含まれています。これら設定には、SwissProtのように今日でも頻繁に利用されているデータベースだけでなく、現在では廃止されたデータベースの定義も含まれています。

International Protein Index (IPI)は2004年にEBIによってまとめられました。Mascot Server では Predefined Database として、ver.2.4からdatabases_1.xmlに追加されています。IPIデータベースは2011年9月にUniprot proteomesに取って代わられましたが、FASTAファイルが変わらず入手可能であったため、つい最近まで設定をファイルに保持していました。しかし、そのFASTAファイルもとうとうEBIのウェブサイトから消えてしまったため、弊社ではdatabases_1.xmlからIPIデータベースを削除いたしました。

SARS-CoV-2の定義も削除しました。これはUniprotが2020年に作成したプレリリースデータベースのものでした。その後配列が見直され、さらにそれらはSwissProtに追加されました。もはや存在価値もなくなったため、Predefined Definition のリストから削除しました。

Predefined Definitionから該当データベースを削除しても、ローカルにインストールされているMascot Server内のデータベースは削除されずに残ります。上記のデータベースを有効にしていた場合、そのローカル設定は以前のバージョンのdatabases_1.xmlを指し、シーケンスデータベースは引き続き動作します。ただし削除されたデータベースは、新しいシステムで設定そのままに有効化することはできませんし、同じシステムでも一旦データベースを削除した場合再度有効にすることができなくなります。もしまだデータベースが必要であれば、Database Managerでローカルコピーを作成し、バックアップをとっておく事を推奨します。

お問い合せ

マトリックスサイエンス株式会社

〒110-0015

東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

Matrix Science logo