To view the English version web page, click here.   日本語のWeb版はここをクリックしてください

newsletter banner

2018年9月号

フロリダ州オーランドで開催される HUPO 2018 に出展します。ブース番号307で皆様のご来店をお待ちしております。

質量分析計を最新型に替えた場合などはMascotの検索条件を変更する必要があるかもしれません。Mascotの検索条件を最適化する手順をご説明します。

「今月の論文」では、芸術作品から非侵襲的(non-invasive)にタンパク質を抽出して同定する方法に関する研究例をご紹介しています。お客様が取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。

「今月の小技」では、日々大きくなるNCBIのnrデータベースの最近の状況についてご説明します。

Mascotニューズレターのバックナンバーは このページ からご覧いただけます。日本語版は「Japanese」リンクをクリックしてください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

今月のトピックス

検索条件の最適化
今月の論文
今月の小技:nr近況
 

Mascot検索条件の最適化手順

実験プロセスを変更した場合(たとえば最新の質量分析計の導入や前処理方法の変更など)は、質量データの質や内容がこれまでとは異なりますので、Mascotの検索条件もそれに応じて見直し、最適化することをお薦めします。Mascotの検索条件が最適化されれば検索結果も改善されます。

最適な検索条件を見つけるための手順を次に示します。お試しください。

  1. アミノ酸配列の質量を変化させる要素の確認
    Mascot検索は「与えられた質量にマッチするアミノ酸配列を探すこと」ですので、実験プロセスを構成する各単位操作において、アミノ酸配列の質量に影響を及ぼす要素(由来生物種、ラベル化法、化学処理、消化酵素、使用機器、断片化法など)を確認してください。たとえば、同位体ラベルを使えばその分質量が増えますし、化学処理を施せば官能基に由来する質量が増減しますし、質量分析計により測定精度が異なります。また、由来生物種を指定して検索することにより、全生物種を指定して検索する場合に比べて同じ質量の「影武者」が少なくなりますので検索結果の見通しが良くなります。

  2. 質量誤差の推定
    質量分析計の測定精度(質量確度や質量精度)はその質量分析計の特性値ともいうべき値ですので、この値に対応する質量誤差をMascot検索で使えば良いと思いますが、念のため平均的・代表的な質量データを使って、質量分析計の質量誤差よりも大きな誤差を設定して試し検索を行い、検索結果の中の確実にマッチしているペプチドを念頭に置いてペプチド及びプロダクトイオンの質量誤差グラフをチェックし、検索に適した「Peptide tol. ±」と「MS/MS tol. ±」の値を決めてください。

  3. 修飾と切断状況の確認(Error tolerant検索)
    Error tolerant再検索機能(Mascotが持っている全ての修飾、semiTrypsinまたはNoneの切断特性を考慮した検索)を利用すると、頻出する脱アミド化などの修飾や未切断部位並びに非特異的切断の存在を確認できますので、これらの結果を通常の検索条件として、あるいは追加検索の際の検索条件として考慮するかどうかを検討してください。

  4. Mascot検索の実行
    最適化した検索条件が決まりましたら「Decoy」の条件を含めて検索を実行し、検索結果を「False Discovery Rate」=1%に調整して検索結果を吟味してください。

より詳しい内容は ブログ にまとめてありますのでご覧ください。

Mascot Distiller

今月の論文

Mascotニューズレターで取り上げてほしい話題や研究論文がありましたらぜひご紹介ください。また、Mascotニューズレターの内容に関してお気づきの点やご質問などありましたらご連絡ください。

 

Minimally Invasive and Portable Method for the Identification of Proteins in Ancient Paintings

Paola Cicatiello, Georgia Ntasi, Manuela Rossi, Gennaro Marino, Paola Giardina, and Leila Birolo

Anal. Chem., 2018, 90, 10128-10133

The authors have developed a method for capturing and identifying proteins from works of art in order to understand aging and deterioration in historical objects. Invasiveness of analytical measurements is a central issue in conservation and restoration of cultural heritage goods, and this method demonstrated no significant surface changes at the microscopic level.

The method uses a cellulose acetate sheet that is coated with Vmh2 hydrophobin, which then non-covalently immobilizes the trypsin enzyme. Dampened sheets are then gently put in contact with the artwork, removing the proteins and generating the peptides. Extraction of the peptides from the sheet is followed by MALDI-TOF MS and MS/MS analysis to identify the proteins.

Eight different historical samples were investigated, one from the detached frescoes by Buonamico Buffalmacco (XIII century) from the Monumental Cemetery in Pisa, and seven unknown painting from the XIX to XX centuries. The results on the Buffalmacco frescoes were in agreement with previously published results.

Thumbnail from featured publication

今月の小技:NCBIのnrデータベース近況

Mascotはオプション設定「MaxSequenceLen」を使って配列データベースを構成する各エントリの文字数を制限しています。初期値は50000ですので、アミノ酸の平均分子量を110として550万程度の大きさのタンパク質まで対応しています。通常はこれで問題ないと思うのですが・・・最近NCBIのnrにアミノ酸残基数が50000を越える次のふたつのエントリが追加されました。

PWL95011 (74488残基)[Clostridiales bacterium]
hypothetical protein DBY08_01055
https://www.ncbi.nlm.nih.gov/protein/PWL95011

PWL93229 (74074残基)[Clostridiales bacterium]
hypothetical protein DBY08_05850
https://www.ncbi.nlm.nih.gov/protein/PWL93229

出処は両方ともヒトの腸のメタゲノムの未発表の論文であり、「ab-intioな遺伝子予測プログラムである GeneMarkS+ を用いた自動計算解析によって得られた」と注釈されています。私見ですがこれらはGIGOの典型例で意味を持たないかもしれません。「MaxSequenceLen 50000」の設定をそのままにすればこれら2つのエントリはMascot検索ではスキップされます(ただし「2 sequences ignored because length greater than maximum configured」のwarningが出力されます)。

もしこれら2つのエントリをMascot検索したい場合は、次回のNCBIprotを更新する前に次の操作を行ってください。

  • Mascotトップページ[Configuration Editor]リンク
  • [Configuration options]リンク
  • [MaxSequenceLen]の値をたとえば80000に変更
  • ページ最下方の[APPLY]ボタン

「MaxSequenceLen」はメモリ消費につながる設定ですので必要以上に大きな値を設定しないでください。

NCBIのnrは巨大な配列データベースであり、日々増殖しています。ダウンロードする圧縮ファイルは38GB、解凍して94GB、セットアップが完了するまでに時間がかかり、セットアップ後のcurrentフォルダは200GBにもなります。最新版のMascotのTaxonomyフィルタは非常に高速に動作しますので、NCBIprotの生物種をしぼって検索するのはストレスにはなりませんが、GenBankのサブセットUniprot complete proteome のようなコンパクトな配列データベースもあります。ディスクスペースを節約することができますのでご検討ください。

jumbo

お問い合せ

マトリックスサイエンス株式会社

〒110-0015 東京都台東区東上野1-6-10 ARTビル1F

info-jp@matrixscience.com

電話:03-5807-7895

ファクシミリ:03-5807-7896

 

Matrix Science logo

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe