慶應義塾大学先端生命科学研究所慶應義塾大学先端生命科学研究所

論文/ハイライト

HOME 論文/ハイライト 研究ハイライト 論文ハイライト MSデータの新規ノイズフィルタリング手法の開発

MSデータの新規ノイズフィルタリング手法の開発

メタボローム研究の強力な助っ人は、ノイズピークの山に埋もれた本物を探り当てるトレジャーハンター

Morohashi, M., Shimizu, K., Ohashi, Y., Abe, J., Mori, H., Tomita, M. and Soga, T. P-BOSS: A new filtering method for treasure hunting in metabolomics. J Chromatogr A, 1159(1-2):142-8.

 質量分析装置(Mass Spectrometer, MS)は、標的分子の質量を解析することでその分子が何か同定するために現在広く用いられている。MSを使ってサンプル試料を分析すると含まれている分子の質量を示すピークスペクトラムが結果として得られ、これはMSデータと呼ばれる。

MSはさまざまな技術との融合がなされているが、中でもキャピラリー電気泳動と飛行時間型質量分析を合わせたCE-TOFMSは、細胞内の代謝物質を一斉分析することが可能な技術である。しかし、ここで得られるような大規模なオームデータを処理する際、特に注意すべき問題となるのがノイズの扱いである。目的とする代謝物質由来のピーク以外にも多くの細かなノイズがピークスペクトラムとして検出されてしまうためである。これまで代謝物質由来のピークを検出するためには、大量の人手を駆使したフィルタリング、あるいは経験則に基づいた閾値の設定などが行われてきた。大量データの処理には同時に大量の人的コスト、経験則が必要とされており、研究者にとっての大きな悩みの種であった。

この煩雑な作業をなんとか自動化できないか。

人手に頼った処理では人為的ミスの可能性も否定することができない。これらの問題点を解決するために、特定の基準に基づいて自動的に閾値を設定し簡単に信頼性の高いデータを抽出したい。そこで開発されたのが、MSデータの新たなフィルタリング手法、P-BOSS (Peak filter Based on Orphan Survival Strategy)である。

 メタボロミクスにおける宝探し(treasure hunting)とも題されているように、この画期的な手法は、ノイズにまぎれた宝、すなわち生体内において重要な働きを担う代謝物質を抽出してくれる。例として、モデル生物である大腸菌(E. coli)のノックアウト変異株について得られた、トリプトファンとプリン生合成経路に関するCE-TOFMSデータにこの手法を適用したところ、質量電荷比(m/z) がほぼ等しいピーク群に含まれるノイズを除去し、代謝物質のシングルピークを抽出することができた。P-BOSSを適用することで、ピーク全体のうち65%をノイズとして除去し、かつ標準物質由来の重要なピークは確実に残すことに成功した。これにより、ピークの初期スクリーニング用のフィルタとしての有効性を示した。

 大量データ時代には、その大量データを処理する新しい手法の開発が必要不可欠だ。また、新しい手法の開発によって、これまでに見えなかった知見を得ることも可能である。解析結果を簡単に、統一した基準でフィルタできる手法 P-BOSS は、メタボロミクス研究における大幅なコストダウンを実現し、その分のコストを本質的な探求活動に充てることを可能にしたという点で、メタボロミクス研究において大きな貢献を果たした。

 生命の本質的な活動である代謝に関する研究は、非常に歴史の長い分野でもありながらも、未知の研究領域も数多く残っている。大量データを効率よく処理・解析し、小さな発見を積み重ねていくことで、今は隠れて見えない生命の謎、まさに「科学の宝」をいつか発見できるに違いない。

[ 編集: 小川 雪乃 ]

TOPへ