慶應義塾大学先端生命科学研究所慶應義塾大学先端生命科学研究所

論文/ハイライト

HOME 論文/ハイライト 研究ハイライト 論文ハイライト ノンターゲット臨床メタボローム研究の確立へ向けて

ノンターゲット臨床メタボローム研究の確立へ向けて

メタボロームデータに含まれる未知ピークの信頼性評価

Saito R, Sugimoto M, Hirayama A, Soga T, Tomita M, Takebayashi T,Quality Assessment of Untargeted Analytical Data in a Large-Scale Metabolomic Study, Journal of Clinical Medicine, 10(9), 1826, (2021).

DOI: 10.3390/jcm10091826

 メタボローム研究とは生体内の様々な代謝物質を測定する研究手法である。特に、測定対象となる代謝物質を限定せずに分析する手法をノンターゲットメタボローム研究といい、分析装置(CE-TOFMS)を用いることで生体サンプルから網羅的かつ高感度に医学的・疫学的に価値のある情報を抽出することができる。しかしながら分析の過程で、装置より得られるピークと呼ばれる波形データからどの種類の代謝物質が生体サンプルに含まれているのかを検出しているのだが、高感度になるほどノイズも増え、"未知ピーク"と呼ばれるノイズかどうか判断がつかないデータが増えてしまう(図a)。特定の代謝物と照合出来ず、ノイズと区別が難しい未知ピークに関しては生化学的に解釈することが出来ないため、ほとんど無視せざるを得ないのが現状である。一方で、過去にはこの未知ピークを精査することで病気の状態を検出するのに適したバイオマーカー候補が発見された例もある (Sugimoto, et al., 2010; Hirayama, et al., 2012)。

 そこで慶應義塾大学先端生命科学研究所の斎藤輪太郎特任教授らは、実際にどれほどの有益データが未知ピークの中に含まれているのか、「鶴岡メタボロームコホート研究プロジェクト」で得られた大量のメタボロームデータに含まれる未知ピークを対象に大規模な調査を行なった。このコホート研究は鶴岡市民協力のもと、生活習慣病の予防法確立に向け調査を続けているものであり、本研究では約3,000人分のコホートデータを用いてメタボロームデータの精度調査を行なった。具体的には、メタボローム解析で分析装置が産出する各ピークの検出率、ピークのシグナル強度、サンプル希釈に応じたピーク形状の変化、そしてピーク同士の相関を評価項目とし、未知ピークの信頼性評価を行った(図b)。コホート研究のように大規模なメタボローム研究において、人手で未知ピークを検出するのは極めて困難なため、まず斎藤特任教授らはメタボロームデータの自動処理システムを開発した。その結果、手動で抽出処理されたピークデータを自動処理システムでほぼ再現することに成功した(相関係数 ≥ 0.8)。このシステムを用いて網羅的評価を行なったところ、血中および尿中サンプルで検出された276個と202個の未知ピーク中、大部分(241個および128個)はノイズであることがわかった。一方で、生体内代謝物質に対応していると推定された血中未知ピークも抽出された(図c)。そして本解析を通じて、ピークがノイズなのか、それとも代謝物質に対応しているかは、広く使われるピークの強度や再現性だけでは判断が難しいことが浮き彫りになった。

 本研究の統計調査は、メタボロームデータから健康情報を引き出し、疾患の検査やリスク判定を行う大規模なコホート研究の礎を築けた事になる。斎藤特任教授は「未知ピークを有効利用するための基盤が整えられました。一方で自動処理パイプラインの改良・評価項目の見直しや、様々な条件検討、性能の最適化、ピーク自動処理精度の改良等、数多くの課題も見えております。今後も課題解決に向けて研究を進めていきます。」と語った。

Cohort_Tsuruoka_unchar_peaks_mini_p1_ovv_JPN1.png

図: 今回の研究で使用したパイプラインの概要

(a)代謝物質および発生したノイズを波形とし出力

(b)データ収集とピーク処理・抽出のパイプラインの概要

(c)生体内代謝物質に対応していると推定された血中未知ピークの一例

[編集: 安在麻貴子]

TOPへ