はじめに
心電図やスマートウォッチで計測される脈拍など、私たちの周りには様々な健康データが存在します。これまでは個別に分析されることが多かったこれらのデータを、AIを使って統合することで、病気の遺伝的な要因をより深く、そして正確に解明しようという研究が進められています。
本稿では、Google Researchが2025年6月23日に公開した記事「Unlocking rich genetic insights through multimodal AI with M-REGLE」を基に、複数の医療データを統合して分析する新しいAI技術「M-REGLE」について、その仕組みと可能性を詳しく解説します。
引用元記事
- タイトル: Unlocking rich genetic insights through multimodal AI with M-REGLE
- 発行元: Google Research
- 発行日: 2025年6月23日
- URL: https://research.google/blog/unlocking-rich-genetic-insights-through-multimodal-ai-with-m-regle/
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- M-REGLEは、心電図(ECG)や光電式容積脈波(PPG)といった複数の異なる種類の健康データ(マルチモーダルデータ)を統合して分析するAI手法である。
- データを個別に分析する従来手法(U-REGLE)と比較して、病気に関連する遺伝子の発見能力が大幅に向上する(最大19.3%増)。
- M-REGLEは、データを分析の初期段階で結合し、変分オートエンコーダ(CVAE)というAI技術でデータに潜む本質的な特徴を抽出することで、より高品質なデータ表現を学習する。
- この手法で構築した多遺伝子リスクスコア(PRS)は、特に心房細動などの心疾患の予測精度を著しく改善する。
- スマートウォッチの普及により、M-REGLEのようなマルチモーダル分析は、個別化医療や予防医学の発展に大きく貢献する可能性を秘めている。
詳細解説
なぜ今「マルチモーダル分析」が重要なのか?
現代医療の世界では、電子カルテや医療画像、ゲノム情報、さらには多くの人が日常的に使用するスマートウォッチに至るまで、膨大かつ多様なデータが生み出されています。これらの異なる種類のデータは、それぞれが私たちの健康に関する独自の、そして補完的な情報を持っています。
例えば、心臓の健康状態を考えてみましょう。病院で測定する心電図(ECG)は心臓の「電気系統」の活動を詳細に捉え、一方でスマートウォッチにも搭載されている光電式容積脈波(PPG)は血流量の変化を追跡し、心臓の「ポンプ機能」の効率を評価します。これらを別々に分析するのではなく、同時に分析することで、心臓の全体像をより正確に把握できるはずです。
しかし、従来の手法では、これらのデータを個別に分析し、後から結果を突き合わせるのが一般的でした。この方法では、データとデータの間に隠された、病気を解明するための微細な関連性を見逃してしまう可能性がありました。そこでGoogleの研究者たちは、これらのデータを最初から「一つのもの」として扱う、マルチモーダルAI「M-REGLE」を開発したのです。
M-REGLEの技術的な仕組み
M-REGLEは、どのようにして複数のデータから、より豊かな知見を引き出すのでしょうか。そのプロセスは、大きく4つのステップに分けることができます。
- データの統合入力:
M-REGLEの最大の特徴は、ECGとPPGのような異なるデータを、分析の開始時点から1つのデータセットとして結合する点にあります。これは、別々の食材を個別に調理するのではなく、最初から一緒に煮込むことで新しい味を引き出す料理に似ています。この「同時入力」が、データ間の隠れた相乗効果を引き出す鍵となります。 - AIによる本質的な特徴の抽出(CVAE):
次に、結合されたデータは畳み込み変分オートエンコーダ(CVAE) というAIに入力されます。CVAEは、ノイズが多く複雑な元のデータ(心電図の波形など)から、そのデータが持つ最も本質的な特徴だけを凝縮した「潜在因子」と呼ばれる低次元のデータ表現を学習します。これは、長文の記事から要点だけを抜き出す作業に似ており、後の分析に本当に必要な情報だけを効率的に取り出す役割を果たします。 - 特徴の整理整頓(PCA):
CVAEによって抽出された特徴が、互いに独立した意味を持つように、主成分分析(PCA) という統計的な手法を用いて整理整頓(直交化)します。これにより、各特徴が体の特定の機能とより明確に対応付けられるようになり、分析の精度が向上します。 - 遺伝子との関連付け(GWAS):
最後に、整理整頓された特徴と、何万人分もの遺伝子情報が格納された大規模なバイオバンクのデータを照らし合わせます。ゲノムワイド関連解析(GWAS) と呼ばれる手法を用いて、どの遺伝子の変異が、どの特徴(つまり、体の特定の生理機能)と統計的に強い関連を持つかを特定します。

M-REGLEがもたらした成果
この新しいアプローチにより、M-REGLEは従来の手法(U-REGLE)を大幅に上回る成果を上げています。

- 遺伝的関連の発見数が大幅に増加:
12誘導心電図の分析では、従来法より19.3%も多くの病気に関連する遺伝的領域を発見しました。これは、これまで原因が分からなかった病気のメカニズム解明に繋がる可能性を秘めた、非常に重要な成果です。 - 疾患リスク予測の精度が向上:
M-REGLEが発見した遺伝的変異を用いて、個人の病気へのかかりやすさを示す多遺伝子リスクスコア(PRS) を作成したところ、特に心房細動という心疾患の予測精度が著しく向上することが確認されました。これにより、将来的に個人の遺伝情報から、より早期かつ正確に病気のリスクを予測し、予防的な介入に繋げることが期待されます。 - AIの判断根拠の可視化:
さらに、M-REGLEが学習した「潜在因子」が、実際に心電図や脈波のどの部分の変化を捉えているのかを可視化することにも成功しています。これは、AIがなぜそのような判断を下したのかを人間が理解する上で重要であり、AI技術の信頼性を高める一歩と言えます。
まとめ
本稿で紹介したGoogleのM-REGLEは、複数の異なる健康データをAIで統合的に分析するという新しいアプローチによって、遺伝子と病気の関連を解明する研究にブレークスルーをもたらしました。
データを最初から「束ねて見る」ことで、従来の手法では見逃されていた微細な信号を捉え、ノイズを低減し、結果として遺伝子の発見能力や疾患リスクの予測精度を劇的に向上させたのです。
スマートウォッチなどが普及し、私たちの健康データが日常的に収集されるようになった今、M-REGLEのような技術は、その膨大なデータを医学的な知見へと変換する強力な架け橋となります。この研究は、一人ひとりの遺伝的特性に合わせた個別化医療や予防医学を大きく前進させる、非常に大きな可能性を秘めていると言えるでしょう。