[技術解説]AIで脳を解読する:幼魚ゼブラフィッシュの全脳活動ベンチマークZAPBench紹介

目次

はじめに

 脳は、膨大な数のニューロンが複雑な電気信号を発し、広大で入り組んだシナプスのネットワークを通じて情報を伝達する、驚異的な器官です。これらの活動パターンを理解することは、脳がどのようにして複雑な行動を生み出すのかを解明する鍵となります。近年、コネクトミクス(脳内の神経接続を網羅的にマッピングする研究分野)がこの問題に対する強力なアプローチとして注目されていますが、構造的な接続情報だけでは、それらがどのように機能しているかを完全に理解するには限界がありました。

 本稿では、Google ResearchがHHMI Janeliaおよびハーバード大学との共同研究により発表した、ZAPBenchという画期的な取り組みを紹介します。ZAPBenchは、幼魚ゼブラフィッシュの脳全体を対象とした、単一細胞解像度での活動データセットおよびベンチマークであり、より正確な脳活動モデルの開発と比較を可能にすることを目的としています。

引用元記事

・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。

要点

  • 目的: 脳の構造(コネクトーム)と機能(神経活動)の関係性を解明し、より正確な脳活動予測モデルを開発するためのデータセットとベンチマークを提供する。
  • 対象: 幼魚ゼブラフィッシュ。複雑な行動能力を持ち、体が透明で脳全体を顕微鏡で観察可能。
  • データ:
    • 全脳活動データ: 約7万個のニューロン活動を単一細胞解像度で記録。特殊なライトシート顕微鏡GCaMP(カルシウムインジケータ)を使用。
    • コネクトームデータ: 活動記録と同じ個体の包括的なコネクトーム(神経接続マップ)も生成中(将来的にデータセットに追加予定)。
  • 手法:
    • 仮想現実(VR)を用いて様々な視覚刺激を与え、それに対する脳活動を記録。
    • 記録データは、3Dボリュームビデオと、個々のニューロンの活動時系列を示すタイムシリーズデータの2種類で提供。
  • ベンチマーク (ZAPBench): 記録された脳活動の一部(コンテキスト)を入力とし、その後の活動(例: 30秒間)を予測するタスク。MAE(平均絶対誤差)でモデルの精度を評価。
  • 主な知見:
    • 予測にはより長いコンテキスト(過去の活動データ)が有効。
    • 3Dボリュームデータを用いたモデルは、空間情報を利用できるため、タイムシリーズデータを用いたモデルより高性能な場合がある。
    • 脳の領域によって予測の難易度が異なる。
    • 低解像度のビデオデータでもモデルは比較的良好に機能する。

詳細解説

前提知識

 本稿の内容をより深く理解するために、以下の知識があると役立ちます。

  • 基本的な神経科学: ニューロン、シナプス、神経活動電位といった基本的な概念。
  • コネクトミクス: 脳の神経回路接続を網羅的に解明しようとする研究分野。
  • カルシウムイメージング: GCaMPなどの蛍光プローブを用いて、ニューロン活動に伴うカルシウムイオン濃度変化を可視化する技術。
  • ベンチマーク: 機械学習モデルの性能を客観的に評価・比較するための標準化されたデータセットとタスク。

背景と課題

 従来の神経科学研究では、脳全体の構造(コネクトーム)を詳細にマッピングする研究と、特定の脳領域の神経活動を大規模に記録する研究が、それぞれ独立して進められてきました。しかし、「神経回路の構造が、どのようにダイナミックな活動パターンを生み出すのか?」という根源的な問いに答えるためには、同一の脳において、詳細な構造と大規模な活動の両方を捉えたデータが不可欠でした。これまでの研究では、マウスの視覚野など、脳のごく一部(0.1%未満)を対象としたものはありましたが、脊椎動物の脳全体を対象に、構造と機能の両面からアプローチする試みは限定的でした。ZAPBenchはこのギャップを埋めることを目指しています。

ZAPBenchのアプローチ

  1. 対象生物: 幼魚ゼブラフィッシュ
    • 選定理由: 生後6日でも、学習や記憶を含む複雑なタスク(例: 流れへの適応、獲物の追跡・捕獲、危険な環境の記憶)を実行できます。さらに重要な点として、体が小さく透明であるため、生きたまま脳全体の活動光学顕微鏡で観察することが可能です。これは、哺乳類などでは困難なアプローチです。
  2. データ取得技術:
    • ライトシート顕微鏡: レーザー光をシート状にして脳の薄いスライスを高速にスキャンし、3D画像を生成する特殊な顕微鏡です。これにより、脳全体の活動を高速かつ低侵襲で記録できます。
    • GCaMP (遺伝子コード化カルシウムインジケータ): ニューロンが活動する際に流入するカルシウムイオンと結合すると緑色に蛍光するタンパク質です。これを遺伝子工学的にゼブラフィッシュに発現させることで、ニューロンの活動を蛍光の明滅として捉えることができます。
    • 仮想現実 (VR) 刺激: 固定された魚の周囲に、単純化された自然環境(例: 変化する水流、明暗の変化、魚を押し流す強い流れ)を模したコンピューター生成画像を投影し、様々な条件下での脳活動を誘発・記録します。尾部の電極で筋肉活動(泳ぐ試みなど)も同時に記録されます。
  3. データ形式:
    • 3Dボリュームビデオ: ライトシート顕微鏡から得られる、脳全体の蛍光強度変化を示す生の3D動画データです。空間的な情報(ニューロンの位置関係など)が豊富に含まれますが、データサイズが大きく、計算コストも高くなります。
    • タイムシリーズデータ: 3Dビデオデータを後処理し、ボクセルレベルセグメンテーション(3D画像の最小単位であるボクセルごとに、どのニューロンに属するかを識別)によって個々のニューロンを特定し、それぞれの活動強度を経時的に抽出したデータです。各行が一つのニューロンの活動履歴(2時間分)に対応するような形式になります。データサイズは比較的小さく扱いやすいですが、処理過程で一部の情報が失われる可能性があります。
  4. ベンチマークタスク: 活動予測
    • ZAPBenchの中心的なタスクは、「ある時点までの脳活動データ(コンテキスト)が与えられたときに、その後の一定期間(例: 30秒)の脳活動をどれだけ正確に予測できるか?」というものです。これは、時系列予測問題として定式化できます。
    • 評価指標: 予測精度はMAE (Mean Absolute Error) を用いて評価されます。これは、予測された活動値と実際の活動値の差の絶対値の平均であり、値が小さいほど予測精度が高いことを示します。

モデルと知見

 研究チームは、ベースラインとして単純なモデル(例: 各ニューロンの平均活動を用いる)に加え、より洗練された機械学習モデルを構築し、両方のデータ形式(3Dボリューム、タイムシリーズ)で評価を行いました。

  • 得られた知見:
    • コンテキスト長の重要性: より長い過去の活動データ(長いコンテキスト)を用いて学習したモデルは、短いコンテキストを用いたモデルよりも有意に予測精度が高いことが示されました。これは、脳活動のダイナミクスが長期的な依存関係を持っていることを示唆しています。
    • データ形式の比較: 3Dボリュームデータを用いたモデルは、タイムシリーズデータを用いたモデルよりも優れた性能を示す場合があることがわかりました。これは、3Dモデルがニューロン間の空間的な関係性を利用できるためと考えられます。
    • 予測の難易度の偏り: モデルの予測誤差は、脳全体で一様ではなく、特定の脳領域でより頻繁に発生する傾向が見られました。これは、領域によって活動パターンの複雑さや予測可能性が異なることを示唆しており、今後の研究の興味深いテーマとなります。
    • 解像度の影響: 3Dビデオモデルは、データの解像度を下げても比較的良好に機能することが示されました。これは、計算コスト削減の観点から重要な知見です。

まとめ

 ZAPBenchは、脊椎動物の脳全体を対象として、単一細胞レベルの活動記録と(将来的には)詳細な構造情報(コネクトーム)を組み合わせた、前例のないデータセットとベンチマークです。これにより、AIエンジニアや神経科学者は、脳活動の予測モデルを開発し、その精度を客観的に比較評価することが可能になります。

 本研究で得られた知見(コンテキスト長の重要性、3Dデータの有効性、領域による予測難易度の違いなど)は、今後の脳モデル開発における重要な指針となるでしょう。将来的には、活動記録と同じ個体の完全なコネクトーム情報がデータセットに追加される予定であり、これにより、神経回路の物理的な接続構造に基づいた、より生物学的に妥当性の高いモデルの構築と、さらなる予測精度の向上が期待されます。ZAPBenchは、脳の理解とAI技術の双方の発展に貢献する、非常に価値のあるリソースと言えます。

  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次