はじめに
本稿では、Google DeepMind社が2025年6月25日に公開した公式ブログ記事、「AlphaGenome: AI for better understanding the genome」を基に、ゲノム科学の新たな地平を切り開く可能性を秘めた最新のAIモデル「AlphaGenome(アルファゲノム)」について、その能力と科学的な意義を解説していきます。
引用元記事
- タイトル: AlphaGenome: AI for better understanding the genome
- 著者: Ziga Avsec and Natasha Latysheva
- 発行元: Google DeepMind
- 発行日: 2025年6月25日
- URL: https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- AlphaGenomeは、最大100万塩基対という従来にない長大なDNA配列を、1塩基対レベルという極めて高い解像度で解析できる画期的なAIモデルである。
- 遺伝子の発現、RNAスプライシング、DNAの物理的なアクセスしやすさなど、遺伝子制御に関わる多様な生物学的プロセス(マルチモーダル)を、単一のモデルで統合的に予測することが可能である。
- DNA配列のわずかな違いである「遺伝的バリアント」が遺伝子機能に与える影響を高速かつ正確に評価し、特にこれまで解析が困難であったゲノムの非コード領域(全体の98%を占める)の機能解明に大きく貢献する。
- RNAスプライシング異常が原因となる遺伝性疾患のメカニズム解明に繋がる、新しいスプライスジャンクションのモデリング手法を世界で初めて導入している。
- 24のDNA配列予測タスクのうち22タスクで、26の変異効果予測タスクのうち24タスクで最高性能を達成し、特化型モデルをも上回る包括的な性能を実現している。
- これらの能力により、疾患メカニズムの深い理解、特定の機能を持つDNAを設計する合成生物学、そして生命科学の基礎研究まで、ゲノム研究全般を強力に加速させることが期待される。
詳細解説
ゲノムとは何か? – 生命の設計図と「98%の謎」
私たちの体の細胞一つひとつには、「ゲノム」と呼ばれる生命の設計図が収められています。これはDNAという物質で書かれた膨大な情報で、その中には髪の色や目の色といった見た目から、病気へのかかりやすさまで、生命活動のあらゆる情報が記録されています。
しかし、この壮大な設計図のうち、タンパク質の作り方を直接指示している「遺伝子」と呼ばれる部分は、実はゲノム全体のわずか2%に過ぎません。では、残りの98%は何をしているのでしょうか? かつては「ガラクタDNA」などと呼ばれたこともあったこの広大な領域は、現在では「非コード領域」と呼ばれ、遺伝子の働きをオンにしたりオフにしたりする「スイッチ」や「ボリューム調整ノブ」のような、極めて重要な役割を担っていることが分かってきました。実際、がんや生活習慣病など、多くの疾患に関連するDNAの変異は、この非コード領域に存在します。
AlphaGenomeが革命的である理由の一つは、まさにこの謎に満ちた98%の非コード領域の機能を解明するための、かつてないほど強力なツールであるという点にあります。
AlphaGenomeの正体 – 新世代のゲノム解析AI
AlphaGenomeとは、一言で言えば「DNA配列を入力すると、その配列が持つ生物学的な機能に関する多様な情報を予測して出力するAI」です。Google DeepMindは、タンパク質の立体構造を予測する「AlphaFold」で世界を驚かせましたが、AlphaGenomeはゲノム配列そのものの機能解読に挑むモデルです。
このAIは、先行モデルである「Enformer」の技術を発展させたものであり、また、ゲノムの2%のコード領域に特化して変異の影響を評価する「AlphaMissense」とは相補的な関係にあります。
AlphaGenomeは、非コード領域を含むゲノム全体を、より包括的に見渡すことができます。
モデルの訓練には、ENCODE、GTEx、4D Nucleome、FANTOM5といった大規模な公的コンソーシアムから提供された実験データが使用されており、数百種類の人間とマウスの細胞・組織における遺伝子制御の重要な側面を網羅的に測定したデータによって支えられています。
AlphaGenomeを支える革新的な技術
AlphaGenomeの驚異的な性能は、いくつかの重要な技術的ブレークスルーによって実現されています。
1. 長い配列と高い解像度の両立
遺伝子の働きを制御するスイッチは、対象の遺伝子から非常に遠く離れた場所にあることが珍しくありません。そのため、広い範囲のDNA配列(長い配列)を一度に見渡すことが重要です。一方で、変異の影響を正確に知るには、DNAの文字(塩基)一つひとつのレベルで何が起きているかを見る(高い解像度)必要があります。
従来のモデルでは、この「配列の長さ」と「解像度」はトレードオフの関係にあり、両立は困難でした。AlphaGenomeは、技術的な進歩によりこの課題を克服し、最大100万文字(塩基対)もの長いDNA配列を、1文字単位の解像度で解析することを可能にしました。
ただし、現在でも10万塩基対以上離れた極めて遠距離にある制御要素の影響を正確に捉えることは技術的な課題として残っており、これは今後の改良で取り組むべき重要な領域として認識されています。
2. 包括的なマルチモーダル予測
遺伝子の働きは、単一の要因ではなく、様々なプロセスが複雑に絡み合って制御されています。例えば、「どのくらいRNAが作られるか(遺伝子発現)」、「RNAがどのように編集されるか(スプライシング)」、「DNAが物理的にアクセスしやすい状態か」といった複数の側面があります。
AlphaGenomeは、これらの多様な側面(モダリティ)を、たった一つのモデルで同時に予測できます。これにより、研究者はある一つのDNA変異が、これらのプロセス全体にどのような連鎖的な影響を及ぼすのかを、統合的に、そして効率的に分析できるのです。
3. RNAスプライシングの新たな理解へ
私たちの体の中では、DNAの情報を一度RNAに写し取った後、不要な部分を切り取って必要な部分だけを繋ぎ合わせる「スプライシング」という編集作業が行われます。この編集作業にミスが起こると、異常なタンパク質が作られてしまい、脊髄性筋萎縮症や一部の嚢胞性線維症といった深刻な遺伝性疾患の原因となります。
AlphaGenomeは、DNA配列からスプライシングの「つなぎ目(ジャンクション)」がどこにあり、どのくらい使われるかを直接モデル化できる世界で初めてのAIです。これにより、DNA変異がどのようにスプライシング異常を引き起こすのか、そのメカニズムをより深く理解する道が拓かれました。
AlphaGenomeが拓く医学と生命科学の未来
AlphaGenomeの登場は、研究者に強力な武器を与えることを意味します。
- 疾患の原因究明: なぜ特定のDNA変異が病気を引き起こすのか、その根本的なメカニズムを解明するのに役立ちます。記事では、T細胞急性リンパ性白血病(T-ALL)というがんの一種で、特定の変異ががん遺伝子「TAL1」を活性化させる仕組みを、AlphaGenomeが正確に予測した例が紹介されています。これにより、新たな治療法の開発につながる可能性があります。
- 合成生物学への応用: 例えば「神経細胞では働くが、筋肉細胞では働かない」といった、特定の目的を持ったDNA配列をコンピューター上で設計するためのガイドとして利用できます。
- 基礎研究の加速: ゲノムという広大な設計図の中から、生命にとって重要な機能を持つ領域を効率的に見つけ出し、その役割を定義する「ゲノムの地図作り」を加速させます。
ただし、重要な注意点として、AlphaGenomeは個人のゲノム予測用には設計・検証されておらず、あくまで研究目的での利用を意図しているということを理解しておく必要があります。また、遺伝的変異が複雑な疾患や形質に至る過程には、発達段階や環境要因といったより広範な生物学的プロセスが関与しており、これらはAlphaGenomeの直接的な予測範囲を超えています。
まとめ
本稿で解説したように、AlphaGenomeは、AI技術を駆使して、これまで解明が困難であったゲノムの非コード領域の機能に光を当てる、画期的な研究ツールです。長大なDNA配列を高解像度かつ多角的に解析するその能力は、遺伝性疾患の原因究明から、新しい治療法や医薬品の開発、さらには生命そのものの仕組みを理解する基礎研究に至るまで、非常に幅広い分野に革命的な進歩をもたらす可能性を秘めています。
AlphaGenomeは現在、非商用目的の研究者向けにAPIとして提供が開始されており、今後、世界中の科学者がこのツールを手にすることで、私たちのゲノムに関する理解が飛躍的に深まることは間違いありません。まさに、ゲノム科学における新たな時代の幕開けと言えるでしょう。