はじめに
Anthropicが2026年1月16日、科学研究におけるClaudeの活用事例を紹介する記事を公式ブログで発表しました。本稿では、スタンフォード大学やMITの研究室が開発したClaude活用システムの詳細と、AI for Scienceプログラムを通じた研究支援の取り組みについて解説します。
参考記事
- タイトル: How scientists are using Claude to accelerate research and discovery
- 発行元: Anthropic
- 発行日: 2026年1月16日
- URL: https://www.anthropic.com/news/accelerating-scientific-research
要点
- AnthropicはClaude for Life Sciencesとして科学研究向けのコネクタとスキルを提供し、Opus 4.5で図表解釈や計算生物学の性能を大幅に向上させた
- スタンフォード大学が開発したBiomniは、25以上の生物学分野で数百のツールとデータベースを統合し、通常数ヶ月かかるゲノムワイド関連解析を20分で完了させた
- MIT Cheeseman研究室のMozzareLLMは、CRISPR実験で生成される大規模データの解釈を自動化し、研究者が見落とした発見を継続的に検出している
- スタンフォード大学Lundberg研究室は、従来の文献ベースではなく分子特性マップを用いたAI主導の仮説生成システムを構築し、どの遺伝子を研究すべきかの判断を効率化している
詳細解説
Claude for Life Sciencesの強化とAI for Scienceプログラム
Anthropicは2025年10月にClaude for Life Sciencesをリリースし、科学研究向けのコネクタとスキルのセットを提供してきました。その後、Opus 4.5において図表解釈、計算生物学、タンパク質理解のベンチマークで大幅な性能向上を実現したと発表しています。
これらの進歩は、学術界や産業界の研究者とのパートナーシップを通じて得られた知見に基づいており、科学者がAIをどのように活用して研究を加速させているかを理解する取り組みの成果と位置づけられています。
また、AnthropicはAI for Scienceプログラムを通じて、世界中の高インパクトな科学プロジェクトに取り組む研究者に無料のAPIクレジットを提供しています。このプログラムを通じた研究者たちは、文献レビューやコーディング支援を超えた、研究プロセス全体にわたるカスタムシステムを開発してきました。
これらのシステムでは、Claudeが実験設計の支援、通常数ヶ月かかるプロジェクトの数時間への圧縮、人間が見落とす可能性のある大規模データセット内のパターン発見など、研究プロセスの全段階で協働者として機能しています。特に、深い知識を必要とし従来はスケール化が困難だったタスクを処理することで、研究のボトルネックを解消している点が注目されます。
Biomni:数百のツールとデータベースを統合した汎用生物医学エージェント
生物学研究における大きなボトルネックの一つは、ツールの断片化です。数百のデータベース、ソフトウェアパッケージ、プロトコルが利用可能ですが、研究者はさまざまなプラットフォームの選択と習得に多大な時間を費やしています。
スタンフォード大学が開発したBiomniは、数百のツール、パッケージ、データセットを単一のシステムに統合し、Claude駆動のエージェントがナビゲートできる環境を構築しました。研究者は平易な英語でリクエストを出すだけで、Biomniが自動的に適切なリソースを選択し、仮説形成、実験プロトコル設計、25以上の生物学分野にわたる解析を実行します。
具体例として、ゲノムワイド関連解析(GWAS)が挙げられています。GWASは、特定の形質や疾患に関連する遺伝的変異を探索する手法です。例えば、絶対音感のような遺伝的基盤の強い形質について、大規模な集団のゲノムをスキャンし、一方のグループでより頻繁に現れる遺伝的変異を特定します。
ゲノムスキャン自体は比較的シンプルな作業ですが、データの解析と意味付けに時間がかかります。ゲノムデータは煩雑な形式で提供され、広範なクリーニングが必要であり、交絡因子の制御や欠損データへの対処が求められます。さらに、「ヒット」を特定した後、それが何を意味するのか—近傍の遺伝子、発現する細胞タイプ、影響を与える生物学的経路など—を解明する必要があります。各ステップで異なるツールと異なるファイル形式を扱い、多くの手動意思決定が必要となります。従来、単一のGWASには数ヶ月を要していましたが、Biomniの初期試験では20分で完了したと報告されています。
Biomniチームは、異なる分野での複数のケーススタディを通じてシステムを検証しました。ある事例では、Biomniが分子クローニング実験を設計し、ブラインド評価において5年以上の経験を持つポスドクの設計と一致する結果を示しました。別の事例では、30人から得られた450以上のウェアラブルデータファイル(持続グルコースモニタリング、体温、身体活動の混合)を35分で解析しており、人間の専門家であれば3週間かかると推定される作業でした。第三の事例では、ヒト胚組織から採取された336,000以上の個別細胞の遺伝子活性データを解析し、既知の制御関係を確認するだけでなく、ヒト胚発生に関連すると以前は認識されていなかった新しい転写因子を特定しています。
転写因子とは、遺伝子のオン・オフを制御するタンパク質のことで、細胞の分化や発生において重要な役割を果たします。新しい転写因子の発見は、発生生物学の理解を深める上で重要な意味を持つと考えられます。
Biomniは完璧なシステムではなく、Claudeが誤った方向に進んでいないかを検出するガードレールが組み込まれています。また、すぐにすべてを実行できるわけではありませんが、不足している部分については、専門家が自身の方法論をスキルとしてエンコードすることで、エージェントに専門家のアプローチを教えることができます。例えば、Undiagnosed Diseases Network(未診断疾患ネットワーク)と希少疾患診断に取り組んだ際、Claudeのデフォルトのアプローチは臨床医の方法と大きく異なっていました。そこで、専門家にインタビューし、診断プロセスを段階的に文書化してClaudeに教えた結果、エージェントは良好なパフォーマンスを発揮したと報告されています。
Cheeseman研究室:大規模遺伝子ノックアウト実験の解釈を自動化
遺伝子の機能を理解するための一つのアプローチは、細胞や生物からその遺伝子を除去し、何が機能しなくなるかを観察することです。2012年頃に登場した遺伝子編集ツールCRISPRは、これを大規模かつ精密に実行することを容易にしました。しかし、CRISPRの有用性には限界がありました。研究室は解析できる帯域幅をはるかに超えるデータを生成できるようになったのです。
これは、MITのWhitehead InstituteおよびDepartment of BiologyのIain Cheeseman研究室が直面している課題そのものです。CRISPRを使用して数千もの異なる遺伝子を数千万個のヒト細胞からノックアウトし、各細胞を撮影して何が変化したかを観察します。これらの画像のパターンから、類似した機能を持つ遺伝子は除去された際に類似した外観の損傷を生じる傾向があることが明らかになります。ソフトウェアはこれらのパターンを検出し、遺伝子を自動的にグループ化できます。Cheeseman研究室は、まさにこれを実行するBrieflow(ブリーフロー、チーズのブリーにちなんだ名称)というパイプラインを構築しました。
しかし、これらの遺伝子グループが何を意味するのか—なぜ遺伝子がクラスタ化されるのか、何が共通しているのか、既知の生物学的関係なのか新しいものなのか—を解釈するには、依然として人間の専門家が科学文献を遺伝子ごとに精査する必要があります。これは時間のかかる作業です。単一のスクリーニングで数百のクラスタが生成されることがあり、大半は研究室に時間、帯域幅、または細胞が行う多様な機能についての深い知識がないため、調査されないままになっています。
Cheeseman氏は長年、すべての解釈を自身で行ってきました。彼は約5,000の遺伝子の機能を記憶しているといいますが、このデータを効果的に解析するには依然として数百時間を要します。このプロセスを加速するため、博士課程の学生Matteo Di Bernardoは、Cheeseman氏のアプローチを自動化するシステムの構築に取り組みました。Cheeseman氏と密接に協力して、彼がどのように解釈にアプローチするか—どのデータソースを参照するか、どのようなパターンを探すか、何が発見を興味深いものにするか—を正確に理解し、Claude駆動のシステムMozzareLLM(モッツァレラにちなんだ名称)を構築しました。
MozzareLLMは、遺伝子のクラスタを受け取り、Cheeseman氏のような専門家が行うことを実行します。それらがどのような生物学的プロセスを共有している可能性があるかを特定し、どの遺伝子が十分に理解されているか、どの遺伝子がほとんど研究されていないかをフラグ立てし、どの遺伝子がフォローアップする価値があるかを強調します。
これは研究を大幅に加速するだけでなく、重要な追加の生物学的発見を支援しています。Cheeseman氏は、Claudeが自身が見落としたものを一貫して捉えていると述べています。「毎回見直すたびに、これに気づかなかった!と思います。そしてそれぞれの場合で、これらは理解し検証できる発見なのです」と語っています。
MozzareLLMが非常に有用である理由の一つは、単一機能のシステムではないことです。多様な情報を統合し、科学者のように推論できます。特に注目すべきは、発見に信頼度レベルを提供する点であり、Cheeseman氏はこれが極めて重要だと強調しています。これにより、結論をフォローアップするためにさらなるリソースを投入すべきかどうかを判断できます。
MozzareLLMの構築にあたり、Di Bernardo氏は複数のAIモデルをテストしました。Claudeは代替モデルを上回るパフォーマンスを示し、ある事例では他のモデルがランダムノイズとして却下したRNA修飾経路を正しく特定しました。
Cheeseman氏とDi Bernardo氏は、これらのClaude注釈付きデータセットを公開することを構想しています。これにより、他分野の専門家が、彼の研究室が時間をかけて追求していないクラスタをフォローアップできるようになります。例えば、ミトコンドリア生物学者は、Cheeseman研究室がフラグ立てしたが調査していないミトコンドリアクラスタを深く掘り下げることができます。他の研究室が自身のCRISPR実験にMozzareLLMを採用すれば、長年機能が特定されていない遺伝子の解釈と検証を加速できる可能性があります。
Lundberg研究室:AI主導の仮説生成で研究対象遺伝子を選定
Cheeseman研究室は、数千の遺伝子を単一の実験でノックアウトできるオプティカルプールドスクリーニングという技術を使用しています。彼らのボトルネックは解釈にあります。しかし、すべての細胞タイプがプールドアプローチで機能するわけではありません。スタンフォード大学のLundberg研究室のような一部の研究室は、より小規模で焦点を絞ったスクリーニングを実施しており、彼らのボトルネックはより早い段階—まずどの遺伝子をターゲットにするかを決定する段階—にあります。
単一の焦点を絞ったスクリーニングには2万ドル以上のコストがかかり、コストはサイズとともに増加するため、研究室は通常、特定の状態に関与している可能性が最も高いと考えられる数百の遺伝子をターゲットにします。従来のプロセスでは、大学院生やポスドクのチームがGoogleスプレッドシートの周りに座り、候補遺伝子を一つずつ追加し、一文の正当化理由や論文へのリンクを付けていきます。これは、文献レビュー、専門知識、直感に基づいた教育的推測ゲームですが、人間の帯域幅によって制約されています。また、他の科学者がすでに解明し記述したことや、その場にいる人間がたまたま思い出すことに基づいているため、誤りを含む可能性があります。
Lundberg研究室は、Claudeを使用してこのアプローチを反転させています。「研究者がすでに研究したことに基づいてどのような推測ができるか?」と尋ねる代わりに、彼らのシステムは「分子特性に基づいて何を研究すべきか?」と問います。
チームは、細胞内のすべての既知の分子—タンパク質、RNA、DNA—とそれらの相互関係のマップを構築しました。どのタンパク質が結合するか、どの遺伝子がどの産物をコードするか、どの分子が構造的に類似しているかをマッピングしました。そして、Claudeにターゲット—例えば特定の細胞構造やプロセスを制御する可能性のある遺伝子—を与えると、Claudeはそのマップをナビゲートし、生物学的特性と関係に基づいて候補遺伝子を特定します。
Lundberg研究室は現在、このアプローチがどれほど機能するかを調べる実験を実施しています。そのために、ほとんど研究が行われていないトピックを特定する必要がありました(十分に研究されているものを調べた場合、Claudeはすでに確立された知見を知っている可能性があります)。彼らは一次繊毛を選びました。一次繊毛は細胞上のアンテナのような付属物であり、まだほとんど知られていませんが、さまざまな発達障害や神経障害に関与しています。次に、全ゲノムスクリーニングを実行して、実際にどの遺伝子が繊毛形成に影響を与えるかを確認し、グラウンドトゥルースを確立します。
テストは、人間の専門家とClaudeを比較することです。人間はスプレッドシートアプローチを使用して推測を行います。Claudeは分子関係マップを使用して独自の推測を生成します。仮にClaudeが200個中150個を捉え、人間が200個中80個を捉えた場合、このアプローチがより効果的であることの証明となります。たとえ両者がほぼ同等に遺伝子を発見したとしても、Claudeの方がはるかに高速に機能する可能性が高く、研究プロセス全体をより効率的にできると考えられます。
このアプローチが機能する場合、チームはこれを焦点を絞った摂動スクリーニングの標準的な最初のステップにすることを構想しています。直感に賭けたり、現代の研究で一般的になっているブルートフォースアプローチを使用したりする代わりに、研究室はどの遺伝子をターゲットにするかについて情報に基づいた賭けができるようになり、全ゲノムスクリーニングのインフラストラクチャを必要とせずにより良い結果を得られます。
今後の展望
これらのシステムはいずれも完璧ではありません。しかし、わずか数年で科学者がAIを基本的なタスクをはるかに超える研究パートナーとして組み込み始めた方法を示しています。実際、研究プロセスのさまざまな側面を加速させ、場合によっては置き換えることさえ可能になりつつあります。
これらの研究室との対話で共通のテーマが浮かび上がりました。構築したツールの有用性は、AI能力と連動して成長し続けているということです。各モデルのリリースごとに顕著な改善がもたらされています。わずか2年前には初期のモデルがコード記述や論文要約に限定されていましたが、より強力なエージェントは、徐々にではあるものの、それらの論文が記述する作業そのものを再現し始めています。
Anthropicは、ツールが進化しAIモデルがより知的になるにつれて、科学的発見がどのように発展するかを継続的に観察し学習していくとしています。
まとめ
AnthropicのClaude for Life Sciencesは、科学研究の各段階でAIを実用的な協働者として機能させる取り組みを示しています。スタンフォード大学やMITの研究室が開発したBiomni、MozzareLLM、分子特性マップ活用システムは、それぞれ異なる研究ボトルネックに対処し、従来数ヶ月かかっていた解析の大幅な時短や、人間が見落とす発見の検出を実現しています。AI能力の向上とともにこれらのツールの有用性も成長し続けており、科学的発見の加速に向けた可能性が広がっていると言えます。
