はじめに
Google Researchが2025年10月23日、複数の基盤モデルとGemini搭載の推論エージェントを組み合わせた地理空間AIプラットフォーム「Google Earth AI」の最新版を発表しました。本稿では、この発表内容をもとに、3つの基盤モデルの性能、モデル統合による予測精度の向上、そして実世界での応用事例について解説します。
参考記事
- タイトル: Google Earth AI: Unlocking geospatial insights with foundation models and cross-modal reasoning
- 著者: Niv Efron, Luke Barrington
- 発行元: Google Research
- 発行日: 2025年10月23日
- URL: https://research.google/blog/google-earth-ai-unlocking-geospatial-insights-with-foundation-models-and-cross-modal-reasoning/
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- Google Earth AIは、衛星画像分析(Imagery)、人口動態(Population)、環境予測(Environment)の3つの基盤モデルと、Gemini搭載の地理空間推論エージェントで構成される統合プラットフォームである
- Remote Sensing Foundationsモデルは、テキストベースの画像検索タスクで16%以上の精度向上を達成し、ゼロショット物体検出ではベースライン精度を2倍以上に改善した
- 複数モデルの統合により、FEMA国家リスク指数の予測精度が平均11%向上し、特に竜巻リスクで25%、河川氾濫リスクで17%の改善を記録した
- 地理空間推論エージェントは、Q&Aベンチマークで0.82の精度を達成し、ベースラインのGemini 2.5 Pro(0.50)を大きく上回った
- 国連グローバルパルス、GiveDirectly、Bellwetherなど複数の組織が、災害対応や保険査定にEarth AIを活用している
詳細解説
Google Earth AIの全体像:複数ドメインを統合する新しいアプローチ
Googleによれば、Google Earth AIは地理空間AIモデルと推論エージェントのファミリーとして設計されており、実世界のデータに基づいた実用的なインサイトを提供します。従来のGoogle製品では、衛星画像を分析してGoogle Mapsの精度を維持したり、気象や自然災害の最新アラートをSearchユーザーに提供したりするために、個別のAIモデルが活用されてきました。
しかし、「ハリケーンはどこに上陸する可能性が高いか?どのコミュニティが最も脆弱で、どのように準備すべきか?」といった複雑な問いに答えるには、画像、人口、環境といった複数ドメインにまたがるインサイトの統合が必要です。この課題に対応するため、Googleは複数の基盤モデルとGemini搭載の推論エージェントを組み合わせた統合プラットフォームを開発しました。
推論エージェントは、複雑な問いを複数ステップの計画に分解し、各ステップで適切な基盤モデルを呼び出してデータストアにクエリを実行し、地理空間ツールを使用して、最終的に各ステップの結果を統合して包括的な回答を生成します。このモジュラー設計により、拡張性とカスタマイズ性が確保されていると考えられます。

3つの基盤モデル:Imagery、Population、Environment
Google Earth AIは、3つの専門分野に特化した基盤モデルで構成されています。
Imageryモデル(Remote Sensing Foundations)
衛星画像分析を簡素化・高速化するモデルです。Googleによれば、視覚言語モデル、オープンボキャブラリー物体検出、適応可能な視覚バックボーンの3つのコア機能を備えています。ユーザーは「嵐の後に撮影された画像で浸水した道路をすべて見つける」といった自然言語クエリを入力でき、迅速かつ正確な回答が得られます。
このモデルは、高解像度の航空写真の大規模コーパスとテキスト説明のペアで訓練されており、複数の公開地球観測ベンチマークで最先端の結果を達成しました。具体的には、テキストベースの画像検索タスクで平均16%以上の改善を達成し、新規物体検出のゼロショットモデルではベースライン精度を2倍以上に向上させました。

ゼロショット学習とは、事前に学習していない新しいカテゴリの物体を認識する能力を指します。従来の物体検出では、認識したい物体ごとに大量の学習データが必要でしたが、ゼロショットモデルでは、自然言語での記述だけで新しい物体を検出できるため、災害現場などで柔軟な対応が可能になると考えられます。
Populationモデル(Population Dynamics Foundations)
人と場所の複雑な相互作用を理解することを目指しています。Googleの発表では、最新の研究で2つの重要な革新が導入されたとされています。1つ目は17カ国にわたるグローバルに一貫した埋め込み(embedding)、2つ目は時間に敏感な予測に不可欠な、人間の活動の変化する動態を捉える月次更新の埋め込みです。
このモデルの有効性は、第三者機関の独立した研究でも確認されています。オックスフォード大学の研究者は、ブラジルにおけるデング熱の予測モデルにこれらの埋め込みを組み込んだところ、12ヶ月予測の長期R²(決定係数)が0.456から0.656に改善したと報告しています。R²は、モデルが実際の疾病率をどの程度説明できるかを測る指標で、0から1の範囲で、1に近いほど予測精度が高いことを示します。

人口密度、樹木被覆率、夜間照明、標高の予測における国別のR2スコア(範囲は0~1、高いほど良好)。
世界的な傾向は、当初米国のみで実証した高いパフォーマンスと一致しています。
埋め込みとは、複雑な地理空間データを数値ベクトルとして表現する技術です。この数値表現により、機械学習モデルが地域の特性(人口密度、移動パターン、経済活動など)を効率的に学習・予測できるようになります。
Environmentモデル
中期気象予報、モンスーンの開始時期、大気質、河川氾濫など、最先端の予測を実現します。Googleによれば、最近これらのモデルを拡張して地球全体の降水ナウキャストを実現し、現在では20億人に対して最も深刻な河川氾濫の予測を提供しているとのことです。
ナウキャストとは、現在から数時間先までの極めて短期的な気象予測を指します。従来の天気予報が数日から数週間先を対象とするのに対し、ナウキャストは豪雨や突風などの急激な気象変化をリアルタイムに近い形で予測するため、災害対応や交通管理などで重要な役割を果たすと考えられます。
モデル統合による予測精度の向上
個々の基盤モデルが強力なインサイトを提供する一方、Googleの調査結果によれば、モデルを組み合わせることでさらに高い予測力が得られることが確認されています。
具体的な例として、FEMA(米国連邦緊急事態管理庁)の国家リスク指数の予測が挙げられています。この指数は、経済的・社会的脆弱性、物理的・環境的リスクなどの要因に基づいて、洪水や嵐などの自然災害に対するコミュニティのリスクを示します。
GoogleによればPopulation Dynamics Foundationsからの社会経済的特徴を捉える埋め込みと、AlphaEarth Foundationsからの景観特徴を融合することで、いずれかのデータソース単独を使用する場合と比較して、20種類の異なる災害にわたってFEMA国家リスク指数の予測がR²で平均11%向上しました。特に竜巻リスクの予測では25%、河川氾濫リスクでは17%の改善が見られたとのことです。
この結果は、異なる種類のデータを統合することで、単一のデータソースでは捉えきれない複雑な相互作用を理解できることを示しています。例えば、河川氾濫のリスクは地形データだけでなく、その地域の人口密度や建物の密集度、インフラの整備状況などの社会経済的要因にも大きく影響されます。複数モデルの統合により、こうした多面的なリスク評価が可能になったと考えられます。
Gemini搭載の地理空間推論エージェント
複雑な実世界の問題に取り組むには、多様な能力を持つ複数モデルからのインサイトが必要です。Googleの発表によれば、新しいGemini搭載の地理空間推論エージェントにより、これらのEarth AIインサイトのオーケストレーションが簡素化されます。
エージェントは、複雑な自然言語クエリを分解し、回答への動的な複数ステップの経路を計画します。各ステップを実行するために、エージェントは前述のEarth AIモデルを装備した「専門家」サブエージェントや、地理空間固有のツールを呼び出すことができます。
具体的な動作例として、迫り来る嵐のリスクに脆弱な特定の人口を特定したいユーザーのケースが示されています。エージェントは以下の透明な一連の推論ステップを実行します:
- Environmentモデルを呼び出して、ハリケーン級の風のリスクがある特定の地理的エリアを特定
- Data Commonsにクエリを実行して、予測される上陸エリアの人口の多い郡を特定するための人口統計を取得
- BigQueryの公開データセットから対象となる郡の公式境界を取得
- 風のゾーンと公式の郡境界の間で空間交差を実行
- Population Dynamics Foundationsと郡レベルの統計を使用して、その場でモデルをトレーニングし、最も脆弱な郵便番号を特定
- Remote Sensing Foundationsの物体検出モデルを使用して、最も脆弱な郵便番号の1つを撮影した衛星画像から重要なインフラを特定
このマルチステップの推論プロセスにより、単一のモデルやツールでは対応できない複雑な分析タスクが可能になります。また、各ステップが明示的に記述されることで、AIの意思決定プロセスの透明性が確保され、ユーザーがなぜその結論に至ったのかを理解しやすくなると考えられます。
性能評価:Q&Aベンチマークと危機対応シナリオ
エージェントの評価のために、Googleは2つの新しい評価手法を開発しました。1つは、公開データに基づく検証可能な正解を持つ事実調査・分析のためのQ&Aベンチマーク、もう1つは複雑な予測シナリオのための危機対応ケーススタディです。
Q&Aベンチマークにおいて、地理空間推論エージェントは0.82の総合精度を達成し、ベースラインのGemini 2.5 Pro(0.50)とGemini 2.5 Flash(0.39)のエージェントを大きく上回りました。これらのスコアは、ROUGE-L F1とパーセンテージエラーから導出されたもので、高いほど優れた性能を示します。

地理空間推論エージェントは、ベースラインのGemini 2.5 Proエージェントと比較して、記述および検索カテゴリで37%、より複雑な分析および関係カテゴリで124%、全体で64%高いスコアを獲得しました(ROUGE-L F1とパーセンテージ誤差から算出されたスコア)。
より詳細に見ると、地理空間推論エージェントは記述的・検索的カテゴリーでベースラインのGemini 2.5 Proエージェントを37%上回り、より複雑な分析的・関係的カテゴリーでは124%上回り、全体で64%高いスコアを記録しました。
この結果は、汎用的な大規模言語モデルだけでなく、専門化された地理空間モデルとツールへのアクセスを提供することの重要性を示しています。地理空間データには、座標系、投影法、空間インデックスなど、一般的なテキストデータとは異なる特殊な扱いが必要であり、専門ツールの活用が精度向上に寄与したと考えられます。
より複雑な危機対応シナリオでは、技術論文において、Environment、Remote Sensing、Population Dynamicsの多様なインサイトをケーススタディを通じてオーケストレーションする利点が実証されています。
実世界での応用事例:災害対応から公衆衛生まで
Google Earth AIは、既に複数の組織で実用化が進んでいます。
Google XのムーンショットプロジェクトであるBellwetherは、気象予測、Population Dynamics Foundationsの埋め込み、衛星画像分析、不動産データベースを使用して、嵐が襲来する前に建物の損害を予測しています。これにより、保険クライアントがより迅速に保険金を支払うことができ、住宅所有者はより早く再建を開始できるため、時間、費用、ストレスが節約されます。
国連グローバルパルスは、Earth AI Imageryモデルを使用して自然災害後の損害を評価し、政府や国際機関が危機に迅速に対応できるようにしています。従来の損害評価では、現地調査員が被災地を直接訪問する必要があり、時間とコストがかかりました。衛星画像の自動分析により、より広域を短時間でカバーできるため、支援の優先順位付けや資源配分が効率化されると考えられます。
GiveDirectlyは、洪水予測と地理空間推論を使用してリスクのあるコミュニティを特定し、世帯が災害に備えて被害を軽減できるよう現金支援を送っています。
さらに、Google.orgは、国連グローバルパルス、GiveDirectlyなどの組織への支援に加えて、Khushi Baby、Cooper/Smith、Direct Relief、Froncort.aiなどのパートナーに資金を提供しています。これらのパートナーは、Population Dynamics Foundationsを活用して感染症をモデル化し、世界的な公衆衛生対策を改善しています。
企業ユーザーとしては、Public Storage、CARTO、Visiona Space Technology(エンブラエルの一部)などがEarth AIを利用しています。
これらの事例は、地理空間AIが社会課題の解決に実際に貢献できることを示していますが、同時にアクセスの公平性という課題も浮かび上がります。高度なAI技術を活用できる組織とそうでない組織の間で、災害対応や公衆衛生対策の質に格差が生じる可能性があるため、技術へのアクセス拡大と支援体制の整備が今後の課題と言えるでしょう。
アクセス拡大:開発者・企業向けの提供
Googleは、Earth AIのポテンシャルを最大限に引き出すため、アクセスの拡大に取り組んでいます。組織は、Remote Sensing Foundations(Vertex AIでImageryモデルとして利用可能)、Population Dynamics Foundations、地理空間推論への早期アクセスについて関心を表明することが推奨されています。
Vertex AIは、Googleが提供するクラウドベースの機械学習プラットフォームで、開発者や企業がAIモデルを構築、デプロイ、管理するための統合環境です。このプラットフォームを通じてEarth AIモデルが提供されることで、既存のクラウドインフラやワークフローに統合しやすくなると考えられます。
まとめ
Google Earth AIは、衛星画像、人口動態、環境予測の3つの基盤モデルをGemini搭載の推論エージェントで統合することで、複雑な地理空間的問いに対する包括的な回答を可能にするプラットフォームです。複数モデルの統合により予測精度が大幅に向上し、災害対応、公衆衛生、インフラ管理など、実世界の課題解決に既に活用されています。今後、開発者・企業へのアクセス拡大が進むことで、さらに多様な応用が生まれる可能性があると考えられます。
