[レポート紹介]AIの現在地と未来像:スタンフォード大学「AI Index Report 2025」を紹介

目次

はじめに

 AI(人工知能)が私たちの社会に与える影響は、かつてないほど大きくなっています。スタンフォード大学人間中心AI研究所(Stanford HAI)が発行する「AI Index Report」は、AIの技術的進歩、経済への影響、社会へのインパクトについて、データに基づいた包括的な視点を提供する信頼性の高い資料として世界的に認知されています。

 本稿では、最新版である「The 2025 AI Index Report」の主要なポイントを、前提知識や背景を補足しながら、分かりやすく解説します。なお、レポート自体も無料公開されているので、興味がある方はぜひ確認してみてください。(なお、総ページ数は、456ページとなっています。)

参照元情報

・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。

要点

 「AI Index Report 2025」が示す、現在のAIを取り巻く状況の主なポイントは以下の通りです。

  1. 性能向上: AIは、MMMUGPQASWE-benchといった難易度の高いベンチマーク(性能評価指標)で急速にスコアを伸ばしており、高品質な動画生成や、特定の条件下でのプログラミング能力で人間を上回る例も出てきています。
  2. 社会実装: 医療分野でのAI搭載機器の承認数増加(2015年の6件から2023年には223件へ)や、WaymoBaidu Apollo Goといった自動運転タクシーの実用化が進んでいます。
  3. ビジネス活用: AI導入企業は増加(2024年に78%、前年比+23%)し、生産性向上効果も研究で示されています。特に生成AI分野への投資が活発です。
  4. 国際動向: AIモデル開発では米国が依然リードしていますが、中国が性能面で急速に追いついています。研究論文や特許では中国が先行しています。
  5. 責任あるAI (RAI): AI関連インシデントが増加する一方、開発企業における標準化されたRAI評価はまだ稀です。しかし、安全性を評価する新たなベンチマークが登場し、政府間の協力も進んでいます。
  6. 効率化とアクセス向上: より小型で高性能なモデルが登場し、推論コスト(AIを利用するコスト)が大幅に低下。オープンウェイトモデル(内部構造がある程度公開されているモデル)も性能を向上させ、先進的なAIへのアクセス障壁が下がっています。
  7. 政府の動き: 各国政府によるAI関連規制の導入や、大規模な投資計画が相次いでいます。
  8. 産業界の優位: 注目すべきAIモデルの約90%が産業界から生まれていますが、性能差は縮小傾向にあり、競争が激化しています。
  9. 課題: 国際数学オリンピックレベルの問題は解けても、PlanBenchのような複雑な論理的推論や計画立案能力には依然として課題があります。

詳細解説

 それでは、上記の要点をさらに詳しく見ていきましょう。

1. AI性能の目覚ましい向上

 AIの能力は、様々な「ベンチマーク」と呼ばれる標準テストで測られます。2023年に導入されたMMMU(多様なタスクでのマルチモーダル理解)、GPQA(専門家レベルの質疑応答)、SWE-bench(ソフトウェアエンジニアリング)といった特に難しいベンチマークにおいて、AIはわずか1年でスコアをそれぞれ18.8、48.9、67.3パーセントポイントも向上させました。これは、AIがより複雑で専門的なタスクをこなせるようになってきていることを示しています。

 また、文章から高品質な動画を生成する技術も大きく進歩しました。さらに、特定のプログラミングタスクでは、時間制限がある中でAI(言語モデルエージェント)が人間を上回る成果を出したことも報告されており、AIの実用的な能力が急速に高まっていることがわかります。

2. 日常生活へのAI浸透

 AIは研究室を飛び出し、私たちの身近なところで使われるようになっています。医療分野では、AIを活用した診断支援システムなどがFDA(アメリカ食品医薬品局)によって承認される件数が急増しています。2015年にはわずか6件だったものが、2023年には223件に達しました。

 交通分野でも、自動運転技術の実用化が進んでいます。米国の大手事業者であるWaymoは、毎週15万回以上の自動運転サービスを提供しており、中国ではBaiduのApollo Goロボタクシーが多くの都市で手頃な価格で利用可能になっています。

3. ビジネスにおけるAI活用と投資の加速

 企業によるAIの導入が加速しています。2024年には、調査対象組織の78%がAIを利用していると回答し、前年の55%から大幅に増加しました。AIが業務の生産性を向上させ、多くの場合、従業員間のスキル格差を埋めるのに役立つことが、多くの研究によって裏付けられています。

 こうした状況を背景に、AI分野への投資も記録的な水準に達しています。特に米国は積極的で、2024年の民間AI投資額は1091億ドルに上り、これは中国(93億ドル)の約12倍、英国(45億ドル)の約24倍に相当します。特に、文章や画像を生成する生成AI分野への投資が世界的に活発で、339億ドル(前年比18.7%増)を集めました。

4. 米国リードも、中国が猛追、そしてグローバル化

 高性能なAIモデルの開発においては、依然として米国の研究機関や企業が中心的な役割を担っています。2024年には、注目すべきAIモデル40件が米国から発表され、中国(15件)や欧州(3件)を大きく引き離しました。

 しかし、量では米国がリードする一方、質(性能)の面では中国が急速に差を詰めています。MMLU(大規模マルチタスク言語理解)やHumanEval(コード生成能力)といった主要なベンチマークにおける性能差は、2023年には二桁あったものが、2024年にはほぼ同等レベルにまで縮小しました。研究論文の発表数やAI関連特許の取得数では、中国が引き続き世界をリードしています。

 同時に、AI開発はグローバル化しており、中東、ラテンアメリカ、東南アジアといった地域からも注目すべきモデルが登場しています。

5. 責任あるAI(RAI)エコシステムの不均一な進化

 AIの利用拡大に伴い、誤情報生成やバイアス、プライバシー侵害といったAI関連のインシデント(問題事象)も急増しています。しかし、大手AI開発企業の間でも、責任あるAI(Responsible AI: RAI)、つまりAIを倫理的かつ安全に開発・利用するための取り組みや、その標準化された評価方法はまだ十分に確立されていません。

 一方で、HELM Safety、AIR-Bench、FACTSといった、AIの事実性や安全性を評価するための新しいベンチマークが登場しており、今後の活用が期待されます。

 企業レベルでは、RAIのリスクを認識してはいるものの、具体的な対策が追いついていない状況が見られます。対照的に、政府レベルでは危機感が高まっており、OECD(経済協力開発機構)、EU(欧州連合)、国連、アフリカ連合などが、透明性や信頼性といったRAIの基本原則に焦点を当てた枠組みを発表し、国際的な協力体制が強化されています。

6. 世界的なAIへの期待感と地域差

 AI製品やサービスに対して、「害よりも利益の方が多い」と考える人の割合は、世界的に見ると増加傾向にありますが、地域によって大きな差があります。中国(83%)、インドネシア(80%)、タイ(77%)などでは非常に高い期待感が示されている一方、カナダ(40%)、米国(39%)、オランダ(36%)などでは依然として低い水準にとどまっています。

 しかし、変化の兆しも見られます。2022年以降、以前は懐疑的だった国々、例えばドイツ(+10%)、フランス(+10%)、カナダ(+8%)、英国(+8%)、米国(+4%)などで、AIに対する楽観的な見方が著しく高まっています。

7. AIの効率化、低コスト化、アクセス向上

 AI技術は、より効率的で、手頃な価格で、利用しやすくなっています。特に、比較的小規模ながら高い能力を持つモデルの開発が進んだことにより、GPT-3.5(一世代前の高性能モデル)レベルの性能を持つシステムの推論コスト(AIを実際に動かすためのコスト)は、2022年11月から2024年10月の間に280分の1以下にまで劇的に低下しました。

 ハードウェアレベルでも、コストは年率30%で低下し、エネルギー効率は年率40%で向上しています。

 また、オープンウェイトモデル(モデルの構造や学習済みパラメータの一部が公開されており、誰でも利用・改変しやすいモデル)が、クローズドモデル(企業秘密として公開されないモデル)との性能差を急速に縮めています。あるベンチマークでは、性能差が1年で8%から1.7%にまで縮小しました。これらのトレンドにより、先進的なAI技術を利用するためのハードルが急速に下がっています。

8. 政府によるAI規制と投資の本格化

 AIの影響力増大に対応するため、各国政府の動きが活発化しています。米国では、2024年に連邦機関が導入したAI関連規制は59件に上り、2023年の2倍以上、規制を発行した機関数も2倍になりました。世界的に見ても、75カ国における法律文書でのAIへの言及は2023年から21.3%増加し、2016年比では9倍に達しています。

 規制と並行して、大規模な投資も行われています。カナダは24億ドル、中国は475億ドルの半導体基金、フランスは1090億ユーロ、インドは12.5億ドルをAI関連に投じる計画を発表しました。サウジアラビアの「Project Transcendence」は1000億ドル規模の巨大イニシアチブです。

9. AI・コンピュータサイエンス(CS)教育の拡大と課題

 将来のAI人材育成のため、初等中等教育(K-12)におけるコンピュータサイエンス(CS)教育の導入が進んでいます。現在、世界の3分の2の国がCS教育を提供または計画しており、これは2019年の2倍にあたります。特にアフリカやラテンアメリカでの進展が著しいです。米国では、コンピュータ分野の学士号取得者数が過去10年で22%増加しました。

 しかし、課題も残ります。多くのアフリカ諸国では、電力供給といった基本的なインフラ不足が教育機会を制限しています。米国でも、K-12のCS教師の81%が「AIは基礎的なCS教育の一部であるべきだ」と考えているものの、実際にAIについて教える準備ができていると感じている教師は半数以下にとどまっています。

10. 産業界主導の開発と「フロンティア」の競争激化

 2024年に発表された注目すべきAIモデルの約90%は、産業界(企業)によって開発されたものであり、2023年の60%からさらにその割合が高まりました。一方で、引用数の多い基礎研究論文は依然として学術界(大学など)が多く発表しています。

 モデル開発の規模は拡大し続けており、学習に必要な計算能力(コンピューティングパワー)は約5ヶ月ごと、データセットの規模は約8ヶ月ごと、消費電力は年ごとに倍増しています。

 しかし、最先端(フロンティア)における性能差は縮小しています。トップ性能のモデルと10位のモデルとのスコア差は、1年間で11.9%から5.4%に縮小し、トップ2モデル間の差はわずか0.7%にまで迫っています。AI開発の最前線は、ますます競争が激しく、多くのプレイヤーがひしめき合う状況になっています。

11. AIが科学分野にもたらしたインパクトと栄誉

 AIの重要性は、主要な科学賞の受賞にも表れています。ディープラーニング(深層学習)につながる研究(物理学賞)と、そのタンパク質構造予測への応用(化学賞)に対して、2つのノーベル賞が授与されました。また、コンピュータ科学の最高峰とされるチューリング賞は、強化学習への画期的な貢献に対して贈られました。

12. 複雑な推論能力における課題

 AIモデルは、国際数学オリンピックのような特定の問題解決能力では目覚ましい成果を上げていますが、PlanBenchのような複雑な論理的思考や計画立案能力を要するベンチマークでは依然として苦戦しています。論理的に正解が存在する場合でも、それを確実に見つけ出すことができないケースが多く、これは精度が極めて重要な、例えば医療や重要インフラ制御といったハイステークス(失敗が許されない)な領域でのAI活用における限界を示唆しています。

まとめ

 「AI Index Report 2025」は、AIが技術的にも社会的にも急速な進化と拡大を遂げている現状を明確に示しています。性能向上、社会実装、ビジネス活用が進む一方で、責任あるAIの確立、国際的な協調と競争、教育体制の整備、そして複雑な推論能力といった課題も浮き彫りになりました。

 AIは間違いなく21世紀を最も変革する技術の一つとなる可能性を秘めていますが、その恩恵を公平に享受するためには、私たちがその開発を注意深く導いていく必要があります。本稿が、AIの現在地と今後の動向を理解する一助となれば幸いです。

  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次