はじめに
近年、人工知能(AI)の進化は目覚ましいものがあります。専門家の中には、数年以内にAIが人間の知能を超えるという予測をする人もいるほどです。しかし、AIは本当に人間と同等、あるいはそれ以上の知能を持つのでしょうか。本稿では、TheNewYorkTimesの「Are You Smarter Than A.I.?」を基に、AI研究者のFrançois Chollet氏が開発したパズルゲームからAIの現状と課題について考察します。
参考元記事
- 記事タイトル: Are You Smarter Than A.I.?
- URL: https://www.nytimes.com/interactive/2025/03/26/business/ai-smarter-human-intelligence-puzzle.html
- 発行日: 2025年3月26日
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- François Chollet氏は、人間には容易だが機械にとっては難しいパズルゲーム「ARC (Abstraction and Reasoning Corpus)」を開発しました 。
- このパズルは、与えられた例から視覚的なパターンを素早く認識する能力を試すものです 。
- 長年、このパズルはChatGPTのようなAIシステムにとってもほぼ不可能でしたが、最近OpenAIの「o3」というシステムが人間の成績を上回りました 。
- しかし、この結果はAIが人間レベルの汎用人工知能(AGI)に到達したことを意味するのかが議論のテーマとなっています。
詳細解説
François Chollet氏が開発したARCというパズルゲームは、AIの進歩を測る上で重要な役割を果たしてきました 。このパズルの特徴は、人間にとっては直感的に理解できるパターン認識を、AIにとっては非常に難しいタスクとして提示することにあります。
パズルでは、いくつかの例題が示され、それぞれが色のついた正方形のグリッドを別のグリッドに変換するパターンを示しています プレイヤー(またはAIシステム)は、これらの例からパターンを特定し、それを別のグリッドに適用して結果を予測します。

従来のAIシステムは、インターネット上の大量のデータを分析することでスキルを習得していました 。そのため、過去に大量に見たことがあるような文章を生成することは得意でしたが、少数の例から新しい論理パズルを解くことは苦手でした 。
しかし、2023年12月、OpenAIは新しいAIシステム「o3」がARCテストで人間の成績を上回ったと発表しました 。o3は、従来のChatGPTとは異なり、応答する前に様々な可能性を考慮する時間を設けることができました 。この成果は、AIがAGIに近づいている証拠と見る向きもありましたが、同時にARCのようなベンチマークテストの限界も露呈させました。
プリンストン大学のコンピュータ科学教授であるArvind Narayanan氏は、ARCテストがAGIへの進歩を測る指標であるという主張は「非常に疑わしい」と述べています 。しかし、同氏はOpenAIの技術がARCテストに合格したことは印象的なスキルを示しているとも認めています。
OpenAIのo3システムは、ARCテストで87.5%の正解率を達成しましたが、この結果を出すために多大な計算資源を消費しました 。また、OpenAIはAIシステムの技術を公開しなかったため、ARC Prizeの受賞資格はありませんでした。
François Chollet氏は、AIの知能は効率性とは程遠いと指摘しています。同氏らは、より高度なARC-AGI-2という新しいベンチマークを導入し、AIのさらなる挑戦を促しています。
新しいARC-AGI-2ベンチマークは、元のベンチマークと同じようなカラフルなグリッド形式ですが、より難易度が高くなっています。Chollet氏によれば、人間にとってはまだ解けるレベルですが、AIにとっては非常に難しいものになるだろうとのことです。

ARC Prizeチームは、ARC-AGI-2がAIによって解かれるまでには約2年かかると予想していますが、もっと早く解決される可能性もあると考えています。彼らはすでにARC-AGI-3の開発に着手しており、2026年に発表する予定で。ARC-AGI-3の初期のモックアップでは、動的なグリッドベースのゲームとのインタラクションを伴うパズルが示唆されています。
まとめ
AI技術は着実に進化していますが、人間の知能を完全に模倣するにはまだ多くの課題があります 。ARCパズルは、AIの進歩を測るための重要なツールとして機能していますが、同時にその限界も示しています 。François Chollet氏らの取り組みは、AI研究における重要な指標を提供し、AGIの開発に向けた道筋を示しています 。AIが人間の知能を超える日が来るかどうかはまだ不透明ですが、今後の研究開発の動向から目が離せません。
コメント