はじめに
本稿では、2025年6月6日にScientific American誌に掲載された「At Secret Math Meeting, Researchers Struggle to Outsmart AI」という記事をもとに、人工知能(AI)が人類の知的活動の頂点ともいえる数学の分野で、どれほどの進歩を遂げているのかについて解説します。
引用元記事
- タイトル: At Secret Math Meeting, Researchers Struggle to Outsmart AI
- 著者: Lyndie Chiou, edited by Clara Moskowitz
- 発行元: Scientific American
- 発行日: 2025年6月6日
- URL: https://www.scientificamerican.com/article/inside-the-secret-meeting-where-mathematicians-struggled-to-outsmart-ai/
要点
- 世界トップクラスの数学者30名が秘密裏に集まり、AIに解けない数学の問題を作成するコンテストに挑んだ。
- 対象となったAIはOpenAIが開発した「o4-mini」という「推論型大規模言語モデル」であり、従来のモデルより高度な推論能力を持つ。
- このAIは、専門家でも解くのに苦労するような未解決の博士課程レベルの問題を、関連文献の調査から始め、わずか10分で解いてみせるなど、驚異的な能力を発揮した。
- AIのこの進歩は、数学者の役割を根本的に変える可能性を秘めており、人間にはAIへの問いかけや創造性の発揮がより一層求められるようになることを示唆している。
詳細解説
秘密裏に開かれた数学者たちの会合
2025年5月のある週末、カリフォルニア州バークレーに、世界で最も著名な数学者30名がイギリスなど遠方から集まりました。彼らの目的は、あるAIの数学的能力を試すために、AIには解けないであろう超難問を作成することでした。この会合は、AIに事前に情報を与えないよう、メッセージアプリ「Signal」でのみ連絡を取り合うなど、徹底した情報管理のもとで行われました。もしAIが問題を解けなければ、問題作成者の数学者には7,500ドルの賞金が与えられるという、まさに人間とAIの知恵比べの場でした。
対決したAI「o4-mini」とは?
今回、数学者たちの挑戦相手となったのは、OpenAIが開発した「o4-mini」というAIです。これは「推論型大規模言語モデル(reasoning large language model)」と呼ばれる新しいタイプのAIで、私たちが普段利用するChatGPTのような従来のモデルとは一線を画します。
従来のAIは、膨大なテキストデータを学習し、次に続く単語を予測することで文章を生成していました。これに対し、o4-miniのような推論型モデルは、より軽量化され、特定の専門分野のデータと人間からの強力なフィードバック(強化学習)によって訓練されています。これにより、単語を予測するだけでなく、複雑な問題に対してより深く論理的な「推論」を行う能力を獲得しました。
このAIの能力を測るため、OpenAIは非営利団体Epoch AIに依頼し、「FrontierMath」というベンチマークプロジェクトを立ち上げました。このプロジェクトでは、まだ世に出ていない学士レベルから研究者レベルまでの全く新しい数学の問題が300問集められ、o4-miniの能力が試されました。
AIが示した驚くべき「思考プロセス」
会合の中心人物の一人であるヴァージニア大学の数学者、ケン・オノ氏(Ken Ono)は、このAIの実力に衝撃を受けたエピソードを語っています。彼は自身の専門分野である整数論の中から、博士課程の学生にとって良い課題となるような未解決問題をo4-miniに出題しました。
するとAIは、私たちを驚かせるようなプロセスで解答を導き出したのです。
- 関連研究の調査(最初の2分間): まず、問題に関連する学術文献を自ら探し出し、内容を習得しました。
- 単純な問題での練習: 次にAIは、いきなり本題を解くのではなく、より簡単な「おもちゃ(toy)」バージョンを自分で設定し、それを解くことで問題への理解を深めようとしました。
- 解答の提示(5分後): そして準備が整ったと判断すると、元の難問に取り掛かり、5分後には正解を導き出したのです。
驚くべきは、解答の最後に「この謎の数字は私が計算したので、引用の必要はありません!」と、まるで人間のような生意気なコメントまで付け加えていたことです。オノ氏はこの一連の流れを見て、「科学者が行う思考プロセスそのものだ。恐ろしい」と語りました。これは、AIが単に答えを知っているのではなく、問題解決のための戦略を立て、実行する能力を持っていることを示しています。
数学の未来はどうなるのか?
最終的に、数学者チームはAIが解けなかった問題を10問見つけることに成功しましたが、参加者たちはAIの急速な進歩に深い感銘と同時に懸念を抱きました。ロンドン数理科学研究所のヤン・フイ・ホー氏(Yang Hui He)は、AIがあまりにも自信たっぷりに解答を提示するため、人間がそれを鵜呑みにしてしまう危険性を「威圧による証明」という言葉で表現しています。
この出来事は、数学者の役割が未来にどう変わっていくのかという議論を巻き起こしました。もしAIが、現役の数学者でも解けない「ティア5(第5段階)」レベルの問題を解くようになれば、数学者の役割は大きく変化するでしょう。例えば、数学者は自ら問題を解くのではなく、AIという強力な協力者に対して、創造的な問いを投げかけ、新たな数学的真理を発見する手助けをする、まるで指導教官と大学院生のような関係になるかもしれません。
オノ氏は、「汎用人工知能は決して実現しない、ただのコンピューターだと言うのは重大な間違いだ」と警鐘を鳴らします。AIはすでに、世界の最も優秀な大学院生の多くを凌駕する能力を示し始めているのです。
まとめ
今回の秘密会合は、AIが数学という人間の知性の砦において、専門家と対等以上に渡り合えるレベルにまで到達しつつあるという事実を浮き彫りにしました。AIはもはや、与えられた作業をこなすだけのツールではありません。自ら学習し、戦略を立て、未知の問題を解決する「思考する協力者」へと変貌を遂げようとしています。
この変化は、私たち人間にとって、計算や知識の記憶といった能力の価値が相対的に低下し、代わりに「何を問うべきか」という創造性や、物事を深く考える批判的思考力が、これまで以上に重要になる時代の到来を告げているのかもしれません。