はじめに
歴史研究、特に文字史料が限られる古代史の分野では、石碑や遺物に刻まれた「碑文」が当時の社会や文化を知るための極めて重要な手がかりとなります。しかし、その多くは長い年月を経て断片化・風化しており、解読は困難を極めます。
本稿では、この課題に対してAI技術がどのように貢献できるかを示す最新の研究成果についてGoogle DeepMindが発表した「Aeneas(アイネアス)」というAIモデルの技術的な側面と歴史研究における意義を解説します。

参考記事
- タイトル: Aeneas transforms how historians connect the past
- 発行元: Google DeepMind
- 発行日: 2025年7月23日
- URL: https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
実験用サイト
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- Aeneasは、断片化した古代ローマのラテン語碑文を解読・復元するために開発されたAIモデルである。
- テキスト情報だけでなく、碑文が刻まれた石の画像といったマルチモーダル(複合的)な情報を活用し、碑文の欠損部分の復元、作成された年代の特定、出土地点の推定を高精度で行う。
- 膨大な碑文データベースから類似例(パラレル)を瞬時に検索する機能により、従来は多大な時間を要していた歴史家の研究を大幅に加速させることが可能である。
- Aeneasは歴史家に取って代わるものではなく、専門家の知見とAIの能力を融合させる協業ツールとして設計されており、歴史研究の質と効率を向上させることが実証されている。
詳細解説
古代碑文研究が直面する課題
古代ローマ世界では、皇帝の功績を称える記念碑から、個人の墓碑銘、さらには日常的な落書きに至るまで、社会のあらゆる場面で文字が使われていました。これらの「碑文」は、文献史料からは見えてこない、当時の人々の生活や価値観を伝える貴重な一次史料です。
しかし、これらの多くは風化や破壊によってテキストが欠けていたり、表面が摩耗していたりします。歴史家は、こうした不完全な碑文を解読する際、自らの専門知識と経験を頼りに、他の膨大な碑文の中から「パラレル」と呼ばれる類似例(定型文や表現、書式が似ているもの)を探し出し、比較検討することで欠損部分を推測してきました。この作業は、極めて専門的であると同時に、膨大な時間と労力を要するものでした。
歴史研究を加速させるAI「Aeneas」
Aeneasは、こうした歴史研究の根幹をなす作業を支援するために開発されたAIモデルです。その名前は、ギリシャ・ローマ神話の英雄アイネアスに由来します。このモデルは、Google DeepMindが以前に開発した古代ギリシャ語碑文のためのAI「Ithaca(イタカ)」をさらに発展させたものです。
Aeneasの最大の特徴は、単に欠損部分を復元するだけでなく、その碑文が持つ「文脈」を理解し、提示する点にあります。数千ものラテン語碑文を学習したAeneasは、歴史家が求めるパラレルを数秒で検索し、その碑文がどのような時代に、どこで、どのような目的で作成されたのかを推定するための根拠を提示します。

Aeneasの優れた機能と技術
Aeneasは、従来のモデルにはないいくつかの重要な機能を備えています。
- パラレル検索: Aeneasは、各碑文のテキスト情報や文脈情報を「エンベディング」という技術を用いて、いわば「歴史的な指紋」のような数値データに変換します。これにより、テキストの内容や言語的特徴、年代、出所といった複数の要素に基づいた複雑な類似性判断を瞬時に行い、関連性の高いパラレルをリストアップできます。
- マルチモーダル入力: Aeneasは、碑文のテキストだけでなく、碑文が刻まれた媒体の画像も分析します。文字の書体や配置といった視覚的な情報も考慮することで、特に碑文の出土地点を特定する精度を大幅に向上させています。これは、テキストと画像を同時に扱うことができる初のモデルです。
- 未知の長さの欠損復元: 従来のモデルでは、復元すべき文字数があらかじめ分かっている必要がありました。しかし、Aeneasは欠損部分の長さが不明な場合でもテキストを復元できる世界初の機能を搭載しており、より損傷の激しい史料にも対応可能です。

Aeneasは、複数のデジタル碑文データベースを統合して構築された17万6000件以上のラテン語碑文からなる独自のデータセットで訓練されており、その性能は既存のモデルを上回ります。
具体的には、10文字までの欠損部分の復元精度は73%、出土地点の特定精度は72%、年代特定は歴史家が推定した年代範囲から平均13年以内の誤差という高い性能を示しています。
歴史家とAIの協業がもたらす未来
Aeneasの真価は、歴史研究の現場でどのように活用されるかにあります。開発チームは、23人の碑文研究者と協力し、Aeneasが研究支援ツールとして有効かを検証する実験を行いました。
その結果、歴史家が単独で作業した場合に比べて、Aeneasが提示したパラレルや予測情報を活用した場合、碑文の復元、年代、出土地点の特定精度が著しく向上しました。また、研究者自身の分析に対する確信度も高まり、研究の出発点として非常に価値があると評価されました。ある歴史家は、「Aeneasが提示したパラレルは、碑文に対する私の認識を完全に変えました」と述べています。
これは、AIが人間の専門家に取って代わるのではなく、その能力を拡張し、より深い洞察を得るための強力な協業者となりうることを明確に示しています。
まとめ
本稿では、Google DeepMindが開発した古代碑文解読支援AI「Aeneas」について解説しました。Aeneasは、テキストと画像のマルチモーダル情報を活用して、断片化した碑文の復元、年代特定、出土地点推定を高精度で行います。特に、膨大な史料から類似例を瞬時に検索する機能は、歴史家の研究を大幅に効率化し、新たな発見を促す可能性を秘めています。
Aeneasの事例は、AIが専門家の知見と融合することで、人文科学の分野においても大きな貢献ができることを示しています。この技術はラテン語だけでなく、他の古代言語や、パピルス、貨幣といった異なる媒体の研究にも応用が期待されており、私たちが過去を理解する方法そのものを変革していくかもしれません。