はじめに
オンラインショッピングや動画配信サービスで表示される「あなたへのおすすめ」。この推薦システムが、私たちの好みをより深く理解し、まるで店員さんと相談するように欲しいものを見つけられるとしたら、どうでしょうか。現在、大規模言語モデル(LLM)の進化によって、推薦システムは単に商品を提案するだけでなく、自然な言葉でユーザーと対話する新たなステージへと進化しようとしています。
本稿では、この「対話型」推薦システムの開発を加速させる画期的な研究として、Google Researchが2025年6月27日に発表したブログ記事「REGEN: Empowering personalized recommendations with natural language」をもとに、「REGEN」について解説していきます。
引用元記事
- タイトル: REGEN: Empowering personalized recommendations with natural language
- 発行元: Google Research
- 発行日: 2025年6月27日
- URL: https://research.google/blog/regen-empowering-personalized-recommendations-with-natural-language/
・本稿中の画像に関しては特に明示がない場合、引用元記事より引用しております。
・記載されている情報は、投稿日までに確認された内容となります。正確な情報に関しては、各種公式HPを参照するようお願い致します。
・内容に関してはあくまで執筆者の認識であり、誤っている場合があります。引用元記事を確認するようお願い致します。
要点
- REGENは、大規模言語モデル(LLM)が自然言語対話を通じて個人に最適化された推薦を行う能力を評価・訓練するための新しいベンチマークデータセットである。
- 既存のレビューデータセットに、ユーザーの具体的な要望を示す「Critiques(批評)」と、推薦理由を説明する「Narratives(物語)」という2つの会話要素をAI(Gemini 1.5 Flash)で合成し、追加したものである。
- 実験では、「批評」を入力に加えることで、推薦システムの精度が大幅に向上することが示された。
- REGENは、推薦と理由説明を同時に行う統合モデルと、それぞれを別のモデルで行うハイブリッドモデルの性能比較を可能にし、より人間らしい対話型推薦システムの開発を促進する。
詳細解説
なぜ今「対話型」推薦システムなのか?
これまでの推薦システムは、主にユーザーの過去の購入履歴や閲覧履歴から、「次に買いそうなもの」を予測する仕組みでした。これは非常に強力ですが、「なぜそれが推薦されたのか分からない」「もっと細かい要望、例えば『このデザインは好きだけど、色が違うものが欲しい』といったことを伝えられない」という課題がありました。
しかし、近年の大規模言語モデル(LLM)の目覚ましい発展により、コンピューターは人間の言葉を非常に高い精度で理解できるようになりました。この技術を応用すれば、ユーザーが自然な言葉で伝える細かなニュアンスを汲み取り、よりパーソナライズされた推薦と、その理由の丁寧な説明が可能になります。推薦システムは、一方的な提案から双方向の「対話」へと進化の時を迎えているのです。
ただし、このような賢い対話型AIを開発するには、AIを教育するための「質の高い教科書」、すなわち会話データを含むデータセットが不可欠でした。そこでGoogleの研究者たちが開発したのが「REGEN」です。
REGENとは何か? – 「会話」を教えるための教科書
REGEN(Reviews Enhanced with GEnerative Narratives)は、その名の通り、既存のレビューデータを「生成的な物語」で強化したデータセットです。ベースとなっているのは、広く使われている「Amazon Product Reviews」という膨大な商品レビューのデータです。
REGENの最大の特徴は、この既存データに、AIモデル「Gemini 1.5 Flash」を用いて生成した、次の2つの全く新しい会話要素を加えた点にあります。
- Critiques (批評):
これは、ユーザーの「もっとこうだったら良いのに」という具体的なフィードバックを言語化したデータです。例えば、あるユーザーの履歴から次に「赤いボールペン」を推薦しそうだとします。しかし、本当に欲しいのは「黒いボールペン」だった場合、AIが「赤いボールペン」から「黒いボールペン」へと推薦を修正するよう導くための会話データを生成します。具体的には「これの黒色が欲しいです」といった自然な文章が「批評」としてデータに追加されます。これにより、AIはユーザーの細かな要望に応える訓練ができるようになります。 - Narratives (物語):
これは、なぜその商品を推薦するのか、その文脈を説明するための文章です。単に商品を提示するだけでなく、「お客様のこれまでの購入履歴から、このブランドの書き味を好まれる傾向があるため、こちらの商品をおすすめします」といった購入理由や、「このペンのインクは速乾性に優れており、左利きの方でも手が汚れにくいのが特徴です」といった製品の利点を説明する文章が含まれます。これにより、AIはユーザーが納得できる推薦理由を生成する能力を学びます。
つまりREGENは、AIに「ユーザーの意図を汲み取り、対話を通じて推薦を修正し、説得力のある説明をする」という一連の高度なコミュニケーション能力を教え込むための、世界初の本格的な教科書なのです。
REGENを使った実験 – 2つのアプローチで「対話力」を検証
研究チームは、REGENの有効性を確かめるために、非常に興味深いタスクを設定しました。それは、「ユーザーの購入履歴」と、任意で与えられる「批評(フィードバック)」を基に、「次に買うべき商品」と「その推薦理由(物語)」を同時に生成させるというものです。
この難しいタスクに、2種類のアーキテクチャ(AIの構造)で挑戦させ、その性能を比較しました。
ハイブリッドモデル(分業型):
これは、商品を選ぶ専門家(逐次推薦モデルFLARE)と、説明文を書く専門家(軽量LLMのGemma 2B)が連携するアプローチです。まず推薦の専門家が最適な商品を予測し、その結果を文章作成の専門家に渡して推薦理由を生成させます。多くの実用システムで採用されている構成に近い考え方です。
LUMEN(統合型):
こちらは、一人の万能な専門家(単一のLLM)が、ユーザーの意図の理解、商品の推薦、推薦理由の作成まで、すべてを一貫して行うアプローチです。推薦と説明の間に矛盾が生じにくく、より自然で一貫した対話が期待されます。
明らかになったこと – 「対話」の驚くべき効果
実験の結果、非常に重要なことが明らかになりました。
最大の発見は、ユーザーからの具体的なフィードバック、すなわち「批評」を入力に加えるだけで、推薦の精度が飛躍的に向上したことです。 ある指標(Recall@10:推薦上位10件に正解が含まれる確率)では、「批評」を加えた場合、ハイブリッドモデルのスコアが0.124から0.1402へと大幅に向上しました。これは、AIがユーザーの言葉を正しく理解し、推薦軌道を修正できたことを明確に示しています。この効果は、商品の種類が5倍から60倍も多い、より複雑な「衣料品」のデータセットでも確認されており、REGENが現実世界の複雑な状況にも対応できる有効なベンチマークであることが証明されました。

また、2つのモデルの比較からは、それぞれの長所が見えてきました。ハイブリッドモデルは推薦精度そのものでは高い数値を示しましたが、統合型のLUMENは、推薦する商品と生成する説明文の一貫性において強みを見せました。これは、一人のAIが文脈をすべて理解して処理するため、より人間らしい自然な応答が可能であることを示唆しています。
まとめ
本稿で解説したREGENは、単なる新しいデータセットではありません。それは、これからの推薦システムが目指すべき方向、すなわち「予測」から「対話」へという大きな変化を後押しするための、強力な羅針盤です。
REGENによって開発が進む未来の推薦システムは、まるで優秀なコンシェルジュのように、私たちの曖昧な要望から最適な提案を引き出し、なぜそれが良いのかを丁寧に説明してくれる可能性を示しています。オンラインでの買い物はもちろん、旅行の計画、音楽や映画の選択など、あらゆる場面で、より直感的で、信頼でき、人間味あふれるサポートを受けられるようになるかもしれません。