はじめに
Googleは2025年7月14日、開発者向けに最新のテキスト埋め込みモデル「gemini-embedding-001」を、Gemini APIおよびVertex AIを通じて正式にリリースしたことを発表しました。この新しいモデルは、AIがテキストの意味をより深く理解するための基盤技術であり、今後のAIアプリケーション開発に大きな影響を与える可能性があります。
本稿では、Google Developers Blogの公式発表「Gemini Embedding now generally available in the Gemini API」を元に解説していきます。
参考記事
- タイトル: Gemini Embedding now generally available in the Gemini API
- 発行元: Google Developers Blog
- 発行日: 2025年7月14日
- URL: https://developers.googleblog.com/en/gemini-embedding-available-gemini-api/
要点
- Googleの最新テキスト埋め込みモデルgemini-embedding-001が一般提供開始された。
- 本モデルは、MTEB(Massive Text Embedding Benchmark)という客観的な性能評価指標でトップクラスの性能を誇り、100以上の言語に対応する。
- 従来のモデルからの移行が推奨されており、今後のAIアプリケーション開発の基盤となることが期待される。
詳細解説
そもそも「テキスト埋め込み(Embedding)」とは?
まず、本稿のテーマである「テキスト埋め込み(Embedding)」という技術について、簡単にご説明します。これは、AI、特に大規模言語モデル(LLM)が私たちの使う「言葉」を理解するための非常に重要なステップです。
人間は「犬」と「猫」が似た動物で、「車」とは全く違うことを直感的に理解できます。しかし、AIはテキストをそのままでは理解できません。そこで、テキスト(単語や文章)を、AIが処理できる数値のリスト、すなわち「ベクトル」に変換する技術が「テキスト埋め込み」です。
このベクトルの特徴は、単語や文章の「意味」を数値で表現している点にあります。意味が近い単語同士(例:「犬」と「猫」)はベクトル空間上で近くに配置され、意味が遠い単語(例:「犬」と「車」)は遠くに配置されます。
この技術により、以下のような高度なアプリケーションが実現可能になります。
- セマンティック検索(意味検索): キーワードが完全に一致しなくても、意味的に関連性の高い文書を検索する。
- クラスタリング: 大量の文書を意味の近さに応じて自動的にグループ分けする。
- 推薦システム: ユーザーが過去に興味を示したアイテムと意味的に似たアイテムを推薦する。
- 質問応答システム: 質問文と最も関連性の高い回答を膨大な知識ベースから見つけ出す。
つまり、テキスト埋め込みは、AIが言葉のニュアンスを捉え、より人間に近い形で情報を処理するための根幹をなす技術なのです。
Gemini Embeddingの性能
今回リリースされたgemini-embedding-001は、このテキスト埋め込みの性能を新たなレベルに引き上げるモデルです。その性能は、MTEB(Massive Text Embedding Benchmark) という、テキスト埋め込みモデルの性能を多角的に評価する業界標準のベンチマークで証明されています。

gemini-embedding-001は、このMTEBの多言語リーダーボードで常にトップクラスのスコアを維持しており、検索、分類、クラスタリングといった様々なタスクにおいて、Googleの旧モデルや他の商用モデルを凌駕する性能を示しています。
特筆すべきは、その汎用性の高さです。科学、法律、金融、そしてプログラミングコードといった多様な専門分野にわたって、統一された最先端の性能を発揮します。さらに、100以上の言語をサポートしており、グローバルなアプリケーション開発にも非常に強力なツールとなります。
開発者向け情報
gemini-embedding-001は、Gemini API及びVertex AIを通じて利用でき、無料枠も用意されています。有料プランでの価格は、100万入力トークンあたり$0.15と設定されています。
Googleは、既存の埋め込みモデル(embedding-001やtext-embedding-004など)を利用している開発者に対し、この新しいgemini-embedding-001への早期移行を強く推奨しています。
Google AI Studio での利用
以下のように設定することで簡単に利用することができます。
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
まとめ
本稿では、Googleが新たにリリースしたテキスト埋め込みモデルgemini-embedding-001について解説しました。
このモデルは、MTEBベンチマークで証明されたトップクラスの性能と100以上の言語への対応力で、これまでにない大きな利点を提供します。
セマンティック検索、RAG(Retrieval-Augmented Generation)、推薦システムなど、テキストの意味理解が重要となるあらゆるAIアプリケーションの品質と効率を飛躍的に向上させる可能性を秘めています。gemini-embedding-001は、間違いなく今後のAI開発における新たなスタンダードとなるでしょう。AI開発に携わる方は、ぜひこの新しいモデルの力を試してみてはいかがでしょうか。