はじめに
本稿では、Google Cloudが2025年6月18日に公開した公式ブログ記事「Gemini momentum continues with launch of 2.5 Flash-Lite and general availability of 2.5 Flash and Pro on Vertex AI」を基に、Googleの最新AIモデルファミリー「Gemini 2.5」に関する重要なアップデートを解説します。
引用元記事
- タイトル: Gemini momentum continues with launch of 2.5 Flash-Lite and general availability of 2.5 Flash and Pro on Vertex AI
- 発行元: Google Cloud Blog
- 発行日: 2025年6月18日
- URL: https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-flash-lite-flash-pro-ga-vertex-ai?hl=en
要点
- GoogleのAI開発基盤「Vertex AI」において、最新AIモデルGemini 2.5 Pro(最高性能)とGemini 2.5 Flash(高速・高効率)が正式版となり、企業が本番環境で本格的に利用できるようになった。
- 大量のタスクを低コストで処理することに特化した、最も費用対効果の高い新モデルGemini 2.5 Flash-Liteがプレビュー版として公開された。
- Gemini 2.5 Flashを自社の独自データで追加学習させ、特定の業務に合わせて性能を向上させる「教師ありファインチューニング(SFT)」機能が正式版となり、より専門的なAIの構築が可能になった。
- リアルタイムでの音声対話システム開発を効率化する「Live API」が、ネイティブオーディオ機能を搭載してアップデートされ、より自然な音声AIアプリケーションの開発が容易になった。
詳細解説
今回のアップデートの核心:Gemini 2.5ファミリーが本格始動
今回の発表の最も重要な点は、GoogleのAIモデル「Gemini」の最新世代である2.5ファミリーが、企業向けのAI開発プラットフォーム「Vertex AI」上で、いよいよ本格的に利用できるようになったことです。
これまで「プレビュー版」として提供されていたモデルが「正式版(GA)」になるということは、いわば「試用期間」が終わり、Googleがその安定性、信頼性、そして拡張性を公式に保証したことを意味します。これにより、企業は自社の根幹をなす重要なサービス(ミッションクリティカルなアプリケーション)にも、安心してGemini 2.5の強力なAI機能を組み込めるようになりました。用途に応じて性能とコストのバランスが異なる複数のモデルが提供され、ビジネスの選択肢が大きく広がったと言えます。
【正式版】Gemini 2.5 Pro:最高峰の知能を、最も困難な課題へ
Gemini 2.5 Proは、Geminiファミリーの中で最も高性能な最上位モデルです。その能力は、人間でも時間のかかる非常に複雑なタスクを解決するために設計されています。
- 得意なこと:
- 高度な推論: 膨大な科学論文や財務報告書などのデータセットを読み解き、洞察を引き出す。
- 高度なコード生成: 古いプログラム言語で書かれた複雑なシステムを、最新の言語へ書き換える(マイグレーション)。
- 深いマルチモーダル理解: テキストだけでなく、画像や音声、動画の内容を深く理解し、それらを組み合わせた高度な処理を行う。
- 活用事例:
- Snap社: 同社が開発するARグラス「Spectacles」とGemini 2.5 Proを連携。グラスが見ている風景の画像から、物体の位置を3次元空間で認識し、現実世界に情報を重ねて表示する「空間知能」の実現を目指しています。
- Multimodal社: 金融や保険業界向けに、専門的な業務フローを自動化するAIエージェントを開発。Gemini 2.5 Proの長文読解能力と推論能力を活用し、専門文書や複雑なワークフローをAIが即座に理解・実行できるようにしました。
【正式版】Gemini 2.5 Flash:速度と効率性を追求した実用モデル
Gemini 2.5 Flashは、処理速度とコスト効率のバランスに優れたモデルです。多くの企業アプリケーションで求められる、高速な応答性と大量処理能力を両立させています。
- 得意なこと:
- 大規模な要約: 大量の顧客レビューや会議の議事録などを瞬時に要約する。
- 応答性の高いチャットボット: ユーザーからの問い合わせに、遅延なく自然な対話で応答する。
- 効率的なデータ抽出: 請求書や契約書などの非構造化テキストから、必要な情報(金額、日付、契約者名など)を正確に抜き出す。
- 活用事例:
- SmartBear社: Gemini 2.5 Flashの高速処理を活かし、手作業で行っていたソフトウェアのテスト項目を自動化されたテストコードに変換。開発速度を大幅に向上させています。
- Suggestic社: 栄養管理アプリにおいて、食事の画像から栄養素を分析するAPIのコアモデルとして採用。Gemini 2.5 Flashの活用により、他モデルと比較して精度と処理速度が25%向上したと報告しています。
【プレビュー版】Gemini 2.5 Flash-Lite:コストパフォーマンスを最大化する新星
今回新たにプレビュー版として公開されたGemini 2.5 Flash-Liteは、Gemini 2.5ファミリーの中で最もコスト効率に優れたモデルです。性能は従来のFlashモデルよりも向上しつつ、コストを抑えられるように設計されています。
- 得意なこと:
- テキスト分類: 顧客からのフィードバックを「ポジティブ」「ネガティブ」などに分類する。
- 翻訳: 大量のテキストを多言語に翻訳する。
- インテリジェントルーティング: 問い合わせ内容を解析し、最適なサポート担当者へ自動的に割り振る。
このように、一つ一つの処理は比較的単純でも、非常に多くの量をこなす必要があるタスクでその真価を発揮します。
AIを「自社仕様」に:教師ありファインチューニング(SFT)の威力
今回のアップデートで、Gemini 2.5 Flashにおいて教師ありファインチューニング(Supervised Fine-Tuning, SFT)が正式版となりました。
ファインチューニングとは、簡単に言えば「汎用的なAIモデルに、自社独自のデータや知識を追加で学習させること」です。例えば、医療業界なら専門用語を、製造業なら独自の製品知識を、小売業なら自社ブランドの口調やスタイルをAIに覚えさせることができます。これにより、汎用モデルのままでは難しかった、特定の業務における精度を飛躍的に向上させることが可能になります。この機能が正式版になったことで、あらゆる企業がより手軽に「自社仕様のAI」を構築する道が開かれました。
リアルタイム音声AIがより身近に:Live APIの進化
Live APIは、AIとのリアルタイムな対話システムを構築するためのAPI(プログラムの呼び出し規約)です。今回、このAPIがネイティブオーディオ機能に対応しました。
これは、音声データを一度テキストに変換してからAIが処理し、生成したテキストを再び音声に変換する…という回りくどい手順を踏むことなく、音声から音声へ(audio-to-audio)の直接的なやり取りが可能になったことを意味します。これにより、遅延が少なく、より人間と話しているかのような自然で応答性の高い音声AIアプリケーション(AI受付係やリアルタイム通訳など)の開発が、これまで以上に簡単になります。
まとめ
今回のGoogleによるGemini 2.5ファミリーのアップデートは、単なる新機能の追加ではありません。AIを「試す」段階から「本格的にビジネスで活用する」段階へと移行するための、強力な基盤が整ったことを示しています。
- 多様な選択肢: 最高性能のPro、速度とコストのバランスに優れたFlash、そして圧倒的なコスト効率を誇るFlash-Liteという明確な選択肢が揃い、企業は自社の目的と予算に最適なモデルを選べるようになりました。
- 高いカスタマイズ性: ファインチューニング機能の強化により、汎用的なAIを自社の業務に最適化させ、唯一無二の価値を創出することが容易になりました。
本番環境への対応: 主要モデルが正式版となったことで、企業は信頼性と安定性が求められる本番環境でも、自信を持って最先端のAIを導入できます。