［ニュース解説］Googleの動画生成AI「Veo」が進化：高速版「Veo 3 Fast」と画像からの動画生成機能が登場

2025-08-01

はじめに

　Googleは同社が開発する動画生成AI「Veo」に関して、アップデートを発表しました。本稿では、新たに追加された高速・低価格モデル「Veo 3 Fast」と、静止画を生き生きとした動画に変換する「Image-to-Video（画像から動画へ）」機能に焦点を当てて解説します。これらの技術がクリエイターや開発者にどのような新しい可能性をもたらすのか、その詳細に迫ります。

参考記事

タイトル: Veo 3 Fast and new image-to-video capabilities
発行元: Google Developers Blog
発行日: 2025年7月31日
URL: https://developers.googleblog.com/ja/veo-3-fast-image-to-video-capabilities-now-available-gemini-api/

要点

Googleは、動画生成AI「Veo 3」の派生モデルとして、速度とコスト効率を重視した「Veo 3 Fast」を発表した。
Veo 3およびVeo 3 Fastに、静止画から動画を生成する「Image-to-Video」機能が追加された。
これらの新機能は、開発者向けにGemini APIを通じて有料プレビュー版として提供が開始された。
Veo 3 Fastは、プログラマティック広告やSNSコンテンツの大量生産など、迅速な動画生成が求められるビジネス用途に適している。

詳細解説

動画生成AI「Veo」とは？

　まず前提として、「Veo」はGoogleが開発している、最先端の動画生成AIモデル群を指します。テキストによる指示（プロンプト）や画像を入力するだけで、AIがその内容を解釈し、高品質な動画を自動で作り出してくれます。この技術は、映画制作、広告、教育、コンテンツ制作など、様々な分野での活用が期待されています。今回の発表は、このVeoファミリーに新たな選択肢と機能が加わったことを意味します。

新モデル「Veo 3 Fast」の登場：速さとコストを両立

　今回のアップデートの柱の一つが、「Veo 3 Fast」という新しいモデルの導入です。これは、既存の高性能モデル「Veo 3」の品質を可能な限り維持しながら、動画生成の速度と利用コストを最適化したバージョンです。

目的と特徴
　開発の主な目的は、開発者がより迅速に、かつ経済的にアイデアを試し、試行錯誤（イテレーション）を重ねられるようにすることです。Veo 3 Fastは、テキストから動画を生成する機能と、後述する画像から動画を生成する機能の両方を備え、音声付きの動画を作成できます。
価格
　価格は、音声付き動画1秒あたり $0.40 に設定されています。これは、Veo 3の$0.75/秒と比較して、大幅に利用しやすくなっています。
想定される活用シーン
　この速度とコストのバランスから、Veo 3 Fastは特に以下のようなビジネス用途で真価を発揮すると考えられます。
- プログラマティック広告: 広告のターゲットや内容に合わせて、多数のバリエーションを持つ広告クリエイティブを自動で生成するシステムの動力源として。
- ラピッドプロトタイピング: 複数のクリエイティブ案を素早く動画化し、効果を比較検討するA/Bテストを効率的に行うために。
- 大規模コンテンツ制作: SNS向けの短い動画など、迅速な制作と大量の出力が求められるアプリケーションの開発に。

新機能「Image-to-Video」のインパクト：静止画に命を吹き込む

　もう一つの大きな発表が、「Image-to-Video」機能です。この機能は、Veo 3とVeo 3 Fastの両方で利用でき、クリエイティブ制作の可能性を大きく広げるものです。

機能の概要
　これは、1枚の静止画とテキストプロンプトを組み合わせて、動画を生成する技術です。AIは入力された画像を動画の最初のシーンとして認識し、その画像のスタイルや被写体、雰囲気といった一貫性を保ったまま、テキストで指示された通りの動きや物語を加えて動画化します。
　例えば、トートバッグに描かれた山のロゴの画像をAIに見せ、「ロゴの中の太陽が昇り、山頂から小さな鳥たちが飛び立つ」というプロンプトを与えると、その通りのアニメーションが生成されます。
利点と可能性
- クリエイティブな制御の向上: ゼロからAIに動画を作らせるのではなく、制作者が用意した画像を起点にすることで、意図した通りのビジュアルや世界観をより正確に動画に反映させることができます。
- 既存資産の活用: 企業ロゴ、商品写真、イラスト、アート作品など、既にある静止画のビジュアル資産を、簡単に動きのあるダイナミックなコンテンツへと生まれ変わらせることが可能です。

開発者にとっての意義

　これらの新機能は、GoogleのAI開発者向けプラットフォームである「Gemini API」を通じて提供されます。これにより、開発者は自身のアプリケーションやサービスに、これらの先進的な動画生成機能を比較的容易に組み込むことができます。

　実際に、動画編集サービスを提供するOpusClip社のような企業は、このImage-to-Video機能を活用し、メイン映像を補足するための映像素材（Bロール）を生成するサービスを強化しています。記事によれば、「Veo 3は静止画を最初のフレームとして取り込み、滑らかで映画のような動きを生成することで、それを生き生きとさせます。これにより、クリエイターは最小限の労力で魅力的な動画コンテンツを手に入れることができます」と述べられています。