[Google I/O 2025]Google最新AIが創造の未来を変える!動画・画像・音楽生成の進化と新ツール「Flow」を解説

目次

はじめに

 本稿では、Google DeepMindが発表した最新の生成AIモデルとクリエイティブツールについて、公式ブログ記事「Fuel your creativity with new generative media models and tools」をもとに、解説します。

引用元記事

あわせて読みたい
[Google I/O 2025]Vertex AIが切り拓くメディア新時代:Imagen 4、Veo 3、Lyria 2がコンテンツ制作を革新 はじめに  本稿では、Google Cloudが発表したVertex AIにおける生成AIメディアモデルの最新情報について、Google Cloud Blogの記事「Expanding Vertex AI with the nex...
あわせて読みたい
[Google I/O 2025]AIが映画制作の未来を拓く:Googleの新ツール「Flow」とは? はじめに  本稿では、Googleが発表したAI映画制作ツール「Flow」について、Google公式ブログ「Meet Flow: AI-powered filmmaking with Veo 3」をもとに解説していきま...

要点

  • Google DeepMindは、動画、画像、音楽を生成する新たな最先端AIモデルとして、Veo 3Imagen 4Lyria 2を発表した。
  • Veo 3は、高品質な動画生成に加え、初めて音声付きの動画生成に対応し、より現実に近いシーン再現が可能である。
  • Imagen 4は、細部の描写力とタイポグラフィ(文字表現)性能が大幅に向上し、多様なアスペクト比と高解像度(最大2K)に対応する。
  • AI映画制作ツールFlowが発表された。これはVeo、Imagen、Geminiといった高度なAIモデルを統合し、より洗練されたキャラクター、シーン、スタイルの制御を可能にする。
  • 既存のVeo 2モデルもアップデートされ、参照ベースの動画生成、カメラ制御、アウトペインティング、オブジェクト追加・削除といった新機能が追加された。
  • 音楽生成AIのLyria 2はアクセスが拡大され、リアルタイム作曲モデルLyria RealTimeもAPI経由で利用可能になる。
  • AI生成コンテンツの識別を助けるSynthID Detectorが発表され、責任あるAI開発への取り組みが強化されている。

詳細解説

創造性の新たなフロンティアを切り拓くGoogleの生成AI

 Google DeepMindは、クリエイターが持つ創造的なビジョンを、より豊かに、そして容易に実現するための新しいAIモデルとツール群を発表しました。これらの技術は、映画制作者、ミュージシャン、アーティスト、そしてYouTubeクリエイターといったプロフェッショナルだけでなく、誰もが自己表現を楽しむための強力な手段となる可能性を秘めています。

Veo 3:音をまとい、よりリアルに進化した動画生成AI

 今回発表された中で注目すべきは、最新の動画生成モデルVeo 3です。従来のVeo 2から品質が向上しただけでなく、特筆すべきは初めて動画と同時に音声を生成できるようになった点です。これにより、例えば街中のシーンであれば車の走行音や雑踏、公園のシーンであれば鳥のさえずり、さらには登場人物間の会話まで、映像と調和した音響空間を自動で作り出すことができます。

 Veo 3は、テキストや画像からの動画生成はもちろんのこと、現実世界の物理法則を理解し、正確なリップシンク(口の動きと音声の一致)も実現しています。ユーザーが短い物語をプロンプト(指示文)として入力するだけで、それを生き生きとした動画クリップとして出力できるのです。このVeo 3は、米国のGeminiアプリのUltraサブスクライバー向け、およびVertex AIのエンタープライズユーザー向けに提供が開始されています。

Veo 2の進化:映画制作者の声に応える新機能群

 Veo 3の開発と並行して、既存のVeo 2モデルも大幅な機能強化が図られました。これらはクリエイターや映画制作者との連携を通じて生まれたもので、より実践的なニーズに応えるものとなっています。

  • 参照ベースの動画生成: キャラクター、シーン、オブジェクト、さらには特定の画風(スタイル)を参照画像としてVeoに与えることで、より一貫性のある、意図した通りの動画を生成できます。これにより、例えば特定のキャラクターを複数のシーンで同じ姿で登場させるといったことが容易になります。
  • カメラ制御: 回転、ドリー(台車を使った移動撮影)、ズームといった精密なカメラワークを指示できるようになりました。これにより、映画的な表現の幅が大きく広がります。
  • アウトペインティング: 生成された動画のフレームを拡張し、例えば縦長の動画を横長に変換したり、シーンに新たな要素を自然に追加したりできます。これにより、様々な画面サイズへの対応が容易になります。
  • オブジェクトの追加・削除: 動画内のオブジェクトを自由に追加したり、消したりすることができます。Veoは物体のスケール感、相互作用、影の付き方などを理解しているため、自然でリアルな編集が可能です。

 これらの新機能のうち、参照ベースの動画生成とカメラ制御は、後述するAI映画制作ツール「Flow」で利用可能になっています。その他の機能も、数週間以内にVertex AIのAPIを通じて、そして今後数ヶ月でさらに多くの製品に展開される予定です。

Flow:AIと共に紡ぐ、新しい映画制作体験

 Flowは、クリエイターのために設計された革新的なAI映画制作ツールです。Google DeepMindの最先端モデルであるVeo、Imagen、そしてGeminiをシームレスに統合し、ユーザーが自然言語でショットを記述するだけで、映画のようなクリップ、シーン、そして物語を創り出すことができます。

 Flowでは、物語に必要な要素(キャスト、ロケーション、オブジェクト、スタイルなど)を一元的に管理し、それらを組み合わせて美しいシーンを織りなすことができます。キャラクターの一貫性やシーン間のつながり、全体のトーンなどをより高度に制御できるため、複雑なストーリーテリングもAIのサポートを受けながら実現可能です。Flowは、米国のGoogle AI ProおよびUltraプランの加入者向けに提供が開始されており、今後提供地域が拡大される予定です。

Imagen 4:息をのむ高画質と、進化した文字表現

 画像生成モデルの最新版であるImagen 4は、スピードと精度を両立させ、驚くほど美しい画像を生成します。特に、複雑な布地の質感、水滴のきらめき、動物の毛並みといった微細なディテールの表現力が際立っており、写実的なスタイルから抽象的なスタイルまで、幅広い表現に対応します。

 Imagen 4は、様々なアスペクト比の画像を最大2Kの解像度で生成できるため、印刷物やプレゼンテーション資料への活用にも適しています。さらに、スペルチェック能力とタイポグラフィ性能が大幅に向上したことで、グリーティングカードやポスター、さらにはコミック制作など、文字情報を含むクリエイティブな作業がより容易になりました。

 Imagen 4は、Geminiアプリ、Whisk、Vertex AIのほか、Google WorkspaceのSlides、Vids、Docsなどでも利用可能になっています。また、近日中にはImagen 3と比較して最大10倍高速なImagen 4の高速バリアントも提供予定とのことです。これにより、アイデアの試行錯誤をさらに迅速に行えるようになります。

Lyria 2:パワフルな作曲と無限の探求を可能にする音楽AI

 音楽制作の分野でもAIの進化は目覚ましく、GoogleはLyria 2を搭載した「Music AI Sandbox」へのアクセスを拡大しました。これはミュージシャン、プロデューサー、ソングライターに対し、実験的なツール群を提供し、新たな創造の可能性を引き出し、ユニークな音楽的アイデアを探求することを支援します。

 Lyria 2は、パワフルな作曲能力と無限の音楽的探求を可能にし、YouTube Shortsを通じてクリエイターに、またVertex AIを通じてエンタープライズ向けに提供されています。さらに、MusicFX DJの基盤技術でもあるインタラクティブな音楽生成モデルLyria RealTimeも、APIおよびAI Studio経由で利用可能になりました。Lyria RealTimeを使えば、誰でもリアルタイムで生成音楽をインタラクティブに作成、制御、演奏することができます。

責任ある創造とクリエイティブコミュニティとの連携

 Googleは、これらの強力な生成AIモデルを提供するにあたり、責任ある開発と利用を重視しています。2023年に導入されたSynthIDは、AIによって生成された画像、動画、音声ファイル、テキストに電子透かしを付与する技術で、これまでに100億以上のファイルに適用されてきました。これにより、コンテンツがAIによって生成されたものであることを識別しやすくし、誤情報や誤った帰属表示のリスクを低減します。Veo 3、Imagen 4、Lyria 2によって生成されるコンテンツにも、引き続きSynthIDによるウォーターマークが付与されます。

 さらに今回、AI生成コンテンツの検証を支援するポータルサイトSynthID Detectorが発表されました。ユーザーがコンテンツをアップロードすると、SynthID Detectorがファイル全体または一部にSynthIDが含まれているかどうかを識別します。

 Googleは、これらの生成AIモデルを通じて、人間の創造性を解き放ち、アーティストやクリエイターが自身のアイデアをかつてないほど迅速かつ容易に実現できるようになることを目指しています。

まとめ

 本稿では、Google DeepMindが発表した最新の生成AIモデル「Veo 3」「Imagen 4」、AI映画制作ツール「Flow」、そして音楽生成AI「Lyria 2」について、その概要と技術的なポイントを解説しました。これらの技術は、動画、画像、音楽といったメディア制作のあり方を根底から変える可能性を秘めています。特に、音声付き動画を生成できるVeo 3や、より高度な制御が可能なFlowは、クリエイターにとって強力な表現ツールとなるでしょう。また、SynthIDのような技術を通じて、責任あるAIの利用に向けた取り組みも進められています。

 これらの新しいAIモデルとツールが、今後どのようにクリエイティブ業界や個人の創作活動に影響を与えていくのか、非常に楽しみです。

  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次