はじめに
本稿では、Google DeepMindが2025年6月13日に公開した公式ブログ記事『Behind “ANCESTRA:” combining Veo with live-action filmmaking』を基に、最新の動画生成AI「Veo」が実写映画制作の現場でどのように活用されたのか、その技術的な詳細と可能性について解説していきます。
引用元記事
- タイトル: Behind “ANCESTRA:” combining Veo with live-action filmmaking
- 発行元: Google DeepMind
- 発行日: 2025年6月13日
- URL: https://blog.google/technology/google-deepmind/ancestra-behind-the-scenes/


要点
- Google DeepMindは、最先端の動画生成AI「Veo」を用いて、著名な映画監督ダレン・アロノフスキー氏らと共同で短編映画『ANCESTRA』を制作した。これは、Veoを実写映画制作に本格導入した初の事例である。
- 映画制作の要求に応えるため、Veoには「パーソナライズされた動画生成」「動きを一致させた動画生成(モーションマッチング)」「実写映像へのオブジェクト追加」といった、これまでにない新機能が開発・実装された。
- 制作プロセスでは、プロンプト生成に大規模言語モデル「Gemini」、コンセプトアート作成に画像生成AI「Imagen」が活用され、複数のAIが連携してクリエイティブなワークフロー全体を支援した。
- このプロジェクトは、生成AIが単なる映像生成ツールに留まらず、従来のVFX(視覚効果)技術と融合し、撮影が困難または高コストな表現を可能にすることで、映画制作の限界を押し広げる強力なパートナーとなり得ることを示した。
詳細解説
『ANCESTRA』とは? AIと映画界の巨匠によるコラボレーション
今回制作された短編映画『ANCESTRA』は、トライベッカ映画祭でプレミア上映された作品です。監督自身の誕生時に心臓に穴が開いていたという劇的な出来事から着想を得ており、「母の愛が宇宙的な力となって命を救う」という壮大な物語を描いています。
このプロジェクトが特に注目されるのは、その制作体制にあります。監督は新進気鋭のエリザ・マクニット氏ですが、彼女を指導するメンターとして、映画『ブラック・スワン』や『ザ・ホエール』で知られる巨匠ダレン・アロノフスキー氏が参加しています。アロノフスキー氏が設立した制作会社とGoogle DeepMindが提携し、世界トップクラスの映画制作者の手に最新の生成AIを届けることで、物語表現とテクノロジーの新たな地平を切り拓くことを目指しました。
制作の裏側:AIたちはどのように連携したのか
『ANCESTRA』の制作では、単にVeoが使われただけではありません。Googleが誇る複数のAIモデルが、それぞれの得意分野を活かして連携し、一つのチームのように機能しました。
- Gemini(プロンプト生成): まず、マクニット監督の父親が彼女の生まれた日に撮影した実際の写真を、Googleの対話型AI「Gemini」に読み込ませました。Geminiは、それらの写真の美的特徴を非常に詳細かつ詩的に描写する文章(プロンプト)を生成しました。これが、AIで映像を作り出すための設計図となりました。
- Imagen(コンセプトアート生成): 次に、画像生成AI「Imagen」がGeminiのプロンプトを基に、映画全体の雰囲気やスタイル、色調を決定づける「コンセプトアート」を生成しました。これにより、映画のビジュアルの方向性が固まりました。
- Veo(動画生成): 最後に、本稿の主役である動画生成AI「Veo」が、Imagenによって作られた画像を基に、動きのある動画シーンを生成しました。さらにテキストによる指示を追加することで、カメラの動きや被写体のアクションを細かく制御し、監督が思い描く映像を形にしていきました。
技術的ブレークスルー:映画制作のために進化したVeoの3つの新機能
既存のAI技術だけでは、プロの映画監督が求める高いレベルの品質や表現の自由度に応えることは困難でした。そこでGoogle DeepMindは、このプロジェクトのためにVeoの能力を飛躍的に向上させる、いくつかの重要な新機能を開発しました。
- パーソナライズされた動画生成
監督は、物語の重要な要素である「胎内にいる赤ん坊」の映像を、リアルかつ特定の美的スタイルで表現したいと考えていました。これに応えるため、チームはAIモデルを特定の画像スタイルに合わせて追加学習させる「ファインチューニング」という手法を用いました。これにより、Veoは映画全体で一貫したアートディレクションを保ちながら、非常にリアルで、かつ物語に寄り添った親密な雰囲気の映像を生成することに成功しました。 - 動きを一致させた動画生成(モーションマッチング)
映画には、人体の中を突き進み、最終的に子宮にたどり着くといった、複雑なカメラワークが求められるシーンがありました。通常、このような映像はCGIで制作されますが、莫大な時間とコストがかかります。
そこで開発されたのが、参照する映像のカメラの動きを完全に再現する「モーションマッチング」機能です。制作者はまず3Dソフトで簡易的なカメラの動きを作成し、その映像をVeoに読み込ませました。するとVeoは、その動きを寸分違わずトレースしながら、テキストプロンプトに応じた全く新しい高精細な映像を生成したのです。これにより、複雑なカメラワークを持つシーンを、わずか数分で作り出すことが可能になりました。 - 実写と生成動画のシームレスな融合
生まれたばかりの赤ん坊をリアルに撮影することは、倫理的・物理的な観点から非常に困難です。かといって従来のVFXで制作すると、時に「不気味の谷」と呼ばれる、人間らしいのにどこか不自然で違和感を覚えてしまう現象が課題でした。
『ANCESTRA』では、この課題を解決するために、実写映像にAIが生成したオブジェクトを後から追加するという画期的な手法が取られました。まず俳優の演技を撮影し、その映像をVeoに読み込ませます。そして、赤ん坊を追加したい領域を指定し、テキストで指示を与えるだけで、Veoはシーンの照明や雰囲気に完璧にマッチしたリアルな新生児を映像内に生成しました。これにより、俳優の演技とAIが生成した赤ん坊が、まるで同時に撮影されたかのように自然に融合したといえます。
AIと伝統的ワークフローの融合
本プロジェクトの重要な点は、AIが既存の制作プロセスを置き換えるのではなく、補完し、強化していることです。例えば、ワニの卵が内側から割れるシーンでは、卵の殻の質感、差し込む夕日、近くにいる親ワニなど、複数の要素がAIによって個別に生成されました。そして、それらの素材を従来のVFXの合成技術を用いて組み合わせることで、一つの複雑で美しいショットが完成しました。AIは強力な素材提供者となり、クリエイターはそれを活かして最終的な画作りを行うという、新しい協業の形が示されています。
まとめ
短編映画『ANCESTRA』の制作は、生成AIが映画制作の現場において、単なる自動化ツールではなく、クリエイターの想像力を拡張するための「新たなレンズ」となり得ることを証明しました。マクニット監督が「Veoは、私が周りの宇宙を想像するための、もう一つのレンズです」と語ったように、AIはこれまで表現不可能だった、あるいは莫大なコストがかかった映像世界への扉を開きつつあります。
本稿で紹介した「パーソナライズ」「モーションマッチング」「実写合成」といった技術は、今後さらに洗練され、多くのクリエイターにとって身近なものになっていくでしょう。これにより、制作者は技術的な制約から解放され、より純粋に物語の創造に集中できるようになるかもしれません。AIと人間の才能が融合することで、私たちはこれから、かつてないほど多様で革新的な映像体験を目の当たりにすることになるでしょう。