はじめに
本稿では、OpenAIが2025年9月30日に発表した、最新の動画・音声生成モデル「Sora 2」について解説します。Sora 2は、従来のモデルから大きく進歩し、より物理的に正確で現実的な動画を生成できるだけでなく、同期した音声や効果音の生成、そしてユーザーが自身を動画に登場させられる新機能などを搭載しています。その技術的な進化点と、新たに提供されるソーシャルアプリ、そしてOpenAIが掲げる責任ある開発への取り組みについて掘り下げていきます。なお、Sora2は招待を受けたユーザーから順次利用が可能となります。
参考記事
- タイトル: Sora 2 is here
- 発行元: OpenAI
- 発行日: 2025年9月30日
- URL: https://openai.com/index/sora-2/
要点
- Sora 2は、物理法則への理解を深め、より現実的で制御性の高い動画生成を実現した。従来のモデルがしばしば無視していた物理的な正しさや、失敗のシミュレーションも可能である。
- 動画生成と同時に、映像と同期した会話、効果音、BGMなどの音声も生成できる統合モデルに進化した。
- ユーザーが自身の姿や声を動画内に取り込める「カメオ」機能を搭載した、新しいソーシャルiOSアプリ「Sora」がリリースされた。
- OpenAIは、ユーザーのウェルビーイング(心身の健康)や安全性を重視し、フィードの調整機能や10代ユーザーの保護、肖像権の管理といった、責任ある展開への取り組みを強調している。
詳細解説
Sora 2の技術的な進化
Sora 2は、単に綺麗な映像を作るだけでなく、現実世界をシミュレートするという方向へ大きく舵を切りました。これは「ワールドシミュレーター」という構想に基づくもので、AIが物理法則を理解し、仮想世界で現実の出来事を再現・予測することを目指しています。
物理シミュレーション能力の向上
以前の動画生成モデルは、テキストの指示(プロンプト)を遂行するために、物理法則を無視してしまうことがありました。例えば「バスケットボール選手がシュートを外す」という指示に対し、ボールが不自然にゴールに吸い込まれるといった挙動です。
しかし、Sora 2は物理的な正確性が向上しており、同じ指示でもボールがバックボードに当たって跳ね返るような、より現実的な結果を生成します。このように「失敗」を正しくモデル化できることは、現実世界で役立つAIを開発する上で重要な能力です。
音声との完全な統合
Sora 2のもう一つの大きな特徴は、映像と音声の統合です。プロンプトに基づいて動画を生成する際に、その場面に合った背景音、登場人物の会話、効果音などを高い品質で同時に生成できます。これにより、映像コンテンツとしての完成度が一段と高まりました。
高い制御性と多様なスタイル
複数のショット(カット)で構成される複雑な指示にも対応し、登場人物や背景の一貫性を保ったまま動画を生成できます。また、現実的な実写映像から、映画のようなシネマティックなスタイル、そして日本のアニメ風のスタイルまで、幅広い表現に対応可能です。
新ソーシャルアプリ「Sora」と「カメオ」機能
OpenAIは、Sora 2の能力を最大限に体験できる場として、新しいiOSアプリ「Sora」を発表しました。このアプリは、単に動画を生成するだけでなく、ユーザー同士が作品をリミックスしたり、フィードで新しい作品を発見したりできるソーシャルな体験を提供します。
その中核となるのが「カメオ」機能です。これは、ユーザーがアプリ内で自身の短い動画と音声を一度だけ録画することで、Soraが生成するあらゆる動画シーンに自分自身を登場させられるというものです。友人や家族、ペット、さらには物体でも同様のことが可能です。これは、テキストやスタンプ、ボイスメッセージに続く、新しいコミュニケーションの形となる可能性があります。
責任あるAI開発と展開
強力な技術には責任が伴います。OpenAIは、Sora 2とSoraアプリの展開にあたり、ユーザーの安全とウェルビーイングを守るためのいくつかの仕組みを導入しています。
- フィードのコントロール: ユーザーは自然言語(話し言葉)で指示を出すことで、フィードに表示されるコンテンツの傾向を自分で調整できます。
- 創造性の最大化: アプリの設計思想として、単なる「消費」ではなく、ユーザー自身が「創造」することを促す点を重視しています。
- 10代ユーザーの保護: 10代のユーザーに対しては、1日に閲覧できる動画数に上限を設けたり、「カメオ」機能の権限を厳しくしたりするなどの保護措置が取られています。
- 肖像権の管理: 「カメオ」機能で生成された自身の姿を含む動画は、本人のみが使用許可を管理でき、いつでもアクセス権を取り消したり、動画を削除したりすることが可能です。
利用方法と今後の展望
Soraアプリは、まず米国とカナダで招待制として提供が開始され、順次対象国を拡大していく予定です。また、同様に招待を受けたChatGPT Proのユーザーは、より高品質な「Sora 2 Pro」モデルを順次利用できるようになります。将来的には、開発者向けにAPIとしての提供も計画されています。
まとめ
Sora 2は、物理法則を理解し、音声と同期したリアルな動画を生成することで、AIによるコンテンツ制作の可能性を広げようとしています。一方で、OpenAIが安全性や倫理的な課題に向き合うことを示しているのはAI能力の向上が与える社会的なインパクトが大きくなっていることも意味しています。この技術が社会にどのような変化をもたらすのか、注意深く見守る必要があります。