「映画の中に入ってみたい」と思ったこと、ありませんか?
子どもの頃に観た映画のワンシーン。
砂漠を駆け抜ける主人公、宙を舞うロボット、幻想的な空中都市—「こんな世界に入れたらなあ」そう思ったこと、一度はあるのではないでしょうか?
2025 年7月、Google DeepMind の CEO であるデミス・ハサビス氏がX(旧 Twitter)上で、映像生成AI「Veo 3」をビデオゲームに活用する可能性について示唆しました。
これまでの「AIが作る動画」は、いわば”動く絵画”。
きれいだけど、一方向に流れていくだけでした。
でも「Veo 3」は、そこから大きな一歩を踏み出す可能性を秘めています。
今回は、そんな最新技術のワクワクする可能性について、やさしく、でもしっかりと解説していきます。
そもそも「Veo 3」ってなに?
Google DeepMind が開発した「Veo 3」は、テキストや画像から動画と音声を生成するAIです。
現在はパブリックプレビューの段階で、一般向けにはまだ完全公開されていません。
たとえば「夕焼けの中を飛ぶ鳥の群れ」という文章を入力すると、AIがそれに合わせて自然な動画を作り、さらに環境音や音楽まで付けてくれるのです。
これだけなら他のAIでもできるようになってきました。
しかし「Veo 3」の特徴は、現実世界の物理法則をシミュレートして、よりリアルな映像を生成できる点にあります。
ただし、重要な点として、Veo 3 は現在のところ「受動的な出力」を行う生成モデルです。
つまり、美しい映像を作ることはできますが、ユーザーがリアルタイムで操作したり、インタラクティブに世界と関わったりすることはまだできません。
現状では、ゲームのカットシーンやトレーラー、物語の試作品作りなどの用途に適していると言えるでしょう。
それでも、ハサビス氏が「それは何かになるでしょうね」とつぶやいたように「Playable World(遊べる世界)」への第一歩として注目を集めているのです。
映像生成AIと「世界モデル」の違い
ここで重要な区別をしておきましょう。
Veo 3 は現在のところ「映像生成AI」であり「世界モデル(World Model)」とは異なります。
映像生成AIは、テキストや画像から美しい動画を合成する技術です。結果として生成される映像は非常にリアルですが、基本的には「一方向に進む動画」という性質を持っています。
一方、世界モデルは、現実世界の環境の動きをシミュレートし、エージェント(AIや人間)の行動に対して世界がどのように変化するかを予測できる技術です。
これにより、ユーザーが世界に働きかけて、その結果を見ることができるインタラクティブな体験が可能になります。
興味深いことに、Google は既に世界モデルの開発にも取り組んでいます。
2024 年12月には、DeepMind が「Genie 2」という、無限のバリエーションを持つ「遊べる世界」を生成できるモデルを発表しました。
また、同社は基盤モデル「Gemini 2.5 Pro」を、人間の脳の一部をシミュレートする世界モデルに発展させる計画も持っています。
現在の Veo 3 は、まだ完全な世界モデルではありません。
しかし、物理法則をシミュレートする能力を持っているため、将来的には世界モデルの技術と組み合わせることで、真の意味での「遊べる映像」が実現する可能性があるのです。
たとえば、あるシーンで丘の上に小さな家があったとき、従来の映像生成AIでは視点が変わると一貫性が保てないことがありました。
しかし、世界モデルの技術が組み込まれれば、家は常に同じ場所にあり、どの角度から見ても自然に見えるようになるでしょう。
まるで、実際にその場所が存在しているような感覚です。
どうやって「遊べる映像」ができるの?
Veo 3 の革新的な技術の背景には「ビデオ生成」と「世界モデル」という2つの重要な概念が巧妙に組み合わされています。
まずビデオ生成技術について説明しましょう。
これは、AIが画像やテキストから動画を作り出す技術です。
従来のビデオ生成AIは、与えられた情報をもとに美しい映像を作ることはできましたが、その映像は基本的に「一方向に進むもの」でした。
まるで映画のように、始まりから終わりまで決められたストーリーラインに沿って展開していくのです。
一方で世界モデル技術は、より複雑で興味深いアプローチを取ります。
これは、AIが空間の構造や物体同士の関係性を深く”理解”し、一貫性を保ちながら再現する技術です。
例えば、部屋の中にテーブルと椅子があるとき、AIはそれらの位置関係や大きさの比率、光の当たり方などを総合的に把握し、どの角度から見ても自然に見えるように映像を生成します。
Veo 3 の画期的な点は、この2つの技術を融合させたことにあります。
単純に美しい映像を作るだけでなく、一貫した「世界」として機能する映像空間を創り出すのです。
その結果「映像」として一方向に流れるだけのものではなく、まるで実際に存在する場所のように 360 度に広がる”世界”が誕生します。
現時点では、まだ完全に”ゲームのように自由に操作できる”状態ではありません。
しかし、技術の進歩を考えると、近い将来「Veo で作った映像の中を実際に歩き回れる」「好きな角度から世界を眺められる」「物語の登場人物と同じ空間を共有できる」といった体験が実現する可能性が高いのです。
可能性と課題——未来はどうなる?
ハサビス氏の Twitter での発言は、あくまで可能性を示唆したものに過ぎません。
Google の広報担当者も「現時点で共有できることは何もない」と述べており、具体的な計画は明らかになっていません。
それでも、Veo 3 やそれに続く技術が実現する可能性は、創作活動やエンターテインメント業界に革命的な変化をもたらすかもしれません。
映画制作の分野では、従来は膨大な予算と時間、そして大勢のスタッフが必要だった映像制作が、根本的に変わるかもしれません。
映画監督が頭の中で描いているシーンを、シナリオとプロンプトだけで具体的な映像として表現できるようになれば、アイデアから完成品までの距離が劇的に短縮されます。
特に、低予算の独立系映画制作者や新進気鋭のクリエイターにとって、これまで技術的・資金的な制約で実現できなかった壮大なビジョンを形にする道が開かれるでしょう。
ゲーム開発の世界では、より複雑な課題があります。
ゲーム制作において真に重要なのは、単に美しい映像を作ることではなく、リアルタイムで一貫性があり、プレイヤーが制御可能なシミュレーションを構築することです。
この課題を解決するため、Google は Veo 3 と既に発表済みの Genie 2 を組み合わせたハイブリッドアプローチを取る可能性があります。
Veo 3 の高品質な映像生成能力と、Genie 2 のプレイ可能な世界生成能力を融合させることで、これまでにない体験が生まれるかもしれません。
教育分野への応用も非常に魅力的です。
歴史の授業で古代ローマの街並みを歩いたり、科学の時間に分子レベルの世界を体験したり、文学の授業で小説の舞台となった場所を実際に訪れるような感覚で学習できるようになるでしょう。
これは単なる「見る」学習から「体験する」学習への大きなパラダイムシフトを意味します。
しかし、これらの輝かしい可能性と同時に、重要な課題も山積みです。
技術的な課題として最も大きいのは、現在の Veo 3 が「受動的な出力」モデルである点です。
真のインタラクティブ体験を実現するためには、より能動的で予測的なシミュレーターへの進化が必要です。
競争環境も激化しています。
この分野では、Microsoft、Scenario、Runway、Pika、そして将来的には OpenAI の映像生成モデル「Sora」などが競合相手となります。
また、AI研究の先駆者であるフェイフェイ・リー氏が設立した World Labs というスタートアップも、一枚の画像からゲームのような3Dシーンを生成するAIシステムを開発しており、注目を集めています。
法的・倫理的な課題として、既存の著作物に似た映像を生成してしまった場合の著作権の扱い、実在の人物に酷似したキャラクターの肖像権、さらには生成された映像を悪用したディープフェイクの問題など、社会全体で考えるべき課題が数多く存在します。
経済的な課題として、高品質な映像生成にかかる膨大な計算コストも無視できません。
現在のAI技術は、美しい映像を作るために大量の電力と計算資源を必要とします。
これが一般に普及するためには、より効率的なアルゴリズムの開発が不可欠です。
今はまだ「未来の入り口」に立っているに過ぎません。
Google の豊富な資金力と技術力を考えると、同社がこの分野で大きな存在感を示す可能性は高く、競合他社は注意深く動向を見守る必要があるでしょう。
「ただ見る」から「触れられる映像」へ——物語の新時代
映像は、ずっと”受け身”のものだと思われてきました。
でも、もしそれが”触れられる”ものになったら?
あなたが物語の中を歩き、登場人物と目を合わせる未来が来たら?
現時点では、これらはまだ可能性の段階です。
しかし、Veo 3 とそれに続く技術が描く可能性は、そんな「体験する物語」の世界なのです。
これはSFのような話ではありません。
今まさに、技術の先端で静かに芽吹いている、確かな”可能性”なのです。
映画やゲーム、教育やデザイン—。
あらゆる表現が変わっていく可能性を秘めたこの瞬間を、どうか一緒に見守ってください。
最後に:未来を創るのは、わたしたちの想像力
仮に Veo 3 やその後継技術が進化したとしても、それを「何に使うか」を決めるのは人間の想像力です。
そしてその想像力の源泉は「こんな世界があったらいいな」という、小さな願い。
その願いを、AIとともに形にしていく未来が、もしかすると、すぐそこまで来ているのかもしれません。
参考:Could Google’s Veo 3 be the start of playable world models?
コメント