ある日、ふと「こんな世界があったらいいな」と思うことはありませんか?
空がキャンバスのように色を変えたり、地面がマシュマロでできていたり、海が空に浮かんでいたり…。
でもそんな空想は、ただの夢にすぎない。
これまでは。
2026年1月、Google DeepMindが発表した「Project Genie(プロジェクト・ジーニー)」は、そんな夢を本当に”創れる”ようにした、まさに魔法のような技術です。
この記事では「Genieとは何か?」「なぜ注目されているのか?」「私たちの未来をどう変えるのか?」を、専門用語を使わず、誰にでもわかる言葉でやさしくご紹介します。
空想が現実になる時代が来た
「Project Genie」は、一言で言えば「AIがあなたの頭の中の世界を、インタラクティブなゲームのように生成してくれる技術」です。
たとえば、「空飛ぶ猫がいる草原を作って」と入力すると、AIがその指示を読み取り、まるでゲームの中のような映像を生成してくれるのです。
しかも、あらかじめ用意された素材を組み合わせているわけではありません。
まっさらな状態から、一から映像や動きまでを自動で作り上げるのです。
このプロジェクトの核となっているのが、「ワールドモデル」と呼ばれる技術。
Project Genieは、テキストの指示や1枚の画像を元に、インタラクティブな世界を生み出します。
実際には、GoogleのワールドモデルであるGenie 3、画像生成モデルのNano Banana Pro、そしてGeminiを組み合わせて動いています。
2026年1月29日から、アメリカ在住のGoogle AI Ultraサブスクライバーは、この実験的なプロトタイプにアクセスできるようになりました。
DeepMindは、ユーザーからのフィードバックと訓練データを集めることで、より高性能なワールドモデルの開発を目指しています。
「マシュマロの城」を建ててみたら…
TechCrunchの記者は実際にこのProject Genieを使って「雲の中にマシュマロでできた城を建て、チョコレートソースの川と、キャンディでできた木を配置し、クレイアニメーションスタイルで」とリクエストしてみました。
すると数秒後、画面上にはふわふわと揺れるマシュマロの壁、雲のように柔らかい塔がそびえ立つファンタジー世界が出現。
しかも、キャラクターがその中を動き回ることができるのです。
パステルと白の色合いの尖塔や小塔は、ふわふわとしておいしそうで、まるで一片をもぎ取ってチョコレートの堀に浸したくなるようなリアルさがありました。
この体験は、まるで自分が”夢の世界の神様”になったような気分でした。
Genieは、どうやって世界を作っているの?
Project Genieの使い方は、まず「ワールドスケッチ」を作るところから始まります。
環境とメインキャラクターの両方についてテキストプロンプトを入力すると、Nano Banana Proがそのプロンプトに基づいて画像を生成します。
この画像は理論上は修正可能で、その後Genieがこの画像を出発点として、インタラクティブな世界を作り上げます。
一人称視点または三人称視点でキャラクターを操作することもできます。
また、現実の写真を元にして世界を構築することも可能ですが、こちらは成功率にばらつきがありました。
記者が自分のオフィスの写真を使い「写真の通りに世界を作って」と指示したところ、似たような家具(木製の机、植物、グレーのソファ)が配置されたものの、レイアウトは異なり、無機質でデジタルな印象の空間になったそうです。
画像に満足したら、数秒でProject Genieが探索可能な世界を生成します。
既存の世界をリミックスして新しい解釈を加えたり、ギャラリーやランダマイザーツールで厳選された世界を探索してインスピレーションを得たりすることもできます。
そして、探索した世界の動画をダウンロードすることも可能です。
現時点では、予算と計算リソースの制約から、DeepMindは世界の生成と操作を60秒に制限しています。
Genie 3は自己回帰モデルであるため、大量の専用計算リソースを必要とし、ユーザーに提供できる容量に厳しい上限が設けられているのです。
ワールドモデルが切り拓く未来
ワールドモデルとは、環境の内部表現を生成し、未来の結果を予測したり行動を計画したりできるAIシステムのことです。
DeepMindを含む多くのAI研究者は、ワールドモデルが汎用人工知能(AGI)の実現に向けた重要な一歩だと考えています。
しかし、より近い未来においては、DeepMindはビデオゲームやその他のエンターテインメント分野から始め、最終的にはシミュレーション環境でロボットなどの物理的エージェントを訓練することまで視野に入れています。
実際、ワールドモデル開発競争は激化しつつあります。
Fei-Fei Li氏のWorld Labsは2025年後半に「Marble」という最初の商用製品をリリースしました。
AI動画生成スタートアップのRunwayも最近ワールドモデルをローンチしています。
また、元Meta主任科学者のYann LeCun氏のスタートアップAMI Labsもワールドモデルの開発に注力しています。
技術の限界と今後の課題
DeepMindの研究者たちは、このツールの実験的な性質について率直に語っています。
一貫性に欠けることがあり、時には見事にプレイ可能な世界を生成する一方で、的外れな奇妙な結果を生み出すこともあります。
実際の使用体験では、芸術的なプロンプト(水彩画、アニメスタイル、古典的なアニメーション美学など)に基づいて世界を作ることには優れていましたが、写実的または映画的な世界を作ろうとすると失敗する傾向がありました。
また、インタラクティブ性にも改善の余地があります。
キャラクターが壁や他の固体オブジェクトを突き抜けて歩いてしまうことが何度もありました。
操作性についても、矢印キーで周囲を見回し、スペースバーでジャンプまたは上昇し、W-A-S-Dキーで移動するという方法は、しばしば反応が鈍かったり、間違った方向に進んでしまったりしました。
安全対策も重要です。記者が試した際には、すでに安全ガードレールが機能しており、ヌードに類するものや、ディズニーなどの著作権で保護された素材に似たものを生成することはできませんでした。
これは、2025年12月にディズニーがGoogleに対し、AIモデルがディズニーのキャラクターや知的財産で訓練され、無許可のコンテンツを生成しているとして差し止め通知を送ったことへの対応です。
最後に:空想を、ただの空想で終わらせない時代へ
DeepMindの研究ディレクター、Shlomi Fruchter氏は次のように語っています。
「私たちは、Project Genieを毎日使える完成品とは考えていません。しかし、すでに興味深く、ユニークで、他の方法では実現できない何かの片鱗が見えていると思います」
今後、チームは現実性を高め、インタラクション機能を改善し、ユーザーがアクションや環境をより細かくコントロールできるようにしたいと考えています。
かつて「空想の世界」は現実から切り離されたものでした。
でも今、AIによってその境界線は静かに消えつつあります。
GoogleのProject Genieは「創造」という人間の根源的な欲求に、まったく新しい扉を開いてくれました。
それは、どんなに不器用でも、専門知識がなくても、誰もが自分の”世界”を創れる未来です。
あなたが子どものころに描いた空想の世界。
それを、もう一度、AIと一緒に形にしてみませんか?
参考:I built marshmallow castles in Google’s new AI-world generator
コメント