一分钟生成3D世界，DeepMind的最新模型能给游戏行业带来什么？

图源：DeepMind

界面新闻记者 | 李彪

界面新闻编辑 | 宋佳楠

年初发布之一代世界模型Genie后，DeepMind又在年末带着升级版新模型登场了。

美国当地时间12月4日，谷歌旗下人工智能研究机构DeepMind推出新模型Genie 2。作为Genie模型的升级版，Genie2同样是一款世界模型（AI行业对理解和模拟现实世界生成式AI模型的统称），升级后其在模拟复杂环境方面展现出更加强大的实力。

据DeepMind论文介绍，新模型更大的特色是支持通过单张图片和文字描述生成3D世界，生成时长可持续一分钟左右，但多数情况下维持在10到20秒之间。

DeepMind在论文中附带了许多段演示视频，展示用户与Genie 2的互动过程。模型会根据文字描述生成初始图片，再基于这张图片创造出一个完整的3D互动世界。用户可以通过操纵键盘鼠标与其互动，而Genie 2会实时模拟生成你看到的每一帧画面。

图片来源：DeepMind

生成的3D世界支持用户从不同的视角互动，如之一人称视角和等距视角，以还原真实世界互动的既视感。

图片来源：DeepMind

从演示视频中可以看出，模型生成的3D世界中的许多细节都在模拟真实世界，例如模拟物体交互、复杂角色动画、物理现象、照明效果、反射效果及NPC设计等等。

图源：DeepMind

最为重要的是，这款世界模型还可以“继续成长”变得更强大。论文介绍，推出Genie 2的主要目的之一是为通用AI智能体提供无限多样的动态场景，用于训练和评估。经过循环往复的大规模训练，AI也从模拟真实世界无限接近成为一个可以理解真实世界的“智能体”。

具备以上一系列强大功能后，Genie 2模型有望在游戏领域先找到一番“用武之地”。

DeepMind团队在论文中特别指出，Genie 2能按照用户需求生成丰富多样的3D游戏环境，如果未来用于游戏开发中任务场景设计，或可彻底改变游戏行业，特别会给《我的世界》这类开放世界游戏的创作带来“一场技术革命”。