谷歌DeepMind日前推出了其最新的根底国际模型Genie 2,经过一张图画或文字描述,就能生成可供人类或AI智能体玩耍的3D场景。
谷歌表明,用户只需供给一张由Imagen 3生成的图画和相应的文字描述,Genie 2便能生成一个可交互的3D环境,用户都能够经过鼠标和键盘在其间自在探究,最长可继续一分钟。
该模型不仅仅能够坚持生成环境的一致性,还能在用户移动时精确出现视界中消失的部分。
谷歌还表明,Genie2在生成过程中能够模仿物体交互、动画、光照、物理反射以及NPC的行为,许多生成的场景画质挨近3A等级的游戏,甚至在物体视角一致性和场景回忆方面体现优异。
有人被这技术进步的速度震慑,称之为视频游戏的未来,更难以想象的是人看到了全部都被虚拟化的国际模型的更长远未来。
值得一提的是,Genie 2发布后,DeepMind CEO约请马斯克一同制造AI游戏,马斯克则回复:Cool。
谷歌研究人员Jack Parker-Holder也给出了两个实例,其间,一张图上有一个红门和一个蓝门,向模型输入不同的言语指令,能够生成不同的3D场景,走向红门或蓝门。
在更杂乱的三门场景中,Genie 2仍然很好地舆解了指令并生成了研究人员想要的3D动图。