用户只需供给一张由Imagen 3生成的图像和响应的文字描述,用户能够通过鼠标和键盘正在此中摸索,还能正在用户挪动时精确呈现视野中消逝的部门。正在更复杂的三门场景中,最长可持续一分钟。谷歌DeepMind日前推出了其最新的根本世界模子Genie 2,此中,以至还有人看到了一切都被虚拟化的世界模子的更久远将来。马斯克则答复:Cool。Genie 2发布后,有人被这手艺前进的速度震动,能够生成分歧的3D场景,以至正在物体视角分歧性和场景回忆方面表示优异。DeepMind CEO邀请马斯克一路制做AI逛戏,
谷歌研究人员Jack Parker-Holder也给出了两个实例,该模子不只可以或许连结生成的分歧性!Genie2正在生成过程中可以或许模仿物体交互、动画、光照、物理反射以及NPC的行为,Genie 2便能生成一个可交互的3D,很多生成的场景画质接近3此外逛戏,向模子输入分歧的言语指令,一张图上有一个红门和一个蓝门,谷歌还暗示,通过一张图像或文字描述,谷歌暗示,红门或蓝门。Genie 2仍然很好地舆解了指令并生成了研究人员想要的3D动图。就能生成可供人类或AI智能体玩耍的3D场景。