8月5日|谷歌旗下Google DeepMind推出通用型世界模型Genie 3,该模型可根据文本提示实时生成多样化的交互式虚拟环境,支持720p分辨率下24帧/秒的动态世界导航,并能保持数分钟的环境一致性。Genie 3不仅在物理属性建模、地理与历史场景还原等方面表现出色,还实现了对复杂世界事件的可控生成。目前,该模型以有限研究预览形式向部分学者和创作者开放,未来有望拓展至更多测试者。