本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。
Meta、World Labs、Niantic Labs 和谷歌DeepMind 等团队近期均发布了各自的世界模型进展。这些世界模型所展示了前所未有的理解能力和构建虚拟空间的效果,为冷却的元宇宙回了一波温。
目录
01 冷却的元宇宙热度又被世界模型拉回来了?
1、ALL in 元宇宙的 Meta 经历了裁员、股价下跌、人员变动和团队拆分等一系列动荡。但在 2024 年初,Meta 在 AI 方面的突破为公司的股价回了一口血,也让扎克伯格对元宇宙+AI 双管齐下的策略更具信心。
2、扎克伯格曾表示,元宇宙是一个「具身的互联网」,目前 AI 领域发展迅速,但下一代的 AR、MR 和 VR 计算平台将提供真实的「在场感」,这将成为未来社交体验乃至几乎所有其他领域的基础。[5]
① 「在场感」强调了用户在虚拟环境的身临其境,以及可交互性。而这种虚拟的空间可以视为现实世界的一种复制或延展,与 AI 领域所追求世界模型所需的特征相重合。
3、Yann LeCun 作为最早开始推崇世界模型的研究者之一,他带领 FAIR 团队在 2024 年提出了一系列世界模型方面的进展。
① 2024年11月,LeCun 团队提出了一种可基于离线的轨迹数据集构建与任务无关的世界模型的方法,称为DINO-WM,用于在不重建视觉世界的情况下模拟视觉动态。
② 2024年12月,LeCun 团队发提出了NWM,这是一种能够在复杂环境中导航的世界模型,能在已知和未知环境中导航,执行路径规划;还能基于单张图像生成连续一致的视频。
4、除了 Meta,2024 年宣布创业的李飞飞团队同样计划开发世界模型,通过赋予 AI 空间智能以创建更真实、更具互动性的 3D 世界,根据其创业公司 World Labs 描述的路径,他们或许也会有机会先解锁 AR 元宇宙。
5、与 Meta 同为 AI 头部公司的谷歌 DeepMind 在 2024 年同样公布了团队在世界模型的突破。其在年初推出的世界模型 Genie 能够生成多种 2D 世界,而在 12 月 5 日发布的第二代 Genie 2 则实现了质的飞跃,能够通过单图生成可交互的 3D 世界。
6、除了 AI 巨头,知名 AR 游戏宝可梦 GO 的团队 Niantic Labs 也在 11 月提出了大型地理空间模型(LGM)的概念,虽然目前仅有一项概念验证的成果,但因为 LGM 与李飞飞提出的「空间智能」概念颇为相似,因而认为是先一步解锁 AR 元宇宙的有力竞争者。
1、由图灵奖得主 Yann LeCun 领衔的基础人工智能研究团队 FAIR 是 AI 领域备受关注的明星实验室之一。2024 年 6 月,FAIR 在 Meta 的 AI 部门重组后并入了 Reality Labs,而前者的一系列技术储备也将更直接地为 Meta 的元宇宙设备增加智能性……