今日应用
今日话题
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
重点标签 AI代理、SIMA、3D游戏、自然语言、DeepMind
文章摘要
谷歌DeepMind的研究人员开发了一种名为SIMA的通用AI代理,专门针对3D环境。
SIMA能够通过输入图像和简单的自然语言文本指令执行各种游戏中的操作,无需访问游戏源代码或定制API。
在多个复杂3D游戏上的测试表明,SIMA可以执行600多种基本操作,如挖矿、开飞船等,每个动作在约10秒内完成。
SIMA的架构模仿人体,由视觉感知模型(眼睛)、大语言模型(大脑)、建模规划模型(思维)和控制执行模型(四肢)组成。
SIMA能理解文本指令并转化为具体行动。
研究人员通过收集和预处理大量数据,优化了SIMA的性能。
未来,SIMA的通用代理能力将不断迭代,以帮助用户在实际生活中完成更多任务。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC开放社区
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...