今日应用
今日话题
ICRA 2024:基于物理常识进行推理
重点标签 tag1、机器人、常识推理、大型语言模型、视觉语言模型
文章摘要
为了在现实世界中推理,机器人必须超越被动地查询LLMs,积极地从环境中收集所需的信息来做出正确的决策。研究人员提出了一种方法,利用LLM和视觉语言模型(VLM)来帮助机器人积极感知其环境,进行基于实践的常识推理。
研究人员提出了一个框架,通过迭代地确定场景中仍需澄清的细节,并积极收集新的观察结果来帮助回答这些问题,从而使机器人能够进行基于实践的常识推理。
为了大规模评估所提出的框架,研究人员发布了MessySurfaces数据集,其中包含了70个需要清理的真实世界表面的图像,以及每个物体的一个场景级别的图像,5张特写图像,以及一个关于清理物体最合适方式的基准问题和答案。
通过这种方法,机器人可以更好地理解其所处的环境,并做出更加合理的决策。这将有助于提高机器人在现实世界中的实用性和效率。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC最前线
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...