今日应用
今日话题
Pollen-Vision:用于机器人的零样本视觉大模型
重点标签 机器人自主性、Pollen-Vision、3D物体检测、零样本模型、深度信息
文章摘要
使用Pollen-Vision,用户可以通过少量代码构建对象检测和分割系统。例如,使用OwlVitWrapper和MobileSamWrapper进行零样本物体检测和分割,以及Annotator进行标注。在性能方面,模型的推断时间取决于检测对象的数量,并且在配备RTX 3070 GPU的笔记本电脑上进行了测试。
在机器人应用方面,Pollen-Vision可以用于抓取未知物体。通过计算分割掩模的质心,可以估计物体在像素空间中的位置,并结合深度信息来估计物体的3D位置。这使得机器人能够移动其末端执行器到物体所在位置并抓取它。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC最前线
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...