今日应用
今日话题
DeepMind机器人打乒乓球,正手、反手溜到飞起,全胜人类初学者
文章摘要
DeepMind公司开发了一款能够与人类业余选手相媲美的乒乓球机器人智能体,这一成果在巴黎奥运会期间引起了广泛关注。这款机器人智能体通过学习型的方式,掌握了乒乓球的基本技能,包括正手和反手击球以及应对不同旋转的发球。尽管其竞技水平与公园里的老大爷相比可能还有差距,但它在乒乓球运动中展现出的潜力和进步速度令人瞩目。
机器人智能体的竞技水平
DeepMind的机器人智能体在与人类选手的比赛中,展现出了与业余选手不相上下的水平。在29场与不同水平选手的比赛中,机器人的胜率达到了45%,特别是在与初学者的对决中,机器人更是取得了100%的胜率。然而,面对最高级别的选手,机器人则未能取得胜利。这表明,尽管机器人在某些方面已经达到了人类业余选手的水平,但在面对更高水平的对手时,仍然存在一定的差距。
机器人智能体的策略架构
DeepMind的机器人智能体采用了分层和模块化的策略架构。这种架构包括一个低级技能库和一个高级控制器。低级技能库专注于乒乓球的特定方面,如正手上旋球、反手瞄准等,而高级控制器则负责根据当前游戏统计数据和技能描述选择最佳技能。此外,研究者还通过收集人类比赛数据,为智能体提供了初始任务条件,并利用强化学习在模拟环境中进行训练。
机器人智能体的分层控制
机器人智能体的分层控制主要包括乒乓球打法的选择、技能的调整、技能的选择和更新等环节。高级控制器会根据与对手比赛中的统计数据,在线维护每个打法的偏好,并根据调整后的偏好对入围的技能进行抽样,以选择最有效的技能。同时,智能体会持续更新对手统计数据,直至比赛结束。
机器人智能体的不足之处
尽管DeepMind的机器人智能体在乒乓球比赛中取得了一定的成绩,但它在面对高级玩家时仍然存在一些不足。这些不足主要体现在物理和技术的限制上,如反应速度、相机感应能力和旋转处理等。这些因素在模拟环境中很难准确建模,因此对机器人智能体的性能造成了一定的影响。
与机器人对打的体验
参与研究的人类选手表示,他们非常享受与机器人对打的过程,并在趣味性和吸引力方面给予了机器人高度评价。他们一致表示愿意再次与机器人对打,并在自由时间内与机器人进行了较长时间的对打。
机器人智能体的改进方向
研究人员发现,机器人智能体在处理下旋球时存在一定的不足。为了解决这一问题,研究人员对机器人的着陆率进行了测试,并发现在面对更多下旋球时,机器人的着陆率明显下降。这一缺陷部分是由于机器人在处理低球时需要避免与桌子碰撞,另一部分则是由于实时确定球的旋转确实具有一定难度。因此,未来DeepMind的机器人智能体在乒乓球领域仍有很大的改进空间。
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心