谷歌DeepMind开发的乒乓球机器人通过结合人工智能(AI)和工业机器人手臂,似乎能够与人类平起平坐。这个创新的系统不仅可以与初级到中级的人类玩家竞争,而且还成功地为对手提供了有趣且引人入胜的体验。

AI机器人乒乓球达到人类业余水平

谷歌 DeepMind 的研究团队利用强化学习和模拟技术,成功开发出可以学习基本乒乓球技能的机械臂。该系统不仅教球员如何反击,还教授乒乓球所需的各种技术,如正反手发球、上旋球、瞄准等。值得注意的是,该机器人不仅学习技术,还会分析对手的优劣势,根据情况选择最优策略。这模仿了人类玩家在比赛中经历的思维过程。

研究团队通过收集人类玩家的小型数据集开始开发人工智能系统。然后他们在模拟环境中使用强化学习来训练机器人。使用特殊技术,他们能够将从模拟中获得的知识转移到真实的硬件中,而无需任何额外的示例。这被称为“零射击”方法,是一种使通过模拟学习的机器人适应现实世界的方法。

此外,机器人通过与人类的实际竞争产生了更多的训练数据。随着技能的提高,战斗和控制变得更加复杂,但它们始终植根于现实世界。该机器人还具有实时适应新对手的能力。

该系统的核心由低级技能库(例如正手上旋球和反手瞄准)和控制它们的高级控制器组成。研究人员收集了每种技能的优点和局限性的数据,并创建了一种机制,允许高级控制者根据游戏统计数据、技能信息和对手能力来选择最佳技能。

在现实世界的测试中,机器人与 29 名不同技能水平的人类进行了比赛。结果,我赢了所有对初学者的比赛,并且能够击败 55% 的中级玩家。然而,他却被最熟练的玩家彻底击败了。他的总胜率为45%。根据这些结果,研究小组评估该机器人的能力处于“完全业余”的水平。在国际评价体系中,可以说他拥有相当于一名扎实的业余选手的能力。

专业乒乓球教练巴尼·J·里德(Barney J. Reed)参与了该项目,并表示他对机器人的表现印象深刻。在观看了机器人与各种水平和风格的玩家的比赛后,他认为机器人不仅达到了达到中级水平的最初目标,而且超出了他的预期。

有趣的是,大多数人类玩家认为与机器人对战“有趣”和“有吸引力”,无论技能水平或结果如何。这表明人工智能机器人不仅有潜力成为训练伙伴,而且还能与人类进行有趣的比赛。高级球员尤其认为该系统有潜力成为比发球器更好的训练辅助工具。

然而,这个机器人也有问题。他倾向于对抗高球和反手击球。此外,由于目前物理限制,无法提供该服务。这些弱点也可能被人类玩家利用。

谷歌 DeepMind 的研究人员认为他们的发现可以应用于乒乓球以外的领域。该技术有潜力用于需要在动态物理环境中快速反应的各种应用。自 20 世纪 80 年代以来,乒乓球一直是机器人研究的重要基准。这是因为比赛不仅需要回球等基本功,还需要更高级的战略思维。

这项尚未经过同行评审的研究表明,机器人技术和人工智能的结合在模仿人类身体能力和战略思维方面向前迈出了一大步。未来,它有潜力被用作训练工具,并带动技术更先进的机器人的发展。虽然这个结果没有达到世界乒乓球冠军的水平,但这个结果暗示了人类与机器人合作关系的新可能性。

参考

参考

arXiv:实现人类水平的竞技机器人乒乓球

谷歌DeepMind:实现人类水平的竞技机器人乒乓球

研究总结

研究总结

在现实世界的任务中实现人类水平的速度和性能是机器人研究界的北极星。 在这项研究中,我们朝着这个目标迈出了一步,并推出了第一个在竞技乒乓球比赛中达到业余人类水平表现的学习机器人代理。 乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到很高的熟练程度。 在本文中,我们介绍了(1)一个具有详细技能描述符的低级控制器,它可以对代理的能力进行建模并帮助弥合模拟与现实之间的差距,以及(2)一个选择低级技能的高级控制器( 2)基于现实世界的零样本模拟到模拟架构,包括定义自动化课程的任务分配的迭代方法;(3)实时适应未知情况;对手。 该策略的性能通过 29 场机器人与人类比赛进行评估,其中机器人获胜 45% (13/29)。 所有人类都是新玩家,他们的技能水平从初学者到锦标赛级别都有所不同。 尽管该机器人在与高级选手的比赛中全部输掉,但它在与初级选手的比赛中获胜率为100%,在与中级选手的比赛中获胜率为55%,表现出了业余人类水平的可靠表现。 比赛视频可通过 https URL 观看。