五名精英乒乓选手走进一个标准奥运尺寸的赛场。球台是ITTF认证的SAN-EI,球是Nittaku 40+三星球,裁判是日本乒协持证上岗的。一切按国际乒联规则来,没有缩水。
他们的对手不是人,是一个叫Ace的机器人。结果,五场三局两胜,Ace赢了三场。
要知道,这是人类历史上,自主机器人首次在正式比赛规则下,实打实地从人类运动员手中抢下胜场。Ace并非实验室里的发球模板,面对时速超过20米、每秒转动上百圈的极限旋转球,它不仅接住了,还回击得极为刁钻。
同时,这项成果刚刚以封面文章的形式登国际顶刊《Nature》。它用数据向世界证明,物理AI在复杂、高速的实时交互任务中,已经拥有了足以媲美人类精英的无限潜力。
01.
为什么“打乒乓球”件事这么难?
职业乒乓球的球速能飙到20米/秒以上,两拍之间往往不到0.5秒。更狠的是旋转,角速度可达1000弧度/秒,一个上旋或下旋能让球的轨迹完全违背直觉。球台上的弹跳还会受旋转影响,下旋球可能“飘”,上旋球可能“扎”。
自1983年以来,人类做了四十多年乒乓球机器人。但之前的方案要么用发球机喂球,要么缩小场地覆盖范围,要么干脆忽略旋转,要么禁止某些击球方式。说白了,它们打的不是真正的乒乓球。
所以索尼AI团队面对的问题是:不是让机器人碰到球,而是让它在完整的、对抗的、带旋转的真比赛里,跟人类高手过招。
Ace的核心突破,就是赢在稳定性和对旋转的处理能力。
02.
Ace是如何练成的?
如何做到这一点?索尼AI团队为ACE搭载了一套精密的“感知-决策-执行”链条。Ace的整套系统以1毫秒周期同步运行,与视觉系统共享时钟信号,即使在最大速度下,位置跟踪延迟仍低于5毫秒。
- 感知:看懂位置,更看懂旋转
乒乓球场上,人类选手靠眼睛追球、靠经验猜旋转、靠肌肉记忆调整动作。Ace走的完全是另一条路,靠直接测量。
它看位置靠的是9台APS传统相机,分布在球台外围,以200赫兹的频率捕捉球的3D位置,平均误差只有3毫米,延迟10.2毫秒。
真正的核心突破,是“看懂旋转”。
Ace配备了三套凝视控制系统,每套都搭载了事件驱动视觉传感器,这种相机不按帧曝光,而是对光线变化做像素级异步响应,高速旋转物体在传统相机里糊成一片,在它眼里却是清晰的运动轨迹。
每套系统还配了一对可旋转的跟踪镜和一个远摄可调镜头,镜头会主动跟随球的移动,始终对准球体表面印着的商标。
系统用卷积神经网络和对比度最大化算法分别估算角速度,再根据不确定性动态融合,最终以400到700赫兹的频率把旋转数据传给决策层。平均测量误差24.8弧度每秒。
- 决策:仿真中自学,比赛中调用
有了位置和旋转数据,下一步是决策。
Ace采用Soft Actor-Critic(SAC)算法,在仿真环境中通过试错自学回球策略。训练中,评估模块能看到真实的球状态,而决策模块只能依赖带噪声的传感器历史数据。这种“不对称”设计确保策略能从仿真顺利迁移到真实世界。
比赛时,策略每32毫秒查询一次,根据球和机器人的当前状态输出一个抽象动作,然后映射为未来32毫秒的关节轨迹。与此同时,系统会预先计算一条返回安全位置的“重置轨迹”,一旦预测到碰撞就立刻执行,保证高速运动中的安全。
为了应对不同类型的来球,团队训练了多个策略,分别掌握高上旋、下旋等技能,每个技能设定期望的落点和旋转权重。比赛时,系统根据来球特征从技能库里实时选取最合适的策略。这套思路上很像一个全能运动员,拿到什么球就调出什么技能包。
发球则单独处理。抛球动作来自人类示范,击球动作通过遗传算法优化。每种发球要经过真人陪练测试,20次尝试中失败率低于5%才能入库。最终,Ace的发球库里存了15种发球。
- 执行:为速度与精度定制
执行层面,机械臂有8个自由度(2个直线关节+6个旋转关节),末端最高速度设定为20米/秒,工作空间覆盖3.6米×3.6米。
此外,其连杆经过拓扑优化设计减重,使用Scalmalloy高强度铝合金3D打印。末端执行器是一块改装球拍——Butterfly Dignics 05胶皮搭配VICTAS ZX-GEAR OUT底板,外加一个用来发球的小杯。
有了这套能“看懂旋转、实时决策”的系统,Ace走上了赛场。
03.
赢下精英选手,从职业选手手中拿分
2025年4月,Ace先对阵5位精英选手(三女两男,十年以上竞技经验,每周训练约20小时),三局两胜制,3胜2负,13局拿下7局。
随后对阵两位日本T联赛现役职业选手安藤南和曾根薰,五局三胜制,0胜2负,但7局中拼下1局。
数据揭示了Ace的赢法。它不靠更快的击球。Ace的制胜球和普通回球在速度和旋转分布上几乎一致,稳定回球等对手失误。而人类选手的制胜球明显高于普通回球,靠突然加力得分。
面对旋转高达450弧度/秒的来球,Ace回球率始终超过75%,远超此前报道的竞技乒乓球机器人水平。
它自己打出最高速度16.4米/秒、最高旋转600弧度/秒,也能回击对手最高19.6米/秒、867弧度/秒的来球。平均回合长度5.0拍,比人类职业比赛典型值3.9拍更长。发球方面,15种不同发球直接拿下16分,精英选手仅8分。
最惊艳的一幕是擦网球。球在0毫秒触网,Ace仅用49毫秒调整轨迹并成功回球。
团队做了反事实模拟:如果球没擦网,Ace的动作路径会截然不同。说明它真的是在实时决策,而非执行固定套路。
04.
从球桌走向更多场景
当然,Ace还远非完美。
目前它仍无法稳定击败顶级职业选手。《Nature》同期评论文章指出,Ace从多个视角同时观察场地的方式与人类存在本质差异,离“拟人化”还有距离。
研究团队自己也很清醒:真正的挑战在于如何建模人类对手的行为。在高维物理空间中精确模拟人类动作极其困难,这意味着真正的目标函数(赢或输)无法被直接用于训练,只能使用替代目标。未来如果能引入对手建模和在线学习,Ace有望在实战中持续进化。
即便如此,这项突破的意义已经超出了乒乓球本身。它为制造、服务、搜救等需要高速、精准人机协作的领域,提供了一个可验证的技术路径。机器人执行实时复杂任务的能力,正在被一步步验证。
正如1992年奥运会选手、乒乓球专家中村金次郎在看完Ace一记击球后的感叹:“其他人根本做不到。我以前认为这是不可能的。但既然它能做到……那就意味着人类也有可能。”
热门跟贴