打开网易新闻 查看精彩图片

机器之心报道

编辑:泽南、张倩

波士顿动力Atlas进厂打工,不靠远程操控,转身动作像惊悚电影。

波士顿动力的人形机器人,进厂了。

本周三,波士顿动力发来一条喜讯。其最新披露的视频展示了机器人在工厂环境中的任务完成能力。机器人现在已经可以全自动干活了,它可以在储物柜之间搬动汽车发动机零件:

打开网易新闻 查看精彩图片

搬运的这个东西是汽车的发动机盖。视频里可见新版 Atlas 机器人是在寻找零件并挑选位置放置,还附带识别过程的展示:

打开网易新闻 查看精彩图片

搬着搬着 Atlas 看到有人拍摄,突然虎躯一震(其实是东西没放对位置)。没关系,我很稳:

打开网易新闻 查看精彩图片

我们注意到,在拿到东西和放好东西后需要转身的瞬间,Atlas 并没有像人类一样转过来,而是以腰部为中心进行旋转,该动作最大限度地减少了移动,从而节省了过程中宝贵的几秒钟。不过,这也让人联想到一些惊悚电影里,主人公身子不动,头直接转过来的画面。

打开网易新闻 查看精彩图片

一通操作看下来,机器人在工厂完成一些简单工作看起来是游刃有余了。

在社交网络上,网友们纷纷表示:太强了,看起来已经可以商业化了。

打开网易新闻 查看精彩图片

但众所周知,实现这样的愿景还有很长一段路要走。

波士顿动力指出,目前该公司的人形机器人已经能够通过视觉、受力和本体感受传感器的组合来检测环境变化(例如移动固定装置)和动作故障(例如无法插入盖子、绊倒、环境碰撞)并做出反应。

需要注意的是:波士顿动力这次强调了演示视频中的机器人是完全自主运行的,没有「预设程序或遥控动作」,它可以使用机器学习算法理解并适应真实世界的环境。这一声明似乎是在 cue 谁,但就是没有明说。

最近一段时间,哪家的人形机器人上过头条?应该是在特斯拉「We, Robot」活动中大放异彩的擎天柱 Optimus。马斯克还说,人形机器人的数量将在不到 20 年内超过人类,「这工作要由我来干」。

特斯拉的 Optimus 机器人展示了与观众互动,玩游戏、跳舞,甚至进行简单对话的能力,好不先进。

打开网易新闻 查看精彩图片

然而,很多人指出,Optimus 在展示过程中实际上部分依赖于人类的远程操控,这引发了外界对于其自主能力的质疑。由于种种原因,特斯拉的股价当时还瞬间跌了 10%。

与 Figure、Tesla 和 Apptronik 等竞争对手一样,波士顿动力公司人形机器人的首次应用包括在汽车工厂的工作。考虑到该公司现在属于现代汽车公司,而现代汽车公司刚刚选择与丰田汽车的研究部门达成协议,关注 Atlas 这一应用是很有意义的。几十年来,汽车行业在自动化领域也一直遥遥领先。或许有一天,Atlas 真的会变身一名「汽车工人」。

波士顿动力也玩转型:Atlas 电动化之后

今年 4 月,波士顿动力曾跟全世界开了一个玩笑,先是官宣人形机器人 Atlas 退役,狠狠来了一波回忆杀。

打开网易新闻 查看精彩图片

紧接着,就在第二天,他们又放出了一个新的人形机器人视频。新机器人也叫 Atlas,不过由原来的液压改为了电动,身材更为小巧、灵活。

打开网易新闻 查看精彩图片

此时,外界才反应过来,原来波士顿动力并不是要放弃人形机器人,而是转变了研发方向,让机器人更加适应工业环境。当时,该公司表示,这个电动版的 Atlas 将于明年初在韩国现代汽车工厂里开始进行试点测试,并会在几年后全面投产。看来,试点的时间可能提前了一些。

和之前的液压版 Atlas 一样,电动版的 Atlas 也是有一些绝活在身上的,比如随手就来一个俯卧撑:

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

做完俯卧撑后,Atlas 还能自己站起来。

倒立行走:

打开网易新闻 查看精彩图片

这些「绝活」是怎么做到的呢?前段时间,在机器人顶会 RSS 的一场技术分享中,MIT 博士、波士顿动力机器人工程师 Robin Deits 介绍了 Atlas 机器人过去几年的研发历程,以及从中学到的经验、教训。

打开网易新闻 查看精彩图片

具体来说,Robin Deits 主要介绍了 Atlas 控制器的核心 ——MPC(模型预测控制)。他表示,波士顿动力从 2019 年以来实现的所有机器人动作都是依靠 MPC 来完成的,包括跑酷、体操、跳舞、后空翻等等。最近,他们还展示了 MPC 用于操纵物体的效果。2024 款纯电驱动的 Atlas 新版本也是由 MPC 驱动的。

对于这场技术分享,机器之心也做了详细报道,感兴趣的读者可以抽时间详细阅读(参见《波士顿动力技术揭秘:后空翻、俯卧撑与翻车,6 年经验、教训总结》)。

其实,除了内部研发,波士顿动力也在加强与外部的基础研究合作。就在两周前,波士顿动力和丰田研究院(TRI)官宣建立新的合作伙伴关系,以「利用 TRI 的大型行为模型和波士顿动力的 Atlas 机器人,加速通用人形机器人的开发」。

根据 IEEE Spectrum 的报道,TRI 的大型行为模型(LBM)其实类似于大型语言模型(LLM),只不过它的应用场景是在物理世界中工作的机器人。TRI 长期以来一直致力于开发基于人工智能的学习技术,以应对各种复杂的操作挑战。在与波士顿动力合作后,他们将通过 Atlas 获取更多物理世界的数据,这些数据将反过来用于支持高级 LBM 的训练。双方合作有一定的互补作用。

在基础研究层面,人工智能能否给 Atlas 带来新的突破,欢迎在评论区讨论。

参考内容:

https://techcrunch.com/2024/10/30/boston-dynamics-electric-atlas-humanoid-executes-autonomous-automotive-parts-picking/

https://x.com/BostonDynamics/status/1851624026424197434

https://spectrum.ieee.org/boston-dynamics-toyota-research