打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

深深嘬了一口杯子里的饮料,身子往后一倾,整个人陷在沙发里——可乐畅饮,这是上海人工智能研究院首席科学家、上海交通大学博士生导师闫维新最舒服的放松方式,许多年来一贯如此,也是他无数个深夜工作时的日常。

过去一段时间,具身智能机器人以前所未有的速度闯入公众视野。资本追逐、产业升温、舆论沸腾,几乎所有人都在期待具身智能机器人尽快落地,成为照护老人、料理家务、替代危险劳动的“全能助手”。

按理说,从事20年相关研究的闫维新应该是产业界的香饽饽。但他却出人意料地冷静,甚至为公众对具身智能机器人的期待泼了一盆“冷水”:“相当于人们饿了,想吃菜,但现在这个菜还在地里呢。”

闫维新认为,对今天的具身智能机器人而言,真正重要的不是“看上去像不像人”,而是能否在具体任务中做到安全、稳定、可靠、标准化地工作。

毕竟,任何一桌“满汉全席”,都要先备菜、切配、起火、掌勺,急不得。这也构成了他观察这一轮产业热潮的基本判断:方向值得坚定,节奏必须冷静。

打开网易新闻 查看精彩图片

闫维新(右)团队研发智能多功能护理床

菜”还在地里

当前,大众对人形机器人的期待空前高涨,从翻跟头到磨咖啡,似乎它们无所不能。但闫维新直指核心:刚需存在,但技术还远远跟不上。

家庭场景中的养老照护,恰恰是难度最高、风险最大的落地方向之一。老年人真正的刚需是什么?不是陪聊、倒水、拿报纸这些“锦上添花”,而是二便照护、翻身防褥疮、移乘搬运等“雪中送炭”的硬任务。

“一个老人体重大概四五十公斤,现在的人形机器人双臂负载通常只有10公斤。足式机器人搬起老人容易失衡,轮式的又未必够得到床。”更复杂的是,许多老人同时伴有基础疾病、骨质疏松、术后恢复等情况,身体摆位和接触方式都必须精准可控,“你不能乱碰他。”

这意味着,真正进入家庭照护的机器人,不只是“会动”就够了,更要懂得在什么时候接触、用多大力、保持什么姿态、如何避免二次伤害。而这些能力,目前离成熟还有一定距离。

安全伦理问题更被他列为应用风险因素的首位。“有些人形机器人的髋关节、膝关节爆发能力非常强。高爆发力的铁疙瘩如果‘踹’一脚,是不得了的。这个高度又是儿童关键脏器的位置——头部、胸部,正好都在这个高度。”

因此,在闫维新看来,具身智能机器人的应用不能只靠企业自我定义边界,也不能只由市场热情推动,而必须尽快纳入制度化治理框架之中。

“这件事如果不以政府出面,通过法律法规进行引导、认证和标准制定,是存在巨大风险的。”他建议,仿照医疗器械的准入制度,根据人机交互程度(无、弱、中、强)分别“持证上岗”。

打开网易新闻 查看精彩图片

闫维新团队研制的核酸采样机器人。

除了安全,另一个根本制约在于标准化能力不足。闫维新长期从事康复机器人、眼科手术机器人研究,对这一问题感受极深。康复机器人面对的是不同疾病、不同分期、不同身体条件的患者,治疗理念、训练模式、作用力度并不相同;眼科手术机器人面对的是更高精度、更高风险的微创操作。

表面看,赛道不同,本质上都指向同一个核心命题:机器人必须先把任务“标准化”,才能真正稳定复制。

要做到这一点,仅靠硬件堆料远远不够。闫维新把机器人的能力概括为“大小脑协同”:小脑负责运动控制,是高频系统,负责生物应激反应下的肌肉记忆;大脑负责感知、规划、决策,是负责“深思熟虑”的慢节拍。感知系统则相当于人类触觉、力觉、视觉,负责多模态异构数据的融合与分发。

近几年,随着强化学习等技术发展,机器人的“小脑”进步很快,跑跳、翻滚、空翻、复杂地形通过能力都有了显著提升,一些过去只能在科幻片里出现的动作,如今真的可以完成。这也是机器人重新进入公众视野的重要原因。

“那些炫酷动作让大家眼前一亮,也就有了慢慢融入我们生活的可能性。”但他同时认为,大脑的发展尚需时日。“感知、规划、决策下的长程任务,自主能力还需要一段时间。”

换句话说,今天很多机器人已经能“做动作”,却还不真正“懂任务”;已经能在特定条件下表现亮眼,却还不足以在真实世界中稳定、长期、低风险地工作。这也是为什么它们常常给人一种“中看”但“不一定中用”的印象。

所以,闫维新并不否认未来,也不否认需求。他只是反复提醒:公众对具身智能机器人的落地应用,的确有些操之过急了。

“像人”不重要

闫维新对机器人“不能操之过急”的论断,源于他极其“接地气”的研发起点——菜市场。

2005年,当同学们都在做高精尖项目时,导师一句“脑袋大脖子粗,不是大款就是伙夫”,把他“发配”去做了烹饪机器人。谁也没想到,这段从菜市场、厨房、灶台开始的经历,后来反而成为他理解机器人产业化问题的一个关键入口。

为了做烹饪机器人,他花了多年时间研究川、鲁、淮扬、粤等不同菜系,和名厨、教师、院校团队反复交流,把一道道菜拆解成参数、动作、流程和控制逻辑。

体重就这么飙升了。“刚做烹饪机器人时,我还是150斤的小伙子。做完200斤了。”5年间,他“煸、炸、熬、溜、炖、烤、烧、烩吃遍了”。

这段“伙夫”生涯,让他深刻理解了机器人产业化的核心难题:现实世界太复杂,而复杂世界最难被标准化。

打开网易新闻 查看精彩图片

3月23日,在人形机器人数据采集训练场,工作人员对人形机器人进行训练和数据采集。 新华社记者 李紫恒 摄

做烹饪机器人,首先就要把“炒菜”从经验活变成可计算、可复制、可执行的过程。比如,煸炒时的油温是多少,滑炒时的温度区间是多少;食材下锅的时机、翻炒的路径、颠勺的幅度、出锅前的火候如何控制,背后都需要数字化建模和运动学分解。

但即便如此,真正做下去后仍然会发现,厨房里的变量远比预想中多。为了复刻一口菜的“锅气”,燃气压力会在不同时间段、不同地域发生变化;同样的食材,产地、含水量、切配方式不同,状态也完全不同。很多在人类厨师那里依赖经验即时调整的部分,对机器人来说,恰恰是最难跨过去的门槛。

这些关于成本、口感的朴素经验,后来成了他思考所有机器人的底层逻辑:做机器人不是追求形式上的“像人”,而是在理解任务本质后,用最优的构型去解决问题。

比如“颠勺”这个动作,最初团队曾尝试使用价格昂贵的进口高爆发电机,一个电机模组就要一万多元,成本高得难以产业化。后来他发现,颠勺的本质是在一定锅的角度下实现出锅和回锅的位置,用牛头刨机构这种传统机械调整角度、模拟颠勺动作,不仅一样能达到效果,而且更便宜。

所以,闫维新始终主张,今天看待具身智能,不应只盯着“形式上的像人”,而应回到工程逻辑:什么场景最需要,什么任务最适合,什么构型最优,什么成本可接受,什么标准能支撑规模化落地。

通用人形机器人当然可能是未来的重要方向,但如果把它理解成一桌立刻就能端上来的“满汉全席”,显然高估了现实进度。目前,这桌“满汉全席”还处在备菜、试味、起灶的阶段。

长三角蓄势待发

尽管对短期落地保持克制,闫维新对具身智能的长期前景并不悲观。恰恰相反,他认为,真正把这项产业做起来,中国,尤其是长三角,正手握能最终解锁未来的“金钥匙”。

“产业化体系极其完善,供应链可触达性很强,尤其在长三角地区,这是非常大的优势。”闫维新说。

这些年,电机模组的价格从1万多元降到几百元,实现了数量级的降本。这正折射了长三角供应链的成熟。“浙江很灵活,能把所有东西全做成白菜价。江苏的关键零部件,尤其是谐波减速器做得非常扎实,纯国产技术,很多参数不比日本差。安徽在产业落地方面,尤其是汽车制造,场景非常多。上海有应用场景牵引、测试、研发和资本双频共振、高校资源丰富。”

他特别强调一个时间节点:2018年。2018年之前,我国工业机器人处在陪跑跟跑阶段,电机、减速器、驱动器、控制器等,精度、速度、可靠性都不如人。到了2018年,随着产业链、供应链的丰富,“我国在人形机器人、智能机器人方面处于领跑状态,至少是与美国一起领跑全世界。”

打开网易新闻 查看精彩图片

3月10日,工作人员在苏州市具身智能机器人综合创新中心对机器人进行多场景训练。新华社记者 李博 摄

另一个优势是场景丰富度和开放的试验态度。“我们有其他国家没有可比性的场景丰富度。我们愿意做这个事情。”闫维新举例,最近研究工业场景中的叶片打磨,提出想法后,很多国有企业非常愿意验证,愿意提供场景、参数和验证平台,且容忍度非常高——“一开始,成本、可靠性和节拍达不到没关系,只要有这个方向,我们就朝这个方向来做数据采集”。

这种态度背后是真实的需求。“恶劣危险场景下人员流失率很高,他们也有非常大的需求。”他提到生物制药的洁净厂房,人员每天穿防护服,手套扎起来后手都泡得发白。而机器人在这里的优势是什么?操作范式固定、24小时运行、不需要等机器停机就能做后续工作。

数据开放与协同共享是再一重优势。闫维新指出,大语言模型之所以能快速发展,一个重要原因是互联网提供了海量可获取数据;但机器人不同,它需要的是动作数据、交互数据、任务执行数据、失败数据、场景数据,而这些数据通常无法“天然存在”于网上,必须通过真实场景反复采集和验证。

在这一点上,中国具备通过中试验证中心、联合攻关平台、场景开放机制来积累数据的能力。更重要的是,中国可以依托完整产业链,形成一种多方协作的共享模式:有人做数据采集,有人做机器本体,有人做端侧算力,有人做算法系统,大家围绕接口和场景协同推进。这种模式不是单一企业单打独斗,而是产业链丰富度支撑下的合作共赢。

面向未来,闫维新给出的方向也很明确。其一,长三角需要进一步整合资源,形成真正意义上的区域协同,下一盘更大的产业棋;其二,要推动关键零部件继续升级,特别是在人工智能加持下,让关节模组本身具备一定计算能力,提升机器人系统的分布式智能水平;其三,要强化政府、高校、企业三方联动——政府负责标准制定、行业规范和中试平台牵引,高校攻克卡脖子技术,企业围绕场景推动落地,并从中凝练共性问题与共性技术。

在闫维新的描述中,具身智能像是一座正在点亮的“未来灯塔”——它之所以令人期待,不仅因为这本身是一个前沿产业方向,更因为它能把人工智能、高端制造、核心零部件、新材料、算力基础设施、医疗健康、工业服务等众多产业链条重新组织起来,形成新的创新共同体。

但也正因此,闫维新反复提醒,不要操之过急,稳扎稳打才是硬道理。

一开始大家可能会觉得,机器人笨一点、傻一点,离真正有用还很远。“但5年之后呢?”闫维新的这句反问里,既有谨慎,也有信心。

原标题:《炒菜5年胖50斤,“伙夫”科学家泼冷水:别指望机器人养老,“菜还在地里”》

栏目主编:陈抒怡

本文作者:解放日报 吴恺沄 巩持平