人形机器人短期内不太可能取代普通人的工作。我长期在一家机器人公司担任兼职顾问,我们主要研究人如何控制机器,这其中的难点正是人形机器人难以普及的技术原因。

人指挥机器做事并非易事。比如说“请把这杯水拿过来放桌子旁边”,跟人说这句话,人就能帮忙完成。但要让机器理解什么是水、怎么拿、什么叫放桌子旁边,就特别困难。看看我们的日常生活,我们能用方向盘和刹车控制汽车,用遥控器控制电视,可机器人却没有类似简单的控制方式。现实中,为了让机器人完成一个简单动作,我都得让工程师去编程,构建三维空间,定义物体,设置从这个点到那个点的位移。

也正因如此,我们看到的人形机器人,往往在PPT和视频里画面很酷炫。像宇树科技的机器人能做回旋踢,可以上春晚转手帕,可这些固定动作背后,都是大量工程师提前设计好的。要是放到灵活的工厂生产环境中,人形机器人就很难派上用场。

别说人形机器人了,就算是成熟的机械臂,由于教它做事麻烦,在工厂的使用也很有限。比如好不容易调试好一条机械臂,生产线却马上变了,上个月还在组装手机,这个月就改成组装相机了。相比之下,还是工人最聪明灵活,产线一变,经过培训就能适应新环境。

在工厂里,汽车产业使用机械臂较多,因为汽车产业相对固定。像丰田卡罗拉车型,1966年诞生,能卖40多年,其产线也相对稳定。这样就可以投入大量资金和成本去调试一个机械臂,让它使用多年。

所以汽车大国往往也是机器人大国,比如德国有机器人四大家族之一的库卡,日本有发那科和安川这两家机器人四大家族企业。但即便在汽车产业,也不会盲目采用人形机器人,因为汽车生产最重要的是稳定和效率,产线不能停,一个小环节出问题导致产线停滞,对汽车生产来说损失巨大。中国电动汽车新势力对此深有体会,刚开始造车没经验,就曾在这方面吃过大亏。当年特斯拉产能上不去,马斯克怎么解决的呢?他把产线上所有机械臂撤下来,让人上去干活,产能就突然提升了。

回到人形机器人难以普及的问题,最大的难题就是人如何控制、教导机器人做事。如今整个机器人行业都把希望寄托在AI上。以前控制机器编程门槛很高,现在借助AI技术似乎看到了曙光,比如能不能用自然语言指挥机器人。AI确实带来了不少突破,以无人驾驶为例,最初体验很差,2016年特斯拉推出自动驾驶时事故频发。后来ChatGPT带火了Chat Format技术,特斯拉采用端到端技术,即视频端进,动作端出。

它摒弃了传统自动驾驶系统中感知、判断、规划、控制的模块化分工。传统自动驾驶要先采集图像,判断是什么物体,再反馈决策如何驾驶;而端到端靠大模型训练,通过看大量视频,由AI设计神经网络架构,让车自己学会开车。采用端到端技术后,特斯拉自动驾驶体验明显提升。当时马斯克和扎克伯格约架,马斯克还直播演示让特斯拉自动驾驶经过扎克伯格家门口。

大模型端到端技术如今也应用到了机器人领域,机器人创业公司Finger推出了名为Helix的VLA模型(Vision Language Action),即图像文字输入,机器人执行动作。这确实是很大的进步,但实事求是地讲,距离实际应用还有很大差距。要做好AI、端到端和大模型,数据非常关键。

拿机器人和自动驾驶相比,自动驾驶的数据丰富得多,路上有很多车在跑,能收集大量数据。但在工业场景中数据几乎没有,要让机器人在工厂使用,还得配个工人,机器人做错了,工人修正,才能得到有价值的数据。可这又回到老问题,和自动驾驶比,人指挥机器人获取有效数据太难了。用自动驾驶时,发现AI不管用,自己接管方向盘,每天众多司机开车的数据能让自动驾驶更智能。但对于机器人,不管在工厂还是家庭,如果机器人动作做错,比如螺丝拧得不对,普通人没办法修正,只能请工程师来编程调试,告诉机器人怎么做才对,才能获得提升机器人AI有价值的数据。

所以,人形机器人要真正普及,需要长期积累,不是一家公司努力就行,可能要整个行业乃至全人类共同努力,或者技术底层有重大范式革命。

说到人形机器人,就不得不提马斯克。目前来看,马斯克手握好牌。特斯拉的无人驾驶一开始就坚持纯视觉技术,很适合做人形机器人。马斯克的另一家公司XAI做大模型,发布了号称全世界最聪明的AI——Grok 3。马斯克拥有全世界最大的算力集群,有20万张英伟达GPU,相当奢侈。他控制的推特(现X社交平台)能提供大量数据和影响力,而且他融资能力超强,还能调动巨额资本。

现在他跻身政坛,能影响美国国策。更关键的是,特斯拉有应用场景,其他机器人创业公司得求着客户在产线上试用机器人,而特斯拉有自己的工厂,马斯克说上机器人就能用。所以我认为,AI在人形机器人领域若有重大突破,马斯克肯定参与其中。

但从另一方面看也很有意思,如今马斯克急需一场AI和机器人革命来拯救特斯拉。现在特斯拉遇到大麻烦,电动车销量不佳,上一财年,特斯拉收入仅增长2%,其中汽车收入下滑8%。马斯克因干预欧洲政治被欧洲抵制,在英国销量腰斩,在法国销量跌60%,股价也持续下跌,已跌破1万亿美元,较巅峰时跌去40%。

如果特斯拉只是造车,如今的市值都算高,因为把全球前20的车企放一起,特斯拉比后面19家加起来还贵,凭什么呢?就因为马斯克画的大饼,他说特斯拉不是汽车制造商,而是人工智能公司,只是碰巧现在靠卖汽车赚钱。但怎么证明呢?所以马斯克迫切要在无人驾驶和人形机器人上取得成绩。

看看马斯克的时间表,人形机器人今年要进入特斯拉工厂工作。2025年,特斯拉目标生产几百到几千台擎天柱(Optimus);2026年将产量提升到5万 - 10万台;2027年再提高10倍,达到一年50 - 100万台的产量。马斯克还说,到2040年,人形机器人数量会超过人类。在他的规划里,人形机器人可能给特斯拉带来十万亿美元的年收入,超过汽车业务成为公司主要收入来源。

马斯克认同摩根士丹利分析师的看法,认为自动驾驶出租车能让特斯拉估值达到5万亿美元,而Optimus机器人能让特斯拉估值达到25万亿美元,可现在特斯拉市值连1万亿美元都不到。

总结来说,人形机器人行业一方面技术极不成熟,另一方面行业里条件最好的玩家今年要全力冲刺。但短期内,诞生能替代人工作的人形机器人概率很低。人形机器人行业若要有大变革,要么走长期主义路线,慢慢布局、收集数据、迭代发展,而且这比无人驾驶难度大很多;要么机器人行业出现类似Transformer技术这样的全新范式,实现重大技术突破。

不可否认,像马斯克、黄仁勋这样的企业家很伟大,他们常以强势推动社会进步,比如英伟达规定半年一更新,所有人跟着向前冲;特斯拉早年为拼汽车产能,先定时间表,马斯克亲自督工,大家拼命干,最终创造了奇迹。但科技创新并非只靠给工程师设定期限、高薪激励就能出成果,伟大的创新往往难以计划和预见,很多时候是工程师在轻松状态下,在没人关注的领域突发灵感。比如带来AI大革命的Transformer技术,之前很冷门,诞生在谷歌实验室,可谷歌自己都没重视。

总之,短期内人形机器人取代人工作可能性不大,但我很高兴看到人形机器人形成这么大的热度。这让我想起去年5月,我和黄博士去芜湖参加机器人行业峰会,当时机器人行业远没现在这么火。一位大学老教授在台上分享,世界四大机器人公司,一家盈利,一家微利或微亏,两家长期亏损,行业龙头都如此,整个行业肯定也艰难。

当时A股机器人行业几乎全亏损,甚至行业营业收入都无法覆盖研发投入。老教授说,可这是能真正变革人类生产力的高科技啊。如今人形机器人热度高,虽然短期内不会有变革性产品,但会有大量资金流入这个行业,有助于留住优秀人才,推动重点项目科研攻关,为机器人行业未来发展埋下希望。科学进步和商业发展就是这样一种奇妙的关系。