“如果没有一个好的身体平台,大脑再好也没有用。”
作者|周悦
编辑|王博
上海张江人工智能岛的一间会议室里,一幅装裱好的老式科幻海报斜靠在角落。
海报中,两艘流线型太空飞船驶过星球,其中一艘银白色飞船还以剖面形式露出舱内乘客。那是美国“黄金时代”科幻对商业太空旅行的想象。
这幅海报曾挂在特斯拉创始人埃隆·马斯克(Elon Musk)得克萨斯州住所的墙上,后来被张海星搬回了中国。
矩阵超智会议室内海报,科幻杂志《Amazing Stories》1939年12月刊封面,图片来源:「甲子光年」拍摄
张海星是人形机器人公司矩阵超智的创始人兼CEO,也曾是特斯拉中国设计研究中心的创始领导人。
张海星很早就在关注马斯克。
2010年前后,马斯克在公开采访中明确谈到人类应向火星扩展。到了2014年前后,他开始更系统地描绘“百万级火星文明”的蓝图。当时,张海星觉得,如果人类真去火星,带一款普通的音箱显然不符合调性。于是,他做了一款磁悬浮音箱,并将其命名为Mars(火星)。这款音箱在美国只卖了半年,却流转到马斯克手中。
2021年,在经历了马斯克亲自面试后,张海星加入特斯拉,开始参与人形机器人Optimus(擎天柱)项目。按照他的说法,“中国第一台特斯拉Optimus机器人,就是我带队做的。”
张海星把特斯拉形容为一所“万亿美元商学院”。离开这所“商学院”后,他在2024年创办了矩阵超智,开始给出自己的“答案”。
今年5月18日,矩阵超智在上海张江发布了第三代全尺寸人形机器人MATRIX-3。
MATRIX-3搭载33个全身自由度;MATRIX HAND灵巧手达27个自由度;关节方案采用串并联直线关节架构,单腿大腿3个直线关节,小腿2根直线关节;机身覆盖3D立体织物,内嵌分布式触觉传感网络,搭配自研具身大模型MATRIX Wave。
矩阵超智第三代全尺寸人形机器人MATRIX-3,图片来源:矩阵超智
有些人会把矩阵超智MATRIX和特斯拉Optimus进行比较,甚至称MATRIX为“中国版Optimus”,张海星并不排斥这种说法,但在比较两者的路线差异时,他告诉「甲子光年」:“我们打造的就是‘中国擎天柱’。更准确表达应该是,MATRIX不是像Optimus,而是更像人。”
在「甲子光年」和张海星对话的两个多小时里,他把愿景说得很大,也把问题说得很具体。他说,矩阵超智想做的不是细分领域最大,而是“这颗星球上最大的物理AI公司”。回到机器人本体,他讲得更多的是能耗、成本、公差、温升和每一个工程细节。
“做硬件就像做红烧肉,没有四个小时,这肉就是不行。”张海星说,“你用空气炸锅、高压锅弄一下,味道就是变的。”
当被问及,如果马斯克本人看到这篇文章,最希望他看到什么时,张海星说:“其实也不需要隔空对话,我在X上发,他都能看得到,MATRIX-3就算是我的答案。”
本文,「甲子光年」对话矩阵超智创始人兼CEO张海星,由「甲子光年」整理编辑,在不改变原意的基础上有所删改。
矩阵超智创始人兼CEO张海星,受访者供图
1.特斯拉就像一家高级“商学院”
甲子光年:你和马斯克是怎么认识的?
张海星:2014年前后,马斯克刚在讲火星移民计划。他说要去火星,我当时就想,如果你真的去火星,到底带一台什么音箱?我觉得市面上的音箱都不太符合火星那种调性。后来想到“引力场”这个概念,就把磁悬浮技术整合到音箱产品上。这款音箱当时在美国卖得不算多,但到了马斯克手里,可能他喜欢收集“乱七八糟”的东西吧。
后来他找到李开复(注:创新工场早期投过张海星的公司),并亲自面试我。
马斯克奥斯丁宿舍照片,右上角桌上为张海星推出的磁悬浮音箱,受访者供图
甲子光年:他当时面试你,都问了哪些问题?
张海星:他问我,未来自动驾驶汽车怎么做,机器人怎么做。我给了他很多想法,比如车里面为什么一定要有四个座椅、五个座椅?座椅能不能重新布置?车为什么一定要有A柱?车轮为什么一定要裸露在外面?很多前沿的想法,都是我提出来的。
甲子光年:他当时的反应是什么?
张海星:他会问我,这怎么实现?你为什么会有这种想法?聊到最后,我们又聊火星移民计划,聊为什么要去火星,怎么看人类文明2.0,然后我就加入了。
甲子光年:我们之前跟在SpaceX工作过的人聊,有人形容向马斯克汇报“像一场酷刑”。你自己的感受是什么?
张海星:我跟马斯克汇报还挺friendly(友好)。但我觉得他有两种模式:天使模式和恶魔模式。
天使模式时,他甚至像个“小白”,会一直问为什么这样?你说什么,他都是“哦,好好好”。
恶魔模式时,你跟他说话,他会哪哪看你不爽,这取决于他当天状态。对其他人来说,可能坐在他前面也会觉得战战兢兢。
甲子光年:2021年你加入特斯拉中国设计研究中心(Design Studio),但我们发现你实际负责工作范围,似乎比“设计”更广?
张海星:老实说,我进Design Studio的目标,不是只做造型。我之前就是一家公司的CEO,是产品一把手,我才不屑去做“弼马温”。
我想做的,至少是整个产品由我负责。产品长什么样、应该有什么功能,基本是由Design Studio说了算,工程团队根据产品规划去实践,AI团队定义技术路线和模型。
甲子光年:我很好奇你在特斯拉是什么级别?
张海星:我当时的级别跟Andrej Karpathy(注:曾任特斯拉AI主管,近期刚入职Anthropic预训练团队)是一样的。他是Director of AI,我是Director of Design。
在特斯拉中国组织架构里,我跟宋刚(注:曾任特斯拉上海超级工厂生产制造高级总监、现任小米集团汽车部副总裁)平级。
在美国这边,我是直接汇报给马斯克。
甲子光年:你和特斯拉Optimus机器人的关系是?
张海星:中国第一台特斯拉Optimus机器人,就是我带队做的。
甲子光年:后来为什么从特斯拉离开?
张海星:比较直白地说,我当时本来不想加入特斯拉。他们找我聊了很多次,我都没去。后来他们报到马斯克那里,说不行,你得自己出来。
我是一个CEO,很多年没打过工了。当时他们问我年薪的时候,我都懵了,因为我很久没有给自己开过工资。
去了以后,我就把特斯拉当成一个高级“商学院”。他们凭什么把公司市值做到一万亿美元,凭什么马斯克会成为首富?他们的认知肯定有在我们之上的地方。
但加入第一天我就知道,而且特斯拉内部很多人都知道,Allen(张海星的英文名)这个人一定有一天会出去创业。
这里确实有很多东西值得学。特斯拉像一家“商学院”,也像一家AI和软件公司,甚至像未来外星科技公司,但它也保留了很多传统车企的东西。
我觉得,如果我无法成为一家公司的CEO或CTO,也没什么意思。所以我就出来了。
甲子光年:你在这家“商学院”学到了什么?
张海星:节约。上班第一天就有人告诉我“你要节约一点”。很多细节都是极致成本控制。比如,公司T恤也不会随便送,你要就自己买。
在特斯拉的经历强化了我的几个理念:做产品要克制、工程决策要谨慎、供应链要一起磨合,不能只靠自己,也不能单方面去压供应商。组织管理也一样,不合适的人要及时解约,好的人才要用合适的方式留下来。
这些东西后来都在影响矩阵超智怎么从0到1、从1到100往前走。尤其是,一家硬科技公司不只是做出产品,还要知道公司怎么长大。
2.我们不是像Optimus,而是更像人
甲子光年:离开特斯拉后,为什么选择做机器人,而不是造车?
张海星:我出来的时候也考虑过要不要造车。但那时候造车已经开始收缩了,资本也不怎么看了。剩下的时代级流量入口不好做,那只剩机器人。
机器人不是纯软件,它需要硬件和软件结合,这在我的天赋和经验里面。我觉得如果我来组建一支机器人团队,会做得更好。
甲子光年:最初有人不看好你们吗?
张海星:最早融资时确实有过。比如一位早期投资人就直接跟我说,不建议我下场做机器人,他觉得那个时刻还没有到。
2023年底的时候,大家连双足都还没完全看清楚。那时候连很多海外公司都没有很好解决双足行走,全身运动控制、通用运动控制小脑这些事,在当时都是不敢想象的。
但这两年AI进化速度太快了,你不能低估AI的速度。软件、大脑、模型的能力会快速往前推,如果没有一个好的身体平台,大脑再好也没有用,最后就变成“缸中之脑”。
甲子光年:但是行业里也有人认为,机器人本体已经卷到一定程度了,接下来更重要的是“大脑”。你认同吗?
张海星:我不这么看。有人觉得本体已经很卷了,但真正能把人形本体做好的团队,其实没有几家。
全世界范围内,完整做过四五年人形机器人硬件本体的人和团队,凤毛麟角。很多公司做的还是夹爪、轮式,或者还处在很早期的阶段。MATRIX-3是双足机器人里面,少有的既能够稳定行走,又有能直接干活的灵巧手。
人形本体里面有大量工程细节,比如套管、腱绳、添加剂、供应商选择、卡扣装配,都会影响散热、一致性和可靠性。所以我觉得,本体反而是更难的,算法和模型对我们来说没那么难。软件可以加快迭代速度实现,但硬件不一样,急也没有用,给钱也没有用。
另外,好的本体也会反过来影响模型和数据。大脑一定要和好的身体结合才有价值。比如我们现在以第一人称做数据采集,人的动作和关节映射本来就是这样。如果机器人是异构结构,映射时还要再做一层算法转换,这本身就会改变数据质量。更接近人的形态,对采集是有增益的。
甲子光年:其实你们这次也发布了具身模型MATRIX WAVE。
张海星:大脑不是单独存在的。它必须跟身体、本体、数据闭环结合起来,否则还是“缸中之脑”。
我们最近也引入了一批自动驾驶背景的人,包括华为、理想、地平线等团队出来的人。因为自动驾驶可以说是物理AI的第一个应用,而且是一个相对低维的应用。
自动驾驶团队在智驾里走过的路,比如怎么做数据向量,怎么做数据清洗,怎么把一个端到端系统真正跑通,这些经验都可以复用到机器人上。
我们可以把机器人可以理解成一个更复杂、更高维的端到端自动驾驶系统。
甲子光年:自动驾驶背景的人和纯机器人算法背景的人,有什么不同?
张海星:自动驾驶团队面对的是真实安全性、道路碰撞和工程化问题,也经历过量产、产品化和商业化,这和纯做机器人算法出身的人不一样。
部分纯机器人背景的人可能发过很多paper,但并不知道算法真正落到一辆车或者一个本体里会产生什么后果和影响。
系统很重要。如果系统没有可靠性和质量,都是纸上谈兵。最后你绕不开一个问题:你的东西怎么落到物理实体上?当这个物理系统在真实工业场景里部署时,它还能不能可靠、有效,能不能把算法跑出来?
没有人会单独为一个模型买单,大家都是为结果买单。
甲子光年:有些人认为MATRIX系列看起来很像Optimus,你会排斥这种观点吗?
张海星:我一点都不排斥,我们打造的就是“中国擎天柱”。
两条胳膊、两条腿,就跟车一样,我们赌未来汽车是四个轮子。100年前汽车工业也出现过八个轮子的车,后轮特别大、前轮特别小的车。我们不希望造三角形轮子和方轮子,也不是为了不同而不同。
“无限像人”这个概念,是长期磨出来的。怎么样能够做得更像人、更美观。我们坚信机器人未来要走的是人形通用形态,所以我们也相信这个形态。我们其实我们是朝着人去做,再加上我的个人标签,所以有人会觉得有相似之处。
如果非要进行对比,MATRIX-3有很多先进的地方。比如人两条腿中间会有一个三角形夹角,MATRIX-3基线也是三角形夹角;为了更像人,我们把髋关节位置有两个电机取消了。
准确表达应该是:MATRIX不是像Optimus,而是更像人。
MATRIX机器人,图片来源:「甲子光年」拍摄
甲子光年:MATRIX-3看起来比很多人形机器人更接近人体比例,也更轻。你们为什么要把它从1.8米降到1.7米左右,还减重10公斤?这只是审美选择吗?
张海星:不是只为了好看。我们一开始就是对标人体做的,拿人体黄金比例图去卡。比如手臂加上手掌以后,中指应该落在大腿哪个位置,这是有区间的。太长了像外星人,太短了手、腿和身高比例也不对。头也一样,有9头身、8头身、7.5头身的区别。
我们立项时买人体解剖学模型,也是为了让工程师看清楚线怎么走、结构怎么排。比如,正常来说,两个肩关节电机可以直接装,但我们给了它一个角度,因为人的肩胛骨本身有自然曲线。这些细节我们都仔细研究过,不是把零件全部堆上去。
刚才你提到的轻量化也是同一个逻辑。重量降下来以后,能耗会降低,末端关节选型也不需要那么大的推力和负载。峰值推力、扭矩越大,能耗越高,成本也越高,很多都是不必要的成本。
甲子光年:感觉各家机器人厂商强调的点不一样,有的厂商会强调力量,有的会强调灵活,有的还会展现女性的姿态。
张海星:如果机器人真正作为物理世界的生产力,它不一定要像一个很壮的人,反而更像一个瘦小、苗条的青年。它不需要特别肌肉、特别负重,核心是脑子好用、手好用,能够长时间坐在那里做灵巧操作。
减重和降低身高这件事,我们后面还会继续做。今天做不到更小、更好,是因为电机、能耗、温升还有物理限制。
甲子光年:我注意到在发布会上,MATRIX-3上台时晃了一下然后站稳,你当时什么感受?
张海星:我一点都不担心。
那个舞台是木质地板,本身扰动比较大。我和机器人共同站在台上的时候,地板其实一直在发生形变,像一个轻微的气泡床,只是肉眼看不到。机器人走上去以后,前后有一点摆动,本质上是在调整步态。
我们机器人现在已经可以做到从三个方向去推它,抗扰动性很强。它晃动,是通过全身运动控制的小脑在找自己的平衡。
3.我们现在做的就是物理世界的基础设施
甲子光年:马斯克说过Optimus的手是整个项目里最难的部分。那么,MATRIX从初代到三代,灵巧手经历了哪些变化?
张海星:我们最早一代手是直驱方案,把电机做小以后装进去,当时做的是6自由度。用下来发现,直驱电机没有负重时挺好,但一有负重,比如抓东西抓多了,就容易温升、堵转,甚至烧掉。不良率很高,本质上还是实验室产品,没法真正量产。
早期遥操作时,手啪一下打到桌上,直接就打坏了。所以我们需要一种腱驱动、柔性的东西。
一开始没做,是因为腱绳系统复杂,产业链也不完备。到三代机时,金刚线、合金线、高分子聚材、套管、空心杯电机这些国产供应商更成熟了,我们才回到腱绳方案。
这里面都是know-how。比如绳子和套管接触,会有温升、静电和摩擦,动作就没那么平顺。我们后来找化工厂做了一种特殊添加剂,类似润滑脂,但里面有油脂、金属粉末、特种塑胶颗粒和化学液体。灌进去以后,温升、静电和绳子寿命都更可控。
矩阵超智MATRIX-3灵巧手现场操作,图片来源:矩阵超智
甲子光年:团队从原型机到第三代,大概只用了100多天。最难的一仗是什么?
张海星:去年年底,供应商做出来零件有公差,导致东西装不上去。我们只能临时用3D打印,搞了几十台打印机,自己打、自己磨。打印件硬度不够,还要手工做硬化。有些工艺有污染,我和同事都戴着3M化学过滤面罩一起干。
我记得当时几个男同事都被干哭了,好几天没回家,坐在楼梯间哭。那感觉真的跟打仗一样,前线子弹没运上来,也得灭火、包扎、继续往前。我们现在做的就是物理世界的基础设施,不是软件里导一下数据就能出来的东西。
甲子光年:打磨硬件过程中,哪个瞬间让你觉得本体成了?
张海星:第一个是MATRIX-1第一次行走的时候。当时它还是一副骨架,电池都没背在身上,还是外置电池。我们用了一些偏MPC(模型预测控制)的经典运动控制算法,后来加了一点点AI,让它能够正走、反走、转身。那一刻挺不可思议。那个demo没有对外公开,但出来以后我们融了一些钱。
第二个是MATRIX-3。MATRIX-1是旋转关节,到MATRIX-3,我们用了直线关节。当时中国还没有团队证明,直线关节能走得平稳,并且能模仿多种步态。
我们一直在想,能不能把旋转关节的运动控制小脑经验,迁移到全串并联架构?这个花了很长时间。最后攻克完,我们写了发明专利,也自己写了一个方程。这个我还蛮自豪的。
甲子光年:为什么其他团队很难做出直线关节运动控制?
张海星:旋转关节来自四足,已经迭代很久;直线关节很难控制,稍微一不小心力就爆掉,电压、电流稍微一掉帧,腿就软掉。
第一,你要有一套本体。
第二,你要有非常懂电机驱动控制的算法人员。
第三,你还要有参与过UCSD、ETH那种足式机器人运动控制前沿研究的95后、00后的硕士、博士、研究员。
这需要硬件、驱动、软件、机器人学研究员的组合。每天陪着那台机器人测信号、走路、采集,捕捉人体动作、采集数据,不断求证算法是否有效,最后才能找到黄金发现。第一次看到MATRIX-3用我们这套直线关节,全身骨架走得那么稳,而且踹它还不倒,我为团队骄傲。
4.客户买的不是一个摆设
甲子光年:你们这次发布的MATRIX-3人形机器人售价58万元起,搭载灵巧手MATRIX HAND的MATRIX-3 PRO售价68万元起。客户花这么多钱,能买到什么?
张海星:海外头部人形机器人展示过的一些线下服务能力,我们基本都能交付。
客户买的不是一个摆设,而是能够在我们的机器人上部署能力。小白用户可以部署爆米花,也有C端客户自己要买,像拍卖会上买艺术品一样。做导览、打爆米花、在商店里给你递东西、在主题乐园里引流,把整个场景的科幻感和AI感一下子拉起来。
所以不同背景的人都能用。不会写代码的人、能开发模型的人,都能买回去用起来。这就是通用的雏形。我们要把价格降到门槛足够低,让普通人也可以买回去玩一玩,哪怕只是陪人聊天,这也是功能。
甲子光年:特斯拉Optimus已经进工厂了。
张海星:我们的MATRIX不太适合一开始就进工厂,更适合先走到人群当中。到年底之前,我们会找更多线下pop up(快闪)场景,让它进入真实人群,看到更多真实用户和它互动的视频。
有了这个平台以后,也可以往下兼容。比如工厂要做专机,有一万台采购量,要柔性机械臂像人一样工作,但又不要长得像人,我们也可以支持。
这就像特斯拉最早发布的车型Roadster,定位是一款超跑。当品牌定位和调性立住以后,后面做其他事情就是降维打击。
甲子光年:你们的Demo更多展示的是操作能力,但大众和资本可能更容易被后空翻、跑马拉松这种动作吸引。你为什么不优先做这些?
张海星:后空翻那些属于偏表演类,或者叫运动奇观。
运动奇观能博眼球,带来短期资本收益,但长期对我们的使命愿景没有太大增益。海外头部公司都没有后空翻。我们做的是探究什么是物理AGI。真正如果人形可以泛化,它应该是什么样子?我们是朝这个目标做。
未来软硬件迭代后,我们也可以看看能不能在稳定操作、能耗可控的前提下,顺便试一下后空翻。但我们绝对不是为了后空翻设计。后空翻对我们来说是可选项,如果这个能力要增加成本,又不增加客户价值,我们可能永远不会支持。
甲子光年:机器人各个细分赛道竞争激烈,你有信心卷过谁?
张海星:我觉得我们和很多友商不构成直接竞争,因为本身不是一个赛道。
比如有的公司应用场景是科研和表演,更像设备公司,有比较强的控制小脑,偏表演、偏巡检。
还有的公司学术气很重,追求顶尖,永远不考虑商业化。他们是在做科研,不是在做产品和产业化。产品不考虑成本,只考虑demo多炫、画面多好。真正线下展也经常垮掉,说明它压根不是产品,而是实验室样机。
我们是在打造“中国擎天柱”,希望把人形机器人服务到更多场景,比如教育、商业、接待、导览、检票等等。
如果说要卷,我们反而是在卷特斯拉。
(注:特斯拉第三代人形机器人预计年中亮相,2026年7~8月启动正式投产)
甲子光年:各家机器人尝试卷数据采集已经有一段时间了,你们近期才宣布数采计划,会不会晚了?
张海星:我觉得不会。首先数据集和数据模态还没有最后收敛。你可能采1000万小时,milestone是1亿小时;我们的milestone可能只需要采800万小时,再加上生成式数据,用更高效的方式就达到目标。
有些公司为了给资本交作业,拼命堆数据,告诉资本你看我数据集上个月100万,这个月1000万,下个月1亿。这数据集我们都不会要,用不了。客户买的是自动化解决方案,不是数据集。
甲子光年:今年具身智能行业有很多大额融资,动辄十亿元融资、百亿元估值。你看到这些消息,会焦虑嘛?
张海星:这是行业现状,的确比较热,我觉得这些都是好事。这样反而能让我们成为“价值洼地”。
我认为,具身智能还没有真正开始融资。未来真正起来,我觉得一轮可能融100亿、200亿人民币,而不是10亿、20亿人民币。
现在还没有找到从数据到智能,再到商业化策略,资本也在找。过去两年资本很热闹,但很多公司从产品和商业化看还早。有的公司账上趴了几十个亿,有的公司准备IPO,但对消费者、用户、客户来说,价值还没有真正发挥出来。
甲子光年:你现在每天最常处理的事情是什么?
张海星:还是人才,不断招人,这是CEO要做的最正确的事情。资本的事情现在做得比较少,因为有专业资本团队帮我做。更多是定义问题、解决问题,产品、工程化、软件、硬件、算法团队都很顶尖,他们比我更专业。
这个行业现在确实各方面关注度都很高,短期大家可能拼SOTA、拼paper、拼模型、拼资本、拼融资多少;但长期还是回到商业基本逻辑。公司的存在价值,就是给客户提供有价值的商品和服务,然后从中获利,并持续往前走,只靠融资是不可持续的。
甲子光年:如果马斯克本人看到这篇对话,你最希望他看到什么?
张海星:其实也不需要隔空对话,我在X上发,他都能看得到,MATRIX-3就算是我的答案。
(封面图来源:矩阵超智)
热门跟贴