戳破具身智能行业的「气泡」。
作者丨高景辉
编辑丨马晓宁
最近,我们收到了一封奇特的发布会邀请函:打开包装映入眼帘的,居然是一张气泡膜卡片,令人摸不着头脑。
可当我们看到邀请函里的内容,才恍然大悟。原来主办方自变量机器人的意思,是想在4月21日即将举办的发布会上,戳破具身智能行业的“气泡”。
的确,具身智能行业的很多现象,就像气泡一样,一戳就破。有多位投资人向我们表示,一些在外人看来很惊艳的效果,实际上并没有太多“含金量”,问几个问题便知深浅。
所以,这种“气泡”的本质,是一种认知差。具身智能本就是交叉学科,自身的复杂性决定了其难以用日常生活经验理解,因此业内人士和普罗大众对于具身智能的认知存在着巨大偏差。
而戳破气泡,就是要打破这种认知差,还原行业最真实的底色。同时也能让大家明白,各类语境下所谓的“拐点时刻”,并没有那么容易到来。
但批判从来不是目的。相较于戳破行业气泡,重建一套客观公允的行业评价标准,传递真实、可信的产业信号,才是这场祛魅行动真正的内核。
01
热潮之下,细数具身智能行业的四大「气泡」
任何新兴行业,都会经历从喧嚣到理性的过程,具身智能也不例外。当下具身行业里,就普遍存在着四类认知偏差:
评分气泡:打榜成绩亮眼≠模型能力强大
各类评测榜单向来是行业技术水平的直观参考,但目前具身行业尚未形成统一、权威的评测标准,榜单数据的参考价值存在一定局限性。
首先,评测体系缺乏统一规范,榜单公信力有待提升。不同机构、厂商推出的榜单,评分维度、考核指标差异较大,甚至部分整机厂商自建评测榜单,种种原因共同导致行业内出现多家企业均宣称“排名第一”的现象,难以横向对比企业的真实技术实力。
其次,部分榜单不同的硬件却用同一套“考卷”,公平性存在优化空间。某位头部具身公司创始人与AI科技评论谈及打榜时提到:“其实我们打这个榜单是吃亏的,因为我们是基于自己的硬件来测试,反而PI这种没有自己硬件的会沾光,因为他们数采和训练模型用的硬件和平台的一样。”
还有一个问题是,预设任务无法体现开放环境中的自主推理与泛化能力,过去的 Benchmark 多为标准化考题,机器人按预设流程执行即可得分,无法验证核心能力。因此单看打榜成绩,很难对模型能力得出客观评价。
不过,这种情况已出现了了转机。目前,行业渐渐开始发力无预设、动态化、开放环境评测:引入隐藏任务、随机干扰项、非结构化场景,不再考核“复刻动作”,而是聚焦机器人的自主推理、环境泛化与临场决策能力。
此外,新一代 Benchmark 开始绑定真实硬件形态,区分不同机身、末端执行器、传感器配置,同时引入多机并行测试,验证量产一致性。随着行业各方的努力,“评分气泡”有望变得越来越小。
技能气泡:会表演≠能干活
人形机器人的动作演示常被用于技术展示,但舞台演示能力与产业实际作业能力,分属两种不同的技术维度,二者不能混为一谈。
舞台演示侧重肢体运动的流畅性与观赏性,以复刻预设动作为核心,考验的是运动控制能力(Locomotion),或者叫具身“小脑”能力;在工业、民用场景下实际作业,考验的则是末端操作(Manipulation),与模型能力息息相关。
从技术门槛来看,末端操作的实现难度更高。这不仅需要高适配性、高精度的末端执行硬件作为基础,还需要多模态感知、亚毫米级的空间定位和力控、长程推理能力,这才是机器人“干活”所需要的核心能力。
样品气泡:视频“能打”≠现实可靠
当前具身行业内,各种DEMO演示视频被广泛传播,被用作展现技术最新进展。这些DEMO虽然能让人眼前一亮,但往往无法反映真实的可靠性。
一方面,演示视频存在样本选择性,难以反映真实运行成功率。实验室环境下的流畅演示,往往经过多次调试与场景优化,部分视频素材为筛选后的成功案例,辅以剪辑优化,无法全面体现机器人在连续运行中的失败率、容错率等核心指标。
另一方面,单台样机的可行性,无法代表规模化量产的稳定性。单体样机在理想环境中可完成指定任务,但当产品量产规模扩大、运行周期延长、应用场景趋于复杂时,硬件损耗、系统适配、环境干扰等潜在问题会逐步显现。
商业气泡:订单繁荣≠真实生产力
随着具身智能企业加速量产,各种订单信息层出不穷,但考虑到订单数据的统计口径与应用场景存在差异,不能将其直接等同于产业生产力的规模化落地。
首先,订单统计标准不统一。行业尚未明确区分意向订单与确定性订单,“小订” 与 “大订” 的履约约束力差异显著;同时,小型人形机器人与大型人形机器人在量产难度、技术壁垒上差距较大,同质化的订单统计方式,容易模糊产品的实际落地价值。
其次,订单来源结构多元,市场化采购占比有限。部分公开订单来源于关联合作、政府示范项目及短期试点,这类合作以场景验证、技术展示为主要目的,并非基于企业生产刚需的市场化采购,可持续商业化价值有待验证。
再者,订单应用场景集中,生产力属性尚未凸显。即便是市场化采购订单,目前也多集中于科研教育、数据采集、展会展演等领域,主要服务于技术研发与品牌推广,真正落地于工业生产、商业服务等生产力场景的规模化应用,仍处于初步探索阶段。
客观而言,上述行业气泡,是具身智能作为新兴赛道发展初期的阶段性现象,无需过度苛责,甚至可以说尽早暴露问题其实是一件好事,意味着行业玩家们可以及时矫正、调转船头。
02
干扰消散,行业真正的核心信号已然浮现
如果测试分数、舞台表演、视频花活、纸面订单都不具有足够的说服力,那么标志着“拐点时刻”到来的真实信号到底是什么呢?
结合头部具身智能企业的动作来看,这样的“真信号”至少需要达到三个标准。
标准其一:大脑能力突破,完成从预编程到自主推理的进化。
很长一段时间里,具身智能行业的重心都在本体和“小脑”,以运动控制能力著称的宇树科技,便凭借动作灵活的机器人多次登上春晚。但一个明显的信号是,即便是硬件领域的佼佼者,也开始焦虑于“大脑”的缺失,比如去年宇树开始积极寻找大脑供应商,补齐模型能力。
资本市场的偏好,也侧面反映了大脑能力的重要性。当前国内估值最高的几家具身企业,如银河通用、星海图、自变量机器人,都把模型能力放在了首要位置。自变量创始人王潜更曾公开表示“AI是第一性的,硬件是第二性的”,要由AI定义硬件。
而为了突破模型能力,制约模型发展的数据瓶颈更是成为了行业新的攻坚高地,多家头部企业已喊出构建“百万小时数据集”的目标,一座座数据工厂接连在全国范围内建立。具身数据的“scaling laws”被彻底验证、模型自主推理能力产生飞跃的那一天,便是具身智能的拐点时刻。
标准其二:在真实场景中持续稳定运行,完成从“可演示”到“可依赖”的进化。
当前具身智能行业内外,最受关注的话题莫过于“落地”。“机器人究竟能帮我们干哪些活?”是对每个具身企业的灵魂拷问,机器人可依赖的程度,也决定了我们离拐点时刻还有多远。
在商业领域,餐饮、文旅成为最火爆的场景,制作咖啡、甜品的机器人已在各地部署。至于商超、酒店等场景,相关厂商也在通过迭代产品,提供更智能化的服务。
在工业领域,3C电子、汽车零部件、新能源产线正成为核落地场景,机器人承担装配、检测、巡检等高危、高重复、高精度工作,部分厂商的产品已经过POC验证。
家庭场景落地进程相对较慢,不过轻量型陪伴机器狗、家用小型机器人价格已下探到万元级,同时也有厂商尝试与家庭服务平台合作,探寻机器人在家庭落地的新渠道。
的确,这些真实环境中的落地还不够完美,但至少已经走出了实验室,迎接商业的考验。有了“从0到1”,接下来便是从1到100的进化。
标准其三:跑通ROI闭环,完成从“能干活”到“能赚钱”的进化。
“算账”,是具身智能赛道最现实的一道关卡,也是最难的一场考验。虽然目前在工业、商业场景中尚未普遍实现稳定的正向ROI,但所有玩家都在朝这个方向死磕,让机器人赚回自己的成本。
当投资人开始询问机器人的“单机日均产值”而非“算力参数”时,行业才真正进入了深水区。
03
戳破气泡,是为了让具身智能走得更远
回到开头,自变量这封别具巧思的邀请函,不仅是邀请我们参加发布会,更是邀请整个行业回归理性、落到地面。他们想传递的,不是质疑,而是一种长期主义的清醒。
对行业而言,厘清认知偏差,是最好的自律。
告别榜单内卷、演示内卷、营销内卷,把精力放回技术研发与场景落地。透明的认知,会倒逼行业形成良性竞争,让真正有实力的企业,被看见、被认可。
对市场而言,降低非理性预期,是最好的包容。
具身智能是一条长坡厚雪的赛道,没有一蹴而就的飞跃,没有立竿见影的落地。正视技术的难度,尊重发展的规律,多一点耐心,少一点浮躁,就是对行业最大的支持。
厘清认知气泡,方能看清发展本质。告别片面化的成果展示,聚焦技术与落地的双重深耕,具身智能行业的高质量发展,藏在每一次场景落地的实践、每一项技术的稳步突破之中。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
热门跟贴