打开网易新闻 查看精彩图片

2026年的具身智能赛道,气氛和两年前已经完全不同。近期,在北京举行的人形机器人与具身智能标准化年会上,智元机器人联合创始人彭志辉的判断颇为明确:“国内人形机器人整机企业已经超过140家,发布产品达330款。行业已经从实验室炫技、Demo展示,正式进入工程化竞争、场景化竞争的下半场。”这句话,其实可以看作是对整个行业阶段的重新定性。过去几年,人形机器人最容易出圈的是视频。谁走路更像人,谁跑得更稳,谁能翻跟头、飞檐走壁,谁就能在社交媒体上引发转发与融资热潮。那是“展示态”的时代。但在这次演讲中,彭志辉反复强调一个词——“部署态”。“2024年到2025年初,大家还在比拼谁家的机器人走路更直、更自然。现在,本体灵活性已经达到实用化阶段,接下来要比的,是谁的干活能力更强。不仅在国内比,还要跟海外头部企业比,看谁能在‘部署态’真正落地。”当一个技术行业开始从“能不能动”转向“能不能干活”,它就从概念期走向工程期。对于投资者而言,这是风险结构变化的信号。如果说此前是算法与融资的竞赛,那么现在比拼的是系统工程能力。彭志辉开场就坦率表示:“整个具身智能行业目前还在共同探索,没有任何一家企业可以独自给出正确答案。我们要在正确的时间做正确的事情。”这句话听上去谦逊,但背后其实隐含判断——技术窗口已经打开,单点突破的时代结束,系统整合的时代开始。为什么是现在?彭志辉给出的答案并不复杂:“根本原因是AI技术的发展带来的突破。”他把过去十年的AI演进拆解成三段:深度学习带来的感知智能,大模型带来的认知智能,以及当下由AI与机器人结合驱动的物理智慧世界。“我们过去几年完成了数字AI的规模化,现在要挑战的是物理AI的规模化,从数字世界走向物理世界。”这是一条更长、更难的路。在数字世界,“代码跑错了可以重启”;但在物理世界,“有物理成本,有失效成本”。机器人摔倒一次,可能就是硬件损伤与现金流消耗。因此,他提出一个工程范式——“一体三智”。所谓“一体”,指的是机器人本体。“本体是AI在真实世界的约束接口。”彭志辉强调,“真实物理世界充满摩擦、碰撞、形变、误差、老化、噪声。本体设计不是简单的硬件堆叠,而是可靠性工程、供应链工程和安全工程的综合体。”对资本市场来说,这段话等于把赛道逻辑从“算法故事”拉回“制造业能力”。他把核心零部件拆得非常清晰:“当前最重要的两个部件,一个是关节,决定运动能力上限;一个是灵巧手,决定操作能力上限。这两个部件占据整机成本的绝大部分。”这几乎是一张成本结构图。

早期行业里,执行器技术路径多种多样,液压、直线驱动、高速高刚度方案并存。

但“从2023年开始,方案开始收敛到新型关节。”他甚至做了一个类比:“人形机器人的硬件技术和新能源车非常类似,核心是所谓的‘三电系统’。”
不同之处在于复杂度。汽车电机工况相对简单,而机器人“需要高动态、高频的正反转,全身少则数十个、多则上百个自由度。”不同关节之间的规格差异极大,手指和大腿的扭矩需求完全不在一个量级。
“如果为每个关节单独设计规格,那会是量产的灾难。”彭志辉直言。
智元的解法,是系列化与标准化。“我们把五大系列、近10款产品,全部规整到8款系列化关节设计上。这8款关节用在所有产品上,能够满足所有部位需求。这就是标准化带来的收益。”
当一家企业开始讲“系列化规划”而不是单款产品性能时,它已经在为规模化做准备。
灵巧手的挑战则更复杂。“一方面要把10到20个自由度塞进比人手还小的空间,另一方面对高维感知能力要求极高,尤其是触觉。”他说。
彭志辉给出一个非常直观的判断:“接近80%人类做得好、传统自动化做不好的工序,都和触觉强相关。”装配工人凭“咔嚓一声”判断是否成功,这种经验如何数字化,是行业瓶颈。
“视觉是先有标准传感器,再有标准数据格式,再有标准数据集,最后才是算法爆发。”彭志辉表示,“但触觉传感器的技术路径还没有收敛,也没有标准。”
这段话对投资者而言意味着什么?意味着触觉一旦标准化,将带来新的技术与成本拐点。
如果“一体”是躯体,“三智”就是灵魂。
运动智能近两年突飞猛进。彭志辉总结原因:“一是算法范式从模型驱动转向强化学习;二是仿真框架普及,使大规模并行训练成为可能;三是关节技术收敛,降低控制难度。”综合收益之下,动态性能大幅提升。
但运动只是底座。彭志辉指出,“交互智能提供情绪价值,作业智能提供生产力价值。”
交互智能大量复用大模型成果,但“未来的机器人不能只听懂语音指令,它要看到你的情绪、听懂你的语气,甚至预判你的意图。”在他看来,情绪价值“比很多人想象得大”,这也是春晚机器人表演能引发广泛讨论的原因。
真正决定商业价值的,是作业智能。
为了降低训练门槛,智元推出“灵创平台”。“我们把动作训练流程简化到像发抖音一样,上传一段视频,平台自动完成关键点检测、动作迁移、训练和部署。”彭志辉说,这意味着行业要从科研人员的“开发态”,走向大众参与的“创作态”,最终实现低成本“部署态”。
部署,是贯穿整场演讲的核心词汇。
谈到场景选择时,他提出“沿途下蛋”的策略。“我们把任务维度分为场景复杂度和任务复杂度。场景复杂度是一种约束,不体现价值;任务复杂度才能体现价值。”
自动驾驶是在复杂环境下做简单任务,而人形机器人当前更适合“在简单场景做复杂任务”。例如结构化工厂环境里的高自由度操作。
“最终,自动驾驶和具身智能都会走向复杂环境做复杂任务。”彭志辉说,“但现在,我们要选择现实可行的路径。”这是一种阶段性务实,而非终局浪漫。
在演讲后段,彭志给出一个形象比喻,把人形路线的逻辑讲得非常清楚。“Computer Use是数字世界的人形接口,而人形机器人就是物理世界的通用接口。”
理论上,让AI直接生成底层代码效率更高,但现实世界的软件生态是为鼠标键盘设计的,因此通过界面操作反而成为最通用路径。
同样,现实世界的门把手高度、楼梯尺寸、工具形态,都是为人类身体设计的。“既然环境是围绕人类构建的,那么AI要实现最大化的通用性和兼容性,终端形态大概率也要长得像人。”彭志说,“它未必效率最高,但一定兼容性最强。”
这句话,其实回答了资本市场最常见的疑问:为什么一定要做人形?因为它是接口。
最后,他把行业中局定性为“基础设施,而非单点产品”。“物理AI规模化的关键在于数据闭环、可靠性工程以及可运维能力的标准化。”彭志说,“我们既要跑得快,也要跑得稳。”
当一家机器人公司开始反复强调数据治理、评测体系、运维经验与标准共建时,它的视角已经不再是产品发布,而是产业体系。
对于投资者而言,2026年可能并不是爆发元年,而是分化元年。
展示态结束,部署态开始;情绪溢价退潮,工程能力定价上升。关节良率、系列化规划、真实场景运行小时数、数据回流效率,这些指标将逐渐取代舞台动作难度,成为估值核心。
从数字AI走向物理AI,是一次更漫长的产业迁移。彭志辉在结尾说:“标准化不仅是技术规范,更是产业落地的加速器。”
当行业开始谈标准,意味着它正在准备规模。而规模,从来不是喊出来的,是一颗关节、一只灵巧手、一条供应链、一套运维体系,慢慢堆出来的。