作者:吕鑫燚
出品:具身研习社
一个冷知识,2025 年末,有投资人开始专门请博士“外援”,一起去看具身智能项目。
原因并不复杂。
过去一年,具身智能在投融资端经历了一轮高度拥挤的繁荣,催生出大量to VC 的项目,通过视频剪辑、场景设定与工程调参,尽可能地“假装机器人很聪明”,以此换取估值的快速抬升。早期产业的粗放发展,一定程度上遮蔽了非技术出身投资人的判断视野,也直接催生了如今更谨慎、也更理性的资本态度。
但并非所有资方都需要“补课”。在这波浪潮中,有一类玩家反而具备天然优势。互联网大厂,尤其是那些在基础模型领域已经深耕多年的公司。它们“从模型中来”,自然能够精准感知相关领域的具身模型能力是否真实存在,是否具备跨场景的可扩展性,是否可能成为长期技术基座。
换句话说,如果沿着互联网大厂的投资路径去看具身智能的list,往往能避开大量噪音。
纵观2025年的具身智能投融资事件,大厂的表现显得格外克制。出手频率并不高,也不再延续过往对新兴技术“买买买”的惯性风格,但它们并没有缺席。
以近日完成十亿元级A++ 轮融资的自变量机器人为例,其新一轮融资由字节跳动战略投资部、红杉中国领投,多家顶级投资机构跟投。至此,自变量完成了美团、阿里云、字节三家互联网大厂的联合押注,成为国内首个同时获得三家大厂支持的具身智能公司。
问题随之而来,一向克制的大厂,为什么会在同一家公司上形成共识?(偷偷开群聊了)
共同押注有两条线,表层原因是自变量作为全球最早深耕端到端VLA 具身大模型的公司之一,真正让机器人在真实世界中具备“用脑思考”的能力,加速了具身智能从演示走向生产力。
而更深层的原因在于,当自变量选择以具身模型为核心驱动,并主动以开源方式释放技术价值时,它所代表的,不只是某一家公司的成长路径,而是一种有可能演化为行业通用技术基座的方向选择。
可见,投资投的并不是一家公司,而是一张通往未来的船票。
具身智能浪潮本质上源于AI技术的跃迁。作为大模型时代的推动者,互联网大厂对这一点有着更为清醒的判断。因此,它们真正关注的,并不是机器人是否“四肢发达”,而是机器人是否拥有决定应用上限的“头脑”。
自变量机器人就是一家典型的“重脑”型具身智能公司。其创始人兼CEO王潜对物理世界基础模型的投入坚信不疑,他认为“具身智能大模型并非简单的AI 应用,而是在形成一个并列于虚拟世界基础模型的、面向物理世界的基础模型。”
而大厂此番集体选择,看重的就是自变量重投入并已经掌握的,在真实物理世界进行交互的聪明“大脑”。
作为全球第一批ALL INVLA架构的具身智能企业,自变量坚持硬件-数据-模型的闭环迭代,是国内最早规模化扩展真机数据采集、搭建了模型驱动为主的数据管线。
此外,其WALL-A具身大模型,首创性地将VLA架构与世界模型进行了深度融合,构建出一套原生多模态输入输出的系统范式。WALL-A不仅能够处理视觉、语言、动作等多模态信息。更重要的是,它率先实现了具身多模态“思维链”。
通过世界模型进行时空状态预测,协同视觉因果推理理解环境反馈,并借助可学习的记忆机制内化物理常识,WALL-A在非结构化环境中的零样本泛化能力得到了显著提升。这意味着,机器人不再依赖大量预设规则,而是能够在真实环境中进行判断、调整与反思。
WALL-A的能力并非存在于实验室或视频剪辑中。
前不久,自变量机器人成功完成全球首个基于物理世界基础模型,跨越室外与室内场景的移动操作。这是一次近乎“残酷”的验证,模型需要直面真实场景中,风力、光线、意外情况等不可预设的情况。其机器人“量子一号”在外卖配送与纸箱回收任务中,在户外强风干扰与遮挡完成拆解与投递,还能够自主进入楼宇、使用电梯完成室内配送。
例如,当外卖袋被大风吹落并被桌布遮挡时,机器人仍能自主感知并调整策略;当纸箱因尺寸偏差投递失败,它能够即时反思并重新尝试,整个过程无需人工干预,模型自主完成长序列任务的自主闭环。而当机器人进入楼宇中,还会根据实时电梯抵达情况,判断先坐哪个电梯,并操控楼梯按钮。
在真实场景中出现错误并及时改正,这些都是“大脑决定上限”的真实体现。透过自变量大脑侧的落地可以看出,当模型自主游刃有余处理物理世界中不可预设的变化,具身智能机器人才有了成为生产力的可能性,撕下“温室的花朵”标签。
在取得模型突破之后,自变量并没有选择将技术牢牢封装在公司内部,而是做出了一个在当下并不“讨巧”的决定:开源。
2025年9月,自变量正式开源WALL-OSS。WALL-OSS采用了创新性的“共享注意力 + 专家分流(FFN)”设计;在训练方式上,首创“先离散、后连续、再联合”的多阶段训练范式;通过统一的跨层级思维链,模型能够在单一可微分框架内无缝切换高层决策与底层执行。
WALL-OSS在泛化能力、长程操作任务表现、因果推理、空间理解与反思能力等方面,都展现出极强的工程可用性。
于自变量而言,开源这并非某种象征性的企业形象建设,而是一次体系完整、态度明确的技术开放。
自变量开放了预训练模型权重、完整训练代码和数据集接口,还提供了详尽的部署文档。有效助力研发人员和中小企业验证模型能力、跑通落地闭环,完成技术的价值释放。而且值得一提的是,开发者仅需RTX 4090 级别的消费级显卡,即可完成从训练到推理部署的完整流程,大幅降低了具身模型的使用门槛。
正如自变量联合创始人兼CTO王昊在《硅谷 101 播客》中所言:“我一直都觉得开源是非常重要的事情,开源意味着我们可以站在巨人的肩膀上继续前进。我们可以基于已有成果做更多的改进,社区开发者的反馈也会帮助到开源的公司,开源公司可以从中吸取到经验,然后把这个技术路线思考得更加深入。
一般的高校、或者一些小型的企业,他们可能没有能力去做基础模型,但是如果能够使用这些基础开源模型,他们就可以去做应用,把它用到各个方向,丰富整个生态,这也是一个非常重要的事情。”
这种理念,也体现在自变量对社区的长期投入中。
无论是在魔搭社区ModelScope、Lumina具身智能社区的技术分享,还是接入 Hugging Face的LeRobot平台,自变量都在持续与开发者对话。还官方社交平台账号,为开发者答疑解惑。自变量的角色早已超越了单纯的“技术提供者”。其姿态绝非高高在上的“技术展示者”,而是躬身入局的“生态共建者”。
这是一条以开放的技术资源为纽带,以持续运营为桥梁,串联起高校、企业、开发者等不同主体,共同推动具身智能技术从实验室走向真实世界的道路。终点是走向具身模型落地后应用侧的全面开花。
从基础模型的性能持续突破,到以开源模式撬动生态价值的乘数效应,头部科技大厂与产业资本密集涌入,齐聚自变量股东阵营,这一行业动态,释放出极为明确的信号:围绕具身智能核心“大脑”的技术竞赛,将在2026年全面进入白热化阶段。
企业的生存法则已发生根本转变。那些仅靠实验室Demo博眼球、以概念故事撬动融资的玩家,终将在商业化的现实考验中黯然离场;唯有在真实物理世界中完成技术验证、实现商业闭环的硬核企业,才能站稳脚跟。
自变量的产业进展,正体现了这一点:一方面,得益于软硬件全栈自研,其硬件与具身模型实现了深度适配,整机成本显著下降,为规模化量产与商业化普及奠定了基础;另一方面,自变量已逐步进入工业制造、物流、养老等多个高价值场景,完成技术与商业化的闭环。
例如,在工业制造领域,其机器人已承担汽车装配与检测等复杂任务,提升生产柔性;在物流零售侧,通过与四川省智能感算中心合作,打造覆盖商品识别到自动运输的全流程智能化方案;在民生服务端,其智能养老项目成功入选工信部与民政部试点名单,正以具身智能填补现实养老资源缺口。
当行业从“讲故事”走向“交答卷”,具身智能的分水岭已经出现。
资本最终会发现,真正值得长期押注的,并不是某一次炫目的展示,而是那些愿意把“大脑”做到极致,并让技术成为公共基座的公司。而这,或许正是大厂们在同一家公司身上达成共识的根本原因。
2026年,这场围绕具身智能的竞争,不仅是技术实力与资本厚度的较量,更是生态格局与发展理念的比拼。坚持长期主义、深耕实战落地、拥抱开放协同的企业,终将成为这场竞赛的最终赢家。而随着领军企业的持续发力,具身智能技术也将真正融入千行百业,打破实验室与真实世界的壁垒,释放出全新的生产力价值,为产业升级与社会发展注入强劲动力。
热门跟贴