打开网易新闻 查看精彩图片

作者:吕鑫燚

出品:具身研习社

具身智能走哪条路才能真正跨过“技术--商品”的鸿沟?

靠技术的极致发展吗?

答案显然不是,历史的长河中有太多前沿技术找不到合适场景承接,久久困于实验室中。例如,激光技术从问世到在通信、医疗、工业加工等领域找到大规模商业化的落脚点,走了20年。技术本身从来不是商业化的充分条件,甚至不是必要条件,很多改变世界的产品,用的都不是当时最顶尖的技术。

靠产品本身足够好吗?

答案或许也不是。用汽车举例,虽然它在 19 世纪初就已经成为商品,但高昂的价格始终让其成为 1% 人才能拥有的稀罕物。真正让汽车走向大众成为实打实商品的,并不是产品所有维度都很完美,而是福特把价格压得足够低。同样的故事在特斯拉 Model 3 身上重演,在 Model 3 之前,搭载完整自动驾驶传感器套件的电动车售价普遍在 80 万元以上,Model 3 将价格拉到 20 万元级别,开始规模化落地后,通过数百万台的出货量积累了海量驾驶数据,才真正让新能源汽车、自动驾驶从少数人的拥有走向了千千万条马路。

所有跨越了 “技术 - 商品” 鸿沟的伟大产品,都遵循同一个底层逻辑:先成为能创造可量化价值的工具,再同步成为承载更前沿技术的载体。换句话说,商业化的进度决定了技术发展的寿命,尽早商业化是加快技术进步和延长应用周期的唯一解。

反观今天的具身智能行业,绝大多数公司都走反了方向。他们先预设了 “通用” 的终局,然后为了这个终局去造机器人。太多人去追求是 “技术上的完美”,但忽略了一个最基本的问题:这个产品能为客户创造什么价值?客户愿意为这个价值付多少钱?

结果就是,今天大部分具身智能机器人,要么是实验室里只能做特定 demo 的 “展品”,要么是售价几十万甚至上百万的 “少数派的玩具”。难以创造可量化的商业价值。这正是具身智能行业最大的危机,如果不能尽快跨过 “技术 - 商品” 的鸿沟,整个行业将重演泡沫破裂。正如灵御智能CEO金戈对具身研习社表示:梦醒之后,只有能创造真实价值的公司才能活下来。

这对企业提出了三重不可偏废的核心要求:它不能只做技术演进的单向主导者,也不能只做真实场景的被动倾听者,更要成为技术与场景耦合点的精准挖掘者。用与当前技术能力精准匹配的产品,切入真正具备规模化刚需的场景,在可盈利的商业闭环中沉淀数据、反哺技术,最终完成从工具到智能的长期进化。

打开网易新闻 查看精彩图片

当我们在讨论 “通用具身智能” 的终局时,一个最朴素也最尖锐的问题被悬置了:具身智能的价值到底该如何体现?企业又该去哪里找到第一个能让产业活下去的价值锚点?

灵御智能给出的答案依旧遵循被反复验证的产业逻辑,先让产品真正用起来,且是符合客户所有真实需求的用起来。换句话说,先走到 “福特 T 型车” 阶段,把机器人从有钱人的玩具和实验室的展品,变成大众买得起、用得好、能赚钱的商品。

打开网易新闻 查看精彩图片

金戈进一步对具身研习社解释道,价值不是抽象概念,是写在客户财务报表上的数字。对于 B 端客户来说,ROI(投资回报率)是唯一的决策标准。如果一个机器人能在 1 年内收回成本,客户会毫不犹豫地购买;如果需要 5 年甚至 10 年才能收回成本,无论技术多么先进,客户都不会买单。

这是具身智能规模化落地的必要前置因素,摸清这条逻辑后,灵御智能将目光投向了服务业。在金戈的判断中,这是一个刚需强烈的场域,服务业容错率相对较高、长尾场景丰富,发生边缘case的试错成本远低于工业制造,这更契合现阶段具身智能的技术边界。

于是围绕场景,灵御智能做了一系列“重构”。

最重要的就是成本,几十万的产品显然不是场景想下单的标的,只有满足ROI的价格才能写在采购单上。而灵御智能给出的价格足够让客户心动“十万起”,但这并不表示灵御智能交付的是一个为了价格让渡质量的产品,也不是在供应商中抠出利润的短视制造方式,而是用算法替代昂贵硬件,造出好用又成本可控的生产力。

灵御智能CTO莫一林说道,“具身智能这个词很有迷惑性,英文直译是赋予智能以身体,听起来意思像智能是第一位的,身体不重要,但其实不是。”

在灵御智能看来,本体有很多值得优化的空间。例如,灵御智能用低减速比的行星减速器,通过监测电机电流变化估算受力,加上高精度标定和全局逆解算法,实现了更低硬件成本。这套方案最终应用时和业内主流采用昂贵硬件的方案效果不相上下,都能达到毫米级的定位精度。再比如,灵御智能利用广角摄像头实现接近人眼的大视野,以此替代昂贵的颈部多自由度关节,在降低成本的同时确保了广域视野覆盖。

啃下成本问题后,灵御智能又围绕技术开始重构。

灵御智能选择端侧保留"小脑"负责基础控制,"大脑"放置在云端,为此,本体也配备了适合云端控制的架构,视觉回传、力控反馈、运动指令下发的全链路。

这种路线能让机器人共享云端无限的算力和知识,快速迭代能力,但它的致命短板就是通讯延迟。如果延迟问题不解决,整个架构就会从 "智能协同" 变成 "盲人骑瞎马",不仅无法完成复杂任务,还会带来严重的安全风险。通过底层通信协议的重构与专网级优化,灵御智能给出的答案是端到端延迟在90毫秒以内,城内公网传输延迟约4毫秒,1000公里跨城传输延迟增加约10毫秒。低延迟的优化让云端大脑不会“活在过去”,而是“实时理解”。

打开网易新闻 查看精彩图片

在数据层,机器人采集的数据实时上云后云端模型持续训练迭代,然后新版本模型再下发到端侧。这条链路中,灵御智能对数据格式、传输协议、模型接口都做了标准化设计,以保证闭环流畅。

至此,极致的成本控制加上好用的智能表现,为灵御铺平了通往真实商业场景的路。目前,灵御TA机器人在京东七鲜超市面向真实零售门店环境,在无踩点演练的情况下,完成商品递送、试吃服务、货架取放等多类任务。此外,灵御也在酒店、物流等场景推进样机验证。意向订单约3亿元,在手订单约1亿元,今年预计出货约1000台左右。

不为技术造产品,而为价值造产品,灵御智能让具身智能先成为能赚钱的商品,先用起来,再在真实场景中沉淀数据、迭代智能,这才是跨越 “技术 - 商品” 鸿沟的正道。毕竟,历史已经无数次告诉我们:最终改变世界的,从来不是最先进的技术,而是最能满足普通人需求的商品。

打开网易新闻 查看精彩图片

本体在真实场景用起来,为灵御创造了更高的护城河,其核心并不是短期的商业化提振,而是长期的数据来源。这是一条别人抄不走的路:别人为了采数据而烧钱,灵御在赚钱的过程中自然沉淀数据。

当前行业的数据采集,本质上是为 demo 服务的。为了在发布会上展示出完美的效果,模型厂商对数据提出了极其苛刻的 “标准化要求”:背景必须干净无干扰,动作必须严格遵循固定SOP,甚至连操作员的动作速度都要被限制,因为动作太快,摄像头和模型就捕捉不到。

莫一林举了一个极具讽刺性的例子:“有人要求叠衣服必须先叠左袖子,再叠右袖子,每一步的时间都要精确到秒。但现实中,谁会这么叠衣服?有人先叠左袖,有人先叠右袖,有人铺平了直接对折。你用这种标准化数据训练出来的机器人,只会叠‘实验室里的衣服’,到了真实场景,连一件皱巴巴的 T 恤都拿不起来。”

这种为了 demo 而生的 “表演型数据”,本质上是在阉割数据的多样性和真实性。它只能训练出 “过拟合的演示机器人”,永远无法具备应对真实世界复杂情况的泛化能力。

灵御智能对数据质量的定义,与整个行业截然相反:数据质量的第一标准,是 “活干得好不好”而不是 “模型好不好用”。

在灵御智能,操作员是以最快速度、最高质量完成真实任务,不会为了适配模型放慢动作,不会为了标准化强制改变工作流程,更不会为了数据好看去摆拍任何一个动作。“如果一个机器人干活比人慢 5 倍,就算它能自主完成,也没有任何商业意义。” 莫一林说,“用慢数据训练出来的模型,永远达不到人类的生产效率。”

这种对效率的极致追求,在 2025 年中关村具身智能机器人应用大赛中得到了验证:灵御机器人的任务完成速度是第二名的 5 倍。

如果说 “活干得好” 是数据的灵魂,那么极致的时空一致性就是数据可复用的基础。当前行业最大的痛点之一,而灵御智能则用两个方式化解了上述问题。

首先是亚微秒级时间双同步。同时记录两个关键时间戳,一个动作流本身的时间,用于训练需要还原真实物理规律的世界模型;另一个是数据到达 CPU 的系统处理时间,用于训练需要实时响应的 VLA 模型。这种双时间戳设计,是行业内独有的。

此外还有,1 毫米级空间绝对精度。所有出厂机器人都经过统一的高精度标定,保证任意两台同型号机器人的关节误差、末端执行器误差都控制在 1 毫米以内。这意味着 A 机器人在上海采集的理货数据,可以直接用于训练 B 机器人在北京的理货能力,彻底实现了数据的跨本体复用。

而每一条数据都诞生于真实场景工作,机器人每天的长程任务都会被完整记录下来。这些数据不是实验室里被剪辑过的单一动作片段,而是包含了从任务开始到结束的完整流程,包含了真实世界中所有的 “不完美”:顾客的走动、货物的杂乱摆放、光线的变化、突发的意外情况。

打开网易新闻 查看精彩图片

这些别人眼中的噪音,恰恰是训练通用具身智能最宝贵的素材。你不可能在干净的实验室里,训练出能在混乱的超市里干活的机器人。就像你不可能在没有车的空地上,训练出能在城市道路上开车的司机。

为了让这些高质量数据真正成为可复用的生产资料,而不是堆积在云盘里的 “数字垃圾”,灵御智能花了近一年时间,打磨了一套覆盖数据 “采集 - 上传 - 清洗 - 标注 - 训练 - 部署” 全生命周期的自动化平台,彻底解决了行业 “数据全链路脱节” 的痛点。

这套平台的核心是 “端云一体、全流程自动化”。提供多源异构数据统一管理,AI辅助清洗标注,把2周的人工标注流程压缩到2小时,训练层支持3行代码启动分布式训练,内置DiffusionPolicy、ACT、π0等主流具身智能算法架构,也支持自研模型注册,部署层支持一键云端推理或本地下载离线运行,原生兼容ROS2生态。

也就是说,灵御智能是在做可直接用于训练的标准化数据服务。 金戈说,“我们的定位是具身智能的基础设施提供商。未来,所有的模型厂商都可以基于我们的数据平台,快速开发自己的具身智能应用,而不用再从零开始搭建数据体系。”

从更长远来看,灵御智能对数据的规划,戳中了当前行业的核心误区:没有通用标准化的数据底座,所有的定制化都是空中楼阁;没有高质量要求的数据,带来的只会是模型的过拟合。

整个行业现在都在奉行 “模型驱动数据” 的逻辑:模型厂商说需要什么样的数据,数据厂商就按要求去采什么样的数据。数据不再是客观记录真实世界的标准,而是变成了适配特定模型的定制化配件。但灵御智能认为,这种逻辑从根本上就是错的。

“好的数据应该是客观的、中立的,它不应该为任何一个特定的模型服务。” 莫一林说,“当一个行业积累了足够多的高质量标准化数据时,数据本身就会成为行业标准。如果我手里有 100 万小时的真实场景数据,那我的数据就是标准。如果你的模型不能用这些数据训练,那不是我的数据有问题,是你的模型有问题。就像今天如果有人说他的图像识别模型不能用 ImageNet 训练,所有人都会觉得是他的模型不行,而不是 ImageNet 不行。”

在灵御智能看来,数据先于模型存在,模型应该去适应数据,而不是反过来。就像当年 ImageNet 的出现,统一了计算机视觉行业的数据标准,才催生了后来的深度学习革命。今天的具身智能行业,也需要一个属于自己的 “ImageNet 时刻”—— 而这,正是灵御正在做的事情。

在具身智能的泡沫期,数据是最容易被包装成故事的概念。灵御智能用自己的实践证明,真正有价值的数据,从来不是烧钱烧出来的,而是在真实的商业场景中干出来的。灵御智能已经建立了 “商业化→数据→模型→更好的商业化” 的正向循环:越多的机器人在真实场景中干活,积累的数据就越多;数据越多,模型的能力就越强;模型越强,机器人的效率就越高,就能拿下更多的商业订单,进而积累更多的数据。

这个循环一旦转起来,就会形成一个自我强化的护城河。

打开网易新闻 查看精彩图片

在灵御智能的基因中,求真占据着举足轻重的位置。这是灵御智能的核心价值观,也是金戈和莫一林 20多年交情沉淀下来的共同信条。

金戈是投资人出身,摸爬滚打了 10多年,亲眼见证了无数泡沫的升起与破灭。"我见过太多公司,靠一个漂亮的 PPT 融到几亿美金,然后烧光钱倒闭。" 金戈说,"2000 年的互联网泡沫,2018 年的自动驾驶泡沫,历史总是在重复。那些只会造梦的公司,最终都会被周期淘汰。"

这段经历让金戈对商业有着近乎苛刻的本质主义认知:"任何生意,最终都要回归到 ' 能不能赚钱 ' 这个最朴素的问题上。不能创造真实价值的东西,无论故事讲得多么好听,最终都会烟消云散。"

而 CTO 莫一林,则是典型的技术实干派。他毕业于卡内基梅隆大学,亲身经历了 2007 年 DARPA 城市挑战赛的狂热。"当时 CMU 拿了冠军,所有人都觉得自动驾驶 5 年内就能普及。" 莫一林说,"结果 18 年过去了,我们还在为 L2 + 的稳定性头疼。

20多年,从校园结识,在魔兽世界征战到各自分别再重聚,一个见过太多商业的虚妄,一个深知技术的艰难。两种视角的结合,让灵御从一开始就避开了行业的大多数陷阱:他们不追风口,不炒概念,不做只能看不能用的 demo,只专注于解决最本质的问题,如何造出一台能赚钱的机器人。

打开网易新闻 查看精彩图片

但这份务实并不代表,灵御智能的未来只能从一台台机器人手中寻找。"人类是梦想驱动的,我们做具身智能,当然也是因为相信它能改变世界。" 金戈说,"我们同样期待通用智能到来的那一天,期待机器人能走进千家万户,解放人类的体力劳动。但我们更清楚,在终局到来之前,必须先活下来。"

"造梦和脚踏实地并不冲突。" 金戈表示"我们不能去讲自己都不相信的故事"。

这份务实和对抵达终局极其清晰的路径,也让灵御智能收获了更多回响。时隔两个月,灵御智能又宣布完成近亿元人民币天使+轮融资。由福田资本领投,力合创投、金沙江联合资本、复利多、楹辉创投、华仓资本跟投,老股东英诺基金、天鹰资本持续加注。本轮融资将主要用于灵御TA机器人产品迭代、供应链与交付能力建设、以及高质量真机数据和云端协同系统的持续研发。

资本的加持和商业化的落地,各路都在用真金白银 buy in 灵御智能。

我们无法预判未来的模样,也不知道拐点会在哪个不经意的瞬间悄然将至。但透过灵御智能的路线我们能看到,与其思考终局长什么样,不如先动身用起来,去主动把终局变成现实。