专访灵御智能：商业化是先手棋 ROI 是第一准则数据是终极护城河|云端|大模型|机器人|灵御智能|算法|金戈

作者：吕鑫燚

出品：具身研习社

具身智能走哪条路才能真正跨过“技术--商品”的鸿沟？

靠技术的极致发展吗？

答案显然不是，历史的长河中有太多前沿技术找不到合适场景承接，久久困于实验室中。例如，激光技术从问世到在通信、医疗、工业加工等领域找到大规模商业化的落脚点，走了20年。技术本身从来不是商业化的充分条件，甚至不是必要条件，很多改变世界的产品，用的都不是当时最顶尖的技术。

靠产品本身足够好吗？

答案或许也不是。用汽车举例，虽然它在 19 世纪初就已经成为商品，但高昂的价格始终让其成为 1% 人才能拥有的稀罕物。真正让汽车走向大众成为实打实商品的，并不是产品所有维度都很完美，而是福特把价格压得足够低。同样的故事在特斯拉 Model 3 身上重演，在 Model 3 之前，搭载完整自动驾驶传感器套件的电动车售价普遍在 80 万元以上，Model 3 将价格拉到 20 万元级别，开始规模化落地后，通过数百万台的出货量积累了海量驾驶数据，才真正让新能源汽车、自动驾驶从少数人的拥有走向了千千万条马路。

所有跨越了 “技术 - 商品” 鸿沟的伟大产品，都遵循同一个底层逻辑：先成为能创造可量化价值的工具，再同步成为承载更前沿技术的载体。换句话说，商业化的进度决定了技术发展的寿命，尽早商业化是加快技术进步和延长应用周期的唯一解。

反观今天的具身智能行业，绝大多数公司都走反了方向。他们先预设了 “通用” 的终局，然后为了这个终局去造机器人。太多人去追求是 “技术上的完美”，但忽略了一个最基本的问题：这个产品能为客户创造什么价值？客户愿意为这个价值付多少钱？

结果就是，今天大部分具身智能机器人，要么是实验室里只能做特定 demo 的 “展品”，要么是售价几十万甚至上百万的 “少数派的玩具”。难以创造可量化的商业价值。这正是具身智能行业最大的危机，如果不能尽快跨过 “技术 - 商品” 的鸿沟，整个行业将重演泡沫破裂。正如灵御智能CEO金戈对具身研习社表示：梦醒之后，只有能创造真实价值的公司才能活下来。

这对企业提出了三重不可偏废的核心要求：它不能只做技术演进的单向主导者，也不能只做真实场景的被动倾听者，更要成为技术与场景耦合点的精准挖掘者。用与当前技术能力精准匹配的产品，切入真正具备规模化刚需的场景，在可盈利的商业闭环中沉淀数据、反哺技术，最终完成从工具到智能的长期进化。

当我们在讨论 “通用具身智能” 的终局时，一个最朴素也最尖锐的问题被悬置了：具身智能的价值到底该如何体现？企业又该去哪里找到第一个能让产业活下去的价值锚点？

灵御智能给出的答案依旧遵循被反复验证的产业逻辑，先让产品真正用起来，且是符合客户所有真实需求的用起来。换句话说，先走到 “福特 T 型车” 阶段，把机器人从有钱人的玩具和实验室的展品，变成大众买得起、用得好、能赚钱的商品。

金戈进一步对具身研习社解释道，价值不是抽象概念，是写在客户财务报表上的数字。对于 B 端客户来说，ROI（投资回报率）是唯一的决策标准。如果一个机器人能在 1 年内收回成本，客户会毫不犹豫地购买；如果需要 5 年甚至 10 年才能收回成本，无论技术多么先进，客户都不会买单。

这是具身智能规模化落地的必要前置因素，摸清这条逻辑后，灵御智能将目光投向了服务业。在金戈的判断中，这是一个刚需强烈的场域，服务业容错率相对较高、长尾场景丰富，发生边缘case的试错成本远低于工业制造，这更契合现阶段具身智能的技术边界。

于是围绕场景，灵御智能做了一系列“重构”。

最重要的就是成本，几十万的产品显然不是场景想下单的标的，只有满足ROI的价格才能写在采购单上。而灵御智能给出的价格足够让客户心动“十万起”，但这并不表示灵御智能交付的是一个为了价格让渡质量的产品，也不是在供应商中抠出利润的短视制造方式，而是用算法替代昂贵硬件，造出好用又成本可控的生产力。

灵御智能CTO莫一林说道，“具身智能这个词很有迷惑性，英文直译是赋予智能以身体，听起来意思像智能是第一位的，身体不重要，但其实不是。”

在灵御智能看来，本体有很多值得优化的空间。例如，灵御智能用低减速比的行星减速器，通过监测电机电流变化估算受力，加上高精度标定和全局逆解算法，实现了更低硬件成本。这套方案最终应用时和业内主流采用昂贵硬件的方案效果不相上下，都能达到毫米级的定位精度。再比如，灵御智能利用广角摄像头实现接近人眼的大视野，以此替代昂贵的颈部多自由度关节，在降低成本的同时确保了广域视野覆盖。

啃下成本问题后，灵御智能又围绕技术开始重构。

灵御智能选择端侧保留"小脑"负责基础控制，"大脑"放置在云端，为此，本体也配备了适合云端控制的架构，视觉回传、力控反馈、运动指令下发的全链路。

这种路线能让机器人共享云端无限的算力和知识，快速迭代能力，但它的致命短板就是通讯延迟。如果延迟问题不解决，整个架构就会从 "智能协同" 变成 "盲人骑瞎马"，不仅无法完成复杂任务，还会带来严重的安全风险。通过底层通信协议的重构与专网级优化，灵御智能给出的答案是端到端延迟在90毫秒以内，城内公网传输延迟约4毫秒，1000公里跨城传输延迟增加约10毫秒。低延迟的优化让云端大脑不会“活在过去”，而是“实时理解”。

在数据层，机器人采集的数据实时上云后云端模型持续训练迭代，然后新版本模型再下发到端侧。这条链路中，灵御智能对数据格式、传输协议、模型接口都做了标准化设计，以保证闭环流畅。

至此，极致的成本控制加上好用的智能表现，为灵御铺平了通往真实商业场景的路。目前，灵御TA机器人在京东七鲜超市面向真实零售门店环境，在无踩点演练的情况下，完成商品递送、试吃服务、货架取放等多类任务。此外，灵御也在酒店、物流等场景推进样机验证。意向订单约3亿元，在手订单约1亿元，今年预计出货约1000台左右。

不为技术造产品，而为价值造产品，灵御智能让具身智能先成为能赚钱的商品，先用起来，再在真实场景中沉淀数据、迭代智能，这才是跨越 “技术 - 商品” 鸿沟的正道。毕竟，历史已经无数次告诉我们：最终改变世界的，从来不是最先进的技术，而是最能满足普通人需求的商品。

本体在真实场景用起来，为灵御创造了更高的护城河，其核心并不是短期的商业化提振，而是长期的数据来源。这是一条别人抄不走的路：别人为了采数据而烧钱，灵御在赚钱的过程中自然沉淀数据。

当前行业的数据采集，本质上是为 demo 服务的。为了在发布会上展示出完美的效果，模型厂商对数据提出了极其苛刻的 “标准化要求”：背景必须干净无干扰，动作必须严格遵循固定SOP，甚至连操作员的动作速度都要被限制，因为动作太快，摄像头和模型就捕捉不到。

莫一林举了一个极具讽刺性的例子：“有人要求叠衣服必须先叠左袖子，再叠右袖子，每一步的时间都要精确到秒。但现实中，谁会这么叠衣服？有人先叠左袖，有人先叠右袖，有人铺平了直接对折。你用这种标准化数据训练出来的机器人，只会叠‘实验室里的衣服’，到了真实场景，连一件皱巴巴的 T 恤都拿不起来。”

这种为了 demo 而生的 “表演型数据”，本质上是在阉割数据的多样性和真实性。它只能训练出 “过拟合的演示机器人”，永远无法具备应对真实世界复杂情况的泛化能力。

灵御智能对数据质量的定义，与整个行业截然相反：数据质量的第一标准，是 “活干得好不好”而不是 “模型好不好用”。

在灵御智能，操作员是以最快速度、最高质量完成真实任务，不会为了适配模型放慢动作，不会为了标准化强制改变工作流程，更不会为了数据好看去摆拍任何一个动作。“如果一个机器人干活比人慢 5 倍，就算它能自主完成，也没有任何商业意义。” 莫一林说，“用慢数据训练出来的模型，永远达不到人类的生产效率。”

这种对效率的极致追求，在 2025 年中关村具身智能机器人应用大赛中得到了验证：灵御机器人的任务完成速度是第二名的 5 倍。

如果说 “活干得好” 是数据的灵魂，那么极致的时空一致性就是数据可复用的基础。当前行业最大的痛点之一，而灵御智能则用两个方式化解了上述问题。

首先是亚微秒级时间双同步。同时记录两个关键时间戳，一个动作流本身的时间，用于训练需要还原真实物理规律的世界模型；另一个是数据到达 CPU 的系统处理时间，用于训练需要实时响应的 VLA 模型。这种双时间戳设计，是行业内独有的。

此外还有，1 毫米级空间绝对精度。所有出厂机器人都经过统一的高精度标定，保证任意两台同型号机器人的关节误差、末端执行器误差都控制在 1 毫米以内。这意味着 A 机器人在上海采集的理货数据，可以直接用于训练 B 机器人在北京的理货能力，彻底实现了数据的跨本体复用。

而每一条数据都诞生于真实场景工作，机器人每天的长程任务都会被完整记录下来。这些数据不是实验室里被剪辑过的单一动作片段，而是包含了从任务开始到结束的完整流程，包含了真实世界中所有的 “不完美”：顾客的走动、货物的杂乱摆放、光线的变化、突发的意外情况。

这些别人眼中的噪音，恰恰是训练通用具身智能最宝贵的素材。你不可能在干净的实验室里，训练出能在混乱的超市里干活的机器人。就像你不可能在没有车的空地上，训练出能在城市道路上开车的司机。

为了让这些高质量数据真正成为可复用的生产资料，而不是堆积在云盘里的 “数字垃圾”，灵御智能花了近一年时间，打磨了一套覆盖数据 “采集 - 上传 - 清洗 - 标注 - 训练 - 部署” 全生命周期的自动化平台，彻底解决了行业 “数据全链路脱节” 的痛点。

这套平台的核心是 “端云一体、全流程自动化”。提供多源异构数据统一管理，AI辅助清洗标注，把2周的人工标注流程压缩到2小时，训练层支持3行代码启动分布式训练，内置DiffusionPolicy、ACT、π0等主流具身智能算法架构，也支持自研模型注册，部署层支持一键云端推理或本地下载离线运行，原生兼容ROS2生态。

也就是说，灵御智能是在做可直接用于训练的标准化数据服务。金戈说，“我们的定位是具身智能的基础设施提供商。未来，所有的模型厂商都可以基于我们的数据平台，快速开发自己的具身智能应用，而不用再从零开始搭建数据体系。”

从更长远来看，灵御智能对数据的规划，戳中了当前行业的核心误区：没有通用标准化的数据底座，所有的定制化都是空中楼阁；没有高质量要求的数据，带来的只会是模型的过拟合。

整个行业现在都在奉行 “模型驱动数据” 的逻辑：模型厂商说需要什么样的数据，数据厂商就按要求去采什么样的数据。数据不再是客观记录真实世界的标准，而是变成了适配特定模型的定制化配件。但灵御智能认为，这种逻辑从根本上就是错的。

“好的数据应该是客观的、中立的，它不应该为任何一个特定的模型服务。” 莫一林说，“当一个行业积累了足够多的高质量标准化数据时，数据本身就会成为行业标准。如果我手里有 100 万小时的真实场景数据，那我的数据就是标准。如果你的模型不能用这些数据训练，那不是我的数据有问题，是你的模型有问题。就像今天如果有人说他的图像识别模型不能用 ImageNet 训练，所有人都会觉得是他的模型不行，而不是 ImageNet 不行。”

在灵御智能看来，数据先于模型存在，模型应该去适应数据，而不是反过来。就像当年 ImageNet 的出现，统一了计算机视觉行业的数据标准，才催生了后来的深度学习革命。今天的具身智能行业，也需要一个属于自己的 “ImageNet 时刻”—— 而这，正是灵御正在做的事情。

在具身智能的泡沫期，数据是最容易被包装成故事的概念。灵御智能用自己的实践证明，真正有价值的数据，从来不是烧钱烧出来的，而是在真实的商业场景中干出来的。灵御智能已经建立了 “商业化→数据→模型→更好的商业化” 的正向循环：越多的机器人在真实场景中干活，积累的数据就越多；数据越多，模型的能力就越强；模型越强，机器人的效率就越高，就能拿下更多的商业订单，进而积累更多的数据。

这个循环一旦转起来，就会形成一个自我强化的护城河。

在灵御智能的基因中，求真占据着举足轻重的位置。这是灵御智能的核心价值观，也是金戈和莫一林 20多年交情沉淀下来的共同信条。

金戈是投资人出身，摸爬滚打了 10多年，亲眼见证了无数泡沫的升起与破灭。"我见过太多公司，靠一个漂亮的 PPT 融到几亿美金，然后烧光钱倒闭。" 金戈说，"2000 年的互联网泡沫，2018 年的自动驾驶泡沫，历史总是在重复。那些只会造梦的公司，最终都会被周期淘汰。"

这段经历让金戈对商业有着近乎苛刻的本质主义认知："任何生意，最终都要回归到 ' 能不能赚钱 ' 这个最朴素的问题上。不能创造真实价值的东西，无论故事讲得多么好听，最终都会烟消云散。"

而 CTO 莫一林，则是典型的技术实干派。他毕业于卡内基梅隆大学，亲身经历了 2007 年 DARPA 城市挑战赛的狂热。"当时 CMU 拿了冠军，所有人都觉得自动驾驶 5 年内就能普及。" 莫一林说，"结果 18 年过去了，我们还在为 L2 + 的稳定性头疼。

20多年，从校园结识，在魔兽世界征战到各自分别再重聚，一个见过太多商业的虚妄，一个深知技术的艰难。两种视角的结合，让灵御从一开始就避开了行业的大多数陷阱：他们不追风口，不炒概念，不做只能看不能用的 demo，只专注于解决最本质的问题，如何造出一台能赚钱的机器人。

但这份务实并不代表，灵御智能的未来只能从一台台机器人手中寻找。"人类是梦想驱动的，我们做具身智能，当然也是因为相信它能改变世界。" 金戈说，"我们同样期待通用智能到来的那一天，期待机器人能走进千家万户，解放人类的体力劳动。但我们更清楚，在终局到来之前，必须先活下来。"

"造梦和脚踏实地并不冲突。" 金戈表示"我们不能去讲自己都不相信的故事"。

这份务实和对抵达终局极其清晰的路径，也让灵御智能收获了更多回响。时隔两个月，灵御智能又宣布完成近亿元人民币天使+轮融资。由福田资本领投，力合创投、金沙江联合资本、复利多、楹辉创投、华仓资本跟投，老股东英诺基金、天鹰资本持续加注。本轮融资将主要用于灵御TA机器人产品迭代、供应链与交付能力建设、以及高质量真机数据和云端协同系统的持续研发。

资本的加持和商业化的落地，各路都在用真金白银 buy in 灵御智能。

我们无法预判未来的模样，也不知道拐点会在哪个不经意的瞬间悄然将至。但透过灵御智能的路线我们能看到，与其思考终局长什么样，不如先动身用起来，去主动把终局变成现实。