打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

编辑:前沿在线 编辑部

就在最近上海张江科学会堂,具身智能圈迎来了一场颠覆性的发布会。

打开网易新闻 查看精彩图片

没有卷人形机器人的关节灵活度,没有刷新具身大模型的 SOTA 榜单,觅蜂科技(Maniformer)用一套MEgo系列新品,直接掀了行业的底层逻辑桌子 —— 彻底打破物理 AI 数据采集对机器人本体的百年依赖,宣告具身智能数据生产正式进入「无本体、全场景、规模化」的新纪元。

打开网易新闻 查看精彩图片

这场以「蜂行天下,数驱智能」为主题的发布会,不止是一次硬件新品秀。从MEgo 无本体采集硬件、MEgo Engine 一站式数据治理平台,到联合数十家机构启动的蜂巢数据共创行动,再与阿里云、百度云、京东云等头部企业完成战略签约,觅蜂科技用一套组合拳,给困在「数据荒漠」里的具身智能行业,递上了一把破局的钥匙。

先划3 个行业级核心结论,看完你就懂这场发布会为什么震动了整个圈子:

打开网易新闻 查看精彩图片

  1. 釜底抽薪式破局:彻底推翻「机器人本体绑定数据采集」的传统范式,从「机器定点采数据」变成「人走到哪,数据采到哪」,采集效率直接翻 2-3 倍,成本砍半,场景覆盖边界无限拓宽。

  2. 打通行业最大死穴:与精灵 G2 Air原生同构设计,从根源解决了 UMI 数据「采了用不了」的行业顽疾,采集数据可无缝部署到机器人真机,彻底打通「采集 - 训练 - 落地」全链路。

  3. 改写赛道竞争格局:从单一的数据服务商,升级为具身智能时代的「数据水电厂」,用平台化生态整合全行业产能,2026 年千万小时、2030 年百亿小时的产能规划,直接给行业定下了新标尺。

打开网易新闻 查看精彩图片

做具身智能的都懂,我们被「本体绑定」坑了多少年?

在拆解 MEgo 的颠覆性之前,我们必须先回答一个灵魂问题:喊了这么多年「具身智能爆发」,为什么它始终困在实验室里,走不进工厂、家庭、商超这些真实场景?

答案藏在一组扎心的数字里:当前全球具身智能行业的高质量真机交互数据总量,不足头部大语言模型训练语料的两万分之一

GPT-5 的训练语料规模达到 100 万亿 tokens,折算下来相当于 100 亿小时的语音时长;而整个具身智能行业,能拿得出手的高质量训练数据,满打满算只有50万小时

打开网易新闻 查看精彩图片

这道数量级的天堑,就是横亘在具身智能面前的最大鸿沟。而锁住数据产能的,正是行业沿袭多年的「本体绑定式采集」逻辑。

长期以来,物理 AI 的数据采集,被牢牢锁死在「定制化机械臂+专用传感器 +固定工位」的实体机器人本体上,这套模式给行业挖了四个绕不开的深坑,层层锁死了产业规模化落地的可能。

打开网易新闻 查看精彩图片

第一个坑场景边界被本体焊死。传统采集方案不仅设备成本动辄数十万、部署周期长达数月,更受限于机器人的活动半径与本体形态,根本覆盖不了家庭、户外、商超这些真实世界里复杂、动态、非结构化的场景。机器人走不到的地方,就是数据采集的天花板。

打开网易新闻 查看精彩图片

第二个坑,供需两端彻底错配供给侧,全国落地的数采中心手握硬件与场景资源,却大多陷入「为了运营而运营」的怪圈,重复采集无效数据,空有产能却无法实现商业变现,大量机器人长期处于闲置状态

打开网易新闻 查看精彩图片

需求侧,大模型公司、机器人厂商已经开启数据军备竞赛,普遍开出百万小时级的年采购订单,却找不到能稳定、规模化交付高质量数据的服务商,算法迭代被数据供给严重拖慢

打开网易新闻 查看精彩图片

第三个坑,标准缺失,数据孤岛遍地。各家数据生产方的采集格式、标注规范、坐标系定义完全自成体系,算法团队拿到不同来源的数据,要花大量时间做格式转换、标准统一,协作成本高到离谱。

更致命的是,没有统一标准就没有统一的质量评判体系,「垃圾数据进,垃圾模型出」成了行业常态,很多优秀算法甚至因为劣质数据被提前判了死刑。

打开网易新闻 查看精彩图片

第四个坑采了白采,用不了。传统异构采集方案产出的数据,与机器人真机运行的数据分布存在天然差异,算法团队用采集的数据训完模型,部署到真机上完全无法复现效果。这也是整个行业最头疼的灵魂拷问:我们采了这么多数据,为什么机器人还是学不会干活?

打开网易新闻 查看精彩图片

「算法再强,无数据则无源;愿景再美,无基建则空悬。」姚卯青在发布会上的这句话,道破了整个行业的核心困境。当大语言模型已经冲进认知智能的深水区,具身智能却还在为基础的训练数据发愁。

所有人都清楚:不打破本体对数据采集的枷锁,具身智能永远只能是实验室里的 Demo。

打开网易新闻 查看精彩图片

毫米级精度 + 亚毫秒同步,MEgo 到底解决了哪些行业顽疾?

觅蜂科技给出的破局答案,是「无本体数采」这套釜底抽薪式的方案,核心是彻底重构了物理 AI 数据生产的底层逻辑 ——从「以机器人本体为核心」,彻底转向「以人为核心」

MEgo 的命名里就藏着这套逻辑的全部内涵:

打开网易新闻 查看精彩图片

  • ME:以人为核心,把人作为数据采集的主体,人类在真实场景中的每一次操作、每一个交互,都能被精准转化为高质量训练数据;

  • go:随行、轻量、无界,可随身携带的采集系统,打破空间与场景限制,真正实现「走到哪、采到哪」;

  • M+Ego:融合觅蜂全链路数据治理能力与第一视角伴随式采集,实现从采集、重建、质检、标注到交付的全流程闭环。

这套逻辑不是空中楼阁,而是靠两款硬核硬件 + 一个全流程平台,精准命中了行业的每一个痛点。

打开网易新闻 查看精彩图片

MEgo Gripper:把行业轨迹精度,从厘米级拉到 1 毫米级

这款仅480g轻量化多模态采集夹爪,一出手就刷新了行业的精度天花板。

打开网易新闻 查看精彩图片

做 UMI 采集的从业者都懂,轨迹还原精度就是数据的生命线。此前行业通用方案的轨迹还原误差普遍在数厘米级,只能复刻粗略的动作,根本满足不了拧螺丝、插拔物件这类精细操作的采集需求。

打开网易新闻 查看精彩图片

MEgo Gripper直接把轨迹还原精度做到了1 毫米,人类手部的每一个细微操作,都能被完整记录、1:1 复刻到机器人本体上。

打开网易新闻 查看精彩图片

更关键的是它实现了亚毫秒级全局无线时间同步具身智能数据的核心,是视觉、触觉、姿态、力觉等多模态数据的时空对齐——如果不同传感器的数据不在同一个时间维度精准匹配,模型学到的就是不具备因果性的错误信息。

打开网易新闻 查看精彩图片

MEgo Gripper通过硬件级同步触发与全局曝光技术,不仅实现了多传感器的亚毫秒级对齐,还消除了高速移动中的画面果冻效应,完整复刻物理交互的每一个细节。

打开网易新闻 查看精彩图片

同时,它搭载200° 鱼眼镜头与三维触觉阵列,全通道支持 1080P 60fps 高清视频流,搭配 Wi-Fi 6 高速传输,可输出视觉、深度、IMU、运动轨迹、多维触觉在内的全维度交互数据,还能与MEgo View原生协同作业。

MEgo View:300° 全景 + 腕部特写,环境与细节终于能兼顾了

这款行业首创的全场景空间感知采集终端,直接解决了行业长期以来「环境全景与操作细节无法兼顾」的痛点。

打开网易新闻 查看精彩图片

它采用了「超 300° 全景感知 + 腕部交互特写」双视角采集方案:头部 5 个相机实现 300° 超广域环境覆盖,完整捕捉操作所处的全局环境信息;腕部相机精准聚焦手部操作的细节特写,不放过任何一个精细动作。

打开网易新闻 查看精彩图片

全通道 7 个摄像头均支持全局曝光与 1080P 60fps 高清视频流,搭配车规级九轴 IMU,实现了全域空间信息的完整采集。

打开网易新闻 查看精彩图片

MEgo Gripper一样,它也实现了亚毫秒级无线时间同步与硬件级精准触发,彻底解决了多视角数据时空难以统一的行业顽疾。

打开网易新闻 查看精彩图片

再加上全无线、电池快换的轻量化设计,哪怕是工业产线、户外作业这类复杂工况,也能灵活部署,真正实现「随行即采」。

打开网易新闻 查看精彩图片

而最让行业振奋的,是MEgo 全系列产品与智元精灵 G2 Air 的原生同构设计

这一设计直接击穿了无本体采集最大的行业壁垒:采集数据与真机数据不同源,导致「采了用不了」。

原生同构从源头保障了 UMI 采集数据与真机数据的同源共生,基于 MEgo 采集的数据训练的模型,可无缝对接部署到精灵 G2 Air 上,彻底打通了「采集 - 训练 - 部署」的全链路让无本体采集的数据,真正能转化为机器人的落地能力。

打开网易新闻 查看精彩图片

MEgo Engine:一键打通从原始数据到训练数据集的全流程

如果说硬件终端解决了「数据从哪里来」的问题,MEgo Engine一站式数据治理平台,就解决了「数据到哪里去」的核心难题。

打开网易新闻 查看精彩图片

传统数据采集行业,普遍存在「采治脱节」的顽疾:采集终端只负责输出原始数据,后续的对齐、清洗、标注、质检,全靠需求方自己完成,效率极低,数据浪费严重。而MEgo Engine实现了全流程自动化处理,形成了完整闭环:

  • 预处理环节:多源数据时间对齐、智能筛选,解决数据不同步、无效数据冗余的痛点;

  • 空间感知环节:6D 轨迹重建、人体关键点重建与三维环境重建,1:1 还原真实操作的空间逻辑与动作细节;

  • 质量评估环节:多本体回放、智能评分模型,实现数据质量自动化校验,确保符合工业级训练标准;

  • 智能标注环节:把传统人工标注效率提升 10 倍以上,实现数据治理的自动化、标准化、规模化。

更重要的是,平台可直接对接MEgo 全系列采集终端采集数据一键上传即可完成全流程治理,直接输出可用于模型训练的标准化数据集。

打开网易新闻 查看精彩图片

哪怕是没有专业数据治理团队的初创企业,也能快速拿到开箱即用的高质量训练数据,彻底拉低了具身智能算法研发的门槛。

打开网易新闻 查看精彩图片

不止卖硬件卖数据,觅蜂在下一盘多大的棋?

如果只把 MEgo 的发布看作一次硬件新品上市,显然低估了觅蜂的野心。

这家从智元机器人体系中孵化出来的企业,从一开始的定位就不是「数据供应商」,而是全球领先的一站式物理 AI 数据服务平台—— 它要做的,是具身智能时代的「国家电网」,让高质量物理 AI 数据像水电一样即取即用。

打开网易新闻 查看精彩图片

这套平台化的定位,首先体现在它清晰可落地的商业与产能规划上。

打开网易新闻 查看精彩图片

商业模式上,觅蜂坚定走 2B 定制化服务路线,核心客群覆盖大模型公司、具身智能海内外大厂、初创企业。

不同于行业内简单的「按小时卖数据」,它提供的是需求对接、任务设计、标准化采集、全流程治理到交付验收的全链条闭环服务,可满足客户从宏观场景分类到精细化操作的全维度定制需求。

定价体系上,它也给行业建立了清晰的标尺:当前国内真机数据的主流交易价格为500-1000 元 / 小时,而无本体数据凭借更高的采集效率、更低的成本未来价格将收敛至真机数据的 1/2-1/3,大幅降低行业的数据获取成本。

打开网易新闻 查看精彩图片

同时,它明确划分了数据使用权与所有权两类交易模式,针对采购所有权的客户,会完成严格的资产转移与本地数据销毁,从根本上保障客户权益。

产能规划上,觅蜂给出了明确的路线图:2026 年实现千万小时级数据产能,其中 60%-70% 来自无本体采集;2030 年实现百亿小时级数据产能,达到当前大语言模型训练语料的供给规模。

打开网易新闻 查看精彩图片

要实现这个看似激进的目标,靠的不是重资产的自营扩张,而是「自营中试 + 加盟代工 + 规范化众包」的轻资产模式 。

姚卯青在采访中直言,觅蜂自身仅保留一两百人的核心团队,负责0-1 的样板打造、流程规范与标准制定,相当于一个「中试基地」;而规模化产能,将通过加盟代工厂的模式实现 —— 合作伙伴负责固定资产投资与团队组建,觅蜂提供全流程的标准、培训、订单与质量管理体系,打造「数据代工厂」网络。

打开网易新闻 查看精彩图片

而针对行业热议的众包模式,觅蜂也给出了清晰的规划:未来参考美团骑手的「培训 + 管理」体系,在严格的标准规范与隐私保护机制下,推动众包采集落地。这意味着,未来每一个普通人,都有可能成为具身智能数据的生产者,彻底打开数据产能的天花板。

比产能布局更具行业影响力的,是同步启动的蜂巢数据共创行动

这项由觅蜂联合上电科、国家数据标委会、工信部赛迪研究院共同发起的行业行动,吸引了数十家海内外机构成为首批响应单位,核心目标直指行业三大痛点打破数据孤岛、统一数据标准、链接全球供需。

蜂巢行动设计了五大核心落地动作

打开网易新闻 查看精彩图片

1、共享资源,接入全球供需网络、共享海量订单;

2、共建标准,牵头建立行业统一的数据标准与规范;

3、生态合作,优先与成员伙伴共建软硬件与数据生态;

4、行业发声,联合发布行业白皮书与技术报告;

5、产业推动,共享技术、资本、市场资源,共同推动产业规模化爆发。

它的本质,是把行业内分散的采集产能、场景资源、技术能力整合起来,形成一个开放、高效、标准化的物理 AI 数据流通网络

姚卯青用一个很直白的类比解释了它的定位:觅蜂就像「滴滴」,既有自营车队,也有大量三方运力,核心是搭建供需两端的桥梁,让供给方的资源高效变现,让需求方快速拿到高质量数据。

打开网易新闻 查看精彩图片

而针对行业最关心的「觅蜂与智元的关系」问题,姚卯青也给出了明确答案:二者完全市场化解耦,智元与其他客户一样,需要通过市场化采购的方式才能从觅蜂获取数据,不存在任何特殊权限。

这一设计,从根本上保障了觅蜂作为第三方数据平台的独立性,哪怕是与智元处于竞争关系的机器人厂商,也可以放心合作。

打开网易新闻 查看精彩图片

路线之争终局落定:具身智能的未来,到底需要什么样的数据?

MEgo 的发布,也把行业长期争论的核心问题推到了台前:真机采集、无本体采集、仿真数据到底哪条路线才是具身智能的终局?

打开网易新闻 查看精彩图片

在发布会的圆桌论坛上,来自数据平台、模型厂商、仿真企业、科研机构的行业大咖,给出了一致的答案:三者绝非对立替代关系,而是互补共生关系,共同构成了具身智能的数据金字塔

打开网易新闻 查看精彩图片

在这个金字塔中,塔尖是真机采集数据。它的质量最高、针对性最强是具身智能落地真实场景的刚需

要让机器人在工业产线、家庭场景中实现 100% 的任务成功率,必须依赖与落地机器人同构、同场景的数据,保障数据分布与真机运行完全匹配,这是无本体与仿真数据无法替代的。

打开网易新闻 查看精彩图片

金字塔的中间层,是本次发布会引爆的无本体采集数据

它的核心优势是采集效率高、场景覆盖广、成本低,采集效率是真机的 2-3 倍,未来成本仅为真机的 1/3。它最核心的价值,是为模型预训练、表征学习、世界模型训练提供海量、多样化的基础数据,解决行业基础数据供给不足的核心痛点,让模型先学会人类操作的通用逻辑与物理世界的基本规律。

打开网易新闻 查看精彩图片

而金字塔的底座,是仿真数据

它的核心价值是数据增广、反事实场景构建与模型规模化评测。但姚卯青也直言,仿真数据有天然的局限:仿真场景中的资产建模,需要建模师纯手工打造,一个杯子的建模成本甚至比真实杯子还高,真实世界里的海量物体与场景,根本无法通过仿真完全覆盖

同时,仿真数据永远无法 1:1 复刻真实世界的物理规律与随机变量,只能作为真实数据的补充,无法成为主流。

这场路线之争的背后,是整个行业对具身智能发展阶段的清晰认知。业内已经形成共识:2026 年是具身智能数据元年,当前的具身智能,仍处于大语言模型当年的Bert时代,距离GPT级的智能涌现,仍需要 3-4 年的时间。而决定这个时间能否提前的核心变量,就是数据供给的规模化、标准化进程。

打开网易新闻 查看精彩图片

姚卯青在发布会上给出了明确预判:2026 年底,全产业有效数据量级将突破千万小时;到 2030 年,行业需要百亿小时级高质量数据,才能真正迎来具身智能的「GPT-3 时刻」,实现通用能力的涌现。而这个过程中,行业的核心竞争,将从「本体军备竞赛」,全面转向「数据军备竞赛」。

这也解释了,为什么智元要分拆觅蜂,全力布局数据基建赛道。当整个行业都在扎堆卷机器人本体、卷算法的时候,智元已经看清了终局:具身智能的天花板,从来不是本体的灵巧度,而是数据的供给能力

打开网易新闻 查看精彩图片

就像大语言模型时代,最终最先稳定盈利的,是英伟达这样卖铲子的算力基建厂商;具身智能时代,最先实现商业闭环、掌握行业话语权的,一定是数据基建的服务商

打开网易新闻 查看精彩图片

具身智能的基建革命,元年的第一声枪响

这场发布会,最值得关注的,从来不是一款新硬件,而是整个具身智能行业的底层逻辑变了。

之前所有人都在卷「机器人本体有多厉害」,但没人解决「机器人怎么学会干活」的底层问题 ——没有海量、高质量、全场景的数据,再灵巧的本体,也只是个没有灵魂的铁壳子。

觅蜂 MEgo的出现,不是给这个赛道添了一个新玩家,而是给整个行业修了一条高速公路。

它彻底打破了机器人本体对数据采集的枷锁,让数据采集从实验室的固定工位,走向了真实世界的每一个角落

它用标准化的平台与生态,终结了行业的数据孤岛乱象;它让「高质量数据像水电一样即取即用」,从一句口号,变成了触手可及的现实。

2026 年被称为具身智能数据元年,而这场发布会,就是元年的第一声枪响。当数据荒漠迎来甘霖,困在实验室里的具身智能,终于要走进真实的人间烟火了。

打开网易新闻 查看精彩图片
前沿动态前沿大会前沿人物
打开网易新闻 查看精彩图片
前沿动态前沿大会前沿人物

「在看」,给前前加鸡腿