一凡 发自 凹非寺
量子位 | 公众号 QbitAI
2026,什么最火爆?
具身智能和世界模型,今年合计已吸金超300亿元,前者是物理AI落地的产品,后者是物理AI的“训练场”,它们共同组成了物理AI的一体两面。
然而,物理AI始终是融入真实世界的AI,尽管世界模型代表的仿真路线,以较低成本为物理AI供应了海量数据,但其中的Sim2Real鸿沟,又让行业长期头疼。如果转而依靠真实数据,成本又太高,很难上量。
在这种矛盾之下,行业开始转向虚实融合的方式,为物理AI供应大规模的数据。就在近日,这条路线上涌现出了业界首个数据基座平台
具身智能的火,照亮数据的难
开年短短2个月,具身智能赛道融资超20起,平均3天不到就有一笔热钱涌入,行业累计融资金额已超200亿元
海量资本注入,推动行业技术进步,让机器人开始从舞台走向工厂,准备进入千家万户。
但在实际应用场景中,大量任务都面临很多非结构化的场景,这需要机器人模型有很强的泛化能力。而模型强大的泛化能力,又来自海量的高质量数据。
高质量数据的缺失,恰恰又是具身智能正在面临的最大痛点之一。因为具身智能所代表的物理AI不像LLM,后者具有天然的“数据矿”,可以学习移动互联网海量的文本和图片数据。而物理AI只有这些数据还不够,必须要有带物理反馈和交互的多模态数据,当前行业可供给的数据量和通用具身智能需求量相比,差距可能在一千万倍以上。具身智能没有数据,就像火箭失去了燃料,无法带领我们前往新的星空。
针对数据问题,从大的层面来看业内目前主要有三个解决方案:
- 采集真实数据:数据质量高,采集成本极高,效率极低
- 虚拟仿真合成:成本低,生产效率高,但存在Sim2Real鸿沟
- 提取互联网视频:数据存量大,但利用难度高,且缺失关键的物理模态
三大技术路线各有利弊,所以行业近期开始倾向于虚实融合路线,采用取长补短的方式,给物理AI提供数据基座,首个基座平台近日在浙江德清正式发布。
首个物理AI数据基座平台,虚实融合打破数据瓶颈
无问智科近日在德清召开了一场群星闪耀的发布会。地平线创始人、无问智科首席顾问余凯现场致辞,地平线、星动纪元、灵心巧手、云深处和地瓜机器人等50多家不同细分领域的头部玩家,纷纷出席见证。
在一众大咖的见证下,无问智科CEO刘盛翔正式发布行业首个物理AI数据基座平台“无垠”这是行业首次提出“数据基座”概念,什么是数据基座?无问智科认为,数据基座核心应该有三项能力
- 高质量数据体系:大量真实场景采集的数据和大规模高保真的合成数据
- 高价值场景生态:依托顶尖仿真技术实现大规模场景泛化与模拟,联合生态伙伴实现大规模高价值仿真场景复刻与大量可落地真实场景覆盖
- Real2Sim2Real全闭环工具链:实现从数据采集、模型训练、场景测评到产业落地的端到端打通
三项核心能力,分别从四个层面满足了具身智能玩家的各种需求:
- 数据层:通过多源异构采集与多模态合成,解决数据稀缺与质量难题,实现高质量数据供给
- 场景层:从训练场1:1复刻,到德清全域、长三角高价值真实终端场景,实现虚实结合全覆盖,构建大量高价值场景
- 工具链层:以数据采集范式、跨本体数据迁移、自动化标注、生成式仿真、智能化评测等核心技术打造Real2Sim2Real全链路闭环工具链,打通从数据采集到测试验证的每一个环节
- 应用层:最终实现“训练—测评—落地”持续优化闭环
无垠基座平台作为业界首个数据基座,赢得了现场超140多位业界嘉宾的认可,第一个原因是无垠基座平台解决了行业缺失高质量数据的困境。当前无垠基座平台已积累了超1000TB规模的数据,这让无问智科有了十足的底气。无问智科CTO于春磊博士在发布会上正式宣布将开源1万小时高质量数据,以解决行业燃眉之急
为什么无问智科能生产出如此海量的数据?核心是背后独特的虚实融合技术路线。
先来看真实数据采集,无垠基座平台采集数据的方式很全面,包括VR遥操、外骨骼遥操作、UMI、动作捕捉、Human-centric数据、EGO视角等,这是行业目前最多模态的数据采集方式。
同时,为了解决当前行业数采范式不收敛、数据不通用、企业闭门造车的问题,无垠基座平台提供一套跨本体数据迁移的转换工具链,实现了不同机器人本体对同一套数据的通用能力。
由于真实数据采集,需要大量的采集设备、工程师、场地和物料,因此仅靠真实数据,难以实现海量的数据规模。因此无问智科通过其领先的高保真生成式仿真技术,在发布会上与地平线联合发布了EmbodiedGen数字表亲和数字远亲功能。能够把真实场景1:1还原到虚拟世界,并且可以在布局、材质、光照、交互物品上进行任意改变,实现了指数级放大真实数据的能力。
例如下图,只需要一张真实桌子的照片和几个提示词,就可以泛化出近乎无限的桌子。
当前,无垠基座平台已拥有百万级的simready资产——可实现毫米级物理交互的仿真物体,已覆盖全场景、全品类、全模态。这种领先的仿真技术,既能作为数据采集的补充方式,同时还能够支持后续的多维度评测。
虚实融合获取海量数据,是无垠基座平台的亮点,但这还不是全部。
打通训练到落地,从数据荒漠到数据生态
无垠基座平台得到行业广泛认可的第二个原因,是其为行业提供了核心支柱价值。无垠基座平台不仅给具身智能玩家们供应了海量的好数据,还让整个产业能把数据用得好,帮助具身智能玩家们打通了训练、评测和落地的整个链路
首先在训练环节,无垠基座平台提供的高质量数据不仅规模大,而且涵盖了丰富的应用场景,包括物流仓储、家庭服务、酒店文旅、工业制造、办公服务和商业零售等六大核心作业场景,覆盖了家庭商业工业等多种应用场景,能够支撑具身智能大脑模型实现更强的泛化性。
然后是测评,这是具身智能大脑进化的关键环节。就像学生需要通过考试,来测试自己的学业水平并进行查漏补缺,具身智能大脑模型,也需要进行专业系统的“考试”。对此,无垠基座平台提供了具身仿真评测框架,策略模型同时支持仿真模拟环境和世界模型环境评测,可以自己定义任务,进行规则判别,也能通过大模型进行开放式评测。
借助无垠基座平台的评测框架,当具身智能玩家改进了模型算法,或者采用了新的数据集后,就能清楚地感知到模型有没有进步、问题出现在哪里、能不能解决落地需求。
无论模型测评表现多好,最终检验技术实力的,还是商业化落地。无垠基座平台,基于生态合作伙伴开放的高价值场景,能够帮助具身智能企业打造标杆案例场景,真正展示出机器人“干活”的价值,让行业迈出巨大一步。在发布会上星动纪元政企事业部部长邵剑飞展示了其利用无垠基座平台数据打造的具身智能通用物流场景解决方案
同台演讲的中国优选运营CEO林杰则分享了具身智能在新零售场景的落地,他在现场宣布第一家中国优选未来新零售旗舰门店落地长三角(德清)具身智能数据采集训练场
从最源头的数据采集到模型训练,再到商业化落地,无垠基座平台和具身智能玩家一起,打通了AI走进物理世界的全过程。也正是因为无垠基座平台提供了这样支柱性的价值,迅速吸引了众多优秀的具身智能企业入驻。目前无问智科已拥有五十多家生态合作企业,这是目前行业最豪华的生态阵容,充分展现了数据基座这一独特生态位的魅力。
其中最值得关注的是,无问智科和地平线、地瓜机器人的深度战略合作。地平线创始人、无问智科首席顾问余凯在发布会现场表示,人工智能的三次浪潮:算法驱动、算力驱动、数据驱动,数据的厚度决定了物理AI的高度,地平线将为行业提供具身智能大脑基础模型,地瓜机器人提供芯片算力软硬底座与开发平台,“地平线+地瓜机器人+无问智科”将形成算力+算法+数据完整基座能力,彻底打通研发到量产的最后一公里,助力具身智能迎来ChatGPT时刻。
能够成为率先闯出机器人数据荒漠,并在其中培育出繁荣生态的基础设施企业,无问智科靠的是创始团队对物理AI的深刻洞察。
物理AI老兵创业,第三方数据赋能全行业
无问智科创立于2022年11月,其创始人兼CEO刘盛翔中国最早的自动驾驶开拓者之一。他在2013年入局物理AI,在百度Apollo搭建起中国首个自动驾驶数据与测试验证体系、参与了中国首部自动驾驶测试法规的起草、主导了多项国家数据与测试验证核心关键技术攻关。业内人士经常开玩笑称呼他为“中国自动驾驶数据与测试验证第一人”。
百度的经历,让刘盛翔意识到数据对自动驾驶的重要性。所以,当ChatGPT横空出世把AI技术推向大模型时代,进而掀起物理AI的浪潮时,他洞察到了物理AI的痛点——缺乏高质量数据。
在刘盛翔当时看来,物理AI的数据成本高、效率低、使用难,行业很多玩家既缺少数据,又不知道怎么用数据。于是,为了解决行业痛点,刘盛翔和前百度自动驾驶感知技术专家于春磊博士携手创业,专注于解决物理AI数据问题。
开启创业2个月后,无问智科迎来第一位合作伙伴:地平线
地平线是自动驾驶头部玩家,创始人兼CEO余凯博士早年和刘盛翔在百度一起共事。据悉刘盛翔创业后,与余凯进行了三小时的长谈,这场对话打动了余凯,他成为了无问智科的首席顾问。在余凯的推动下,地平线不仅和无问智科达成了深度合作,还成为了无问智科的首位投资人,并在后续轮次持续加码
许多曾经的自动驾驶明星,也在这段时期纷纷下场,入局具身智能,一时间受到热捧,市场展现出对自动驾驶玩家转向的认可与信任。毕竟两个赛道技术有交集,供应链高度重合,自动驾驶玩家的经验与沉淀,能在具身智能领域复用
但两个赛道也存在着很多差异。比如自动驾驶有低成本、高效率采集数据的方法,因此行业重点可以放在如何处理和使用数据上。而具身智能目前仍然没有标准化地数据采集方案,没有大规模采集数据的方法,没有生产和使用高质量数据的工具链。因此,一个专业的第三方数据基础设施,对整个行业的意义非凡,价值深远。
物理AI,这是黄仁勋在2025年亲手点燃的烽火,在今年已成燎原之势。一众大厂纷纷入局,这意味着“AI的下一波浪潮是物理AI”已成为共识。
新的科技浪潮呼唤新的基建。正如移动互联网需要云计算,LLM催化数据中心繁荣,具身智能也需要数据基座,加速AI走向真实世界。
热门跟贴