2026年,具身智能赛道打起了一场“数据之战”。在今年春晚舞台上,机器人表演再度吸引了大众目光后,这个行业又迎来了一波融资的高峰。但在现实中,具身智能机器人还没有走入真实的生活场景,“大脑”成为需要突破的瓶颈。而随着模型的不断进步,数据就成为其中关键的影响因素。
互联网大厂们正在积极布局,成为这个赛道的基础设施。京东集团技术委员会主席、京东云总裁曹鹏在4月16日表示,当前具身智能领域硬件进展迅速,但模型能力仍明显滞后,本质原因还是“缺少数据”。
京东集团副总裁、京东云基础云总经理龚义成也对《财经天下》等表示,具身智能行业尤其是在“大脑”层面的智能化程度目前还较低,其中的核心问题就是模型训练时,数据还处于高度缺失状态。传统的具身智能机器人训练还是主要用遥操获得数据,但成本高、产能低,很难支撑起大规模的数据供给,更重要的是,大部分数据缺乏真实场景。
基于此,京东选择构建具身智能生态,切入这一赛道。4月16日,京东宣布推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,并一口气推出了自研超高清采集终端JoyEgoCam、具身大模型JoyAI-RA等,还同步上线了京东具身智能数据交易平台,首批定向开放2000小时高精标注数据集。
之前在3月,京东就宣布依托供应链基础设施和业务场景,启动建设全球规模最大的具身智能数据采集中心,计划发动数十万人参与采集行动,包括内部超过10万名员工,外部最多50万名来自不同行业的从业人员,以及在宿迁发动超过10万名市民参与。而京东推出的采集终端JoyEgoCam,可在物流、零售、医疗、家庭等多种场景下“即戴即采”。在两年内,京东计划积累1000万小时人类真实场景视频数据,以及100万小时机器人本体数据。
数据采集后,京东云通过任务、人员、设备全流程可视化管理与SaaS化部署,实现视频一键上云,提升采集效率并降低成本。
在实践过程中,京东也同样有问题要面对。具身智能行业还缺乏统一的数据集定义标准,龚义成也表示,如何定义具身智能模型所需维度的数据并采集到,以及在提供高质量数据的同时降低成本,都是行业的共同问题。京东也提到,依托全链路基础设施,可以构建起“数据采集-模型训练-数据优化”的生态闭环,以自采数据和大模型的结合,形成“越用越强、成本越优”的飞轮。
就在同一天,智元机器人旗下觅蜂科技也发布了一站式物理AI数据服务平台,希望能让数据像水电一样“即取即用”。小米也在近期,密集发布了其机器人的动态。能否持续产出高质量的数据,将成为今后具身智能企业最核心的竞争力之一,而大厂们的动作也表明,具身智能行业的数据基础设施之争,注定将是今年的竞争中被关注的主题。
一场关于具身智能未来的生态卡位战,已经悄然打响。
热门跟贴