机器人前瞻(公众号:robot_pro)作者    江宇编辑    漠影
打开网易新闻 查看精彩图片
机器人前瞻(公众号:robot_pro)作者 江宇编辑 漠影

机器人前瞻4月16日报道,今日,在北京京东具身智能生态发布会上,京东公布了其具身智能生态的最新布局,还提出将打造“具身智能超级供应链”。

此次发布包括全球首个覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施、京东自研的可穿戴式采集终端JoyEgoCam、具身大模型JoyAI-RA,以及京东具身智能数据交易平台。

打开网易新闻 查看精彩图片

京东计划在两年内累积超过1000万小时的人类真实场景视频数据,同步实现采集机器人本体数据100万小时,成为全球最大的具身智能数据公司。

为此,京东将动员内部10万员工及外部50万行业参与者参与数据采集,发动最多60万人进行“人类历史上规模最大的数据采集行动”。该行动覆盖家庭、办公、工厂、物流、门店、餐厅、医疗和环卫等多类场景,包括家政、配送、零售等具体工种,实现“即戴即采”。

打开网易新闻 查看精彩图片

会后,京东集团副总裁龚义成与具身智能研究员李一航接受机器人前瞻等媒体采访,就数据采集、人才招聘及具身智能战略落地等话题进行了回应。

一、五问:京东具身智能如何连接供应链、人才与机器人

1、家政、配送一线参与者,接受数据采集是否有负担?

龚义成:数据采集设备轻便,仅220克,操作简单,可在不影响日常工作的情况下完成采集。同时,参与者会获得一定报酬,对二三线城市群体提供了灵活的兼职收入。

2、京东为何要投资众多具身智能企业?

龚义成:投资布局旨在加速整个具身智能行业成熟度,并推动产业落地。通过战略合作,京东能够整合供应链、零售和物流场景的数据与模型资源,形成规模化训练闭环。

3、具身智能浪潮下,京东招聘人才有何新要求?

龚义成:最近两年招聘更关注的人才,是那些在AI方面有深度理解的员工。并非每个人都要去创造AI工具,但必须懂AI的基础和应用,能在岗位上合理使用和布局AI。

4、京东在数据和场景上有哪些独特优势?

李一航:依托3600多个仓库、万余家门店及大量家政、配送人员,京东目标实现百万小时级本体数据采集。结合第一视角视频,数据可直接支撑自研模型训练,并向产业伙伴开放,形成共享生态。

5、京东下一步的战略重点是什么?

龚义成: 我们主要关注如何利用现有供应链和场景优势,加速整个机器人行业的成熟和落地。

二、全链路数据闭环,覆盖硬件、数据处理与模型

在采访中,龚义成和李一航也提到,从数据采集开始,京东形成了硬件、处理平台和模型的闭环。

数据采集始于京东自研的超高清可穿戴终端JoyEgoCam。该设备重量仅220克,支持双目4K/60fps RGB视觉采集和130度超广角拍摄,重投影误差低于0.2像素,并配备车规级IMU和2.5TOPS推理单元。

其可在物流、零售、医疗、家庭等多场景中,实现“即戴即采”。同时,该设备还内置车规级6轴IMU和多传感器融合单元,即使在抖动环境下也能稳定拍摄,为后续训练保障了数据来源。

随后,采集数据便进入京东的具身数据服务平台进行处理。

该平台覆盖采集、存储、标注、训练、评测、仿真和测量七个环节,每日可处理数十万条数据,效率达95%,存储容量PB级,整体处理成本降低约60%。

同时,JoyBuilder模型开发平台可批量生成仿真数据,实现数据从采集到训练的快速转化,“开箱即训”,模型也能“一键部署”。

其训练效率相比开源社区版本提升约3.5倍,1亿条数据的千卡训练时间也从15小时缩短至22分钟,Attention和量化优化分别提速188%和140%以上。

最终,这些数据用于训练京东自研具身大模型JoyAI-RA。在真机实验中,该模型成功率达到73.5%,超过pi0.5等SOTA模型。

三、借助供应链数据优势,解决行业“数据荒”,将采集百万小时本体数据

具身智能行业普遍缺少真实场景数据,目前可用数据约100万小时,远低于行业潜在需求1000万小时。

为解决这一问题,京东依托自身供应链和线下资源,构建了广泛的数据采集基础:覆盖3600多个仓库、20万家合作药房、万余家门店及5万名自运营保洁师,每年服务家庭接近千万户,涉及零售、物流、健康、工业、外卖、家政等百余场景。

具体而言,京东面向具体零售场景进行开放测试。例如,在京东MALL、七鲜超市、京东药房等场景开展摇操数采解决方案共建,为机器人实际操作和数据采集提供真实场景。

通过这些真实操作,京东获得了模型训练所需的重要素材。

为进一步扩大数据规模,京东计划动员内部10万员工和外部50万行业参与者参与数据采集,其中宿迁地区将动员超过10万人。

同时,京东计划采集机器人本体数据100万小时,建立可复用的数据基础。

这些积累的数据不仅支撑自研模型训练,也将通过京东具身智能数据交易平台开放给产业伙伴,首批提供2000小时高精度标注视频数据集,打通数据交易通道。

京东开源社区也将同步上线,汇聚行业优质资源,推动技术交流与产业协作。

结语:两年积累千万小时视频数据,京东怎么才能用数据喂饱机器人

京东正在用自己的仓库、门店和一线人员,搭建一个覆盖硬件、数据和模型的具身智能体系。

同时,京东也为行业提供了一个值得关注的落地样本:在现实场景中,如何将供应链、数据采集与模型交织在一起。

随着数据和实践的积累,京东的布局将成为分析具身智能在零售、物流及其他场景落地难度和可行性的参考点。