若机器人可以像人类般感知物理世界、理解现实环境、听懂语言并做出决策与对应行动,什么才是它们能力进化的关键?答案藏在高质量全模态具身智能数据里。近日,由武汉东湖大数据深度赋能,帕西尼感知科技(以下简称“帕西尼”)创新打造的OmniSharingDB帕西尼全模态具身智能数据集,在北京国际大数据交易所成功上架,标志着国内首个融合多维触觉、视觉、关节角度、动作轨迹、语音、文本等全维度人类物理交互行为的具身智能数据集进入国内权威数据交易平台。
01
契合国家战略
破局具身智能瓶颈
当前主流具身智能大模型依赖海量文本与图像训练,却普遍缺乏对物理世界的具身化理解与交互能力——这正是制约具身智能体真正落地现实场景的关键瓶颈。为此,帕西尼在天津建立全球最大具身智能数据采集工厂Super EID Factory,聚焦具身智能数据采集与模型训练,以近12000平方米超大规模物理基建、150个标准化采集单元、15+N个全场景矩阵为基础的千种任务与百万工序,构建亿级规模全模态具身智能数据集OmniSharingDB,为全球机器人产业提供标准化数据基座。
该数据集采用帕西尼“人因”全模态数据采集系统,通过集成自研PMEC触觉数据手套、空间多维视觉阵列和语音采集模块,基于真人自然动作姿态,高效、精准地实现力触觉、摩擦、形变等物理交互行为的全方位捕获。通过这一创新的具身智能数据生产新范式,帕西尼OmniSharingDB每年可新增近2亿条高质量、全模态、标准化、高可用性的具身智能数据。
此前,国家数据局党组书记、局长刘烈宏一行曾专程到访帕西尼具身智能超级数据采集工厂Super EID Factory调研,并对帕西尼在高价值数据要素规模化生产与技术创新方面的实践给予了高度关注与认可。此次数据集的上架,正是积极响应国家政策号召,将数据资源转化为数据资产,融入全国统一大市场的又一生动实践。将助力企业和科研机构在具身智能领域开展创新研究,加速技术突破与产品落地,推动我国在全球具身智能竞争中占据领先地位,为国家数据要素市场化配置改革与数据基础设施建设添砖加瓦。
02
聚焦场景落地
多领域应用成果显著
目前,这一创新性的数据资产已在汽车制造产线、3C精密仪器装配、物流柔性分拣、地铁及机场安检、商业零售等多个应用场景展现出强大的赋能效应。
未来还将不断扩充,持续加速推进具身智能体快速理解深层复杂环境,以“人类行为”作为正则化的路径,突破机器理解和学习瓶颈、赋予机器人因果理解与高效思考和决策能力。
03
携手攻克挑战
非结构化数据的结构化突围
此次成功上架背后,是技术攻坚的硬仗。帕西尼的数据具有非结构化多模态、数据体量大、数据形式多等特点,这给数据上架工作带来了极大的挑战。
东湖大数据数据要素服务团队首创“多源异构数据分级评价+平台质检+区块链确权”一体化解决方案,完成全维度数据梳理及合规审查全链路闭环,并实现从数据清洗、脱敏、标准化到价值评估的全方位指导,确保了数据资产的权属清晰与质量可靠,为数据集的成功上架奠定了坚实基础,也为行业提供了可复制的多模态数据资产化范式。
作为数据资产化领域的先行者,东湖大数据已构建起一套成熟、专业且跨行业赋能的数据资产入表服务体系。成功助力花卉苗木、低空经济、时空遥感、金融服务、轨道交通、民办教育等多个行业龙头标杆企业完成数据资产入表,践行数据要素赋能产业龙头。东湖大数据始终以专业的数据治理能力、规范的合规审查体系与科学的资产估值模型,为客户提供从数据资源归集、标准化处理、产权界定到登记上架的全流程闭环服务,真正推动数据从“资源”向“资产”的跨越,持续为数据要素市场化发展注入专业、可信的强劲动力。
热门跟贴