6月25日消息,通用具身智能企业RoboScience机器科学在深圳举办通用具身大模型发布会,首次完整披露自研Visics大模型的技术架构VLOA(Vision-Language-Object-Action),并展示了模型在多项真实场景的应用,包括家具拼装等复杂操作任务。

打开网易新闻 查看精彩图片

据介绍,Visics大模型融合“具身世界模型”和“通用操作模型”两大核心引擎,创新性引入Object Trajectory作为中间接口,以物体连续3D点云轨迹进行表征,实现高层语义与底层物理规律的解耦。其中,具身世界模型负责认知和预演物理轨迹,通用操作模型负责将轨迹转化为不同机器人的物理控制信号。

RoboScience机器科学创始人兼CEO田野指出,当前机器人操作面临泛化能力差、精细操作难、长程任务误差累积三大核心瓶颈。Visics大模型的突破在于首次通过自研技术架构VLOA,将Object Trajectory作为中间接口,把“认知”与“执行”彻底解耦。

在数据方面,该公司以自研高精度仿真引擎RoboMirage为核心,结合全自动视频数据标注与清洗管线,构建了“仿真+视频”双数据飞轮,将单条数据获取成本降至传统方案的1/20至1/200,并以每周数十万小时的增速扩展。

据悉,Visics大模型可全程自主完成家具拼装任务,并实现毫米级精度抗干扰。当拼装过程中人为拆解已装好的部件时,机器人能够自动恢复状态并接续完成后续步骤。此外,公司还展示了跨本体灵巧手抓取、精细力控操作以及动态传送带抓取等应用。

RoboScience机器科学拥有一支“学术+产业”双轮驱动的团队,已获得京东集团、商汤科技、达晨财智、招商局创投等多家机构投资。商业化方面,公司已与多家零售、物流、康养服务企业及机器人本体、灵巧手公司开展试点合作,并计划于今年实现面向工业与商业场景的标准化机器人本体产品量产。(崔玉贤)