据介绍,该模型拥有47亿参数,核心解决了传统VLA模型推理延迟、真机动作不连贯的行业痛点,兼具视觉语言理解与高性能实时执行能力,可在消费级显卡上实现实时推理,在仿真测试和真机任务中均刷新多项SOTA成绩。

小米已将Xiaomi-Robotics-0的技术主页、开源代码、模型权重全量开放,相关资源可分别在GitHub、HuggingFace等平台获取。