5月26日,小米汽车正式抛出王炸——Xiaomi Auto World Model全新框架!一举打破自动驾驶世界模型行业僵局,直接登顶Waymo、nuScenes两大权威基准全面SOTA(最优),把智驾从“看见场景”推进到“能推演、会进化”的高阶时代!

打开网易新闻 查看精彩图片

一、行业百年痛点,小米一招破局

此前全球智驾世界模型,一直困在重建(WorldRec)、生成(WorldGen)二选一的死胡同:

- ✅重建路线:3D场景精准还原、高保真,但只能复刻已见画面,没有想象力

- ✅生成路线:能预测未来、脑补未知视角,但无3D结构,长视频必漂移失真

小米直接掀翻传统拆分路线,全球首次实现三维重建+视频生成深度耦合一体化架构,提出颠覆性范式:重建锚定几何、生成填补想象!

- 重建(WorldRec):稀疏3D锚点打牢物理地基,锁定场景几何,10秒视频10秒重建,提速1440倍

- 生成(WorldGen):4步去噪、单帧0.19秒极速生成,最长支持1分钟视频,脑补暴雨、落石、逆行等高危长尾场景

- 双向闭环:重建稳生成、生成扩重建,彻底根治长时序漂移,实现高稳定、高一致、高真实

打开网易新闻 查看精彩图片

二、硬刚全球基准,全维度碾压SOTA

成绩不掺水,数据说话!Xiaomi Auto World Model在两大顶流测试集全面登顶:

- ✅Waymo:重建精度PSNR=28.48,超行业最佳2.1dB,SSIM领先0.04

- ✅nuScenes:生成质量FVD=64.97,快同类自回归5.6倍,零样本泛化第一

- ✅核心指标:跨帧一致、时序稳定、细节逼真,全维度吊打英伟达、特斯拉方案

打开网易新闻 查看精彩图片

三、三大场景落地,智驾直接“开天眼”

不是实验室炫技!这套世界模型已全面落地小米汽车核心业务:

1. 合成数据:交付超10万条高质量数据,训练智驾感知模型,补齐罕见危险场景短板

2. 仿真测试:模拟极端天气、突发路况,事故复现、极限场景验证,让SU7/YU7智驾越练越强

3. 智能座舱:环境理解、意图预判升级,座舱更懂人、交互更自然

打开网易新闻 查看精彩图片

四、小米智驾跃迁:从感知→认知→进化

世界模型=自动驾驶的脑内模拟器!小米把智驾从“被动感知”拉到主动推演、场景进化新高度:

- 能预判:提前预测车辆、行人、障碍物下一步动作

- 会脑补:看不到的盲区、未发生的危险,AI自动推演

- 可进化:海量虚拟场景训练,越用越聪明、越开越安全

从SU7到YU7,小米智驾完成三代跃迁,XLA认知大模型+世界模型双剑合璧,中国智驾正式站上世界之巅!

打开网易新闻 查看精彩图片

五、行业震动:小米重新定义世界模型

英伟达Physical AI、LeCun世界模型、李飞飞空间智能……全球巨头扎堆押注,小米直接给出最优解!

打破重建/生成对立,一体化耦合成为新赛道;从“看风景”到“懂世界”,认知推演成智驾分水岭。

小米汽车,不止造车,重构自动驾驶底层逻辑,中国AI+汽车,硬实力领跑全球!