快科技3月18日消息,理想汽车创始人李想今晚发文,揭开了全球车企与科技公司投入巨资却进展有限的核心原因,并给出理想的技术破局方案。

李想指出,人类在幼年就通过活动建立了完整的3D物理空间认知,这是安全驾驶的基础。

而行业主流方案一直是用2D视频训练AI,相当于只看行车记录仪就上路。传统BEV架构会丢失高度信息,OCC方案缺少语义信息,AI始终无法像人一样真正理解三维世界,这是行业进展缓慢的关键症结。

针对这一痛点,理想推出核心突破——原生3D ViT三维视觉编码器,让模型从一开始就工作在3D空间,同步完成几何结构与语义理解。

配合自研马赫芯片提供的三倍算力支撑,这套系统可稳定感知500米以上范围,激光雷达则转变为高精度标定工具。

MindVLA?o1实现了空间理解、推理决策、驾驶行为的统一建模,具备多模态思考能力,可在隐空间模拟场景变化。

李想表示,该模型不只是用于自动驾驶,还能适配机器人,正逐步成为通用物理世界智能体,自动驾驶只是物理AI的起点。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片