一辆车比人类反应更快,这事听着是不是有点神奇?6月15日的Livis Day发布会上,理想汽车给出了一个具体数字:自研的马赫VLA模型响应速度达到0.28秒,比普通驾驶员的0.45秒快了约40%。换算成更直观的场景,车速120公里每小时时,提前6米就能刹停。这种速度,接近顶级F1车手0.25秒的人类生理极限。

这场发布会最根本的命题,是李想试图回答一个问题:“具身智能跟造车到底有什么关系?”他的判断毫不含糊:传统智能汽车根本算不上真正的智能,不过是功能驱动、服务于特定场景的产物,连安全的定义都停留在功能安全层面。而他给出的答案是,具身智能汽车应该是一辆能保护人类安全、独立完成任务、比人类更高效的汽车。

打开网易新闻 查看精彩图片

发布会上,理想为具身智能汽车下了完整定义:同时拥有电动车、职业司机、AI计算机与生活助手四大能力的智能体。过去十年我们创造了一个移动的家,第二个十年我们要给车和家赋予生命——李想用这句话为整场发布会定调。

支撑这个定义的基座是一套空间交互体验的重构。新一代旗舰座舱首发高通8797 Elite芯片,504K的CPU任务处理能力、8.1T的GPU渲染能力和320TOPS的端侧NPU算力,三项指标直接对标甚至超越主流手机。座舱内那块90Hz高刷新率、180Hz触控采样率的超宽全景屏,显示带宽达到23.5G,搭配自研底层系统做响应优化。单人驾驶时,驾驶员显示区域比上一代双联屏宽了1.5倍,应用界面能自适应调整尺寸,三指轻划就能进入所谓的放空空间。副驾上车后主副驾1:1分屏,驻车观影时显示面积比上一代增加1.7倍。

声音层面同样下了重注。9.3.6声道布局的星环剧院音响峰值功率5440W,用9组水平环绕、3个矩阵式低音炮、6组天空环绕搭建声场。前排5.2.2与后排7.1.4双音区布局,前后排能同时播放全景声,自研音效算法配合96kHz高采样率实现录音棚级回放。头枕音响Livis Pods用背靠背扬声器叠加空间音频算法,为每位乘客营造独立听音区。座舱还全面支持CarPlay与主流旗舰手机互联,CarPlay能把地图投射到HUD上并用方向盘控制。

具身智能的大脑部分,理想拆成了两条线。语言智能由马赫Mind-Pro和Mind-Edge负责,掌管理解指令和推演行动方案;机器智能由马赫VLA负责,处理三维视觉感知与躯体动作控制。Mind-Pro采用混合强化学习并行训练体系,Token平均消耗降低38%,工具调用冗余轮次减少47%,推理TPS峰值跑到208 token/s,是主流Agent模型的两倍以上。Mind-Edge则作为端侧原生智能体,用多模态流式时序建模,全天候主动感知、人车交互、自主控车全部在车端本地完成。

马赫VLA的能力层面,已经能自主完成倒车让路、识别交警手势指挥、应对低矮不规则障碍物、穿越无车道线的城中村雨夜窄路等场景。背后是感知到执行的全链路重构:视觉输入时延优化47%,模型推理链路缩短43%,线控底盘响应时延降低38%,操作系统调度编排时延降低28%,端到端总体时延压缩了40%。模型架构上,原生多模态MoE混合专家大模型替换了传统模块化方案,3D ViT首次上车让系统从看见物理世界进化到看懂物理世界。数据层面,模仿学习数据量增加50%,强化学习数据量增加15倍,模型参数量增加10倍,TPS提升15倍。三季度,搭载Orin和Thor芯片的AD Max用户将收到马赫VLA推送;四季度,模型能力对齐全球顶尖水平。

整个具身智能系统的心脏是马赫M100芯片。面对AI推理算力需求暴涨、供给增速放缓的矛盾,理想从2022年立项,耗时三年半,做出了全球首款量产的动态数据流AI芯片,2026年5月装车。5纳米车规级工艺,单芯片1280TOPS算力,实际运行效率超过82%。一半以上晶圆面积交给神经网络处理器,由56个计算单元和1个数据处理模块构成;CPU用24核ARM A78AE,主频2.3GHz,8通道LPDDR5X内存带宽273GB/s。对比主流智能驾驶芯片,运行35B参数大语言模型时,prefill速度是顶尖桌面级AI超级计算机的2.7倍,decode速度1.5倍。该芯片架构论文已入选ISCA 2026工业分区,理想成为汽车行业第一家获此顶会论文录取的企业。李想给出的具身智能系统拼图至此完整:马赫M100是心脏提供算力,全车感知系统是眼睛,马赫大模型体系是大脑,理想已经在芯片、编译器、操作系统、AI算法和域控制器五个环节全部实现自研。