这个善变的世界,从来都不曾兑现沧海桑田、海枯石烂的诺言。
2025年初,凭借极致语言智能与推理能力横扫市场的DeepSeek,一度成为蹭热点蹭习惯了的车企争相拥抱的小甜甜。
不曾想,刚刚过了半年的时间,阿里巴巴的千问系大模型、字节跳动的豆包系大模型、腾讯的混元系大模型就开始和DeepSeek抢饭吃,成为一票车企的座上宾了。
比亚迪、上汽、吉利、零跑等主流品牌,静水深流一般,默默地完成了座舱主力大模型的更替。
从你侬我侬到陡生情变,本土智能汽车座舱的AI基座格局为何这么快就画风突变?
技术永不眠。
从依赖穿孔纸带和字符命令的笨拙,到鼠标与图形界面带来的革命性便利;
从语音识别与触摸屏开启的直觉化操作,再到以多模态信息为输入输出、以Agent为交互界面的自然无感交互,人机交互技术已经经历了四代跃迁。
智能座舱交互的终极形态,同样是自然与无感。
用户一个疲惫的哈欠,一次望向窗外的眼神,一句含糊的“我有点热”,甚至副驾与后排随口的闲聊,都应被系统精准捕捉,并转化为贴心的服务。
这要求座舱AI必须具备强大的多模态感知与融合理解能力。
这恰恰是强于语言、弱于感知的DeepSeek所欠缺的。
DeepSeek的崛起,根植于其在语言逻辑与推理上展现的超强能力。
但在智能座舱的场景下,人-车交互的核心却不是单一的语言对话,而是多模态感知。
对此洞若观火的小鹏汽车,一开始就选择死磕端侧视觉语言模型VLM,而非跟进DeepSeek热潮。
个中关键就在于,自然的人机交互需要的多模态感知,和以语言能力为主的DeepSeek之间存在巨大的信息模态鸿沟。
在很多汽车产品的座舱场景里,DeepSeek的能力被锁死在语音助手和闲聊上,背后的原因也在这里。
相比之下,阿里巴巴的通义千问大模型、字节跳动的豆包大模型、腾讯的混元大模型,从诞生之初就深植于阿里巴巴、字节、腾讯庞大的内容生态与业务场景中。
它们需要处理抖音海量的短视频,解析腾讯系丰富的音视频与社交内容,处理淘宝海量商品图文、理解优酷视频内容、解析高德地图导航与生活服务请求。
这些日常任务迫使BAT(这里的B是字节ByteDance,而非百度Baidu)必须发展出融合视觉、语音、文本的多模态能力,才能从复杂、动态的交互中推断用户的真实意图与潜在需求。
在座舱场景下,多模态能力强大意味着能同时处理语音、视觉、文本,通过上下文融合进行跨模态对齐,并具备结合物体识别与物理常识的动态意图解析能力。
这种结合通用常识的动态意图解析能力,正是座舱从L2级功能响应迈向L3级主动服务的核心突破点。
凭借着强大的原生多模态能力,豆包、千问在一定程度上对DeepSeek形成了降维打击,这只是车企冷落DeepSeek的原因之一。
更为重要的原因在于,随着座舱智能等级的提升,座舱AI的竞争焦点发生了转移。
我们再也回不去了,对不对?
今天的座舱AI竞争,已从单点模型的智商比拼升级为模型-平台-生态三位一体的系统化战争。
L3级座舱不仅需要感知世界的多模态能力,更需要完成“感知-理解-决策-服务”闭环的能力。
而这种能力,取决于大模型及其背后的生态与Agent智能体体系。
在这方面,DeepSeek的短板同样相当明显。
作为一个致力于AGI的初创模型公司,DeepSeek以其纯粹、专注的模型研发路线赢得了大家的敬意。
但是,在汽车场景中,模型的价值最终要落地为具体的服务。
订咖啡、会员续费、规划包含充电的复杂行程、与智能家居联动等等,这些任务的执行依赖于与无数外部服务API的打通、对各类应用逻辑的深度理解以及稳定的生态协作关系。
这些,也正是DeepSeek的软肋。
相较之下,阿里巴巴、字节跳动、腾讯本身就是由无数超级App和复杂服务构成的数字帝国。
豆包身后是抖音、今日头条、飞书等构成的庞大内容与服务矩阵;
腾讯混元与微信、QQ、腾讯视频、音乐、地图等国民级应用血脉相通;
阿里的通义大模型则与支付宝、淘宝、天猫、饿了么、高德地图、菜鸟等同气连枝。
BAT的这种生态积淀,让它们能够快速将大模型能力Agent化。
比如,腾讯TAI6.0智能座舱全场景AI智能体提供全能陪伴智能体、出行连接智能体、本地生活智能体、出行探索智能体、地图导航智能体。
不仅支持自然语言交互和聊天,基于用户偏好主动推荐餐厅优惠信息,还能直接调用微信接收到的好友聚餐地址,在车机端无缝流转导航,通过腾讯地图规划路线,并协同小程序完成提前预订餐厅、下单、支付的全流程操作。
不同的生活和使用场景需要配备专门的Agent,在驾乘人员的需求洞察和场景定义上,车企有着独到的优势。
所以,阿里巴巴的打法稍有不同,它与斑马智行联合打造了“元神AI智能体”。
作为底层引擎,赋能各个合作车企打造面向特定使用场景的专用智能体。
比如,智己汽车联合斑马智行、饿了么打造了AI外卖智能体,联合飞猪、淘票票打造了AI票务智能体,宝马与阿里合作,推出了用车专家和出行伴侣两大智能体。
还有最近上市的 MG7 ( 参数 丨 图片 ),在交互、场景、地图、AI、生态等多个层面的全方位升级,都是元神AI智能体技术赋能车企的持续落地。
当座舱的竞争维度从单一的大模型跃迁至Agent智能体时,系统生态的协同力就成了豆包、腾讯与阿里大模型大杀四方的核心逻辑。
因为,它们带来的不只是一个大模型,而是三支能随时调用数字帝国资源、且有不同资源特长的Agent军团。
随着多模态能力、Agent技术的加速成熟,智能座舱正在快速进化为承载多模态交互与场景化服务的智能空间。 这个空间,需要能够进行全场景感知、理解、并能驱动全周期服务闭环的AI大脑。 这个战场,属于那些既看得见、听得懂,更能调动千军万马来服务的全能型AI。
所以,DeepSeek失宠,通义千问、豆包与腾讯大模型加速上车,并非车企见异思迁,而是AI座舱发生了范式革命!
热门跟贴