打开网易新闻 查看精彩图片

2026年北京车展,一个微妙变化出现了。车企们不再比谁的车更聪明,开始比谁的车更像人。

理想推出了StreamingClaw,斑马智能推出AutoClaw,地平线推出KaKaClaw,中科创达推出AquaClaw,商汤绝影更是发布一整套舱驾一体全场景智能体方案。连火山引擎也带来小龙虾跨端助手,可实现在汽车、手机、电脑间切换。

这意味着汽车的智能叙事终局,变成了具身智能体。智能汽车的定义不再只是会聊天,还要长出手脚干活。车要从被动听指令进化到主动办事情,实现与物理世界的感知和操控。

自马斯克提出Grok+FSD的概念,即通过一个强大的AI大模型(Grok的角色)来调度和指挥高阶辅助驾驶系统(FSD的角色),这一组合已被行业树立成整车智能体的标杆,并引发中国科技企业和车企的集体跟进。

今年小鹏汽车就成立了通用智能中心,更深度地整合智能座舱和智驾部门,试图押注自动驾驶的DeepSeek时刻。

智能电动车竞争日益激烈,国内车企似乎都在迫切寻找下一阶段的差异化能力。从大模型厂商到像地平线这样的智驾供应商,也都希望抢占未来整车智能化的主导权。

多方博弈构成了当下热闹与噱头混杂的气氛。自动驾驶之心&具身智能之心联创Gloria告诉我们,龙虾成熟上车之路漫漫,仍有非常多工程和安全冗余问题需要探索,以地平线为代表的一批有扎实的软硬一体工程基础的智驾tire1,可能会率先有答案。

01

大模型上车已经不够用

对于很多车企来说,大模型上车一直有个难以调和的问题。若完全依赖外部AI,可能丧失用户入口与数据主导权。坚持自研的话,又面临高成本和周期漫长的困境。

目前仍在坚持智能化核心能力深度自研的新能源车企,如理想、小鹏、蔚来,成本动辄数十亿元。2025年理想全年研发支出达113亿元人民币,约50%投向了人工智能相关项目,包括自研芯片、算力基础设施及自动驾驶系统。今年3月,何小鹏表示,2025年公司研发投入中AI相关投入为45亿元,今年会提升到70亿元。

相比完全自建大模型与智驾体系,更多车企开始选择自研核心+外部模型接入的混合路线,通过接入千问、豆包等通用大模型能力,快速补齐座舱交互、语音助手与AI Agent等智能化短板。

2026年北京车展首日,阿里通义千问宣布与10多家头部车企达成合作。阿里云提供了一整套端+云协同架构助力汽车行业打造极致体验的智能座舱,端侧部署Qwen-Omni全模态大模型,可感知物理世界,保障隐私安全,在弱网环境下也能快速响应、稳定运行。

广汽集团宣布接入千问后,座舱具备了极强的逻辑理解与长文本处理能力,并融入阿里巴巴吃、住、行、游、购、娱全生态。

豆包号称大模型智能车搭载量行业第一。据官方透露,搭载豆包大模型的智能汽车超过700万台,覆盖超50个汽车品牌、145个车型,豆包大模型日均完成超3000万次座舱交互和服务闭环。

这次火山引擎与汽车行业有两套合作方案。一个是豆包座舱助手方案,是完整的产品级交付,并与豆包APP互联互通、能力同步进化,将在年内量产上车。另一个是AI座舱套件方案,对Agentic化的架构进行了升级,车企可按需灵活配置上车。

火山引擎试图将目标驱动引擎、对话推理引擎、学习成长引擎三大引擎,融入统一的汽车大脑,可以基于任务目标和环境反馈自主调用车载全域工具,像人一样去做事。

可以看出,当前所谓的大模型上车,其实已经和能办事的龙虾智能体差别不大。不再只是语音助手。过去大模型上车只能提供语音助手功能,车企们也热衷于在发布会上展示车载大模型写诗、讲笑话的能力,但在实际用车场景中,这些功能往往很鸡肋。

从语音助手到办事助理,是一个必然的进步方向。

阿里、字节以及腾讯的模型,无不在往这个方向前进。4月23号腾讯开放日上,腾讯智慧出行副总裁、负责人钟学丹坦言,“单纯大模型上车没有意义,能解决场景问题才有用。过去很多方案停留在对话优化,无法完成任务闭环。”

随后腾讯发布了出行全场景智能体开放平台,目的正是将AI从对话推向执行。

宝马以千问大模型为底座,基于斑马智能元神AI,推出AI座舱智能体,实现从能听懂到会办事的跨越。千问还凭借高德、飞猪、支付宝的全场景生态,直接帮用户订酒店、买门票、点外卖,把汽车变成了阿里系服务的移动入口。

字节也不示弱。豆包与赛力斯联手实现了全双工对话能力,用户只需说“停到离入口最近的车位”,它能直接联动辅助驾驶系统完成泊车。

火山引擎副总裁杨立伟举了个例子,“如果一位用户关心后排的孩子睡着没,传统大模型可能会做出调节灯光和空调等动作,但豆包座舱助手会想得更多,如果小孩睡了,它会调整座舱到更舒适的状态……”

总之,过去大家讲智能座舱,现在讲端到端驾驶。过去强调车机交互,现在强调世界模型。过去卷UI和语音助手,现在开始卷数据闭环甚至驾驶决策。新叙事背后,是集体对AI范式级潮流的默认与赛道抢注。

02
龙虾能办事

龙虾上车是大模型上车的一个新阶段。大模型厂商如阿里、字节跳动的座舱方案目前都偏云端,豆包上车其实就是车载大模型+座舱智能体,它能多轮对话、意图理解甚至跨场景服务,但无法直接开车、接管底盘,更不要说主动避障了。

一般情况豆包需要融入车企自研的智能体,才能真正升级到能干活的程度。北京车展期间,东风汽车宣布和火山引擎达成合作,双方将共同定义和打造下一代“AI汽车”,奇瑞也表示将豆包大模型融入奇瑞自研的AI智能体,适配现在及未来全系车型。

理想中的龙虾智能体上车,是给车装一个能全权指挥的大脑+双手,可以更深度地控车,直接调度智驾、底盘、车身,把车变成能自主做事的移动机器人。这也更接近所谓的舱驾融合。

2026北京国际汽车展览会上,舱驾融合是一个热门词。地平线发布中国首款舱驾融合整车智能体芯片星空,并推出整车智能体操作系统KaKaClaw(咖咖虾),和一段式端到端辅助驾驶系统HSD V1.6。商汤绝影以“舱驾云”一体化的全栈能力,为车企提供降本、提速、打造差异化体验的智能化解决方案。

打开网易新闻 查看精彩图片

舱驾融合其实是为了解决一直以来行业存在的痛点。过去几年,汽车行业一直沿用一种默认架构,智能驾驶是一套系统,智能座舱是另一套系统。前者负责怎么开车,后者负责怎么和人交流。一辆智能汽车内部,往往同时运行着两套芯片平台、两套软件栈、两套数据链路。

但随着大模型、端到端架构以及整车智能化进入深水区,这套模式的成本和研发效率问题开始暴露出来。

而地平线的核心思路就是,把原本分裂的系统统一到底层计算平台与AI架构之上。这也是为什么地平线近两年的布局,不只是单纯发布一个车机助手或者辅助驾驶系统,而是同时推出征程系列智驾芯片、HSD(Horizon SuperDrive)高阶智驾方案、咖咖虾整车智能体OS。

星空是中国首个舱驾融合智能体芯片,这款产品实现ADAS/座舱/仪表/车控四域独立运行,哪怕座舱重启也不会影响智驾功能。而基于星空芯片的KaKaClaw,被地平线官方称为中国首个整车智能体操作系统,为用户与整车智能体的连接打造了统一交互入口。

甚至,HSD+KaKaClaw被认为是中国版FSD+Grok。这种对标当然是为了更容易被市场感受到。余凯表示,KaKaClaw是一个开放的Agent框架,后端可以接入各种大模型,让用户自己选择。

通过用户的语音指令,KaKaClaw能跨智驾域、智舱域并行调度本地/云端的大模型,不仅能识别模糊的语音需求,还能记住用户喜好,以及变成更懂用户的性格。

业内普遍认为,车载智能体(Agentic Car)通常面临着在云端AI与端侧AI之间的架构困境。纯云端方案能力强,但受制于网络稳定性与长期成本。轻量化端侧小模型运行稳定,却难以支撑高阶智能体任务。

商汤绝影试图解决这个问题。这次北京车展,商汤绝影正式推出全新AI Box座舱软件模组SageBox(千机智盒),构建了Sage端侧模型、Sage OS(千机系统)、New Member原生智能体三层技术架构。整套体系号称覆盖L2到L4全等级自动驾驶。

其中一项关键技术是,商汤绝影围绕Sage后训练阶段自研了ERL(Erasable Reinforcement Learning,可擦除强化学习)技术。在装车实践中,ERL技术直接推动Sage大模型的复杂任务完成率提高20%,提升了端侧智能体在真实出行场景下的交互可靠性与任务执行稳定性。

商汤绝影的野心是,构建L2+到L4的全场景智驾体系。其中关键的一点与地平线相似,试图实现舱驾融合,打通座舱和智驾间的一堵墙。例如,其生成式智驾2.0实现了语音与智驾的深度融合,用户可以直接通过自然语言控制车辆完成变道、超车、调整跟车距离等操作。

技术层面,是通过统一端侧AI架构,将舱内交互、舱外感知、智驾决策与车辆控制整合为一个统一智能体系统。Sage Box(千机智盒)则作为车端AI中枢,承载多模态感知、大模型推理与Agent调度能力,最终实现一脑控全车的整车智能协同。

总体而言,龙虾上车的背后,是一场牵扯芯片、操作系统、端侧大模型、智驾算法和整车架构的全栈押注。没人愿意错过这波浪潮。

具备自研能力的车企,也在积极推动龙虾智能体上车。例如吉利联合阶跃星辰、千里科技,推出超级智能体,在极氪8X上首发。理想即将发布的L9 Livis,被定义为具备主动服务能力的汽车机器人。甚至大众也计划自2026年起,在基于CEA架构的新车型上搭载AI智能体。

照目前的趋势发展下去,未来最强的汽车不一定是自动驾驶最强,很可能是自主完成任务的能力最强。

03

龙虾上车是噱头吗

很多人大概对年初龙虾爆火的事仍然记忆犹新,但因部署门槛高、算力成本高昂、运行不稳定等因素,热度渐渐冷却。谁也无法断定,当前龙虾上车的热度不会重蹈覆辙。

一边高调讲述AI定义汽车,一脑控全车,乃至整车智能体。另一边,又不得不面对的现实问题是,大模型的幻觉,端侧算力瓶颈,以及复杂场景下的决策稳定性。

更真实的声音也不是没有。腾讯智慧出行副总裁、负责人钟学丹判断,智能体在车上的规模化应用取决于三大条件,车企平台成熟度、场景体验真实性、生态连接完整性。

“目前行业仍在早期,大规模落地还需1—2个产品周期,盲目追求全自主、长时程不切实际。”钟学丹说。

最明显的问题,就是算力和Token成本,这些成本最终由车企还是用户承担,目前尚无定论。北京车展上,商汤绝影CTO肖枫也表示,端侧大模型上车,算力需求超过100TOPS,原车SoC算力无法承载,成为智能化升级的核心瓶颈。

所以,商汤绝影的侧重点在于为车企节约Token成本,通过本地化部署的形式实现一次投入,Token永久免费,目标其实是把AI能力真正长期跑在车上。否则就会面临Token成本极高,网络稳定性不可控,实时性不够的问题。

打开网易新闻 查看精彩图片

正如余凯所说,当前龙虾等智能体导致Token调用量飙升,而用户对实时性、低成本、更好体验和隐私保护的需求同样迫切。北京车展上,像地平线、黑芝麻智能等芯片供应商都展示了新款舱驾融合芯片,目的都是为了高效分配算力,减少成本溢出。

除此之外,龙虾上车还有更严重的安全风险。腾讯智慧出行副总裁李博称,很多智能体看起来门槛低,实际用好极难,权限控制、任务拆解、上下文记忆缺一不可,车内场景更涉及安全,不可冒进。

AI智能体不再是简单的语音助手,而是能直接操控车辆的系统。当它出现幻觉一本正经地胡说八道时,在车上可能带来安全风险。同时,一个更懂你的智能体必然需要大量用户数据,当它知道你常去哪、爱听啥、甚至几点下班时,就等于你在它面前裸奔。

尽管如此,龙虾上车的这股趋势已经不可阻挡。因为所有人都隐约意识到,汽车可能是AI第一个真正大规模进入现实世界的载体,它天然拥有摄像头、传感器、麦克风、底盘控制与移动空间,本身就是一个最接近具身智能的终端。

商汤绝影CTO肖枫说:“我一直觉得车是一个特别好的环境,能孕育新技术。”他认为,未来的汽车就是一个自主智能体,AI汽车是刚需。

据中商产业研究院数据显示,2025年中国自动驾驶市场规模逼近4500亿元,预计2026年将超4800亿元。这意味着各方竞争势必不会放缓,大家争夺的已不再是一块屏幕或者一个语音助手,是下一代整车智能化的话语权。

撰写|孙方

编辑|吴寻