21世纪经济报道记者 何煦阳
《21汽车·一见Auto》从多位独立信源处获悉,小鹏集团副总裁、智能座舱负责人魏斌已于近期离职,此前因家庭原因处于休假状态。目前,小鹏智能座舱中心与自动驾驶中心合并成立通用智能中心,由刘先明管理。
今年第二代VLA媒体体验日后群访中,小鹏集团董事长兼CEO何小鹏曾表示,“智能座舱已经太久没有大提升”,当下,小鹏的内部共识是,要在智驾和座舱整合上万个Agent(智能体),将Agent体系融入智驾系统,让智能座舱与自动驾驶信息更加耦合。据何小鹏在群访上介绍,今年八月,小鹏将推出划时代的智能座舱产品。
离职前,魏斌主要负责的工作是推动VLM(Visual Language Model)大模型上智能座舱。一位知情人士告诉《21汽车·一见Auto》,今年秋天,搭载VLM大模型后,小鹏智能座舱的效果会进一步提升。记者获悉,小鹏座舱侧的VLM大模型与智驾侧的第二代VLA大模型融合后,小鹏正在追求实现“语音控车”:用户只需要发出指令,汽车就能实现加速、减速等驾驶行为。
何小鹏曾在今年开工信中透露,自动驾驶中心与智能座舱合并后,“行车决策与人机交互不再分家。不久的将来,你可以对它说:‘走前面的那条小路,绕开前面的几个红灯’‘带我去星巴克点杯咖啡’等。这样的交互才更有温度、更拟人,才是AI时代真正的高阶智能。”
小鹏汽车2026年开工信
今年2月21日,特斯拉CEO马斯克(Elon Musk)也曾在X(原推特)上表示,特斯拉“语音控车”的能力就快来了。
魏斌曾任高德地图产品总监,负责导航与地图产品规划。2021年底加入小鹏集团之后,魏斌主要担任互联网中心负责人,主导智能座舱的研发与落地。
在五年的工作经历中,魏斌推动了小鹏智能座舱的平台化,2024年小鹏发布的天玑XOS 5.0,是魏斌团队成功解决小鹏智能座舱的基础问题、拉通平台化后,开始创新的第一个版本。除此之外,魏斌团队还开发了小鹏与华为合作、首先搭载在小鹏G7上的AR-HUD(「追光全景」抬头显示),以及推出了行业内首个免唤醒的智能语音功能。
一位接近魏斌的知情人士评价,魏斌工作“极其严苛和自律,执行力超强”,能够“连续几个月,每天工作十多个小时”。
去年6月,魏斌接受媒体采访时,曾预判在智能座舱搭载VLM大模型、拥有车身所有的传感器数据,并与自动驾驶中心共建车外情景的图像感知之后,小鹏汽车将会拥有“座舱大脑”,能深度理解用户需求,对用户的潜在需求进行“主动服务”。比如在迎宾环节,乘客在上车的第一刻,小鹏汽车就能够自动帮你调整空调、座椅,甚至播放上次听的歌和今天的头条新闻,并且能根据实时路况主动为用户选择导航线路。
魏斌当时表示,智能座舱曾在很长一段时间内只能小修小补,但如今基于VLM大模型会发生大的创新。
魏斌的预判都已经在今年年初得到了初步实现。今年1月8日的小鹏全球新品发布会上,小鹏发布天玑AIOS 6.0智能座舱系统,宣布其基于VLM大模型的赋能,能通过用户行为学习,主动提供导航规划、空调调节、座椅姿态调整等个性化服务。
智能座舱功能继续大幅提升,除了因为VLM大模型上车以外,还得益于舱驾融合。曾经的“舱驾一体”是在硬件层面,指用一颗芯片干完智能座舱与自动驾驶的所有活儿,但如今的舱驾一体已经进化到数据与模型层面。2025年7月12日,特斯拉最早将多模态大模型Grok融入FSD(完全无人驾驶)系统。随后小鹏迅速跟进,今年2月3日,小鹏集团的自动驾驶、智能座舱中心合并,新成立通用智能中心。
模型层的舱驾融合,能够同时提升智能座舱与自动驾驶的能力。对座舱侧来说,拥有更多智驾侧的环境感知、驾驶行为、场景决策数据之后,感知能力将大幅提升,相当于拥有了人类的“五官”,有潜力成为一个更懂用户的情感化、拟人化助手。
而对智驾侧来说,则拥有了更多座舱侧的人机交互、用户行为数据。一位自动驾驶从业者向《21汽车·一见Auto》表示,多模态大模型经过互联网上海量的文本、图片和视频等数据训练,与自动驾驶大模型融合后,相当于为其安装了“通用大脑”,让其具备了对世界的通识与人类的价值观,并提升其推理能力,解决更多驾驶中的Corner case(长尾场景)。这也是为什么加入Grok后,FSD V14.2的驾驶水平得到了大幅提升,被很多国外媒体评价为“丝滑”且具有“人类感”。
但除小鹏以外,国内其他车企也已经迅速跟进舱驾融合:今年1月28日,理想汽车将自动驾驶团队并入软件本体团队,由勾晓菲统筹智能座舱与自动驾驶研发;3月17日,吉利汽车宣布舱驾融合实现突破,其携手千里科技、阶跃星辰,对标特斯拉的Grok与FSD打造了“超级Eva + G-ASD 4.0”,并称二者会实现技术合流。
虽然都做舱驾融合,但车企对模型自研的侧重不同。
小鹏在自动驾驶的物理基座大模型上投入巨大,其第二代VLA是拆掉规则、从头研发、拥有庞大参数与数据量的自动驾驶模型。对座舱侧的多模态大模型,小鹏只在2024年透露过其名称为“灵犀大模型”,但一直没有过多披露其研究进展和迭代情况。
而理想汽车则从一开始就选择自研多模态大模型,其“理想同学MindGPT”已经迭代至3.1.4版本,适用于车端、AP想AI眼镜Livis,并宣称其拥有“极速推理”“长期记忆”能力。
小米虽然目前没有进行组织上的舱驾融合,但其最新的辅助驾驶架构XLA认知大模型,基于小米具身基座大模型MiMo-Embodied。为了训练MiMo-Embodied,论文中提到小米动用了MiMo-VL与大语言模型,其目的是“继承其成熟的视觉-语言对齐机制和强大的推理能力”。
小米具身大模型MiMo-Embodied技术报告节选
小米自动驾驶VLA技术负责人陈龙在对外接受采访时表示,MiMo-Embodied是一个“通用具身大脑,处于VLM阶段”。到真正要用于自动驾驶中时,小米会再往“大脑”接上“小脑”,也就是“action expert”(动作专家模型)。
或许对小鹏来说,其自动驾驶的能力得到验证之后,需要更多在座舱侧的VLM大模型上发力,并思考自动驾驶如何反哺智能座舱。第二代VLA媒体体验日后的群访上,小鹏通用智能中心负责人刘先明表示,有信心将在自动驾驶上验证过的AI能力大规模迁移到座舱上。
热门跟贴