独家专访元戎启行周光:一场关于信任、偏见与未来定义的对话

原创石劼C次元2026年4月17日 18:53上海听全文

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

作者丨石 劼

责编丨石 劼

编辑丨王 越

周光将阮翀这位前DeepSeek研发负责人带到了物理AI的战场,试图用大模型的‘大脑’,去修复小模型永远修不好的‘跷跷板’。这是一场关于信任、偏见与未来定义的对话。”

一场演讲,一次官宣,一个信号。

2026年4月11日,中国电动汽车百人会高层论坛现场,元戎启行CEO周光做完主题演讲后,台下掌声未落,消息已经在行业群里炸开。不是因为他又讲了无图、端到端或者VLA——这些元戎已经讲了好几年。真正让人意识到“这次不一样”的,是他官宣的那个人。

阮翀,前DeepSeek核心团队成员、多模态技术负责人,正式加盟元戎启行,出任首席科学家。而他的首次公开演讲,将出现在北京车展。

把技术发布权从CEO手中交给一位大模型公司的科学家,这在整个智驾行业都算头一遭。外界看到的是一则人事新闻,但周光看到的,是一场范式革命的前夜。

“他会加入一家Tier 1吗?不可能。他会加入一家AI公司。”周光对汽车公社说出了这句耐人寻味的话。

其实,周光的思路和发展模式,已经超越了一家新锐企业的势能积聚,更应该被视为中国科技的深度探索——谁说中国人只能从1到100做大做强,不能从0到1求新开创?

打开网易新闻 查看精彩图片

将阮翀引入团队,是周光在元戎启行和AI前沿能力之间架起一座桥;而周光更大的雄心,是让元戎启行代表中国创新企业,在整车行业与AI之间架起一座更雄伟的桥。

01

小模型的“跷跷板”,大模型的“基座”

2025年的智驾行业,表面热闹,内里焦虑。

市场规模超过1200亿元,量产芯片算力卷到750 TOPS,城区NOA渗透率却只有15%,用户黏性徘徊在20%-30%之间。消费者没有把城市辅助驾驶当成日常工具——这才是最让从业者睡不着觉的事。

周光用了一个词来形容当前的技术困境:“跷跷板效应”。同一套系统,早上跑得好,中午可能变差;在上海表现不错,换一个城市就不行。某个版本优化了某些场景,下个版本可能又退步了。

“反复修补、不断迭代,但没有本质提升。”周光说这话时,语气并不激烈,但每个字都像钉子一样砸在桌面上。

原因指向一个很具体的技术瓶颈:今天量产的小模型智驾,参数量多数在1B以下甚至0.1B以下,运行算力典型在100-200 TOPS。这类模型以卷积为主,只有少量Transformer架构。2024年端到端技术带来的兴奋已经过去,头部玩家增长放缓,第二梯队加速追赶——但天花板就在那里。

“脑容量不够。”周光打了个比方,“一个数据集翻来覆去地训,这边好了那边差,那边好了这边差。不会超过50到100公里接管一次,这个范式就做不动了。”

那怎么办?

元戎的答案是:40B参数的基座模型。

周光把智驾公司的核心能力拆解为三种角色:Driver(视觉输入生成驾驶动作)、Analyst(对关键场景进行理解和分析)、Critic(从安全与合理性角度评估驾驶行为)。过去行业只训练Driver——教系统怎么开。基座模型把三种能力统一起来:不仅会开车,还会理解为什么这样开,并评估是否开得更好。

“所有辅助驾驶公司的工作都应该沉淀在基座模型里。”周光说,“每一步的信息熵都留在模型中。”

我看到他在提到“Scaling”(规模化)这个词时,眼里同时有遗憾和憧憬两种神色。

遗憾是现在汽车智能辅助驾驶还多半困在小模型和工程的怪圈里兜兜转转,无法真正感知这个世界;憧憬是因为多模态大模型相当于冷兵器到热兵器时代的“质变飞跃”,真正能将智驾的Scaling落到实处,而汽车作为制造业 皇冠 参数 图片 )上的明珠, “规模化”始终是颠扑不破的真理,只是在多模态大模型之前,大家没有找到正确的方向。

这意味着智驾系统从“执行系统”升级为“认知系统”。周光透露,据元戎了解,Waymo和特斯拉已经实现了这一架构。而元戎,是国内第三方供应商里第一个走通这条路的。

02

多模态突破,让大模型公司“降维打击”

为什么是现在?为什么不是去年,也不是前年?

周光的回答很干脆:“2025年多模态领域没有明显突破。直到今年年初,随着Gemini等模型的发布,多模态能力才上了一个大台阶。”

这是一个被很多人忽略的时间线。2025年元戎推出VLA模型时,大模型本身还不够成熟。VLA深耕多模态,但多模态的真正突破发生在2026年初。Gemini、Seedance等模型的出现,让多模态从“技术不确定”变成了“钱的问题”——只要给够算力和数据,它就能work。

而多模态的本质,就是预测物理世界下一刻会发生什么。

“你预测个视频,它的根本目标是什么?”周光的语气突然变得直接,“一定是在物理世界里用。”

这正是大模型公司开始布局自动驾驶的原因。字节跳动多模态负责人周畅亲自带队杀入自动驾驶,其目标远不止于寻求短期的商业回报,而是为了验证物理AI。大模型在纯文本领域的突破已经结束,多模态的下一站,必须是物理世界。而汽车,是目前最高阶、最复杂的物理AI训练场。

“多模态突破之后,行业的焦点便转向于此,并逐渐达成共识——只有自动驾驶能落地物理AI。”周光说。

这对传统智驾公司意味着什么?

“真正的智驾竞争,不再来自同行,而是来自大模型公司的降维打击。”

这不是危言耸听。大模型公司有算力、有人才、有模型能力,缺的只是物理世界的真实驾驶数据。而元戎有30万台量产车、13亿公里行驶数据——这是大模型公司拿钱买不到的。

但元戎也在等待大模型的前沿能力。阮翀就是那座桥。

在行业看来,字节跳动亲自入局自动驾驶,其选择合作伙伴的逻辑,与传统的商业考量有着本质区别。

字节跳动不缺钱,不缺流量,不缺技术人才。它选择智驾合作伙伴,不会因为谁便宜、谁会搞关系。周光说得很直白:“他要的是理念的match(匹配,相投)。”

什么是理念的匹配?就是双方都相信多模态基座模型是物理AI的必经之路,都相信智驾的终局不是功能堆砌而是认知进化,都相信只有大模型范式才能突破小模型的天花板。

“他们甚至不介意合作伙伴获得更多的行业声量。”周光笑了笑,“他们要的就是理念的匹配。”

这种理念上的契合,比任何商务条款都更难复制。这实际上也传递出一个清晰的信号:不差钱的巨头,正在用它的选择,为它所认同的技术路线投票。

而周畅(字节跳动豆包大模型视觉多模态生成方向负责人)和阮翀,本来就是朋友。两个多模态领域的顶尖技术人,一个在大模型公司,一个在智驾公司,做着同一件事——让AI理解物理世界。

03

不做Tier 1,做AI公司

“我们是一家AI公司,不是Tier 1。”

这句话,周光在采访中反复强调。听起来像定位宣言,实际上是生存法则。

Tier 1的逻辑是什么?是满足客户短期的、确定性的需求,是卷成本、卷定点数量、卷市场份额。是客户说“我要这个功能”,你就加班加点做出来。是工程能力强、执行力强、响应速度快。

但AI公司的逻辑完全不同。AI公司要做的,是相信一个可能三五年后才能验证的方向,是在技术不确定的时候all in,是用认知而不是工程来建立护城河。

“你工程能力强,what?你量产到了一定规模,工程体系的优势会逐渐标准化,真正的护城河在于数据闭环与算法的持续进化。”

周光甚至透露,“我们的资源将更聚焦于数据与算法这类能够形成认知差异的环节。”

这种话,Tier 1说不出来。

阮翀选择元戎而不是其他智驾公司,原因也在这里。一个DeepSeek核心团队成员,不会因为“这家公司工程能力强”就加入。他加入,是因为元戎在做真正的AI——从基座模型到物理AI,从认知升级到范式革命。

“顶尖的AI人才,他不会因为这个原因加入你。你说你工程能力很强,这不行的。”周光说,“你得对AI有认知,因为他过来推动的事情可能就是反常识的。你要是不能理解,他也发挥不了作用,也很难存活。”

物理AI的上半场在车,下半场在哪里?

黄仁勋在2026年CES上重点提到了物理AI,认为它比生成式AI更有 远景 价值。周光的判断更具体:“物理AI的上半场在车,下半场在厨房。”

车是最高阶的训练场,但不会是终点。一旦基座模型在自动驾驶场景中被充分验证,它可以迁移到机器人、智能家居、工业自动化等任何需要理解物理世界的场景。

“那时候可能会跟小米这样的企业竞争吗?”笔者问道。

周光没有直接回答,“企业就跟生命一样,应该有新的出来。不应该老是那些站在那里。硅谷就是这样子,一代一代的企业。”

从这个角度看,元戎现在做的所有事情——量产、数据、基座模型、人才引进——都是在为那个更宏大的未来铺路。智驾是第一个战场,但不会是最后一个。

“我们量产有个底子,在这个点上该做这个事。水到渠成。”周光说。

04

明年,消费者会感觉到不一样

采访最后,我问了一个很现实的问题:大模型和智驾的结合,什么时候能让B端到C端都切实感受到收益?

周光想了想:“今年基座模型都会出来,特斯拉年底发。但真正让消费者有明显感知,我觉得是明年。”

“明年,大家会看到比较明显的提升。”

这个判断背后,是一个关键的时间窗口。今年多模态突破,今年基座模型上车,今年算力平台升级——但所有这些技术变量叠加产生质变,需要时间。一旦质变发生,智驾将从“可用”真正走向“爱用”,接管率会从几十公里一次跃升到几百公里甚至上千公里一次。

打开网易新闻 查看精彩图片

“小模型它也能做到几十公里一次接管,但上不去了。(MPI,Average Mileage Per Intervention,平均接管里程)极限就在50到100(公里)之间。要想再上一个数量级,只有上大模型。”

而元戎,已经在路上了。

从2023年国内首个不依赖高精地图的方案,到2024年首个量产端到端模型,到2025年首个VLA模型,再到2026年率先基于基座模型实现范式跃迁——元戎的每次技术跃迁都比行业早一步。

但这一次,对手不是同行,是时代。

北京车展上,阮翀将系统分享基座模型的最新技术进展。那将是检验元戎这盘棋的关键时刻——请来了DeepSeek的人,能不能真正做出DeepSeek级别的突破?

周光的回答只有一句话:“认知是第一位的。”

而元戎,从来不缺认知。