打开网易新闻 查看精彩图片

对主机厂来说没有什么比卖车更重要的事。

文丨魏冰

两次见到于骞,他都因为刚刚见完客户,穿着成套西装。随和、秩序感是他很容易留给人的第一印象。

于骞本硕就读于清华大学计算机系,后赴美国南加州大学攻读博士。毕业后先后加入 Google 和 Waymo,从事机器学习相关研发。清华、美国博士、海外大厂,这是一条典型的技术精英路径。

2018 年,他离开 Waymo 回到中国创业,理由是 “当时中国大部分自动驾驶公司做得不够好”。

对技术的信仰和对现实的务实,在他身上同时存在。他相信无人驾驶最终会实现,甚至认真讨论 “是不是能让机器人开车”;但他反复提到成本、效率、组织规模,以及在有限算力下如何把能力做出来。别的自动驾驶公司两三千人,轻舟只有 600 多人。别人堆更高算力,他想在最极限的算力下做出更好的体验。

轻舟智航此前不在行业最显眼的位置。2024 年他们在地平线 J5 芯片上实现了高速 NOA,并在理想车型上量产;2025 年基于地平线的 J6M 芯片实现城市 NOA。这两件事当时都不被看好——J5 被认为只能做基础功能,J6M 也难以支撑城市场景。但轻舟实现了,还把 J6M 的体验做到对标 Orin X 的水平。

3 月 23 日,轻舟智航完成 1 亿美元 D 轮融资。于骞说,自动驾驶正处在一个分水岭。轻舟接下来会把更多精力放在 L4 和更通用的物理 AI 上,同时加快海外布局。

自动驾驶是一条需要长期投入、也充满不确定性的路。于骞从上学到创业,一直在做自动驾驶,他说,“如果一辈子只做一件事,能把自动驾驶这件事真正做成,是一件挺幸福的事”。

把一颗 128 TOPS 的芯片做到极致

晚点:轻舟成立至今已经 7 年,这些年你闯过最大的难关是什么?

于骞:2024 年底就挺难的,我们给主机厂的智驾项目交付后体验非常好,但产品就是卖不动。主机厂当时认为对销量没有帮助,这种感觉挺痛苦的。当你觉得产品做的很好,又有很强的市场需求,但市场迟迟不爆发,绝望是很强烈的。

晚点:后来怎么熬过去的?

于骞:我比较感谢比亚迪,2025 年 1 月,比亚迪提出 “智驾平权”,把主机厂引爆了。我们在 2025 年底实现了这件事——我们用比亚迪天神之眼 C 同样的 128 TOPS 的算力做出了城市 NOA 。

也就是说,比亚迪吹的牛被我们实现了(笑)。

晚点:你们用的是什么算力方案?

于骞:和比亚迪一样——地平线 J6M。这也是我们今年首推的一个方案,我们在体验上做到对标甚至超过英伟达的 Orin X,2025 年 4 月发布,2026 年 1 月在理想汽车上量产。

对主机厂来说,1000 块钱都是一个很大的成本项,比如整车的座椅按摩系统,加起来可能也就几百块钱。

晚点:为什么你们能在单 J6M 上做到城市 NOA,为什么别人做不到,甚至地平线自己一开始也没做到?

于骞:因为我们是第一个识别出来的,第一个把它做到大规模量产。

晚点:什么是 “识别”?

于骞:当别人都认为 J6M 只能做到高速的时候,我们已经判断出来这款芯片能做到城市功能。这种识别能力还是基于我们底层对这款芯片的了解,基于我们对技术的判断和我们优化的能力。

第一个识别出来的人是有难度的,你识别出来,才能做出来,大家才能做出来。

晚点:在单 J6M 跑出了城区智驾,余凯(地平线创始人)是什么反应?

于骞:我猜他可能受到了不小的震动(笑)。他们后来也跟进了。

不过最早地平线的方案是用双 J6M 来做城市。但我一开始就判断,多 SOC(芯片)的方案很难成功,我们选择用一颗 J6M 来跑,最后成功了。

我们从过去的历史能看到:3J3、双 J5、J3+TDA4,五花八门的多芯片方案没有一个大规模成功的。复杂度高、成本高,而且算力不是线性叠加,两颗芯片不等于两倍性能,可能只有 1.5 倍。同时芯片迭代很快,到下一颗芯片的时候,就会有新的制程和方案出来,多颗芯片的效果不一定比一颗好。

我现在还是这个判断,多 SOC 的系统很难成功。

晚点:你说轻舟在单 J6M 上做出了 Orin X 的体验,这结论其他人认吗?

于骞:如果他们愿意认真评估的话。比如我们的合作方某头部主机厂就很清楚。有各种测试数据支持,主机厂也会特别详细的比较,行车、泊车、主动安全都会比较的,最后会发现我们的技术分就是非常好。

我们在一两百 TOPS 的算力水平上做到了极致,这个产品后面一定会大放异彩。

晚点:你们是怎么做到的?

于骞:说实话,我觉得做 Orin X 的那些人不够努力(笑)。

我们开始也没想到体验能做得这么好,到 2025 年年底客户实测时,才发现整体体验明显超过对标方案。到 2026 年 1 月,我们在几个客户那测评了后发现体验超了 Orin X、Orin Y 。

我们首先在 J6M 实现了无图和端到端。最早我们在 J5 上连无图都做不到,因为它对 Transformer 支持不好,我们在 J6 上做了 Transformer 架构,才追齐了无图和端到端。

但要想实现 L4,这个算力还是不够,所以我们今年也会量产更高算力(500TOPS )的方案。我们 2025 年下半年开始加入强化学习,因为它需要世界模型做的比较好,需要有更多轨迹的监督以及更大规模的优质数据监督,这点我们到 2025 年下半年才开始有一些体验,我们要争取 2026 年把它搞出来。

晚点:你很自信。但现实是,主机厂要么自研,要么有深度绑定的智驾供应商,比如长城和元戎、一汽和卓驭、吉利和千里。这种格局下,你们判断自己还有多大的空间?

于骞:我们 2023 年拿下理想的订单,之前大部分人也不相信我们能拿下。其实就靠产品和体验,没有别的。我们没和理想的人吃过一顿饭、喝过一顿酒,他们不间断地来看产品体验,大概有一百多人次。每一次来看,都能看到明显的进步。

客户关系只是敲门砖,再好也只是暂时。主机厂卖车承受很大 C 端竞争压力,如果产品体验不好,亲爹亲妈也没用。

算法不会被长期垄断,真正拉开差距的是工程

晚点:你们团队现在只有 600 多人,而很多自动驾驶公司在 2000 人甚至更多。

于骞:人多本身是一个 “很羞耻” 的事情。我希望人更少、更精简、更聚焦,理想状态是 200、300 人。

晚点:我们采访过沈劭劼,卓驭也擅长在中低算力下跑出高性能。你觉得你和他们的能力模型有何不同?

于骞:对,卓驭也很擅长 “识别”。

但我们跟其他家的一个差别是大家的标准不同。我们看了 TDA4 的方案,哪怕最早的 VM(Vision Model),后面的 VH(Vision + High),目前没有任何一个体验能跟我们 J6M 的体验接近的。 如果只是为了实现功能,降低安全性和稳定性,算力可以更低;但如果要做到完整、可用且安全的体验,128 TOPS 是一个相对合理的基准线。

晚点:如果追求安全和体验,为什么不直接用 Orin 开发,你们在 2022 年选择了地平线 J5 芯片,当业内普遍认为 J5 是一个在算力和带宽上有限制的产品。

于骞: 本质还是看中了国产化的确定性。我们判断,国产芯片在国内一定会有机会。在那个阶段,行业里绝大多数 L4 公司几乎清一色用的是英伟达方案,我们自己也用过双 Orin X,也登上过 GTC。

如果选 Orin,就要和所有主机厂在同一资源池里竞争。我一直觉得创业要选 “窄门”,去竞争不那么激烈、但确定性更强的地方。国产化选择很少,但方向确定,表面看是一条更 “窄” 的路,反而更容易形成竞争力。我们也擅长用相对有限的资源做出好的体验,这个选择当时是对的。

2022 年我们看了很多家国产芯片,各家都做过比较深入的研究和对比。综合判断之后,我们最终选择了地平线。我们最早选择 J5 的时候,我们当然清楚它的问题,但当时更重要的一点在于:我们选择的不是一颗芯片,而是一套国产化生态。

晚点:那当时为什么不选择更低算力的 J2、J3,或者 TI 的 TDA4?

于骞:我们做过很多工作。J2、J3 基本做不了 OTA,那是上一代的东西。但我们做自动驾驶,从长期目标来看,是要奔着完全无人驾驶去的。如果连 OTA 都做不了、数据也回传不了,那就是 “一锤子买卖”,这样的量再大,我们也不会做。

晚点:在开发 J5 方案的过程中,学习到了什么?

于骞:J5 的限制非常多。它的带宽不够,对 Transformer 支持也不好,CPU 能力弱。我们几乎是针对每一个限制点都单独做了优化。比如,既然 J5 不擅长 Transformer,我们就专门为它设计了一套 backbone,也就是主干网络,尽量采用它更适合的卷积结构;带宽不够,就改网络结构,降低传输压力;CPU 弱,就做大量系统优化和异步处理。基本每一个瓶颈我们都单独想办法解决,最后终于把高速 NOA 跑出来了,但就到这为止了。

晚点:轻舟有没有形成一套自己的方法论?

于骞:第一是尽量把事情一次做对。

这点我们是从 Waymo 学到的。做 J5 时,很多公司会先沿用原有方案,再往 BEV 过渡;但我们当时判断,J5 可以直接把 BEV 做到量产,所以一开始就走了这条路,最后也做成了。那个阶段做 J5 的公司不少,但真正做成的不多。很多团队什么都想选、什么都想优化,最后反而什么都没做好。

第二,是把自动驾驶当成工程问题,而不只是算法问题。背后其实是一整套工程体系,包括开发、验证和迭代流程。

晚点:很多智驾从业者会提到从规则时代切换到数据时代的艰难,你们经历过吗?

于骞:我们相对没那么痛苦,因为我们很早就相信机器学习是最核心的。刚开始做智驾时,我们已经把感知做成模型了。我当时判断,所有非数据驱动、非机器学习的部分都会越来越少,直到消失。

所以我们很早就开始做仿真,甚至一度被外界看成一家仿真公司。因为在我看来,自动驾驶不管算法怎么演进,最后都绕不过验证。

但仿真这件事非常难。车上跑的是一整套复杂的实时系统,里面有 GPU、CPU,还有各种控制单元;云端不可能把这套硬件原样复刻,所以仿真本质上是另一套系统,更像车端的 “镜像”。它不需要实时运行,但结果必须和车端一致。否则你在云端验证通过的东西,上车就可能不成立。这里面最难的是一致性和可复制性。

这也是为什么我一直觉得,自动驾驶真正的瓶颈,不只是模型本身,而是你有没有能力搭出一套有效的验证体系。现在很多头部主机厂,仿真其实做得一塌糊涂。

我经常举一个例子:AI 能在围棋上打败李世石,为什么自动驾驶到今天还这么难?因为围棋可以在虚拟环境里无限对局,但自动驾驶要在真实道路上跑。谁能把仿真做好,谁就能把大量真实道路测试搬到虚拟环境里做,大幅加快技术迭代。大家都在讲 VLA、VLM,但我觉得更本质的是世界模型。世界模型本质上是把仿真再往前推很多步:在虚拟世界里构造一个尽可能接近真实物理世界的环境。

一旦这件事成立,自动驾驶会出现一次非常陡峭的能力跃升。很多原来必须在路上完成的测试,都可以转到虚拟环境里。这件事的重要性,比今天很多人讨论的模型形态都要大。

如果这一层真的突破,自动驾驶会进入一个完全不同的阶段。

自动驾驶会先于更复杂的具身场景,成为世界模型落地的入口

晚点:你现在最大的 bet (判断)是什么?

于骞:我坚信 “世界模型 + 强化学习” 是未来。

晚点:特斯拉是强化学习吗?

于骞:我敢把这句话放在这,现在没有一家公司能真正做到纯强化学习,特斯拉也做不到。我认为特斯拉现在还是很多模仿学习,不是纯强化学习。

晚点:你怎么定义世界模型?和业界提到的有什么不同?

于骞:我说的世界模型,不是在车端跑一个更大的模型,而是在云端搭建一个足够接近真实世界的虚拟环境,让模型能在里面运行、验证和迭代。

它和业界说的世界模型,尤其是李飞飞所说的那种更完整的物理世界模型,不太一样。后者要处理更完整的空间、因果和物理交互,上限更高,可以解决更普遍的问题,但代价也非常高。

自动驾驶面对的,其实是一个被简化过的物理世界。它不需要处理那么多复杂交互,比如碰撞、摩擦、温度。所以我觉得,世界模型会先在自动驾驶里落地。如果四个轮的机器人都搞不定,你去搞那些非结构化的场景更难。

我觉得自动驾驶通向未来物理世界很重要的一个入口,这个入口必须要解决掉。

晚点:很多具身公司 CEO 会认为,他们直接做机器人也可以解决这个 “入口”。

于骞:我觉得还差很远。人类学习很多能力,依赖的是在物理世界里不断试错,尤其是强化学习意义上的试错。小朋友学走路,都是摔很多次才学会的,它是一个在失败中学习的过程。但机器人没有这么多低成本失败的机会。机器人如果在物理世界里反复摔,摔十次,本体可能就坏了。

晚点:也有人质疑自动驾驶里的 “世界模型”,认为端侧根本不需要那么大的模型。

于骞: 我觉得现在很多人说的 “端侧世界模型”,更多是个噱头。本质上,它只是一个更强的预测模型,仅此而已,我不认为那是最重要的。

真正重要的世界模型在云端,作用是训练和验证,你可以把它理解成新的训练基础设施,不是直接搬到车上跑,也不是简单蒸馏到车端。更准确地说,云端世界模型是训练车端模型的一种方法,它提供了一个更高效的训练环境,让你能更快训练出更好的端侧模型。车端最后只会保留其中一部分能力,比如一个简化版的短时预测能力,去预测未来几秒钟的情况,比如 3 秒、5 秒。

真正的云端世界模型,是对物理世界规律更完整的理解。它可以持续运行,生成很长时间尺度的连续序列。给它一段视频输入,再加上方向盘、刹车、油门这些控制信号,它就可以在虚拟物理世界里持续 “漫游” 下去,不断生成后续状态,这是连续的、开放的。但车端没必要做这件事,车端只需要关心未来几秒钟。

晚点:训练强大的云端世界模型,通常需要海量数据。你们怎么高效获得这些数据?

于骞:是,而且这种 “海量” 比普通感知模型要求更高,因为它学的是一个动态世界。

对我们来说,肯定是要找出最优的效率最高的方式。因为是建立了一个新的生产环境,如果这个生产环境比你去物理世界采集数据还贵,那就没有意义了。早期其实有很多方法,比如先把 3D 世界完整建模、生成、再筛掉不合理的部分。这样也能生成很真实的物理环境,但成本甚至比路测还高。

所以我们的目标,不只是把环境生成出来,而是更高效地生成,同时尽量减少那些不真实的数据和毛刺数据。

晚点:我感觉你看技术,带着很强的系统工程视角,同时有很强的成本意识。

于骞:是,这方面我们受谷歌影响很深。团队里很多人来自谷歌和 Waymo,所以在软件工程上,有一套比较完整的方法。

只要涉及到物理世界,就不是单纯比算法。算法更新太快了,没有谁能永远领先;真正决定差距的,是你能不能更快把算法变成产品能力,能不能在更小算力的平台上把体验做出来。

所以自动驾驶拼到最后,拼的不是某一个模型,而是一整套工程体系:开发怎么做,验证怎么做,迭代怎么做,部署怎么做。谷歌过去在软件工程上沉淀了很多 “最佳实践”,后来基本都成了行业共识。现阶段全世界最好的工程实践一大半是谷歌来推动实现的。

晚点:下一个你们要挑战的高峰是什么?

于骞:我们今年会量产一套 500 TOPS 以上的方案。这套方案的目标,是把城市 NOA 的体验做到接近 L4——不是 L4,但非常接近。

算力不是线性增长的,100、200、300、400 TOPS,这种提升用户是感知不到明显差异的。新方案一定要带来代际级的体验跃升。如果只是比现在好 20%、30%,是没有必要重新做一套方案的。我们内部的判断是:成本可能增加 50%,但体验至少要提升一倍甚至更多,这件事才有意义。

这个行业是往上走的,不是往下走的。去年大家在做高速 NOA,今年是城市 NOA,明年就是 500TOPS 的城市 NOA,会非常接近 L4 体验。做不到,就会被淘汰。

我们希望把这套能力放到 10 万到 20 万的车上,让普通用户也能用到现在高端车才有的体验。我相信我们的价值很快会被大家认识到,今年就会看到 “地大华魔” 的排名有变化。

“创始人雄心”

晚点:你和王兴都是清华 97 级的,你们在学校的时候认识吗?

于骞:我们应该同时住过新生楼,但不认识。

我上的清华计算机系。大学期间我在人人网打过工,后来慢慢发现,相比挣钱,做研究、琢磨问题对我来说更有吸引力。

晚点:一个很典型的 “学霸路径”,本硕清华、出国深造、进海外大厂,再回国创业。

于骞:我最开始其实特别想走学术路线,硕士进了清华的人工智能重点实验室,后来去美国读博士,我是想当老师的,只不过当时终身教职特别难找(笑)。

晚点:什么时候意识到自己应该创业?

于骞:我 2012 年的时候就想回国创业,那时候商汤还没有成立,我看了好多都是做安防的,觉得挺没劲的,所以又回美国打工了。

真正决定出来是在 2018 年。当时我在 Waymo ,感觉他们节奏太慢了,后来我也理解,它做的是一件 “徒手攀岩” 的事情,慢是合理的;但我觉得这件事在中国能更快实现。

我本来还挺希望代表 Waymo 外派回中国,但后来 Waymo 的中国计划没有真正成立,我多少也有点失落。所以索性出来创业做一家公司吧。

还有一个原因是,我在清华读硕士最开始就在移动机器人组,做的就是清华移动机器人五型车,本质上也是自动驾驶,所以这条线我其实兜兜转转走了很多年。我内心中觉得如果一辈子做一件事,能够把这件事做成,挺幸福的。

晚点:所以你当时创业是想比 Waymo 更快实现 L4?

于骞: 我觉得至少在中国,这件事可以更快实现。

而且我当时跟国内很多自动驾驶公司都聊过,就觉得很多人的理解其实还不到位。这个东西你一问就知道。比如仿真怎么做、测试怎么做、验证体系怎么建,很多公司其实没有真正想清楚,有些甚至几乎没有形成系统性的认识。

晚点:为什么 Waymo 可以一直坚持 L4,而中国所有本来做 L4 的公司都会转向 “沿途下蛋” 的渐进式路线?

于骞:我觉得来自创始人雄心。Waymo 当时有很多 Founders’ Challenge,就是 Sergey 和 Larry(Google 联合创始人) 给团队提出的挑战。当时 Sergey 经常跟我们一起开会,我感觉他们对这个事是非常坚信的。

像 Cruise,规模已经很大,但一次事故就可能让公司走到终局。它本身也有很多问题,包括研发问题、团队理念不一致等;更重要的是,背后缺少像谷歌创始人那种雄心壮志:不管有任何的理由挑战,必须把这事做成。

国内很多公司的一把手是不相信的。大概 2020 年左右,我和一位国内科技公司 CEO 面对面聊过,他当时觉得这件事投入无底洞,根本就做不出来。当然我觉得他在不同时间也会有不同的变化。

很多人讲第一性原理,好像 “两点之间最短”,就一定要直接去做 L4,不然就是偏离使命、背离信仰。但我不这么看。如果一条路径在现实中走不通,那反而会变成一个长期没有回报的投入。对我们来说,更重要的是找到一条可以逐步落地、不断验证的路径。

晚点:既然开始做了这么苦的 2B 生意,还会有心力去攀那个最高的山峰吗?

于骞:我觉得我们是技术狂热,现实务实。

这种苦对我们来说,其实也是一种磨炼。没有经历过这么苦的生意,你后面很多事情是做不成的。我一直相信技术能改变世界,但如果你的技术跟不上这个时代,吃再多苦也没有意义——搬砖也很苦。

我们不是为了去打那个最亮的技术点,不是为了证明自己在技术上最耀眼。说到底,这件事很简单:我要帮主机厂把车卖好。

晚点:你是什么时候变得这么务实的?

于骞: 对车厂来说,还有什么比卖车更重要的事情吗?

有一次活动上,大家拿李斌开玩笑,说你最近很忙啊,忙着卖车去了吧。李斌就回了一句:对啊,还有什么是比卖车更难的事?

题图来源:轻舟智航