打开网易新闻 查看精彩图片

“任何你觉得 That's it(就这样了)的时候,很可能就会有新的技术出现。”

文丨郭瑞婵

编辑丨龚方毅

智驾行业每隔一段时间就会冒出一轮终局论。2023 年地平线 CEO 余凯说行业十年终局仍将是 L2+++;一年后行业更愿意谈 “决赛圈”“淘汰赛”;去年判断变得更加具体,余凯说 “行业大局 3 年可定”,Momenta CEO 曹旭东说 “智驾竞争将在 2026 年结束,国内只有三家胜出”。

文远知行 CEO 韩旭觉得,所谓 “终局论”,是因为跑在前面的人气喘吁吁,急着要比赛结束 —— 但比赛不会因为领先者的意愿而结束 —— 自动驾驶技术还在快速迭代,几个头部公司都兵精粮足,有充足的现金储备继续投入。“甚至连 ‘结束的开始’ 都不是,现在只是 ‘开局的结束’。” 他对《晚点 Auto》说。

过去两年,文远知行确实成为了智驾量产排位赛里的新变量。去年 8 月发布了一段式端到端方案(用一个模型把传感器数据输出为驾驶决策,不经过人写的规则),获得奇瑞、广汽的量产定点,被一家智驾公司技术负责人评价为 “行业新晋黑马”。持续扩张的 Robotaxi 业务推动文远知行去年收入增长 90%、达到 6.9 亿元。

韩旭说,一段式端到端的突破有一个前提:文远内部研发多年的仿真平台 WeRide GENESIS 取得了超预期的进展。

一段式端到端的能力从数据中训练而来,学习的优质数据越多,能力越强。但数据恰恰是行业共同的瓶颈:Robotaxi 公司的运营场景更集中、数据更干净,但和其他 Tier 1 一样数据规模有限;车企虽有数百万辆车产生的海量数据,优质数据比例很低,筛选有用场景,像从矿石里挑钻石;各家前期可以力大砖飞,再往后,双方都需要更高效的数据生产方式。

韩旭把 WeRide GENESIS 比作一套合成钻石的工具,按需生成各种天气、光照下的复杂驾驶场景,场景中的其他车辆还具备类人的驾驶行为,可模拟出突然加塞、违停占道等博弈行为,直接用于训练一段式端到端模型。这种能生成模拟真实世界视频数据的仿真模型,在行业里也被称为 “世界模型”,都是在云端搭建的模型训练环境。

今年 1 月,文远正式对外发布了这套仿真数据平台,我们借此与韩旭进行了一次对谈。交流中,他明确反对行业里一些流行判断,比如一段式端到端 “上限高但下限低”、自动驾驶的技术范式已经定型等,“任何你觉得 That's it(就这样了)的时候,很可能就会有新的技术出现”。

以下是《晚点 Auto》与韩旭对话的主要内容,略经编辑:

一段式端到端的突破,先要解决数据从哪来的问题

晚点:文远知行去年 8 月发布了一段式端到端方案,成为一些业者眼中的 “黑马”,你们什么时候开始做一段式端到端?

韩旭:我们挺早做一段式端到端,只是直到去年 8 月取得阶段性突破才对外公开。对很多人来说,端到端是自动驾驶里的新路线,但 10 年前我们在语音识别领域就已经实践过了。2016 年我在百度时和吴恩达一起做了全球第一个基于端到端的中文语音识别系统,Deep Speech 2。Anthropic 的创始人 Dario Amodei 当时是我的共同作者。

那是很标准的一段式端到端系统,输入是语音,输出是文字,中间没有人为拆分的模块。我那时就想是不是也有机会用在自动驾驶上。2022 年和奇瑞开始合作时,我们其实已经有相关研发,只是算力和数据条件还不够,很长时间都没有突破。

早期训练一段式端到端,就像驯服一头野兽。车大部分时候可以开得很好,但有时也会突然乱打方向盘。量产有时间限制,我们不可能等到它完全成熟才上车,所以从高精地图到无图、再到两段式端到端和一段式端到端逐步迭代。我们和奇瑞合作的第一款车型星纪元 ES (2024 年 3 月推送高速 NOA 辅助驾驶功能),还是基于传统机器学习的高精地图版本。

晚点:有同行说,文远知行去年能做出一段式端到端,是因为从特斯拉挖来了技术大牛。

韩旭:这绝对子虚乌有。首先,我们没有从特斯拉挖人,更不存在去学别人的技术。第二,回顾文远知行的历史就知道,我们很少去挖其他家的人,最近发布的 “英才计划”,更强调校招英才,自己内部进行培养。

另外,我不太同意 “个人英雄主义” 的说法,一支球队拿了冠军是整个球队的荣誉,而不是一两个球星的功劳。

晚点:那你们去年突破一段式端到端的关键是什么?

韩旭:一段式端到端最缺的是高质量数据,尤其是现实世界里很难稳定采集到的长尾数据。过去我们一直受这方面的制约。真正推动研发进度明显加快的,是通用仿真模型 WeRide GENESIS。它可以生成大量现实中极少出现、但对训练又非常重要的场景数据。

过去车企说他们的优势是有数百万辆车产生的数据,可从巨量数据里获得有用的长尾数据,但这就像在一堆矿石里人工提炼、筛选钻石,最后只有个位数数据可用。WeRide GENESIS 就像发明了一套合成人工钻的工具,不需要大矿石,只要有碳,用强压就能根据自己的需求产生合成钻,生成任何想要的数据。

晚点:WeRide GENESIS 也是去年取得较大突破,是什么巧合么?

韩旭:WeRide GENESIS 和一段式端到端相互促进。我当然希望更早突破,只是最终在那个时间点做出来了。

晚点:WeRide GENESIS 解决了哪些问题?

韩旭:第一是更真实,过去很多生成内容是 Computer Graphics(计算机图形学,简称 CG)生成的,一眼就能看出是假的。第二是物理一致性,比如下雪、强光等复杂环境,生成结果符合真实物理规律。第三是它在 3D 空间完成生成和重建,精度达到厘米级,视角变化后不会失真。第四是我们给场景里其他交通参与主体都赋予了 Agent 形式,可以像人类司机那样抢道,和那些根据预设程序匀速直线运动的物体有很大不同。

晚点:为什么取名 GENESIS?翻译过来刚好是 “创世纪”。

韩旭:我们联合创始人兼 CTO 李岩取的,是 Generative Engineered Neural Environment for Simulated Intelligence in Self-driving(用于自动驾驶模拟智能的生成式工程化神经环境)的首字母缩写。

但我觉得不是刚好,就是李岩故意的。

晚点:这两年智驾行业在提 “世界模型”,它和 WeRide GENESIS 的关系是什么?

韩旭:WeRide GENESIS 本身就是世界模型,它能生成模拟真实世界的视频数据。但自动驾驶需要的世界模型,和具身智能讨论的世界模型可能不同。WeRide GENESIS 不需要阐述物体的硬度、温度和材质。

晚点:WeRide GENESIS 用到了哪些新技术?

韩旭:只能说我们使用了最新的生成模型,具体的技术细节不方便对外公开,但像 NeurIPS、ECML 上发表的很多研究,我们都有跟进。

晚点:生成式模型常见的问题是幻觉,你们怎么处理?

韩旭:幻觉确实可能出现,完全消除非常困难。我们用基于人类反馈的强化学习去约束生成结果,同时用自动驾驶算法本身去反向筛数据。因为数据存在明显幻觉时,自动驾驶系统的行为通常会异常,这类问题其实比较容易被检测出来。

晚点:幻觉问题和数据质量有关吗?

韩旭:当然。如果数据来自量产辅助驾驶,往往比较 “脏”。而文远知行大部分数据来自自有 Robotaxi 车队,比一般数据干净得多,而且大部分都可以用,我们用这些数据训出来的 WeRide GENESIS 幻觉比较少。

晚点:你们怎么评估 WeRide GENESIS 是否好用?

韩旭:我们会去看 inspiring 指数或者攻击弱点的指数,比如是否能产生很多我们没想到的、但确实可能真实发生的场景,帮助我们找到自身算法的局限性。

晚点:对于仿真技术,现在业内比较推崇特斯拉的 3D Gaussian Splatting(3DGS,高斯泼溅),WeRide GENESIS 和它有什么区别?

韩旭:首先我们非常尊重特斯拉在视觉感知和 3D 重建领域的工作,他们推动了整个行业的进步。但 WeRide GENESIS 和特斯拉的 3DGS 在目标和架构上有本质区别。

特斯拉的 3DGS 主要用于车端实时环境重建 Occupancy Grid Map(占位栅格地图),是感知层的一部分。

WeRide GENESIS 的范围更广,是一个工具链的聚合平台,可以生成场景、生成符合物理规律的交互,我不知道特斯拉有没有做到后者,我们生成的每辆车都可以跟自车交互,这一点非常不容易。

WeRide GENESIS 还定义了复杂的评估指标,可以用来衡量交互是否自然,还可以自动诊断问题,甚至给出算法改进建议。

打开网易新闻 查看精彩图片

WeRide GENESIS 算法诊断、改进流程。

晚点:去年的智驾路线是 VLA、世界模型更火,文远为什么选择一段式端到端,而不是直接投入做 VLA 和世界模型?

(注:世界模型在行业里还有另一层含义,指车端模型本身,而非云端的仿真环境,比如蔚来智能驾驶研发副总裁任少卿认为,用图像直接交互的世界模型比基于语言模型的 VLA 有更高的认知带宽。)

韩旭:我个人觉得,VLA、世界模型这些名词本身没有太大意义。如果一段式端到端做得不好,照样不如两段式、不如规则算法。选择什么路线跟自己的目标实现相关,和品控、软件流程都有关系。

晚点:地平线副总裁苏箐认为接下来自动驾驶很难再有新的技术范式出现,你同意吗?

韩旭:我不觉得现在一段式端到端再加世界模型就是终局了,技术具有强大的不可预测性。任何你觉得 “That's it” 的时候,很可能就会有新的技术出现,所以要时时刻刻盯紧前沿、努力突破。我们要一直努力开发新的东西。

从 L4 到 L2++,文远知行补的是量产这一课

晚点:文远知行为什么要做 ADAS?是无心插柳的尝试吗?

韩旭:是我们 “处心积虑” 很久的规划。五六年前,车规级算力芯片主要还是英伟达 Xavier,算力只有约 70 TOPS,激光雷达价格也还在一两万元,当时不少 ADAS 方案甚至不装激光雷达,我认为 L4 和 ADAS 的技术栈差别很大。后来 Orin 出现,算力明显提升,激光雷达价格降到几千元,车厂也开始大规模上车,我的判断是,两者在算法上的距离已经没有过去那么大了,文远知行应该坚定进入 ADAS 市场。

晚点:奇瑞星途星纪元 ES 是你们拿到的第一个车型定点,当时你们怎么竞争到这个项目?

韩旭:博世的品牌、过往的声誉,以及我们的技术展示。我们向奇瑞展示了已有的 L4 技术,告诉他们,我们的 L2++、L3 能做到什么水平,同时尽量压缩成本,保持很强的服务意识、快速迭代的节奏。我们和博世合作 18 个月就推出了第一款高阶辅助驾驶量产产品,属于 “老兵带新兵”——老兵带着新兵在一个老兵都没有打过仗的战场上,打赢了一场仗。

晚点:如果新兵觉得要往 A 处打,但老兵要往 B 处打,那怎么办?

韩旭:我们几乎每天都会遇到这种情况,发生过拍桌子、各种拉数据吵架,但工程和科学世界有个特别好的地方在于,只要大家的心是正的,对事不对人,数据会自己说话,车开得好就行了。如果你是一个真正坦坦荡荡想做技术、想做好产品的人,是会坦率承认自己错误的。我非常讨厌明明错了还不认错的人。

晚点:奇瑞一开始对你们的印象是怎样的?

韩旭:我们也不知道,很多时候我们也很钝感,不管别人怎么看,我们努力做好就行。就像在画一幅油画,这个过程里客户对你的评判都不重要,最终能够出好的作品才是最重要的。感谢奇瑞的包容。

晚点:做奇瑞第一个项目时,你们多少人驻场?

韩旭:我们是车轮大战,一拨人驻完了再换一拨人,有时是百人规模驻场。

晚点:你们和博世怎么达成合作的?

韩旭:应该说,是博世最终答应了我们。任何一家想进入汽车和高阶辅助驾驶领域的创业公司,都会希望和博世合作,我们也一样。2018、2019 年,文远知行还参加过博世的孵化器训练营。非常感谢博世最终认可我们,愿意和我们合作。文远知行的长处是算法,但缺少量产经验;博世作为全球第一大供应商,在安全和软件质量管控上非常成熟,我们从中学到了很多。未来我们也会继续和博世紧密合作,更好地服务车企。

晚点:在你们和博世磨合的过程中,你改变最大的一个认知是什么?

韩旭:第一,不要急着下结论,相持不下的时候,大家可以再考虑考虑;第二,要时刻提醒自己,你不可能永远是对的,还是要具体问题具体分析。治理公司也是一样的,我从来不会说我永远都是对的,有争执的时候,就把逻辑和判断讲清楚,而不是搞 “政治”,抓住错误不放,要避免这种影响团队团结的负能量。

晚点:你们天天坐 L4 的车,回头再看 L2++,感受是什么?

韩旭:我们坐纯无人 Robotaxi,都可以在车里睡觉。现在的 L2++,我更多是觉得 “还行,勉强可以接受”,距离 L4 还差得很远。我心里对 ADAS 量产有一个更核心的目标,这也是特斯拉做得很好的一点,它通过公开视频展示 FSD 在极端场景下如何避免事故、甚至救人一命。

这也是我们在 ADAS 领域的优势:我们知道一辆车的安全性和驾驶质量的上限在哪里,我们照着 L4 的标准一点一点提升。我希望未来博世和文远知行的 ADAS 系统,能够有这样的 “尖峰时刻”。如果我们的技术真的产生了安全价值,对我个人和整个团队来说,都是最大的欣慰,这甚至比实现商业价值更令人开心。

晚点:会不会觉得 “L4 很酷,L2++ 很苦”?

韩旭:L2++ 真的很苦,因为它本质上是在提供服务。我以前是技术大拿的心态,即便在创业之初也是这样。和车企合作之后,我花了一些时间来学习服务意识,现在好多了,愿意以服务心态去对待。

我印象很深的一次,是我从上海坐了很久的车去芜湖看同学们。到芜湖的时候天已经黑了,办公室外面正好在修路,也没有路灯,黑咕隆咚的。那天还下着雨,我打着伞,一脚踩进了一个水坑,到了办公室,好不容易坐下,又坐到一张洒了汤的椅子上,裤子一下就湿了。我悲愤地站起来,再低头一看,发现刚踩水坑的裤腿也沾到了黏糊糊的脏东西,可能是水坑里的垃圾。

我作为 CEO 去看同学们,但大家都在忙,没人顾得上理我。我就自己去卫生间,一边烘干裤子,一边把裤子上的脏东西清掉。当时确实有点心酸,但再一想,大家都在拼,我也没什么可说的,就一起去做。

晚点:有没有特别想找人倾诉的时候?

韩旭:经常有。我有非常好的团队和朋友可以倾述,比如李岩,还有很多其他同事,他们也愿意听我倾诉、给我建议。

晚点:你一般会倾诉什么?

韩旭:什么都会倾诉。我也会说这样的话——“疯了吗?那谁的两段式端到端都做得不好,凭什么抓住我们的(一段式端到端)一顿猛批?” 但我们被人批完以后发发牢骚也就接着干活。没有车厂的猛批、没有来自对手的压力,我们怎么能做出好的产品?所以该吐槽吐槽,该干活干活。

晚点:同一时期和你们一起从 L4 转型拓展 L2++ 的还有其他公司。

韩旭:目前为止,全世界范围内两线作战且都取得成功的公司就只有文远知行。

晚点:为什么只有你们两线作战了?

韩旭:我们做到了坚持。团队累的时候当然会想放弃,他们常常会问,明明我们单独做任何一件事情,都可以做到全中国最好甚至是全世界最好,为什么我们要同时打两场战役?但文远知行有个很好的文化——抱怨归抱怨,决定了就要全力以赴。我们是一家非常相信集体主义精神的公司,追求把 infrastructure(基础设施,常指自动驾驶工具链)的各个方面都要做好。文远知行最具有竞争力的是它的内部培养机制,我从来不觉得找一两个 “大牛” 会改变一个公司的走向。

晚点:你们内部的培养机制具体是怎样的?

韩旭:我们无论哪条业务线都遵循内部培养的逻辑,我们有导师制,由老带新,新同事可以快速上手业务。

晚点:ADAS 量产团队和端到端团队做出成绩后有拿到额外奖励吗?这在文远知行内部属于重大突破奖吗?

韩旭:当然属于,给了年度特等奖。

晚点:做 ADAS 量产之后,对你们做 L4 最大的改变是什么?

韩旭:主要是工程性的帮助。L4 车队是自己的,有问题可以随时改,它的软件更像一个连续函数,任何时候都可以升级、改版。但 L2++ 的软件是一代一代迭代的,更像是离散函数或阶跃函数,到一个时间点必须封版,不能再改,所以一定要严格把握时间线去做,这对 L4 是很大的促进。

晚点:在 L4 场景里,怎样才能真正用好一段式端到端?

韩旭:这是一个非常核心的问题,但再讲下去就涉及太多技术细节了。如果你加入文远知行,我可以详细讲。

晚点:很多人会说,一段式端到端上限高但下限低。

韩旭:我个人的看法是,一段式端到端下限低,本身就是一个误解。很多 “下限低”,其实是模型幻觉的问题,关键在于你怎么把幻觉去掉。这不是一个简单的 “Aha moment” 就能解决,而是需要巨大的 infrastructure 来做,需要大量干净、有用的数据。那这些数据怎么来?从 WeRide GENESIS 来。

晚点:行业各家对于要不要用规则来给一段式端到端兜底安全有不同的看法,因为加规则可能会影响到原生的丝滑体验。

韩旭:我觉得这是人类的错觉。很多时候,人类对机器行为的解释本身就是错的。如果放在仿真平台里看,有些急刹并不是规则触发,而是端到端自己的决策。并不是 “好的都是端到端,差的都是规则”,现实不是这么简单。

不信智驾 “终局论”,只是跑在前面的人气喘吁吁了

晚点:今天,剩下的几乎每家都有自己比较深度绑定的车企客户,但文远知行还没有这样的客户?

韩旭:广汽投资我们了,是我们非常坚定的客户,我们在广汽有不少定点。但文远知行不太适合用单一的绑定关系来讨论,我们既做 L2++,也做 L4,会同时和多家车企合作,也会和很多平台公司、商用车厂商合作。

晚点:智驾行业喜欢讲排名,你怎么看 “地大华魔” 这个一梯队供应商排名?

韩旭:我觉得定点情况已经说明得很清楚了,这是一个客观事实。

我唯一的观察是,这个格局变化非常快。跑在前面的公司总会说 2026 年是决胜之年,最后只剩两三家,这是因为跑在前面的人也气喘吁吁,希望比赛能早点结束。对 ADAS 来说,远远还没到结束的时候,甚至连 “结束的开始” 都不是,现在只是 “开局的结束”,离终局还很远。

晚点:你觉得什么时候会结束?

韩旭:我认为比赛持续的时间甚至要比两三年更长,当然会有人说,落后者一定希望比赛越长越好。

但事实是,新能源车的竞争都持续多少年了,到今天我们还不敢说新能源车的赛局已定。自动驾驶技术还在不断迭代,一段式端到端出来,整个格局就变了,再看看几个头部公司都兵精粮足,有很多现金储备,这些信息结合在一起,从何能推演出 2026 年战局就会结束的逻辑,这就是 Wishful Thinking(痴心妄想)。

晚点:跑在前面的公司气喘吁吁,那文远知行是什么状态?

韩旭:从从容容、游刃有余。不过,我们也还有很大的提升空间,我们跟车企的合作还不够深入,定点还不够多。

晚点:你们用什么和 Momenta、地平线竞争?

韩旭:以前怎么竞争,现在还是怎么竞争,一个一个定点去谈,没有什么特别的。如果我们在技术上有一定领先性,能够很好地保证高阶辅助驾驶的安全性,车企自然会选择好的产品和服务。

晚点:不少智驾公司都在做软硬一体,只做软件会被挤出第一梯队吗?

韩旭:如果芯片出货量达不到百万级,一定是亏的。现在做软硬一体跟早期的新能源一样,都是在烧资本的钱来冲量,讲资本故事,能够从资本融到钱。软件公司找到优秀的硬件伙伴、提供好的软件能力,这本身是一个市场博弈的过程。

我喜欢《孙子兵法》里的一句话——“兵无常势,水无常形”,没有必赢的战略,没有必赢的战术,也没有必赢的武器,一切都是动态的,取决你怎么协作、怎么配合、怎么随机应变。

很多媒体认为只要用了某种技术路线,就一定能做好,这实际上是把真正的工程开发通俗化、娱乐化和演义化了。我对这些 “大词” 不感兴趣,也反对宣传只要用某种武器就一定会赢。

晚点:文远知行现在有 ADAS 量产业务,也有 L4 业务,未来会想做成一个什么样的公司?

韩旭:文远知行的战略一直没有变化:我们是一家自动驾驶公司,核心是无人驾驶技术,最主要的产品是 Robotaxi。与此同时,ADAS 是我们一个非常重要的方向。我们两条路线会慢慢合二为一,我们已经开始用一段式端到端做 L4,你们可能很快就会看到文远知行的 Robotaxi 变得更加丝滑。

我希望我们能够认认真真把技术做好,踏踏实实把人才培养好,成为全世界第一的自动驾驶公司,这对我才最具有实质意义,至于现在表现得好坏、排在第几位,都是暂时的。

晚点:特斯拉、小鹏、理想这类车企,以及 Momenta、元戎这类智驾公司,能有多大机会从 L2++ 做到 L4?

韩旭:我不觉得把公司简单分类是个好方法,这需要具体去看。我认为,如果特斯拉的 FSD 模式能真正做好并保证安全,是有机会的。但是端到端模式要保证安全,本身极其困难。这也是为什么只有极少数像文远知行这样的公司,才能把它真正做成。

晚点:这属于技术机密?

韩旭:是的,我现在确实没法说,所以你们也不用再问了。

晚点:L2++ 公司对于做到 L4 都很有信心,理想和小鹏最近都提到 L4 的落地时间节点在未来三年内,你会怎么看待这条时间线?

韩旭:要做成任何事都要有一定基础,比如参加高考,你在模拟考考到了年级四五十名,说 3 年后要考上清华大学,这是有可能的,但仍然需要非常多的突破性努力。放话容易,但要真正把事情做出来是难的。我更喜欢谈论已经做到的事情,以及如何做到,而不是每天说一些不切实际的目标。比起关注别人说了什么,我更关注我们什么时候能把无人驾驶覆盖到更广的区域。

晚点:Robotaxi 的商业模式是不是更利好打车平台?

韩旭:我觉得很明显不是,出行平台公司有很多家,而真正能够做到安全、可靠的无人驾驶技术公司只有两三家。这里面,我将所有用高阶辅助驾驶来展示自己将来能做无人驾驶的公司排除在外,在我眼中只有使用了自有技术,并实现至少 100 辆纯无人车队运行半年以上的公司,才可以称为 Robotaxi 公司。

晚点:你今天强调了很多遍 “安全”,但 “安全” 对文远知行这类 L4 公司来说,应该是技术最基本的下限?

韩旭:车辆能否安全运行,反映的是技术本质。发生事故是个小概率事件,当观测只有 100 次时,谁都没发生事故,消费者也就看不出差距。而无人驾驶是一个高频运行的系统,运行规模足够大、时间足够长之后,“大数定律” 就会体现出来——小概率事件发生的频次最终会在大量重复试验里收敛到一个稳定值。今天我们所看到的一两次安全事故,就是真正实力的体现,谁的安全事故少,谁的实力就是最好的。

晚点:大数定律是否也适用于 L2++ 定点的商业竞争?

韩旭:本质上是适用的,但有一个前提,数据必须完整、真实地被记录。如果小概率事件发生了,却没有记录,或被当作 outlier(异常值)抹掉,那大数定律就起不了作用。

晚点:在不出事故的情况下,消费者可能体验不出 60 分、90 分和 99 分智驾之间的差别,但 60 分的智驾更便宜、可能营销也更好。这对文远知行或行业里做到更高安全水平的公司来说意味着什么?

韩旭:这个问题很好。可以类比食品安全问题,如果没有监管,卖劣质食品的人一定会把卖优质食品的人挤出市场。

智驾也是一样,一定要保证出事故多的公司受到限制,甚至被淘汰。我们也看到,工信部已经在往这个方向制定规则、出台政策。所以本质上,还是要保证小概率事件被真实记录,并且有公平公正的市场监督。

消费者未来也可以通过保险的价格来识别,保险公司给哪个高阶辅助驾驶系统降保费,哪个就更安全。这个标准最有指标性,未来两三年内或许就能看到这个标准的应用。

晚点:我们能感受到,你不喜欢讲热词,这和你的求学或创业经历有关吗?还是来自你的个人性格?

韩旭:都有关系。我很早就经历过对热词的追逐,比如当年 SVM(Support Vector Machine,支持向量机)出来,大家就把 SVM 用到各种地方;后来 Sparse Representation(稀疏表示)、再到 Bayesian Network(贝叶斯网络)、CNN(卷积神经网络),都有出现类似情况。

但我觉得真正做研究、做产品,还是要回到问题本身。一个好的产品,不是堆几个 buzzword(时髦术语)就能让用户买单的。我对这些热词确实不感冒,因为满口热词的人,可能连几篇 paper 都没认真读过,实在是令人鄙视。

晚点:你是黄煦涛教授(伊利诺伊大学厄巴纳-香槟分校杰出讲座教授,被誉为华人计算机视觉宗师)的学生,在学校时,他也是以这样的方式去教你们的吗?

韩旭:我从 Tom(注:即黄煦涛教授) 身上学到了很多。他数学非常好,但从来不会向我们炫耀一些很复杂的公式,常说的反而是问题的本质是什么,鼓励我们去解决问题。他从来不说自己是 scientist,而是说 “I'm an engineer. Engineer is supposed to solve the problem(我是一位工程师,职责是解决问题)”。

李安琪对本文亦有贡献

题图来源:文远知行