开源模型注定落后半年,真正的胜负手是“发明新算法”

编译 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

把 AGI 的时间表压到五年内,把它形容成“工业革命的 10 倍、而且快 10 倍”,这些话当然足够大,也足够像 Demis Hassabis 会说的话。

最近,20VC 主持人 Harry Stebbings 采访了 Google DeepMind 联合创始人兼 CEODemis Hassabis。这场长谈从 AGI 的定义、时间表和算力瓶颈开始,一路谈到 Google DeepMind 的重新整合、前沿实验室为什么会重新拉开层级、开源模型、药物发现、电网效率、AI 安全、劳动力冲击和欧洲创业环境。

打开网易新闻 查看精彩图片

Demis 这次给出的,不只是几句更响亮的未来口号,而是一张更具体的路线图:当“更大模型”已经不足以解释下一阶段全部竞争时,哪些能力缺口会决定谁继续往前,哪些现实落点会决定 AI 最终落到哪里。

但如果今天还只是把前沿 AI 竞争理解成“谁能继续把模型做得更大”,那真正更冷、更硬的那层判断,反而会被直接漏掉:旧一轮 scaling 红利并没有消失,但已经开始走到后半段;下一阶段真正能把实验室重新拉开差距的,不再只是规模,而是谁还能继续发明算法,并补上持续学习、记忆系统、长期规划和一致性这些能力缺口。

在 Demis 的叙述里,AGI 从来不只是一个远景判断,它越来越像一个现实工程问题:谁先补齐这些缺口,谁就更可能定义未来五年 AI 的真正胜负手

打开网易新闻 查看精彩图片

要点速览

  • 五年内出现 AGI 有很大概率,而且 DeepMind 从 2010 年开始对这件事的长期推演并没有根本逆转。

  • 真正更值得盯的,不是“模型还能不能继续扩大”,而是旧一轮 ideas 的红利已经开始见后半程。下一阶段能继续拉开差距的,会是那些还能发明新算法的前沿实验室。

  • 今天最关键的能力缺口已经很清楚:持续学习、记忆系统、长期规划和一致性,仍然是现有系统最不像“通用智能”的地方。

  • 对 AI 的下注远不止聊天模型。从 Isomorphic Labs 到药物发现,从电网效率到聚变与材料科学,他真正想推动的是 AI for Science。

  • 开源与闭源不会简单分出胜负。开源模型大概率会长期落后于最前沿半年左右,但仍会在小开发者、学术研究和边缘场景中持续重要。

打开网易新闻 查看精彩图片

AGI 没有被重新定义,时间表也没有被往后推

主持人:现在大家对 AGI 的定义差别很大。你这些年一直在认真谈这个问题,所以我想先从这里开始。今天在你看来,AGI 到底是什么?

Demis Hassabis:我们对 AGI 的定义其实一直很一致:它本质上是一个能够展现人类心智全部认知能力的系统。这个定义很重要,因为人脑是我们目前唯一已知的、证明“通用智能是可能的”存在。对我来说,这就是 AGI 的标准。

主持人:那个大家最常问、也最糟糕的问题还是得问:我们离它还有多远?很多非常有影响力的人都在说,也许 2026、2027 就会到来。

Demis Hassabis:我心里当然有一个概率分布,但如果你让我现在给一个总体判断,我会说:未来五年内出现 AGI 的概率很高。这已经不算长了。

主持人:这个时间表比你以前想的更近了吗?

Demis Hassabis:其实没有太大变化。挺有意思的是,我的联合创始人、也是 DeepMind 首席科学家的 Shane Legg,在 2010 年我们创立 DeepMind 的时候就写过博客,预测 AGI 会在什么时候出现。

要知道,2010 年几乎没人真正认真做 AI,很多人还觉得 AI 根本走不通,是一条死路。可我们当年就是根据算力增长和算法进步做推演,大概判断从起点算二十年左右会走到那里。今天回头看,我觉得我们基本还在那条轨道上。

主持人:站在今天这个节点看,你觉得最大的瓶颈是什么?你在纪录片里提过一句话:算力永远不够。那现在最卡住我们的东西到底是什么?

Demis Hassabis:我觉得最大的问题还是算力

原因不只是最直观的那一层——你需要更大的系统、更多参数、更大的训练规模,随着这些东西一起扩大,系统通常也会变得更智能。

另一层同样重要的是,算力也是我们做实验的工作台。云计算基础设施,本质上就是我们的实验台。你有一个新的算法想法,必须在足够合理的规模上验证它,否则你根本没法知道,这个想法放进真正的大系统后还能不能成立。所以只要你有很多研究者、很多新想法,你就会发现自己始终需要大量算力。

主持人:你提到了 scaling laws。现在很多人都在说,scaling law 可能已经见顶,模型进步开始进入平台期。你认同吗?

Demis Hassabis:我不认同,或者至少我会说这件事比外界讲得更细一些。最开始各家都在做大语言模型的时候,每一代系统之间确实都有极其巨大的跃升,看起来像是性能翻倍。但这种幅度不可能永远保持下去,所以增长没有继续保持那种极端的指数形态,这很正常。

可这并不意味着继续扩展这些系统已经没有回报。我们和其他前沿实验室,依然都从这种扩展里拿到非常可观的收益。我的判断是:回报依旧很可观,只是没有最开始那样夸张了。

主持人:那么今天真正落后于你预期的地方在哪里?

Demis Hassabis:其实大多数领域,我们比我原来想得走得更快。你看视频模型,或者像 Genie 这样的交互式世界模型,如果你把这些东西拿给五年、十年前的我看,我会非常震惊。我觉得大部分领域都比当时整个行业的预期更靠前。但确实还有一些很大的东西没有解决,比如持续学习。系统在训练完成、发布到世界里之后,并不能很好地继续学习新东西。这类关键能力现在还是缺失的。

主持人:为什么持续学习到今天还没有解决?

Demis Hassabis:因为大家还没有真正搞清楚,怎么把新学到的东西整合进一个已经训练了几个月的大系统里。大脑在这件事上做得非常优雅,也许和睡眠、强化学习之类的过程有关。白天得到的很多信息会被回放,然后以一种很自然的方式,被整合进你原有的知识系统里。我以前就在想,我们也许需要某种类似的机制,让新信息能和既有知识库一起被吸收进去

主持人:你刚刚提到视频模型,也提到了世界模型。大家明显感觉到 DeepMind 在这方面追得非常快,甚至已经重新领先了。过去两三年,这种加速是怎么发生的?

Demis Hassabis:我们做了一些组织上的变化。我一直认为 Google 和 DeepMind 拥有最深、最广的研究人才储备。如果你回看过去十几年,支撑现代 AI 产业的大概 90% 的关键突破,来自 Google Brain、Google Research 或 DeepMind 这些团队。从 AlphaGo 到强化学习,再到 Transformer,这些都是关键突破。

所以如果还有哪些突破是未来必须完成的,我当然会押注我们自己去完成。后来我们做的,其实就是把公司内部原本分散的人才和资源重新装配起来,朝一个方向推。算力资源也是这样,大家不再各自做两三个版本,而是把资源并起来,去训练真正最大的模型。某种程度上,这更像是把原本已经有的所有原料重新装配起来,再以创业公司的速度和专注度去推进。

主持人:你刚刚说,如果还有哪些未来必须完成的突破——那你现在最兴奋的突破方向是什么?持续学习是你最看重的吗?

Demis Hassabis:我觉得还缺很多东西。

持续学习当然是一个。记忆系统也是一个方向。现在大家用超长上下文窗口,其实有点过于蛮力,就是把所有东西一股脑塞进去。我觉得这里还会有很多有意思的新架构被发明出来。再往后就是长期规划、分层规划,这些系统现在并不擅长处理非常长时间尺度上的规划。还有一个也许最大的难点是一致性。我有时把这些系统叫作“参差不齐的智能”——它们在某些事情上非常惊人,但你稍微换一种提问方式,它们又可能在一些很基础的地方失败。真正的通用智能不应该是这样坑坑洼洼的。

打开网易新闻 查看精彩图片

Google DeepMind 又回到了前线

主持人:你刚才提到组织变化和资源整合。今天大家明显感觉到 Google DeepMind 又重新回到了最前面。你会怎么解释这种变化?

Demis Hassabis:我觉得最核心的一点,是我们一直都拥有很深、很广的研究能力。过去十几年里,很多支撑现代 AI 产业的关键突破,本来就出自 Google Brain、Google Research 和 DeepMind。

区别在于,过去这些力量并不总是在同一个方向上被完全整合起来。现在我们做的,是把这些研究人才、算力资源和产品化节奏真正放到一个统一系统里推进,而不是让公司内部同时跑多个平行版本。这样一来,我们既能继续做前沿突破,也能把资源更集中地押到最重要的系统上。

主持人:所以你会觉得,Google DeepMind 重新回到前线,不只是因为模型能力追上来了,而是因为整套组织终于开始朝同一个方向发力了?

Demis Hassabis:对,我觉得这很重要。研究深度、算力资源和执行节奏,必须在同一个方向上叠起来,才能真正产生效果。你不能一边有很多突破性研究,一边又让资源分散在几个彼此重复的系统里。过去两三年,我们更像是在把原来已经具备的东西重新装配起来,然后以更高的速度去推进。

主持人:现在很多人都在讨论另一个问题:模型能力是不是正在商品化?不同实验室之间的差距,会不会越来越小?

Demis Hassabis:我不太这么看。我的感觉是,现在最前面的三四家实验室——我们当然是其中之一——差距反而会开始重新拉开。因为这些工具本身也会帮助你去构建下一代系统,比如编码工具、数学工具。另一方面,继续从同一套旧思路里榨出同样幅度的收益会越来越难。所以那些还具备发明新算法能力的实验室,在接下来几年里会有更大的优势。旧一轮创意的红利正在被越榨越干,真正决定下一轮差距的,会是新的算法突破。

主持人:所以你会觉得,接下来真正拉开差距的,不只是算力,也不是单纯扩大模型,而是谁还能拿出新的创意?

Demis Hassabis:对,我认为这会越来越重要。算力仍然是基础设施,但只靠扩大规模并不能解释下一阶段全部进步。真正的问题会越来越落到:你有没有新的方法,能补上现在这些缺失的能力。

主持人:那你怎么看开源的未来?很多创业公司现在都会先用最前沿模型定 benchmark,再用更便宜的开源模型尽量逼近。开源最后会走向哪里?

Demis Hassabis:我觉得大体会延续今天的格局。我们一直很支持开放科学和开放模型,从 Transformer 到 AlphaFold,很多关键成果本来就被我们放了出去。以后也会继续,尤其是在科学应用这些我最在意的领域里。

只是我觉得,开源模型大概率会长期比绝对前沿落后一步,大概半年左右。与此同时,我们也在非常认真地做 Gemma 这样的开源模型,希望它们在各自尺寸上做到最好,尤其适合小开发者、学术研究者、早期创业团队和边缘计算场景。所以这不会是“开源赢”或者“闭源赢”的简单问题,而更像是一种长期分层。

主持人:那么再往后看,大语言模型之后呢?有些人会说,现在这一路基础模型不会是最终答案,比如 Yann LeCun 就有很不一样的看法。

Demis Hassabis:我在一些问题上确实和 Yann 看法不同。我觉得基础模型已经证明了自己可以做出极其惊人的事情,所以它们不会消失。真正的问题不是“它会不会被替代”,而是未来的 AGI 系统里,基础模型到底是唯一核心,还是更大系统中的关键部件。我自己的判断更倾向后者:未来系统会建立在基础模型之上,也许还需要一些别的突破,比如世界模型之类的东西,但它不会被简单替换掉。

打开网易新闻 查看精彩图片

Demis 真正押注的,不只是 AGI,而是 AI for Science

主持人:如果我们把时间线拉到五年后,你觉得那个世界最积极的一面会是什么?

Demis Hassabis:我一直把 AGI 视为科学和医学的终极工具。推动科学发现、找到疾病疗法,这些事情都需要这样的技术。我希望五年甚至更长一点时间后,我们能开始进入一个新的科学发现黄金时代。

主持人:对我来说,最有感触的一直是药物发现。可问题是,哪怕 AI 真能帮助我们设计出药,它后面的临床试验还是要走十年。这个怎么解决?

Demis Hassabis:所以 AlphaFold 之后,我们才成立了 Isomorphic Labs。AlphaFold 解决的是蛋白结构预测,而 Isomorphic Labs 想做的是药物发现流程剩下的部分:化学设计、化合物优化、毒性和安全性评估,以及药物必须满足的各种性质。我觉得未来五到十年内,我们会把这套药物设计引擎做出来。

之后你说得对,真正的问题就会变成临床试验仍然需要很多年。但 AI 也可以帮助这个环节,比如模拟人体代谢的一部分过程,帮助患者分层,让不同基因背景的人匹配更合适的药物。我觉得真正的革命会发生在后面:当一批 AI 药物真正通过整个流程之后,监管机构积累了足够数据,也许未来就能信任模型预测到某个程度,从而跳过一部分步骤,或者更快地推进。

主持人:你刚才讲的是药物。可你也一直在谈能源、电网、材料科学。你是不是一直都把 AI 看成一种科学基础设施,而不是单纯的信息工具?

Demis Hassabis:是的,我一直这么看。比如电网,我们也许能把现有国家级电网的效率提升 30% 到 40%。再比如天气和气候建模,我们现在已经有世界上最好的系统之一。再往前一步,像聚变、新电池、超导材料这些突破,AI 也会是很关键的工具。如果这些事成立,AI 带来的变化会不只是模型本身,而是能源、气候、材料和工业系统都会被重新组织。

主持人:所以你真正想做的,不只是更强的 AI,而是用 AI 去推进科学本身?

Demis Hassabis:对。我最终最想被记住的,还是推动科学进步,做出能真正给世界带来巨大好处的技术,比如治疗严重疾病。如果 AI 只是更会聊天,那不是我最想做的事。

主持人:如果说科学和医学是最让人兴奋的一面,那另一面就是安全。Stephen Hawking 当年说过,我们必须把这件事做对,因为我们可能没有第二次机会。你认同这种级别的表述吗?

Demis Hassabis:我认同。我主要担心两件事。第一件,是坏人滥用这些系统,因为它们本身是双用途技术,既能用于科学和健康,也能被拿去做有害的事。第二件,是技术层面的:当系统更强、更具代理性、更自主之后,能不能真正被约束在我们希望它待的护栏内。我觉得这里需要合适的监管,至少在前沿提供者之间建立最低标准,而且理想情况下要有国际层面的协调。

主持人:你说监管要国际化,可现在全球协调看起来越来越难。那你理想中的“正确监管”到底是什么?

Demis Hassabis:我觉得首先要有一套最低标准,以及一组明确的测试基准,去判断系统有没有危险特征,比如欺骗能力。没有人应该去构建具备欺骗能力的系统,因为一旦它能绕过别的安全护栏,就会引入全新风险。再往后,也许需要某种类似认证的机制,让公众和企业知道,这个模型在若干安全维度上经过了独立验证。

主持人:那谁来做这件事?谁是那个验证和审查的机构?

Demis Hassabis:最终当然要落到政府,但真正做技术评估的,很可能是 AI 安全研究所这样的机构。英国已经有很好的例子,美国也有。理想情况下,一些真正有研究能力的国家都应该建立这种机构,由高水平研究者去独立审计这些系统。我更长远的想法,是要有某种国际层面的机构,某种意义上有点像国际原子能机构那样,去统筹这套标准与评估。

打开网易新闻 查看精彩图片

这一次的冲击会比互联网、移动互联网这些都更大

主持人:如果把安全问题放一边,另一个大问题是劳动力市场。AI 真像你说得这么大,它会带来多大的冲击?

Demis Hassabis:冲击肯定会发生。每一轮革命性技术都会替换掉一部分旧工作,同时创造一些事先很难想象的新工作。历史上通常后者会更高质量、回报也更高。但我也同意,这一次的尺度会比互联网、移动互联网这些都更大

我有时把 AGI 的到来说成是“10 倍工业革命,10 倍速度”,也就是在十年内完成过去一百年的剧烈变化。所以我们这次必须比工业革命时期更早、更主动地去处理副作用,比如财富分配、基础设施供给和制度安排。

主持人:那财富分配呢?如果生产率暴涨,但收益高度集中到少数公司和少数国家,怎么办?

Demis Hassabis:我觉得有很多种可能的路径。也许养老基金应该更系统地配置大型 AI 公司,让社会里的更多人间接拥有一部分收益;也许每个国家都应该有某种主权财富基金;也许如果生产率真出现巨大跃升,政府就得更主动思考如何把这些收益转换成基础设施、公共服务或者其他更普遍的回报。总之,如果收益只在很窄的地方累积,而不被重新分配,那会成为非常大的问题。

主持人:最后一个你经常被问的问题:为什么 DeepMind 一直留在英国,而不是彻底搬去美国?

Demis Hassabis:因为英国和欧洲一直都有极强的人才基础。我们有世界最好的大学、科学传统和工程人才。DeepMind 刚开始的时候,我看到的是:这里不是没有能力,而是还没有被真正组织成一个有雄心的深科技创业项目。另一方面,离硅谷远一点,也有好处。你会少受一些最新潮流和噪音的干扰,反而更适合做那种二十年尺度的深科技任务。当然,欧洲的资本市场和成长资金仍然是弱点。如果真要跨进万亿美元公司的级别,欧洲还需要能承接更大规模成长资本的市场。

主持人:所以如果你可以用“魔法棒”改一件欧洲科技界的事,你会先改什么?

Demis Hassabis:对英国来说,我会先解开养老金和成长资本的限制。欧洲其实不缺创业点子,也不缺把公司做成一定规模的能力,缺的是跨过那道门槛之后,真正能支撑全球级公司的那种资本市场。十年前我们给 DeepMind 融资的时候,这件事就很难,今天其实也没有被彻底解决。

打开网易新闻 查看精彩图片

【活动分享】"48 小时,与 50+ 位大厂技术决策者,共探 AI 落地真路径。"奇点智能技术大会是由深耕多年的「全球机器学习技术大会」重磅升级而来。2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开,大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块,特邀来自BAT、京东、微软、小红书等头部企业的 50+ 位技术决策者分享实战案例。旨在帮助技术管理者与一线 AI 落地人员规避选型风险、降低试错成本、获取可复用的工程方法论,真正实现 AI 技术的规模化落地与商业价值转化。这不仅是一场技术的盛宴,更是决策者把握 2026 AI 拐点的战略机会。