AI为何停滞？它可能走错了一条看似正确的路

AI范儿

2025-04-21 22:26 ·上海 ·优质互联网领域创作者

我们听过无数道理，却仍然过不好这一生。

这是一句流行却扎心的话。为什么会这样？很多人归因于“知行不合一”，但在我看来，还有一个更关键的原因：道理归道理，现实归现实。

换句话说，那些所谓的“道理”往往是脱离现实的。即便你能做到知行合一，也可能走不出困境。因为这些道理，本质上是基于前人经验的总结，是过去的答案。

但拿着老地图，是无法发现新大陆的。

让人意外的是，当今最先进的人工智能，也正在重复这条“拿老地图找新路”的老路。

近年来，人工智能依靠海量人类数据不断取得突破。你还在惊叹它们会写诗、答题，它们已经能作画、生成视频，甚至完成订机票、定酒店这样的复杂任务。而各种“智能体”更是在各类应用中崭露头角。

但奇怪的是，我们并未看到这些大语言模型在真正意义上的数学、科学等领域有重大突破。相反，自 ChatGPT 推出两年多以来，大模型的发展已显疲态，进展放缓，迫切需要新的突破方向。（想象一下，GPT-4 已经是 2 年前的产品）

为什么？

一个核心原因是：用于训练的高质量人类数据，已经接近耗尽。更深层的问题是：依赖人类数据的监督学习方法，已经触及天花板。

而许多真正重要的创新——无论是数学定理、科学发现，还是技术发明——恰恰超出了现有人类知识的边界，是任何“人类数据”都无法提供的。

难道 AGI 的梦想就此止步？

当然不是。问题的根源在于：虽然大语言模型的发展迅猛，但却在关键时刻“误入歧途”。

我们熟悉 AlphaGo 的故事。它最初靠大量人类棋谱训练，迅速击败了人类棋手。令人惊叹的是，它的继任者 AlphaZero 彻底放弃了人类棋谱，只靠自己与自己对弈，通过不断试错、反复交互，演化出一整套新颖而高效的棋法，甚至反过来成为人类学习的对象。

这就是典型的“体验式学习”。

不过，这种方式之所以一直未能走向主流，是因为它往往只在模拟环境中表现出色。现实世界远比棋盘复杂多变，目标模糊、奖励不明，而这正是传统强化学习难以适应的原因。

于是，AI 研究转向另一条路——以人类数据为核心的大语言模型。这条路在短时间内确实带来了泛化能力的爆发，但也带来了一个代价：

它造就的，是最聪明的模仿者，而非真正的创造者。

而人类历史上的伟大突破，恰恰发生在无图可循、无人可学的时刻。

正如一个刚毕业的学生，想要成长为真正优秀的工程师，课堂知识只是开始，必须要在真实项目中反复打磨、不断试错，才能真正形成经验与洞察。这种不断与现实互动、感知反馈、改进策略的过程，我们称之为：体验。

人工智能要迈入下一个阶段，同样必须走上这条“亲身体验”的道路。

而这，正是“体验时代”即将带来的变革核心：AI 将从人类数据中走出，转向与环境交互、从经验中学习的新路径。

这不是空想。AlphaZero 已经证明了体验式学习的潜力，而最近 DeepSeek 的工作也再次印证了强化学习的魅力——它不靠人类硬塞知识，而是设置好激励，让模型自己进化出高阶的解决策略。

强化学习的核心是什么？就是通过不断与环境互动、试错调整来实现目标。这套思维方式，才是真正让 AI 自主成长、突破人类经验边界的钥匙。

而现在，它终于等来了属于自己的舞台。

因为今天的 AI，已经初步具备了自主探索现实世界的能力。智能体正在以惊人的速度进化，它们可以自己搜索网页、控制鼠标、操控系统，甚至在虚拟设备中动手做实验。

与此同时，强化学习算法本身也在快速升级，能够支持更复杂的推理与规划能力。

于是，AI 即将从一个“问答式工具”，变成一个“持续成长的智慧体”。

它将拥有一条真正的“生命之流”——像人一样积累记忆、不断适应环境。例如健康助手可以长期追踪用户的身体状态；科研 AI 则能长时间运行实验、积累结果、推导模型。

这种连续性的“体验流”，正是当前碎片化大模型最欠缺的能力。

更重要的是，体验时代中的 AI 不再只是“听话”的输入输出工具，而是可以观察世界、操作世界，并从后果中学习的自主体。

它们将不再依赖人类反馈打分，而是以现实世界的反馈作为学习信号——比如心率变化、分数提升、销量数据等，直接用“发生了什么”来判断“做得如何”。

这将让 AI 真正成为一个在现实中成长的生命体。

体验式 AI 还有一个天然的优点：它能够修正自己的目标。

不像早期系统“一旦设错目标就一条路走到黑”，具备环境感知与反馈调节能力的 AI，更像人类那样，能随着经验及时调整方向。哪怕出错了，也能“撞南墙后回头”。（想想那个超级回形针的问题）

简而言之：AI 终于可以像科学家、工程师、学生一样，从世界中学习，在现实中进化。

而随着“体验式学习”与“强化学习算法”的融合，AI 也将迈向真正的“超人类智能”。

这个新时代，已经悄然到来。

【参考】

Welcome to the Era of Experience：https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf

本文由「AI 范儿」出品

我每天都在更新，如果你觉得这些内容对你有用，

那我们就加个关注、交个朋友。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴