我们听过无数道理,却仍然过不好这一生。

这是一句流行却扎心的话。为什么会这样?很多人归因于“知行不合一”,但在我看来,还有一个更关键的原因:道理归道理,现实归现实

换句话说,那些所谓的“道理”往往是脱离现实的。即便你能做到知行合一,也可能走不出困境。因为这些道理,本质上是基于前人经验的总结,是过去的答案。

但拿着老地图,是无法发现新大陆的。

让人意外的是,当今最先进的人工智能,也正在重复这条“拿老地图找新路”的老路。

近年来,人工智能依靠海量人类数据不断取得突破。你还在惊叹它们会写诗、答题,它们已经能作画、生成视频,甚至完成订机票、定酒店这样的复杂任务。而各种“智能体”更是在各类应用中崭露头角。

但奇怪的是,我们并未看到这些大语言模型在真正意义上的数学、科学等领域有重大突破。相反,自 ChatGPT 推出两年多以来,大模型的发展已显疲态,进展放缓,迫切需要新的突破方向。(想象一下,GPT-4 已经是 2 年前的产品)

为什么?

一个核心原因是:用于训练的高质量人类数据,已经接近耗尽更深层的问题是:依赖人类数据的监督学习方法,已经触及天花板

而许多真正重要的创新——无论是数学定理、科学发现,还是技术发明——恰恰超出了现有人类知识的边界,是任何“人类数据”都无法提供的。

难道 AGI 的梦想就此止步?

当然不是。问题的根源在于:虽然大语言模型的发展迅猛,但却在关键时刻“误入歧途”。

我们熟悉 AlphaGo 的故事。它最初靠大量人类棋谱训练,迅速击败了人类棋手。令人惊叹的是,它的继任者 AlphaZero 彻底放弃了人类棋谱,只靠自己与自己对弈,通过不断试错、反复交互,演化出一整套新颖而高效的棋法,甚至反过来成为人类学习的对象。

这就是典型的“体验式学习”。

不过,这种方式之所以一直未能走向主流,是因为它往往只在模拟环境中表现出色。现实世界远比棋盘复杂多变,目标模糊、奖励不明,而这正是传统强化学习难以适应的原因。

于是,AI 研究转向另一条路——以人类数据为核心的大语言模型。这条路在短时间内确实带来了泛化能力的爆发,但也带来了一个代价:

它造就的,是最聪明的模仿者,而非真正的创造者。

而人类历史上的伟大突破,恰恰发生在无图可循、无人可学的时刻。

正如一个刚毕业的学生,想要成长为真正优秀的工程师,课堂知识只是开始,必须要在真实项目中反复打磨、不断试错,才能真正形成经验与洞察。这种不断与现实互动、感知反馈、改进策略的过程,我们称之为:体验

人工智能要迈入下一个阶段,同样必须走上这条“亲身体验”的道路。

而这,正是“体验时代”即将带来的变革核心:AI 将从人类数据中走出,转向与环境交互、从经验中学习的新路径。

这不是空想。AlphaZero 已经证明了体验式学习的潜力,而最近 DeepSeek 的工作也再次印证了强化学习的魅力——它不靠人类硬塞知识,而是设置好激励,让模型自己进化出高阶的解决策略。

强化学习的核心是什么?就是通过不断与环境互动、试错调整来实现目标。这套思维方式,才是真正让 AI 自主成长、突破人类经验边界的钥匙。

而现在,它终于等来了属于自己的舞台。

因为今天的 AI,已经初步具备了自主探索现实世界的能力。智能体正在以惊人的速度进化,它们可以自己搜索网页、控制鼠标、操控系统,甚至在虚拟设备中动手做实验。

与此同时,强化学习算法本身也在快速升级,能够支持更复杂的推理与规划能力。

于是,AI 即将从一个“问答式工具”,变成一个“持续成长的智慧体”。

它将拥有一条真正的“生命之流”——像人一样积累记忆、不断适应环境。例如健康助手可以长期追踪用户的身体状态;科研 AI 则能长时间运行实验、积累结果、推导模型。

这种连续性的“体验流”,正是当前碎片化大模型最欠缺的能力。

更重要的是,体验时代中的 AI 不再只是“听话”的输入输出工具,而是可以观察世界、操作世界,并从后果中学习的自主体。

它们将不再依赖人类反馈打分,而是以现实世界的反馈作为学习信号——比如心率变化、分数提升、销量数据等,直接用“发生了什么”来判断“做得如何”。

这将让 AI 真正成为一个在现实中成长的生命体。

体验式 AI 还有一个天然的优点:它能够修正自己的目标

不像早期系统“一旦设错目标就一条路走到黑”,具备环境感知与反馈调节能力的 AI,更像人类那样,能随着经验及时调整方向。哪怕出错了,也能“撞南墙后回头”。(想想那个超级回形针的问题)

简而言之:AI 终于可以像科学家、工程师、学生一样,从世界中学习,在现实中进化。

而随着“体验式学习”与“强化学习算法”的融合,AI 也将迈向真正的“超人类智能”。

这个新时代,已经悄然到来。

【参考】

Welcome to the Era of Experience:https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf

本文由「AI 范儿」出品

我每天都在更新,如果你觉得这些内容对你有用,

那我们就加个关注、交个朋友。