23岁小伙用聊天机器人破解60年数学难题，但功劳不全归AI

字节漫游指南

2026-05-05 10:01 ·北京

一个没拿过高等数学学位的人，靠向聊天机器人提问，解决了一众数学天才六十多年没攻克的难题。这事听起来像段子，但加州大学洛杉矶分校的数学家陶哲轩说：这次可能是真的。

「标准起手式」集体翻车

这个月初，23岁的利亚姆·普莱斯在网上公布了他对一道「埃尔德什问题」的解法。埃尔德什问题是匈牙利数学家保罗·埃尔德什留下的一系列著名猜想，以晦涩难懂著称，不少至今悬而未决。

普莱斯没有高等数学学位。按他自己的说法，解法来自向GPT-5.4提问。

这不是AI第一次声称破解埃尔德什问题。陶哲轩专门维护着一个数据库，记录AI「帮助解决」的所有埃尔德什问题。但绝大多数情况，AI要么翻出了某个不太为人知的已有解法，要么给出的证明其实站不住脚。

这次不一样。

陶哲轩对《科学美国人》解释：「这个有点不同，因为确实有人审过了，而审阅的人 collectively 在第一步就集体拐错了弯。」

他所说的「第一步」，是指数学家们面对这道题时，都会先走一套「标准起手式」——一个被前人反复使用的解题路径。所有研究过这道题的人都从这里开始，结果全都走进了死胡同。

AI却绕开了这条路。它用了一个众所周知的公式，只是没人想过把这个公式用到这类问题上。

陶哲轩：「AI采取了一种出乎意料的方法。」

AI的「草稿」需要人类翻译

但别把这事想成AI单枪匹马搞定一切。

斯坦福大学的数学家贾里德·利希特曼专门研究埃尔德什猜想，他的博士论文就围绕其中一道展开。他对《科学美国人》说：「聊天机器人证明的原始输出其实相当粗糙，需要专家来筛选、真正理解它想说什么。」

利希特曼的这句话点破了当前AI辅助科研的真实状态：AI能抛出人类想不到的角度，但把角度变成严谨证明，还得靠人。

普莱斯的解法被发布在erdosproblems.com上，经专家审阅后被认定为有效。这是极少数AI真正「跳出框框思考」的案例——它克服了人类数学高手们陷入的「 flawed hivemind 」（有缺陷的集体思维）。

陶哲轩对此的评价带着数学家的克制：「我们发现了一种思考大数及其结构的新方式。这是不错的成就。至于长期意义，我认为尚无定论。」

为什么这次值得警惕乐观

领域内的专家确实对这次解法表示 enthusiasm ，但历史教训就在眼前。

去年10月，OpenAI副总裁凯文·威尔曾高调宣称聊天机器人解决了另一道埃尔德什问题。结果翻车了——AI只是借鉴了已有解法。威尔在遭到猛烈批评后删帖。

这类「狼来了」的故事，让每一次AI数学突破声明都自带怀疑滤镜。

但普莱斯这次的情况有区别：解法经过了同行审阅，且AI的贡献在于「思路」而非「搬运」。陶哲轩的背书也增加了可信度——他已成为AI攻克数学问题的权威仲裁者，说话有分量。

更深一层看，这件事触及一个核心问题：AI到底是在「思考」还是在「重组」？

陶哲轩的数据库揭示了一个尴尬现实：大多数AI「解法」本质是信息检索，把角落里积灰的旧证明挖出来。但普莱斯案例如果属实，意味着AI确实能产生人类专家集体错过的新颖思路——哪怕这个思路的「执行」依然粗糙，需要人类打磨。

这不是AI取代数学家，而是一种新的分工模式：AI负责打破思维定式，人类负责验证和精炼。

对科技从业者的启示

如果你在做产品或技术，这件事有几个值得咀嚼的点。

第一，「外行+AI」的组合正在入侵传统专家领地。普莱斯没有数学博士学位，但他知道怎么向AI提问，怎么把AI的输出交给专家验证。这种「提问能力」本身正在成为核心竞争力。

第二，AI的「半成品」价值被低估了。聊天机器人的原始输出被利希特曼形容为「相当粗糙」，但粗糙不等于无用。在创意和科研领域，一个错误方向上的新思路，可能比完美执行的老思路更有价值。

第三，验证基础设施决定AI落地的速度。erdosproblems.com这样的平台，陶哲轩维护的数据库，都是让AI输出从「噪音」变成「信号」的关键过滤层。没有这些，普莱斯的解法只会淹没在无数AI幻觉中。

陶哲轩说「jury is still out on the long-term significance」（长期意义尚无定论），这话放在任何AI突破上都适用。但有一件事是确定的：AI已经进入了那些被认为只有人类直觉才能触及的领域，而且开始改变「谁有资格做研究」的游戏规则。

下次遇到卡了六十年的难题，你会先找专家，还是先问问AI？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴