一个没拿过高等数学学位的人,靠向聊天机器人提问,解决了一众数学天才六十多年没攻克的难题。这事听起来像段子,但加州大学洛杉矶分校的数学家陶哲轩说:这次可能是真的。

「标准起手式」集体翻车

打开网易新闻 查看精彩图片

这个月初,23岁的利亚姆·普莱斯在网上公布了他对一道「埃尔德什问题」的解法。埃尔德什问题是匈牙利数学家保罗·埃尔德什留下的一系列著名猜想,以晦涩难懂著称,不少至今悬而未决。

普莱斯没有高等数学学位。按他自己的说法,解法来自向GPT-5.4提问。

这不是AI第一次声称破解埃尔德什问题。陶哲轩专门维护着一个数据库,记录AI「帮助解决」的所有埃尔德什问题。但绝大多数情况,AI要么翻出了某个不太为人知的已有解法,要么给出的证明其实站不住脚。

这次不一样。

陶哲轩对《科学美国人》解释:「这个有点不同,因为确实有人审过了,而审阅的人 collectively 在第一步就集体拐错了弯。」

他所说的「第一步」,是指数学家们面对这道题时,都会先走一套「标准起手式」——一个被前人反复使用的解题路径。所有研究过这道题的人都从这里开始,结果全都走进了死胡同。

AI却绕开了这条路。它用了一个众所周知的公式,只是没人想过把这个公式用到这类问题上。

陶哲轩:「AI采取了一种出乎意料的方法。」

AI的「草稿」需要人类翻译

但别把这事想成AI单枪匹马搞定一切。

斯坦福大学的数学家贾里德·利希特曼专门研究埃尔德什猜想,他的博士论文就围绕其中一道展开。他对《科学美国人》说:「聊天机器人证明的原始输出其实相当粗糙,需要专家来筛选、真正理解它想说什么。」

利希特曼的这句话点破了当前AI辅助科研的真实状态:AI能抛出人类想不到的角度,但把角度变成严谨证明,还得靠人。

普莱斯的解法被发布在erdosproblems.com上,经专家审阅后被认定为有效。这是极少数AI真正「跳出框框思考」的案例——它克服了人类数学高手们陷入的「 flawed hivemind 」(有缺陷的集体思维)。

陶哲轩对此的评价带着数学家的克制:「我们发现了一种思考大数及其结构的新方式。这是不错的成就。至于长期意义,我认为尚无定论。」

为什么这次值得警惕乐观

领域内的专家确实对这次解法表示 enthusiasm ,但历史教训就在眼前。

去年10月,OpenAI副总裁凯文·威尔曾高调宣称聊天机器人解决了另一道埃尔德什问题。结果翻车了——AI只是借鉴了已有解法。威尔在遭到猛烈批评后删帖。

这类「狼来了」的故事,让每一次AI数学突破声明都自带怀疑滤镜。

但普莱斯这次的情况有区别:解法经过了同行审阅,且AI的贡献在于「思路」而非「搬运」。陶哲轩的背书也增加了可信度——他已成为AI攻克数学问题的权威仲裁者,说话有分量。

更深一层看,这件事触及一个核心问题:AI到底是在「思考」还是在「重组」?

陶哲轩的数据库揭示了一个尴尬现实:大多数AI「解法」本质是信息检索,把角落里积灰的旧证明挖出来。但普莱斯案例如果属实,意味着AI确实能产生人类专家集体错过的新颖思路——哪怕这个思路的「执行」依然粗糙,需要人类打磨。

这不是AI取代数学家,而是一种新的分工模式:AI负责打破思维定式,人类负责验证和精炼。

对科技从业者的启示

如果你在做产品或技术,这件事有几个值得咀嚼的点。

第一,「外行+AI」的组合正在入侵传统专家领地。普莱斯没有数学博士学位,但他知道怎么向AI提问,怎么把AI的输出交给专家验证。这种「提问能力」本身正在成为核心竞争力。

第二,AI的「半成品」价值被低估了。聊天机器人的原始输出被利希特曼形容为「相当粗糙」,但粗糙不等于无用。在创意和科研领域,一个错误方向上的新思路,可能比完美执行的老思路更有价值。

第三,验证基础设施决定AI落地的速度。erdosproblems.com这样的平台,陶哲轩维护的数据库,都是让AI输出从「噪音」变成「信号」的关键过滤层。没有这些,普莱斯的解法只会淹没在无数AI幻觉中。

陶哲轩说「jury is still out on the long-term significance」(长期意义尚无定论),这话放在任何AI突破上都适用。但有一件事是确定的:AI已经进入了那些被认为只有人类直觉才能触及的领域,而且开始改变「谁有资格做研究」的游戏规则。

下次遇到卡了六十年的难题,你会先找专家,还是先问问AI?