一个没拿过高等数学学位的人,靠向聊天机器人提问,解决了一众数学天才六十多年没攻克的难题。这事听起来像段子,但加州大学洛杉矶分校的数学家陶哲轩说:这次可能是真的。
「标准起手式」集体翻车
这个月初,23岁的利亚姆·普莱斯在网上公布了他对一道「埃尔德什问题」的解法。埃尔德什问题是匈牙利数学家保罗·埃尔德什留下的一系列著名猜想,以晦涩难懂著称,不少至今悬而未决。
普莱斯没有高等数学学位。按他自己的说法,解法来自向GPT-5.4提问。
这不是AI第一次声称破解埃尔德什问题。陶哲轩专门维护着一个数据库,记录AI「帮助解决」的所有埃尔德什问题。但绝大多数情况,AI要么翻出了某个不太为人知的已有解法,要么给出的证明其实站不住脚。
这次不一样。
陶哲轩对《科学美国人》解释:「这个有点不同,因为确实有人审过了,而审阅的人 collectively 在第一步就集体拐错了弯。」
他所说的「第一步」,是指数学家们面对这道题时,都会先走一套「标准起手式」——一个被前人反复使用的解题路径。所有研究过这道题的人都从这里开始,结果全都走进了死胡同。
AI却绕开了这条路。它用了一个众所周知的公式,只是没人想过把这个公式用到这类问题上。
陶哲轩:「AI采取了一种出乎意料的方法。」
AI的「草稿」需要人类翻译
但别把这事想成AI单枪匹马搞定一切。
斯坦福大学的数学家贾里德·利希特曼专门研究埃尔德什猜想,他的博士论文就围绕其中一道展开。他对《科学美国人》说:「聊天机器人证明的原始输出其实相当粗糙,需要专家来筛选、真正理解它想说什么。」
利希特曼的这句话点破了当前AI辅助科研的真实状态:AI能抛出人类想不到的角度,但把角度变成严谨证明,还得靠人。
普莱斯的解法被发布在erdosproblems.com上,经专家审阅后被认定为有效。这是极少数AI真正「跳出框框思考」的案例——它克服了人类数学高手们陷入的「 flawed hivemind 」(有缺陷的集体思维)。
陶哲轩对此的评价带着数学家的克制:「我们发现了一种思考大数及其结构的新方式。这是不错的成就。至于长期意义,我认为尚无定论。」
为什么这次值得警惕乐观
领域内的专家确实对这次解法表示 enthusiasm ,但历史教训就在眼前。
去年10月,OpenAI副总裁凯文·威尔曾高调宣称聊天机器人解决了另一道埃尔德什问题。结果翻车了——AI只是借鉴了已有解法。威尔在遭到猛烈批评后删帖。
这类「狼来了」的故事,让每一次AI数学突破声明都自带怀疑滤镜。
但普莱斯这次的情况有区别:解法经过了同行审阅,且AI的贡献在于「思路」而非「搬运」。陶哲轩的背书也增加了可信度——他已成为AI攻克数学问题的权威仲裁者,说话有分量。
更深一层看,这件事触及一个核心问题:AI到底是在「思考」还是在「重组」?
陶哲轩的数据库揭示了一个尴尬现实:大多数AI「解法」本质是信息检索,把角落里积灰的旧证明挖出来。但普莱斯案例如果属实,意味着AI确实能产生人类专家集体错过的新颖思路——哪怕这个思路的「执行」依然粗糙,需要人类打磨。
这不是AI取代数学家,而是一种新的分工模式:AI负责打破思维定式,人类负责验证和精炼。
对科技从业者的启示
如果你在做产品或技术,这件事有几个值得咀嚼的点。
第一,「外行+AI」的组合正在入侵传统专家领地。普莱斯没有数学博士学位,但他知道怎么向AI提问,怎么把AI的输出交给专家验证。这种「提问能力」本身正在成为核心竞争力。
第二,AI的「半成品」价值被低估了。聊天机器人的原始输出被利希特曼形容为「相当粗糙」,但粗糙不等于无用。在创意和科研领域,一个错误方向上的新思路,可能比完美执行的老思路更有价值。
第三,验证基础设施决定AI落地的速度。erdosproblems.com这样的平台,陶哲轩维护的数据库,都是让AI输出从「噪音」变成「信号」的关键过滤层。没有这些,普莱斯的解法只会淹没在无数AI幻觉中。
陶哲轩说「jury is still out on the long-term significance」(长期意义尚无定论),这话放在任何AI突破上都适用。但有一件事是确定的:AI已经进入了那些被认为只有人类直觉才能触及的领域,而且开始改变「谁有资格做研究」的游戏规则。
下次遇到卡了六十年的难题,你会先找专家,还是先问问AI?
热门跟贴