AI仅6小时破解30年数学难题，陶哲轩与ChatGPT均失败

许穋很机智

2025-12-04 00:30 ·四川

之前，数学圈炸了个大新闻悬了30年的埃尔德什问题#124，被一个叫「亚里士多德」的AI给解决了。

这事儿说出来你可能不信，人类数学家啃了三十年没啃动的硬骨头，AI花6小时就算完了，验证只用了1分钟，刚开始我也觉得玄乎。

数学这东西，讲究逻辑严密，一步错步步错，30年数学难题，AI仅6小时告破，陶哲轩，ChatGPT们都失败了真能靠谱？直到看到GitHub上公开的证明代码，还有数学界大佬们的讨论，才发现这事儿是真的。

保罗·埃尔德什这个人，在数学圈是个传奇，一辈子没家没业，满世界跑着跟人合作写论文，发表过1500多篇，堪称“数学界的游牧民族”。

他不光自己搞研究，还喜欢出题给别人，生前列了一堆数学问题，从数论到组合数学都有，每个问题都像个智力闯关游戏。

这些问题里，有些不难，很快就被搞定了，但有些就跟“钉子户”似的，一卡就是几十年。

埃尔德什问题#124，就是其中之一，从90年代提出到现在，整整30年没人能拿下。

埃尔德什#124这问题，光看表述就够绕的，大纲里写得专业，“给定k个自然数d_i≥2，若∑1/(d_i-1)≥1，则对任意自然数n，存在a_i使得n=∑a_i，且每个a_i在d_i进制下的数字仅含{0,1}。”

翻译成人话，就是给你几个大于等于2的数，比如3、4、5，先算它们“减1后的倒数”，也就是1/(3-1)=0.5，1/(4-1)≈0.333，1/(5-1)=0.25，加起来0.5+0.333+0.25=1.083，大于1。

这时候，随便给个自然数n，比如100，能不能找到几个数a1、a2、a3，让它们加起来等于100？关键是a1得是3进制的数（只能有0和1），a2是4进制（只能有0和1），a3是5进制（只能有0和1）。

简单说，就像用几种特殊的“二进制”拼出任意数，二进制大家熟，只有0和1，能表示所有数。

这问题听着简单，证明起来要了老命，人类数学家30年没搞定，不是因为笨，是真有技术瓶颈。

传统证明靠人工推导，一步一步算，但这问题涉及的变量太多，要覆盖所有可能情况，光靠脑子想根本顾不过来。

最大公约数验证、边界案例枚举，随便一个环节卡壳就前功尽弃。

有个叫BorisAlexeev的数学家，不服气，想用计算机工具验证，结果折腾半天还是没搞定。

他后来自己说，“就像在迷宫里打转，看着出口就在眼前，就是找不到门。，我瞅着这问题就头大，更别说证明了。

可数学家就吃这碗饭，越难越兴奋，没想到最后破局的，不是哪个天才数学家，而是个AI。

这个AI叫「亚里士多德」，名字挺霸气，跟古希腊哲学家一个名，它是一家叫HarmonicMath的公司搞出来的。

这家公司叫HarmonicMath，老板是VladTenev，团队里既有搞机器学习的码农，也有正经的数学家，算是“文理混搭”的典范。

他们不搞通用AI，就盯着数学推理死磕，「亚里士多德」的核心技术，说起来挺复杂，但简单理解就是“三板斧”，强化学习负责试错找策略，蒙特卡洛树搜索负责高效遍历可能性，Lean形式化语言负责保证每一步都没错。

你可能会问，ChatGPT、Gemini这些大模型不行吗？还真不行。

这些通用AI说白了就是“文献复读机”，只能在已有的知识库里找答案，让它们自己推导新东西，门儿都没有。

Gemini之前分析#124时，也就指出“最大公约数很重要”，然后就没下文了，跟没说一样。

「亚里士多德」不一样，它是“专业选手”，去年年底，BorisAlexeev把#124问题翻译成AI能看懂的“数学代码”，喂给了「亚里士多德」。

接下来的6小时，这AI没干别的，就是疯狂试各种证明思路。

上亿种可能路径里筛出一条它发现埃尔德什当年的问题表述有点小漏洞，少了个关键假设，简化版的问题其实能用已有定理推导。

找到突破口后，它基于Brown判据一顿猛算，直接输出了证明代码，最绝的是验证环节，用Lean系统跑了1分钟，逻辑严丝合缝，一点毛病没有。

证明代码后来发在了GitHub上，感兴趣的可以去瞅一眼。

里面全是密密麻麻的符号，我是看不懂，但数学家们一看就明白，这玩意儿成了！

AI这波操作，确实让不少人惊掉下巴，但你要说它是“突然开窍”，那倒也不是，背后有真功夫。

陶哲轩之前提过个“长尾分布”理论，说数学界的未解问题就像个“长尾”，大部分问题其实不难，就是专家资源有限，没人管，属于“低垂果实”。

AI正好可以去摘这些果子，2023年陶哲轩团队用AI工具，几天内就搞定了2200万条数学关系的证明，放以前人类专家干这活儿，怕是得几辈子。

有人说数学研究像片“暗森林”，大部分问题藏在角落里没人管，AI就像装了夜视仪的巡逻兵，把这些“低垂果实”一个个找出来，清理干净。

埃尔德什#124就是典型的“低垂果实”，人类数学家30年没搞定，不是因为难到逆天，而是没人发现问题表述有漏洞，白折腾了。

AI一上手就找到了关键，直接抄了近道，这事儿也给数学研究提了个醒，以后可能不是“人vs机器”，而是“人+机器”一起闯关。

AI负责体力活验证、找漏洞、清理简单问题，人类负责脑力活提出新问题、搞理论创新。

以后写论文可能都得用Lean这种形式化语言，就像现在写代码一样，每一步都得让计算机认可，想水论文怕是难了。

当然了，AI越厉害，越得有规矩，比如开源工具得共享，别搞技术垄断，让全世界的数学家都能用得上，这才是真的推动科学进步。

「亚里士多德」破解埃尔德什#124，不光是解决了一个数学问题，更像是给数学研究开了个新玩法。

以后咱们可能会看到越来越多的“AI+数学”组合，说不定哪天，那些悬了几百年的难题，也能被AI轻松拿下。

至于人类数学家会不会失业？放心，只要人类还能提出“埃尔德什问题”这样的好问题，数学家就永远有饭吃。

毕竟，AI再聪明，也得有人给它出题不是？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴