普通人用AI攻克数学猜想的时代，要来了？

掉了颗大白兔糖

2026-05-10 05:45 ·四川

2025年10月，OpenAI研究员Mark Sellke在社交平台X上高调宣布：GPT-5搞定了10个埃尔德什问题！

这场闹剧，却意外揭开了AI真正攻克数学难题的序幕。

他最爱干的事就是提猜想，还自掏腰包悬赏：25美元到1万美元不等，难度越高奖金越多。

2023年，数学家Thomas Bloom建了个网站收录这些问题，编号从#1开始，现在已有1200多个，44%已解决。

没想到这个网站后来成了AI的“试金石”——能不能真搞数学，拉出来遛遛就知道。

剑桥21岁数学系本科生Kevin Barreto本来不信AI能搞数学。直到看到有人用AI解决了简化版的埃尔德什问题，他坐不住了。

“如果AI能行，我也行！”他和伙伴Liam Price用OpenAI新出的GPT-5.2 Pro，花了一段时间搞定了#728。

陶哲轩看到后直接称这是“里程碑式成就”——这是第一个AI自主完成的、有严肃学术背景的埃尔德什问题证明！

不过确认过程也一波三折：他们用Aristotle模型把证明转成Lean语言（一种能验证证明正确性的计算机语言），反复校验才通过。

这个成果让数学界炸开了锅，大家突然发现：AI真的能帮人搞前沿数学了。

Kevin和Liam分享了他们用AI做数学的方法，总结下来有11条：

1. 先挑“低垂的果实”——能看出哪些问题足够简单；

2. 用最贵的AI（比如GPT月费200美元的那款）；

3. 禁止AI搜索，逼它进入“思考”模式；

4. 明确要求每一步都严谨证明；

5. 先用AI头脑风暴思路，输出核心提示；

6. 再让AI写完整证明；

7. 交叉检查：用另一个AI审证明，找错误；

8. 让AI诚实：不会就说“未能证明引理”，别瞎编；

9. 分步验证，每一步都要解释逻辑；

10. 转成LaTeX格式，规范清晰；

11. 人类监督：哪怕不是专家，也要看证明“合理不合理”。

这些方法普通人也能学，尤其是数学专业的学生——说不定你也能靠AI搞定一个埃尔德什问题！

陶哲轩说，现在的AI大体上相当于“聪明的博士研究生”——没有太多让人眼前一亮的新颖思路，但能帮人降低进入前沿领域的门槛。

比如美国17岁高中生Enrique Barschkis，用AI自主解决了369。

还有Ulam.ai的研究员Przemek Chojecki，用AI解决了1148，其中#1148的问题连高中生都能理解。

“对足够大的n，有没有x、y、z满足max(x²,y²,z²)≤n且n=x²+y²-z²？”答案是肯定的。

更让人惊喜的是Liam Price后来用AI解决的#1196：AI居然用了马尔可夫链和冯·曼戈尔特函数，这是数学家以前没想过的思路！

菲尔兹奖得主的学生Jared甚至称这是AI的“Move 37时刻”（就像AlphaGo下出的那步颠覆人类经验的棋）。

虽然陶哲轩后来简化证明时发现不用马尔可夫链也能行，但AI的创新思路还是让人大开眼界。

AI的出现让数学不再是“少数天才的游戏”。美国17岁高中生Enrique把问题丢给GPT-5.5，出去散步80分钟回来，AI就给出了答案。

还能直接转成LaTeX并通过Lean校验。从5月1日到2日，24小时里就有5个埃尔德什问题从“开放”变“已解决”。

Thomas Bloom的网站甚至因为AI提交的答案太多（很多是瞎编的）差点瘫痪！

但这场AI数学盛宴里，国内团队普遍缺席。目前唯一出彩的是西安交通大学的大四本科生汤泉宇——这背后的差距，值得我们思考。

AI正在让数学变得越来越“平民化”，连高中生都能参与前沿研究。你觉得AI未来能搞定哥德巴赫猜想这样的世纪难题吗？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴