2025年10月,OpenAI研究员Mark Sellke在社交平台X上高调宣布:GPT-5搞定了10个埃尔德什问题!
这场闹剧,却意外揭开了AI真正攻克数学难题的序幕。
他最爱干的事就是提猜想,还自掏腰包悬赏:25美元到1万美元不等,难度越高奖金越多。
2023年,数学家Thomas Bloom建了个网站收录这些问题,编号从#1开始,现在已有1200多个,44%已解决。
没想到这个网站后来成了AI的“试金石”——能不能真搞数学,拉出来遛遛就知道。
剑桥21岁数学系本科生Kevin Barreto本来不信AI能搞数学。直到看到有人用AI解决了简化版的埃尔德什问题,他坐不住了。
“如果AI能行,我也行!”他和伙伴Liam Price用OpenAI新出的GPT-5.2 Pro,花了一段时间搞定了#728。
陶哲轩看到后直接称这是“里程碑式成就”——这是第一个AI自主完成的、有严肃学术背景的埃尔德什问题证明!
不过确认过程也一波三折:他们用Aristotle模型把证明转成Lean语言(一种能验证证明正确性的计算机语言),反复校验才通过。
这个成果让数学界炸开了锅,大家突然发现:AI真的能帮人搞前沿数学了。
Kevin和Liam分享了他们用AI做数学的方法,总结下来有11条:
1. 先挑“低垂的果实”——能看出哪些问题足够简单;
2. 用最贵的AI(比如GPT月费200美元的那款);
3. 禁止AI搜索,逼它进入“思考”模式;
4. 明确要求每一步都严谨证明;
5. 先用AI头脑风暴思路,输出核心提示;
6. 再让AI写完整证明;
7. 交叉检查:用另一个AI审证明,找错误;
8. 让AI诚实:不会就说“未能证明引理”,别瞎编;
9. 分步验证,每一步都要解释逻辑;
10. 转成LaTeX格式,规范清晰;
11. 人类监督:哪怕不是专家,也要看证明“合理不合理”。
这些方法普通人也能学,尤其是数学专业的学生——说不定你也能靠AI搞定一个埃尔德什问题!
陶哲轩说,现在的AI大体上相当于“聪明的博士研究生”——没有太多让人眼前一亮的新颖思路,但能帮人降低进入前沿领域的门槛。
比如美国17岁高中生Enrique Barschkis,用AI自主解决了369。
还有Ulam.ai的研究员Przemek Chojecki,用AI解决了1148,其中#1148的问题连高中生都能理解。
“对足够大的n,有没有x、y、z满足max(x²,y²,z²)≤n且n=x²+y²-z²?”答案是肯定的。
更让人惊喜的是Liam Price后来用AI解决的#1196:AI居然用了马尔可夫链和冯·曼戈尔特函数,这是数学家以前没想过的思路!
菲尔兹奖得主的学生Jared甚至称这是AI的“Move 37时刻”(就像AlphaGo下出的那步颠覆人类经验的棋)。
虽然陶哲轩后来简化证明时发现不用马尔可夫链也能行,但AI的创新思路还是让人大开眼界。
AI的出现让数学不再是“少数天才的游戏”。美国17岁高中生Enrique把问题丢给GPT-5.5,出去散步80分钟回来,AI就给出了答案。
还能直接转成LaTeX并通过Lean校验。从5月1日到2日,24小时里就有5个埃尔德什问题从“开放”变“已解决”。
Thomas Bloom的网站甚至因为AI提交的答案太多(很多是瞎编的)差点瘫痪!
但这场AI数学盛宴里,国内团队普遍缺席。目前唯一出彩的是西安交通大学的大四本科生汤泉宇——这背后的差距,值得我们思考。
AI正在让数学变得越来越“平民化”,连高中生都能参与前沿研究。你觉得AI未来能搞定哥德巴赫猜想这样的世纪难题吗?
热门跟贴