周三下午,一位数学家坐在电脑前,把一道悬而未决的数论难题丢给AI,然后去泡了杯咖啡。17分钟后回来,答案已经躺在屏幕里——不是近似解,是最佳可能构造。这位数学家后来承认:他自己的贡献为零。

这位数学家是蒂莫西·高尔斯(Timothy Gowers),2006年菲尔兹奖得主,现任法兰西学院组合数学讲席教授、剑桥大学三一学院院士。他在博客中详细记录了这次实验:ChatGPT 5.5 Pro在两小时内独立完成了一项"博士级别"的数学研究,而他"甚至没做任何巧妙的提示工程"。

打开网易新闻 查看精彩图片

测试材料来自数论学者梅尔·内桑森(Mel Nathanson)的一篇论文。该论文研究特定整数和集的可能规模,以及如何高效构造具有指定性质的集合。内桑森对其中一个问题证明了指数级上界,并询问能否改进。高尔斯把这个问题原封不动丢给模型。

17分05秒后,模型给出了答案:用二次界替代指数界,这是最优可能结果。核心思路是把内桑森证明中的某个组件,替换为组合数学中一个已知更高效的变体——但这个替换在此特定问题上的应用并不显然。一位参与项目的初级研究人员评价这个想法"完全原创"。

高尔斯要求模型把论证改写成LaTeX预印本格式。耗时2分23秒。他检查无误后,又让模型解决一个相关变体,同样顺利完成。两篇结果均已公开。

真正的考验是推广版本。麻省理工学院学生艾萨克·拉贾戈帕尔(Isaac Rajagopal)此前对该问题证明了指数依赖关系。高尔斯把拉贾戈帕尔的论文喂给模型,要求改进。

第一次迭代:16分41秒后,模型给出初步改进。拉贾戈帕尔判断正确,但称之为对自己工作的"常规修改"。高尔斯"贪心"起来,要求更强的上界。

13分33秒后,模型表示乐观,但称有两处技术陈述需要验证。又过9分12秒,验证完成。31分40秒后,完整预印本就绪。指数界被改进为多项式界。

拉贾戈帕尔的评估分层明确:第一次改进是"常规修改",多项式界的改进则"相当令人印象深刻"。他特别指出模型的关键想法"相当巧妙"——它找到一种反直觉的方式压缩特定代数结构,使其能嵌入小得多的数值范围而不损失所需性质。

高尔斯在博客中强调,整个过程中他唯一的动作是输入问题和阅读输出。没有迭代提示,没有引导性追问,没有纠正方向。模型独立完成了文献检索、思路构造、技术验证和论文撰写。

这个结果的具体含义仍在发酵。对数学界而言,一个核心问题是:如果博士级研究可以在17分钟内零干预完成,训练下一代数学家的方式是否需要根本改变?高尔斯本人没有给出答案,但他的实验设计本身已经是一种表态——他把这当作一次压力测试,而AI通过了。

拉贾戈帕尔的 nuanced 评价或许比任何欢呼都更值得注意。他区分了"常规修改"和"真正新颖",承认模型在后者上的突破。这种来自领域内部、带有具体技术细节的评估,比外行的一概惊叹更有分量。

预印本已经公开。检验正在开始。