菲尔兹奖得主实测：ChatGPT两小时零干预完成博士级数学研究|数学家|数学研究|数论|菲尔兹奖|高尔斯

周三下午，一位数学家坐在电脑前，把一道悬而未决的数论难题丢给AI，然后去泡了杯咖啡。17分钟后回来，答案已经躺在屏幕里——不是近似解，是最佳可能构造。这位数学家后来承认：他自己的贡献为零。

这位数学家是蒂莫西·高尔斯（Timothy Gowers），2006年菲尔兹奖得主，现任法兰西学院组合数学讲席教授、剑桥大学三一学院院士。他在博客中详细记录了这次实验：ChatGPT 5.5 Pro在两小时内独立完成了一项"博士级别"的数学研究，而他"甚至没做任何巧妙的提示工程"。

测试材料来自数论学者梅尔·内桑森（Mel Nathanson）的一篇论文。该论文研究特定整数和集的可能规模，以及如何高效构造具有指定性质的集合。内桑森对其中一个问题证明了指数级上界，并询问能否改进。高尔斯把这个问题原封不动丢给模型。

17分05秒后，模型给出了答案：用二次界替代指数界，这是最优可能结果。核心思路是把内桑森证明中的某个组件，替换为组合数学中一个已知更高效的变体——但这个替换在此特定问题上的应用并不显然。一位参与项目的初级研究人员评价这个想法"完全原创"。

高尔斯要求模型把论证改写成LaTeX预印本格式。耗时2分23秒。他检查无误后，又让模型解决一个相关变体，同样顺利完成。两篇结果均已公开。

真正的考验是推广版本。麻省理工学院学生艾萨克·拉贾戈帕尔（Isaac Rajagopal）此前对该问题证明了指数依赖关系。高尔斯把拉贾戈帕尔的论文喂给模型，要求改进。

第一次迭代：16分41秒后，模型给出初步改进。拉贾戈帕尔判断正确，但称之为对自己工作的"常规修改"。高尔斯"贪心"起来，要求更强的上界。

13分33秒后，模型表示乐观，但称有两处技术陈述需要验证。又过9分12秒，验证完成。31分40秒后，完整预印本就绪。指数界被改进为多项式界。

拉贾戈帕尔的评估分层明确：第一次改进是"常规修改"，多项式界的改进则"相当令人印象深刻"。他特别指出模型的关键想法"相当巧妙"——它找到一种反直觉的方式压缩特定代数结构，使其能嵌入小得多的数值范围而不损失所需性质。

高尔斯在博客中强调，整个过程中他唯一的动作是输入问题和阅读输出。没有迭代提示，没有引导性追问，没有纠正方向。模型独立完成了文献检索、思路构造、技术验证和论文撰写。

这个结果的具体含义仍在发酵。对数学界而言，一个核心问题是：如果博士级研究可以在17分钟内零干预完成，训练下一代数学家的方式是否需要根本改变？高尔斯本人没有给出答案，但他的实验设计本身已经是一种表态——他把这当作一次压力测试，而AI通过了。

拉贾戈帕尔的 nuanced 评价或许比任何欢呼都更值得注意。他区分了"常规修改"和"真正新颖"，承认模型在后者上的突破。这种来自领域内部、带有具体技术细节的评估，比外行的一概惊叹更有分量。

预印本已经公开。检验正在开始。

菲尔兹奖得主实测：ChatGPT两小时零干预完成博士级数学研究