The Edge of Mathematics

传奇数学家陶哲轩阐释生成式人工智能的前景。

作者:马特奥·王 (Matteo Wong)

打开网易新闻 查看精彩图片

插图:《大西洋月刊》绘制。图片来源:Kimberly White / Getty Images

2026年2月24日

在过去的几个月里,几位研究人员开始提出一个相同的挑衅性主张:他们利用生成式人工智能工具解决了一个此前未解的数学难题。

那些最极端的承诺——即人工智能辅助解决数学界一些最棘手的问题——很可能最终被证明是空洞的炒作。但是,许多由人工智能撰写的解答(尽管针对的是远没那么受赞誉的问题)已经通过了验证。这些答案针对的是“埃尔德什问题”(Erdős Problems)中的一部分——这是由匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的1000多个数学问题——是利用包括ChatGPT在内的生成式人工智能模型写成的。OpenAI迅速宣布了一场胜利:“GPT-5.2 Pro解决了另一个开放的埃尔德什问题,”OpenAI总裁格雷格·布罗克曼(Greg Brockman)于一月份在X平台上发帖称,“这将是数学和科学进步狂野的一年!”

围绕这一新闻的大部分兴奋之情,源于这些人工智能所写证明的裁决者:陶哲轩。他是加州大学洛杉矶分校(UCLA)的教授,被广泛认为是当今世界上最伟大的在世数学家。他的认可似乎赋予了生成式人工智能最大的承诺以合法性——即推动人类知识和文明的边界。当我本月早些时候致电陶哲轩,询问他对人工智能能为数学带来什么的看法时,他的态度更为温和。他告诉我,人工智能生成的埃尔德什问题解答令人印象深刻,但并非压倒性的:陶哲轩表示,这些机器人实际上只是取得了一些“廉价的胜利”。

陶哲轩长期以来对人工智能工具能为他的领域做些什么感到好奇,但也持保留态度。我们在2024年秋季第一次交谈时,陶哲轩将聊天机器人比作“平庸但并非完全无能”的研究生。大约六个月后,他告诉我,这些模型在“某些类型的高层数学推理”方面有所进步,但缺乏创造力且会犯细微的错误。但在我们最近的谈话中,他的态度更加乐观。人工智能或许尚未处于解决世界上所有伟大数学问题的边缘,但聊天机器人已经达到了可以与人类数学家协作的水平。他说,在这个过程中,这项技术正在开辟一种不同的“做数学的方式”。

本次对话经过编辑,以求简练清晰。

马特奥·王: 最近,关于ChatGPT解决某些埃尔德什问题的能力引起了极大轰动。在过去一年左右的时间里,您看到生成式人工智能的数学能力是如何演变的?

陶哲轩: 有一大群人非常、非常希望看到人工智能的成功故事。与此同时,也有另一群截然相反的人想要抹杀所有人工智能的进展。而事实介于两者之间,是一个非常复杂且微妙的故事。

特别是在这些埃尔德什问题中,有一小部分是我们要真正解决的高知名度问题,然后还有长长的尾部,由非常冷僻的问题组成。人工智能非常擅长系统地探索这个长尾部分,并攻克其中最简单的问题。但这与人类的风格截然不同。人类不会系统地浏览所有1000个问题并挑选出最简单的12个来研究,而这正是人工智能正在做的事情。

这些问题之间确实存在着巨大的难度差异。看看迄今为止人工智能独立解决的问题,你会发现:哦,好吧,它们使用的是一种标准技术。如果一位专家花半天时间研究此事,也能解决出来。当然也有更复杂的、由人工智能辅助的解决方案。我认为在短期内,我们将通过纯人工智能方法在简单问题上获得许多快速胜利。而在接下来的几个月里,我认为我们将看到各种形式的人机混合贡献。

我也从出现的一些证明中学习。我喜欢阅读它们——也许它使用了某篇1960年论文中的技巧,而我之前并不知晓。所以它可能不是超级、超级有创造力,但它是新的,并且能做到那些审视该问题的人类专家所忽略的事情。

王: 您曾写道,当人类数学家面对一个新问题时,无论成功与否,他们都会产生见解供该领域的其他人构建基础——这是基于人工智能的证明所无法提供的。为什么会这样?

陶哲轩: 这些问题就像是你需要徒步前往的遥远地点。在过去,你必须踏上一段旅程。你可以放下路标供他人跟随,也可以绘制地图。

人工智能工具就像是用直升机把你直接空降到目的地。你错过了旅程本身的所有益处。你直接到达了终点,而这实际上只是解决这些问题价值的一部分。

王: 当您思考当今这些模型的能力时,除了让非数学家能够处理更高级的问题外,它们还能为您的领域做出什么贡献?

陶哲轩: 如今有很多非常乏味的数学工作是我们不喜欢做的,所以我们寻找巧妙的方法来绕过它们。但人工智能会很乐意猛冲通过这些繁琐的计算。当我们把人工智能整合到人类的工作流程中时,我们就可以滑过这些障碍。

我还认为数学家将开始在更大的规模上进行数学研究。想想科学研究中个案研究与人口调查之间的区别。如果你要在18世纪研究一种疾病,如果这是一种罕见病,你可能会研究一位患有此病的病人,记录其所有症状并做详尽的笔记。但在21世纪,你可以进行临床试验,给1000人用药,进行统计分析,从而获得关于药物效率更精确的信息。

数学仍然很大程度上处于个案研究的水平。一篇论文会选取一两个问题,以一种非常手工打造、高强度的方式对其进行透彻研究。这是我们的风格。但人工智能工具实现的是“群体研究”。

王: 您对人工智能模型在数学能力方面取得的进步感到惊讶吗?

陶哲轩: 有一点惊讶。发生的很多事情是我预料到的,但它们比我预期的时间表稍微提前了一点。并没有提前太多。

例如,在2023年,我为微软写了一篇文章,预测到2026年,人工智能将成为值得信赖的合著者——即其对技术论文的贡献将达到合著者的水平。那篇文章反响不一:有人说我太过雄心勃勃,也有人说我太过悲观。但我认为这基本上几乎完全符合时间表。我们基本上看到人工智能的使用水平达到了我预期初级人类合著者所能做出的贡献,尤其是那些非常乐意做苦差事并解决大量繁琐案例的合著者。

王: 在未来一两年内,您希望或期待生成式人工智能模型有哪些改进?

陶哲轩: 我们需要找到一个中间地带,既鼓励负责任地使用人工智能,又阻止不负责任的使用。这是一条需要小心行走的界线。但我们以前做到过。数学家经常使用计算机进行数值工作,当计算机辅助证明首次出现时,最初遭到了很多反对,因为人们质疑如何信任计算机代码?但我们在20或30年里解决了这个问题。不幸的是,现在的时间表被大大压缩了。所以我们必须在几年内制定出我们的标准。而我们的社区通常不会移动得那么快。

有一件非常基本的事情可以帮助数学社区:当人工智能给你一个问题的答案时,通常它不会很好地表明它对这个答案有多大的把握,或者它总是会说:“我完全确定这是真的。”人类也会这样做。无论他们对某事是否有信心,这都是非常重要的信息。暂时提出一些你不确定的事情是可以的,但重要的是要标记出你对此不确定。然而,人工智能工具并不能准确地评估它们自己的置信度。这降低了它们的有用性。我们会更欣赏诚实的人工智能。

此外,许多人工智能公司痴迷于“一键式”、完全自主的工作流程:你把任务交给人工智能,然后你去喝杯咖啡,回来时问题就解决了。这实际上并不理想。对于困难的问题,你真正想要的是人类与人工智能之间的对话。而人工智能公司并没有真正促进这种互动。

如果我们能与至少一些愿意开发更多互动平台的技术公司合作,那将会更容易被人们所接受。我们不想沦为只是按按钮的角色。

说明:本号刊发来自各方的文章,是为了获得更全面的信息,不代表本号支持文章中的观点。由于微信公众号每天只能推送一次,本站目前在腾讯新闻发布最新的文章,每天24小时不间断更新,请在腾讯新闻中搜索“邸钞”,或在浏览器中点击:

https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D