打开网易新闻 查看精彩图片

很多人都有过这样的体验:面对一道复杂的数学题,反复推演、草稿纸写满,却始终找不到关键一步。

那种卡在思路边缘却无法突破的感觉,几乎是所有学习过数学的人共同的记忆。

长期以来,人们也因此相信,数学是最接近人类纯粹理性的领域之一——它不仅需要计算,更需要直觉、创造力和漫长的思考。

但现在,这种认知正在被迅速动摇。

在今年的圆周率日(3月14日)到来之际,《新科学家)(

New Scientist
)梳理了数学正在经历的史上最大变革。

短短几年之间,人工智能已经从连高中题都难以稳定解决,发展到能够参与真实数学研究、提出证明思路,甚至自动验证菲尔兹奖级别的成果

当机器开始触及数学最核心的能力——证明与创造——一个问题正在浮现:未来的数学家,究竟还需要做什么?

也许,这正是数学史上最剧烈的一次转折。而我们可能正处在它刚刚开始的时刻。

本文16小节,4200多字:

  1. 一场可能输掉的赌注

  2. 从“解不出高中题”到研究级问题

  3. 数学界意识到:变革已经到来

  4. 国际数学奥赛:AI的关键里程碑

  5. AI开始参与真正的数学研究

  6. “第一证明”:给AI设立真实测试

  7. 证明能力的跃升

  8. AI如何“做数学”

  9. “证明成立了吗?”新的哲学问题

  10. 自动化证明验证:形式化数学的突破

  11. 人类与人工智能的协作

  12. 20万行代码的数学证明

  13. 数学研究方式或将彻底改变

  14. 数学家的担忧

  15. 数学家的新角色

  16. 一种新的数学时代

打开网易新闻 查看精彩图片

2026年3月10日发表于《新科学家)(New Scientist)的关于“数学正经历史上最大变革”的文章截图。

长期以来,数学被视为最难被人工智能攻克的智力领域之一。它不仅需要逻辑推理,还依赖高度抽象的概念构建与严密证明。许多数学家曾认为,这种能力属于人类独有的思维疆域。

但在过去短短几年间,这种判断正在迅速动摇。人工智能在数学领域的进展速度,远远超出了许多数学家的预期。一些研究者甚至认为,这一变化可能正在重新定义“数学家”这一职业本身。

1.

一场可能输掉的赌注

2025年3月,多伦多大学的数学家丹尼尔·利特(Daniel Litt)与同事打了一个赌。

当时,尽管人工智能在多个领域取得突破,但他仍然认为数学相对安全。他估计:到2030年,人工智能写出达到顶级数学家水平的数学论文的概率只有25%。

然而仅仅一年后,他的判断就发生了改变。

利特在自己的博客中坦言:

“我现在预计会输掉这个赌。”

这一转变并非个例。越来越多数学家意识到,人工智能在数学推理能力上的进步速度,已经远远超出此前的预期。

2.

从“解不出高中题”到研究级问题

就在几年前,人工智能在数学问题上的表现仍然相当有限。

利特回忆说,当时的系统甚至难以稳定解决高中数学题。但如今,情况已经完全不同。

他说:

“现在它们有时已经能够解决真正出现在数学研究中的问题。”

换句话说,人工智能正在跨越一个关键门槛:

从课堂练习走向真正的数学研究。

这种跃迁让许多数学家感到震惊。

打开网易新闻 查看精彩图片

手写数学的时代即将结束吗?

3.

数学界意识到:变革已经到来

随着人工智能能力的不断提升,一些学者开始公开讨论数学职业可能发生的深刻变化。

美国卡内基梅隆大学的数学家杰里米·阿维加德(Jeremy Avigad)在一篇文章中直言:

“我们正在失去可以躲藏的地方。”

他认为,数学界必须面对一个越来越明显的现实:

人工智能很快可能在定理证明方面超过人类。

值得注意的是,这种反应并非由某一个突破性事件引发,而是来自持续不断的技术进步。

4.

国际数学奥赛:AI的关键里程碑

过去一年,一系列事件加速了数学界的这种认知变化。

例如,OpenAI和谷歌DeepMind开发的人工智能系统,在国际数学奥林匹克竞赛中取得了金牌级成绩

这一结果震动了整个领域。此前,许多专家都认为,这项世界顶级高中数学竞赛所涉及的复杂推理,远远超出人工智能工具的能力范围。

但现实证明,这一判断可能已经过时。

5.

AI开始参与真正的数学研究

进入2026年,这一趋势进一步升级。

今年1月,数学家开始利用类似的人工智能工具,解决匈牙利传奇数学家保罗·埃尔德什(Paul Erdős)提出的一些长期未解问题。

与此同时,人工智能正在进入更复杂的数学工作流程:

  • 帮助解决真实的研究级数学问题

  • 自动化验证最前沿的数学证明

在传统数学研究中,验证一个复杂证明往往需要多个研究团队投入大量时间。而现在,人工智能正被用于加速这一过程。

6.

“第一证明”:给AI设立真实测试

为了更系统地评估人工智能的数学能力,美国加州大学伯克利分校的数学家尼基尔·斯里瓦斯塔瓦(Nikhil Srivastava)在2026年2月发起了一个名为“第一证明”的项目。

这个项目的目标是建立一种更接近真实研究环境的评测基准。

项目的第一轮测试包含10道数学问题,这些问题并不是人为设计的竞赛题,而是研究者在工作中真实遇到的问题,来自多个不同数学领域。

斯里瓦斯塔瓦解释说:

这些问题代表的是数学研究中“自然出现的问题”。

它们的难度分布也具有代表性:

  • 不是极端困难的难题

  • 但也绝非日常例行计算

他说:

“这些问题的难度范围很广,基本反映了研究工作中的真实情况。”

7.

证明能力的跃升

“第一证明”项目公布题目后,很快就吸引了大量研究者参与。来自科技公司的团队也加入了测试,其中包括OpenAI和谷歌DeepMind。

根据各自提供的数据:

  • OpenAI表示,在专家反馈评估下,其人工智能模型正确解决了10道题中的5道。

  • 谷歌DeepMind的模型则被评为解决了6道题。

谷歌DeepMind的研究人员梁汤(Thang Luong,音)表示,人工智能能力的变化速度令人惊讶:

“事情变化得非常快。现在,对我们来说,人工智能已经成为真正严肃的合作伙伴——既可以参与严肃研究,在‘第一证明’这样的任务中,它甚至能够自己提出解决方案。”

8.

AI如何“做数学”

谷歌开发的数学人工智能工具名为Aletheia。该系统结合了两种关键技术:

  • 基于“Gemini”的高计算量版本人工智能模型

  • 用于检测推理漏洞的自动验证算法

其工作方式类似一种循环迭代流程:

  • 人工智能生成一个潜在解答

  • 验证算法检查其中的逻辑漏洞

  • 系统自动修正并生成新的版本

  • 重复这一过程,直到得到稳定结果

不过,谷歌并未公开Aletheia在解决这些问题时进行了多少次迭代,因此外界仍难以精确评估其真实能力。

尽管如此,数学界普遍认为,这一结果已经相当令人印象深刻。

9.

“证明成立了吗?”新的哲学问题

值得注意的是,并非所有问题的解答都获得一致认可。

例如第8题——一个涉及较为冷门几何领域的问题——谷歌咨询的7位专家中,只有5位认为人工智能给出的解答是正确的。

英国剑桥大学的数学家伊万·史密斯(Ivan Smith)并未参与谷歌团队,但他认为人工智能的思路总体上是合理的。

他说,如果这样的解答来自一名博士生,导师通常会感到鼓舞:

“如果这是一个博士生带着自己的想法回来讨论,这会让人觉得很有希望,并逐渐建立起对结果正确性的信心。”

这一情况揭示了人工智能数学的一个核心难题:

验证人工智能生成的证明,本身就是一项艰巨工作。

理论上甚至可能出现一种局面:

人工智能生成证明的速度,超过人类检查证明的速度。

于是,一个新的哲学问题随之出现:

如果人工智能证明了一个定理,但没有人能够检查它——这个定理算被证明了吗?

10.

自动化证明验证:形式化数学的突破

在这一问题上,人工智能也开始提供解决方案。

近年来,一项关键技术正在迅速发展:数学证明的形式化。

所谓“形式化”,指的是把数学家用自然语言写出的证明,转化为计算机可以逐行检查的逻辑代码。

最近,人工智能公司数学公司(Math, Inc.)的一项成果震动了数学界。

该公司宣布,其人工智能工具Gauss已经完成了一项重要工作:

自动形式化并验证了一项获得菲尔兹奖的数学证明。

这项证明来自乌克兰数学家玛丽娜·维亚佐夫斯卡(Maryna Viazovska)。她在2022年获得菲尔兹奖,这项奖项常被称为“数学界的诺贝尔奖”。

她的研究解决了一个经典问题:

在特定维度空间中,球体如何以最密集方式排列。

11.

人类与人工智能的协作

事实上,这项形式化工作并非完全由人工智能独立完成。

早在2024年底,一个由数学家组成的小型研究团队就已经开始尝试手动完成这一任务。该团队由卡内基梅隆大学的西达尔特·哈里哈兰(Sidharth Hariharan)领导。

研究人员最初计划:

把维亚佐夫斯卡提出的8维球体堆积证明逐步翻译成计算机代码。

项目进展稳定,但在此过程中,数学公司后来提供了技术支持,并宣布其人工智能系统已经完成:

  • 完整的8维证明形式化

  • 以及24维情形的更一般结果

参与项目的伦敦帝国学院数学家巴维克·梅塔(Bhavik Mehta)指出,人类研究者此前完成了关键准备工作:

他们已经:

  • 制定了形式化方案

  • 定义了必要的数学概念

如果没有这些基础,人工智能无法完成最终证明。

英国东英吉利大学的研究者克里斯·伯克贝克(Chris Birkbeck)形象地描述这一过程:

“我们已经把所有零件都做出来了,但还没有写出如何把它们组装起来的说明书。”

12.

20万行代码的数学证明

最终生成的形式化证明规模惊人:

整整约20万行代码。

这一体量意味着:

它占到了目前所有已形式化数学内容的约10%。

荷兰乌得勒支大学的数学家约翰·科梅林(Johan Commelin)认为,这是一项具有里程碑意义的成就。

尽管这段代码的长度可能是人类手写版本的约10倍,但他仍然评价说:

“这是一件大事。这是菲尔兹奖级别的数学工作,而它正在被自动形式化。”

13.

数学研究方式或将彻底改变

科梅林认为,这种技术未来可能扩展到更多数学领域,从而改变整个学科的运作方式。

他设想的未来是:

新的数学论文可以被工具自动形式化,并自动检测其中是否存在错误。

如果这一愿景实现,将对学术体系产生巨大影响,例如:

  • 同行评审

  • 论文审稿

  • 数学证明验证

这些流程都可能被彻底重塑。

14.

数学家的担忧

然而,这一趋势也引发了一些担忧。

阿维加德等数学家警告,如果越来越多的数学研究由机器完成,可能会削弱人类自身创造数学的能力。

美国范德堡大学的数学家安娜·玛丽·博曼(Anna Marie Bohmann)指出,依赖机器解决问题会带来一种损失:

学习机会的消失。

她认为,数学学习和研究的重要过程恰恰在于:

  • 困惑

  • 试错

  • 构思新想法

  • 推导解决方案

这些过程正是学生和研究者深化理解的关键。

15.

数学家的新角色

谷歌DeepMind团队成员冯东尼(Tony Feng,音)也表达了类似的谨慎态度。

他坦言,在使用人工智能工具时,有时会产生一种心理:

“我应该自己完成作业,亲自经历建立直觉的过程。”

即便是在形式化证明方面,研究者仍然需要理解人工智能生成的内容。

梅塔和同事们接下来的一项重要任务,就是逐行分析那20万行人工智能生成的代码,找出其中哪些方法可以应用到未来研究中。

16.

一种新的数学时代

尽管存在担忧,许多数学家依然对未来保持乐观。

科梅林指出,在历史上,数学家的工作方式已经经历过多次变化。

例如,在过去:

大量手工计算曾是数学研究的重要组成部分。

但今天,这些计算几乎完全由计算机自动完成。

他认为,类似的转变可能正在发生:

数学家的工作内容会发生巨大变化,但数学本身不会消失。

科梅林总结说:

“也许10年或20年之后,我们仍然会认出自己正在做的事情是数学,只不过是一种全新的数学风格。”

参考资料:

"Mathematics is undergoing the biggest change in its history" by Alex Wilkins from New Scientist, Published 10 March 2026

本文配图来源:量子号

你可能还想知道: