数学被誉为“科学的皇后”,其严谨的逻辑体系和深邃的思维魅力,吸引着一代又一代研究者为之倾倒。在漫长的历史长河中,无数数学家以笔为剑、以脑为刃,在未知的数学疆域中开拓前行。而今,人工智能的崛起为这一古老学科注入了全新活力。近期,HarmonicMath团队研发的AI数学家「亚里士多德」(Aristotle),凭借100%独立思考,成功攻克了困扰数学界30载的埃尔德什问题#124,这一里程碑式的突破,不仅震撼了学术界,更宣告着数学研究正式迈入“人机协同”的新纪元。
埃尔德什
#124:横亘30年的数学“拦路虎”
提及数学界的“难题宝库”,匈牙利数学家保罗·埃尔德什(Erdős Pál)的「问题列表」绝对是绕不开的存在。这些问题难易不一,悬赏金额从几十美元到上万美元不等,但它们的价值早已超越物质层面,成为衡量数学家能力的“试金石”和追逐梦想的“精神图腾”。在这份列表中,第124号问题(Erdős#124)自1995年在《Complete sequences of sets of integer powers》一文中提出后,便如同一座坚固的堡垒,屹立在组合数学领域,让无数研究者望而却步。
要理解埃尔德什#124问题,我们可以用一个通俗的比喻:假设给出k个不小于2的自然数d_i,若将每个数减1后的倒数相加(即∑ 1/(d_i - 1)),结果大于等于1,那么对于任意一个自然数n,能否找到一组数a_i,使得n恰好是这组a_i的和?并且每个a_i用d_i作为基数来表示时,数字只能是0或1。换而言之,这个问题本质上是在探寻:在严苛的规则限制下,任意一个自然数是否都能像二进制数那样,用特定的“0-1组合”来表示,而不受基数大小的影响?
这个看似简单的问题,实则触及了组合数学的核心难点。传统的研究方法始终在最大公约数(gcd)的约束和边界案例的验证上陷入僵局,人类数学家们反复尝试多种思路,却始终无法找到突破口。就在人们以为这个难题还将沉睡更久时,AI数学家「亚里士多德」带来了惊喜。HarmonicMath团队为其量身打造了融合强化学习、蒙特卡洛树搜索与Lean形式化语言的智能架构。当问题输入后,「亚里士多德」仅用6小时便遍历了上亿种证明路径,最终输出了一份100%可验证的完整定理,而通过Lean证明系统进行检验,仅需短短1分钟。
这一成果让数学家鲍里斯·阿列克谢耶夫(Boris Alexeev)赞叹不已,他表示这是AI产出的定理中最令他惊艳的一个。目前,该证明已被上传至GitHub平台(https://github.com/plby/lean-proofs/blob/main/ErdosProblems/Erdos124.md),供全球数学爱好者和研究者参考。值得注意的是,埃尔德什#124问题存在两个版本,此次AI攻克的虽为相对简单的版本,但这丝毫不减其意义——这是人类历史上首次由AI完全独立完成具有重大影响力的数学难题证明。
为何是「亚里士多德」?通用AI的“短板”与专业AI的“优势”
「亚里士多德」的成功,也让人们不禁发问:同为顶尖AI,ChatGPT和Gemini为何在这个问题上铩羽而归?菲尔兹奖得主陶哲轩的分析给出了答案。他指出,据其了解,Gemini和ChatGPT的深度研究功能,均未能找到与埃尔德什#124问题相关的全新、有价值的文献资料。
具体而言,Gemini仅能给出一些基础观察:比如排除数字1后,gcd条件会成为必要条件;它还尝试将问题与康托尔集(Cantor集)的研究,尤其是“Newhouse gap lemma”联系起来,但始终未能挖掘出直接相关的新线索。而ChatGPT则表现出明显的“路径依赖”,大量引用包含「亚里士多德」证明的网页、相关论文及问题页面作为论据,未能提出任何原创性观点。
「亚里士多德」的脱颖而出,关键在于其“专业定位”。与ChatGPT、Gemini这类追求“全能”的通用大语言模型不同,它是为数学研究量身定制的“专项选手”。其核心优势在于融合了数学形式化证明的底层逻辑,能够模拟人类数学家的思维模式,进行严谨的逻辑推理和策略探索,而非简单地对现有信息进行拼接与总结。这种“术业有专攻”的特性,让它在面对需要深度创新的数学难题时,展现出了通用AI难以企及的能力。
陶哲轩视角:AI收割“低垂果实”,照亮数学“暗森林”
作为当代数学界的领军人物,陶哲轩对AI在数学领域的应用有着独到的见解。他在社交平台mathstodon上分享道,数学未解问题呈现出“长尾分布”的特征,而AI的自动化能力恰好擅长处理长尾末端的问题。这意味着,有大量难度适中、可被证明或证伪的问题,因专家数学家数量有限而被长期搁置,这些问题就像是挂在枝头的“低垂果实”,触手可及却无人采摘。
陶哲轩以去年的“Equational Theories Project”为例进行说明:该项目涉及普遍代数中2200万条可能的蕴涵关系,若完全依赖人类研究,可能需要数十年时间。但研究团队从一开始就引入“低技术含量”的自动化工具,短短几天便解决了大部分问题;随后逐步升级技术手段,攻克了一批难点问题;最后剩下的少数“硬骨头”,才由人类数学家耗时数月攻克。这个案例生动地证明,AI在处理海量“低垂果实”类问题时,效率远超人类。
埃尔德什问题网站收录了1108个曾出现在埃尔德什论文中的问题,其中既有E3这样的著名难题,也有大量无人问津的“小问题”,甚至连埃尔德什本人都未曾再度关注。近几周,该网站的“未解”标签减少了近十个,原因并非这些问题刚被解决,而是AI通过文献检索发现它们早已被人类攻克。此外,研究人员还发现了一类因描述存在技术瑕疵而变得容易解决的“低垂果实”,埃尔德什#124便是典型——其完整版本具有一定难度,但两篇相关论文遗漏了关键假设,使得该版本成为“Brown判据”的直接推论,这一漏洞直到「亚里士多德」介入才被发现。
在陶哲轩看来,AI并非要取代人类数学家,而是扮演着“清道夫”与“引路人”的双重角色。它先清理掉那些最容易解决的问题,将真正的核心难题筛选出来,让人类研究者能够将精力聚焦在最具价值的领域。就像一束光照亮了数学的“暗森林”,AI不仅让那些被遗忘的“低垂果实”重见天日,更帮助人类清晰地识别出需要攀登的“数学高峰”。
结语:数学研究的“新范式”已来
HarmonicMath创始人弗拉德·特内夫(Vlad Tenev)感慨道:“数学圈正经历前所未有的变革,‘智能证明’的时代已经到来!”「亚里士多德」攻克埃尔德什#124问题,绝非孤立的成果,而是数学研究范式转变的重要信号——AI与数学的深度融合已成为不可逆转的趋势。
展望未来,我们或将见证更多AI数学家活跃在科研一线,与人类研究者并肩作战,攻克一个又一个数学难题。那些曾经让人类望而生畏的“暗森林”,将在AI的“光照”下逐渐变得清晰;那些沉睡多年的“低垂果实”,将被AI逐一“采摘”。而人类数学家,则能在AI的辅助下,向数学殿堂中那些更巍峨、更神秘的高峰发起冲击。可以肯定的是,AI发现数学的时代,才刚刚拉开序幕。
热门跟贴