GPT-5.4在2011年预印本研究帮助下解决此前无解数学难题

至顶科技

2026-03-10 18:06 ·北京 ·优质互联网领域创作者

GPT在数学问题解决能力方面持续提升，越来越能够攻克最棘手的难题。

今年1月，AI测试公司Epoch AI发现，AI模型的前一个版本GPT-5.2 Pro已经解决了31%的数学挑战，相比之前19%的最佳成绩有了显著提升。

最新版本延续了这一进步趋势，成功应对了学者们设置的一系列数学问题。

根据Epoch AI博客文章，GPT-5.4更进一步：该博客提到，"GPT-5.4 Pro解决了一个此前没有任何模型能够解决的4级难题。在初步分析中，它似乎找到了一篇2011年的预印本，这让它绕过了大部分预期的工作量。问题作者并不知道这篇预印本的存在。"这里提到的预印本是指尚未经过同行评议的学术论文。

虽然"解决"了这个问题，但这也说明了GPT-5.4（实际上所有AI模型都是如此）本质上是精密的搜索引擎，其有效性取决于对信息的获取和快速整合能力。

GPT-5.4 Pro还提供了其他几项创新功能。OpenAI声称这是第一个能够在计算机上执行操作的版本，而不仅仅是说明如何操作。例如，GPT-5.4 Pro可以点击鼠标——更准确地说，它可以向智能体发出"点击鼠标"的命令。

该模型还具有改进的电子表格处理能力，能够使用更少的Token来解决问题，并且会在处理复杂任务前制定计划，让用户有机会调整结果并引导其朝正确方向发展。

Q&A

Q1：GPT-5.4 Pro在数学能力上有什么突破？

A：GPT-5.4 Pro解决了一个此前没有任何AI模型能够解决的4级数学难题。该模型找到了一篇2011年的预印本研究，利用其中的方法绕过了大部分预期的计算工作。相比之前版本31%的数学挑战解决率，最新版本继续保持进步趋势。

Q2：GPT-5.4 Pro除了数学能力外还有哪些新功能？

A：GPT-5.4 Pro是首个能在计算机上直接执行操作的版本，比如可以向智能体发出"点击鼠标"命令。它还具有改进的电子表格处理技能，能用更少Token解决问题，并会在处理复杂任务前先制定计划供用户调整。

Q3：GPT-5.4解决数学问题说明了什么？

A：这次解题过程说明GPT-5.4和所有AI模型本质上都是精密的搜索引擎，其有效性主要依赖于对信息的快速获取和整合能力。虽然"解决"了问题，但实际上是通过找到相关研究资料来实现的。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴