机器之心报道

编辑:+0

这个周末 AI 圈非常热闹,OpenAI 陷入舆论中心,Google、Meta 和 AI 圈多位大佬加入混战。

一句话概括就是:OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲和对于 AI 夸大宣传的激烈讨论。

打开网易新闻 查看精彩图片

故事要从几条引爆社交平台的推文说起。

GPT-5 解决悬赏难题?

10 月 12 日,Sebastien Bubeck 发推表示 GPT-5 文献搜索方面超凡脱俗,发现了 Erdős 问题 339 已被解决但在官方数据库中状态尚未修改。

打开网易新闻 查看精彩图片

10 月 17 日,OpenAI 研究人员 Mark Sellke 转发此贴更新,表示他和 Mehtaab 使用 GPT-5 模型进一步研究,通过数千次查询,针对 erdosproblems.com 网站上列为「开放」的 Erdős 问题进行了调查。

打开网易新闻 查看精彩图片

他们声称「发现了」10 个问题的解决方案(问题编号:223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079)。同时他们在另外 11 个问题上也取得了部分进展。

OpenAI 首席产品官 Kevin Weil 转发此贴。

打开网易新闻 查看精彩图片

这些问题源自数学家 Paul Erdős 提出的未解决问题列表,该网站由数学家 Thomas Bloom 维护。

OpenAI 的副总裁 Sebastien Bubeck 转发并宣称「AI 加速科学已正式开始」,并顺势宣布 Mark Sellke 加入 OpenAI。

打开网易新闻 查看精彩图片

一时间,公众和媒体普遍认为 GPT-5 在数学推理能力上取得了惊人突破,能够独立解决困扰人类数学家数十年的难题。

反转:「这很尴尬」

然而,这场狂欢仅仅持续了几个小时,就迎来了反转。

谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那条「AI 加速科学」的推文下回复:这很尴尬

打开网易新闻 查看精彩图片

Hassabis 随后引导公众关注该数学难题网站维护者、数学家 Thomas Bloom 的澄清。

Thomas Bloom 表示:OpenAI 的表述为「戏剧性的误解」。网站上将这些问题标记为「未解决」,仅仅代表他个人不知道相关解答已经发表,并不意味着数学界没有人解决。

打开网易新闻 查看精彩图片

换言之,GPT-5 扮演了一个效率极高的学术搜索引擎,而非一个数学家。

Sebastien Bubeck 随后删除帖子并道歉,称「我无意误导任何人,我认为表述很清楚,对不起」。他强调,AI 在文献搜索上的作用非常有价值,因为「搜索文献有多难,我很清楚」,这能加速科学研究。

打开网易新闻 查看精彩图片

Kevin Weil 也删帖并承认「我实际上误解了我们的结果(尴尬)」。Mark Sellke 的更新也是转发此贴。

打开网易新闻 查看精彩图片

Hoisted by their own GPTards

对此,Lecun 也辛辣点评:(OpenAI)被自己吹捧 GPT 的言论坑惨了(Hoisted by their own GPTards),讽刺其作茧自缚。

注:源自莎士比亚戏剧《哈姆雷特》的著名短语 Hoist with his own petard(被自己的炸药包给炸飞了),这里 petard(炸药)改成了 GPTards(-tards 源自英文单词 retard,意为笨蛋),指代那些盲目崇拜 ChatGPT / AI 的人。

打开网易新闻 查看精彩图片

搞笑的是,就在同一天,Lecun 在一篇指出最近的热门论文《Definition of AGI》中存在虚假引用的帖子下面回复了相同的一句话。

打开网易新闻 查看精彩图片

Gary Marcus 也做出点评:任何期望当前范式接近AGI的人都是在痴心妄想。

打开网易新闻 查看精彩图片

网友也进行了激烈讨论,有部分人认为 OpenAI 再一次炒作失败。

打开网易新闻 查看精彩图片

不过也有人认为,这是一个有价值的事情。

打开网易新闻 查看精彩图片

陶哲轩的观点与此类似,他在 Mastodon 上表示,AI 在数学中的即时潜力在于加速文献搜索等琐碎任务,而非解决最难的开放问题。他承认 AI 可能「工业化」数学,加速整体进展,但强调人类专家仍需审查、分类和整合 AI 结果。

打开网易新闻 查看精彩图片

  • 贴文地址:https://mathstodon.xyz/@tao/115385022005130505

还有人对「炒作」行为做出了更深层次的解读。

打开网易新闻 查看精彩图片

无论如何,这件事再次警醒我们,在追求技术突破的道路上,AI 社区究竟该如何平衡严谨的科学精神与必要的公众宣传?

https://x.com/Yuchenj_UW/status/1979422127905476778

https://x.com/ns123abc/status/1979574373435441229

https://x.com/ylecun/status/1979596956277289353