打开网易新闻 查看精彩图片

科学塑造了从人类健康、能源生产到对宇宙的理解的方方面面。如果人工智能能够加速科学发展——缩短产生新想法或从想法到经过验证的结果的时间——那么这些益处将在社会中叠加。

但在这里,创新的开发速度依旧是一个限制。即使有了好的创意,将其转化为实际产品也需要一定时间。在近期调查中,60% 的美国人表示科学和医学突破传达得太慢;73% 的人表示我们需要更好的方法来加快发现进程;69% 的人将科学领导力视为人类的首要任务。

打开网易新闻 查看精彩图片

在 OpenAI 与范德堡大学、加州大学伯克利分校、哥伦比亚大学、牛津大学、剑桥大学、劳伦斯利弗莫尔国家实验室和杰克逊实验室等大学和国家实验室合作者共同撰写的论文「Early science acceleration experiments with GPT-5」中,他们详细阐述了 GPT-5 帮助研究人员以新颖方式综合已知结果,进行有力的文献综述,加速艰难计算,甚至生成未解命题的新证明。

相关信息:https://openaiglobalaffairs.substack.com/p/speeding-up-science-with-corrected

这些案例研究表明,在专家手中,GPT-5 正在加速科学发现,以及为什么这种加速很重要:

  • 生物学:由 Derya Unutmaz 医学博士领导的一项研究中,科学家们花费数月时间试图解释人类免疫细胞中一个令人费解的变化。GPT-5 在几分钟内从一份未发表的图表中识别出可能的机制,并提出了一项实验来证明它。这种速度可以帮助研究人员更快地理解疾病,并开发出更好的治疗方法。
  • 数学:另一个案例中,研究人员 Mehtaab Sawhney 和 Mark Sellke 正在解决由 Paul Erdős 最初提出的、持续数十年的开放性问题。他们卡在了最后一步,而 GPT-5 贡献了一个关于某个奇数如何打破模式的新想法,帮助他们完成了证明。这样的进展加强了众多算法和安全性技术最终所依赖的数学基础。
  • 算法与优化:研究人员 Sébastien Bubeck 和 Christian Coester 正在测试一种在机器人和路径规划中常用的决策方法,以求证它是否像人们所假设的那样可靠。GPT-5 发现了一个新的、清晰的例子,表明该方法可能会失败,并改进了优化中的一个经典结果,即用于确定解决问题最佳方法的数学方法。这类进展有助于工程师更好地理解机器人和路径规划中使用的决策系统以及其他现实应用中的决策系统。

OpenAI for Science 是什么?

OpenAI for Science 的使命是加速科学发现:帮助研究人员探索更多想法,更快地测试假设,并发现原本需要大量时间才能揭示的见解。这需要 OpenAI 团队通过将前沿模型与合适的工具、工作流程和合作相结合来实现这一目标。

团队为了获取模型的评估,通常会与学术界、工业界和国家实验室的研究人员紧密合作,从文献综述和证明生成到建模、模拟和实验设计这些反馈中获取改进的方向。

这其中的方法结合了两种互补的信念。专业的科学工具与扩展基础模型。前者对于效率和精确性至关重要。后者则解锁全新的推理能力:跨领域连接思想、勾勒证明、提出机制等。团队希望使用者在专业工具可用的时候积极采纳;对于那些需要一般推理的,团队也在构建针对性模型,这两者是相互强化的。

GPT-5 在科学工作中的当前状态

科学家设定如下议程:定义问题、选择方法、批判思想并验证结果。在这个过程中,GPT-5 贡献了广度、速度以及在并行探索许多方向的能力;研究人员学习如何提出问题、何时提出异议、如何将问题分解为步骤,以及什么需要独立验证。这就像迭代——对话并反馈直到放弃或给出解答。

早期研究中,专家使用 GPT-5 似乎能够缩短研究工作流程的部分环节。它不会自主运行项目或解决科学问题,但它可以扩展探索的广度,并帮助研究人员更快地接近正确结果。

一项新兴的能力是概念性文献检索。GPT-5 通常能够识别思想之间的深层关系,并跨语言和难以获取的来源检索相关材料。在数学和理论计算机科学领域,GPT-5 可以在几分钟内生成可行的证明大纲,将原本可能需要数天或数周的工作转变为高效完成。在生物学和其他经验科学中,该模型可以提出机制并设计实验,以在湿实验室中验证这些假设。

实验中的案例研究

GPT-5 能在科学前沿重新发现已知结果,比如说,寻求数学中的优化。它协助探讨了梯度下降访问的值序列在随时间形成凸曲线(没有凹陷的曲线)的情况,并给出了一个更清晰、更标准的证明,甚至从头推导出了最优界限。

打开网易新闻 查看精彩图片

相关链接:https://arxiv.org/abs/2503.10138

此外,它还能将一个新的几何结果与其他领域联系起来。它指出了与一个凸几何中的得证定理相关的密度估计、学习理论和多目标优化方面的工作,并提出了具体的参考文献,有些甚至连提问者都未曾见过。

同样,GPT-5 也可以作为合作伙伴,在多个组合学案例中,GPT-5 迅速发现候选结构中的缺陷或遗漏的情况,并提出了更简单的替代方案或反例;在其他情况下,它停滞不前或未能取得进展。尽管这未能达到提问者对于完全合著的标准,其在压缩时间等方面上还是卓有成效。

局限性与下一阶段发展

专家监督仍然至关重要。GPT-5 有时会虚构看似合理的引用、机制或证明;它可能对框架搭建和预热问题敏感;有时会忽略特定领域的细微之处;若未得到纠正,它还可能遵循无益的推理路径。对于这些活跃的研究领域,研发团队正与合作伙伴合作,在优化未来系统时测量并缓解这些缺陷。

综合来看,这些早期研究表明,GPT-5 开始帮助进行新型科学工作。该模型并非自主,但在专家手中,它可以帮助证明定理、重新发现和扩展结构、揭示跨领域的联系,并为科学家生成机制和实验以进行验证。

可以看到,这些系统随着时间的推移和计算能力的提升而不断改进。如果 GPT-5 能够在 20 分钟内对某些研究问题提供有意义的帮助,团队预计模型的推理效果将会随着时间而递增。结合世界一流的科学家,这指向了科学生产力随时间发生飞跃式进步的可能性。