机器之心编辑部

OpenAI 在网络安全领域又往前推了一步。

今天,OpenAI 宣布扩展 Daybreak 安全计划,推出更新版 GPT-5.5-Cyber、Codex Security 插件、Daybreak Cyber Partner Program,以及面向开源生态的 Patch the Planet 计划等。

其中最受关注的,是 GPT-5.5-Cyber 完整版的发布。OpenAI 称,更新后的 GPT-5.5-Cyber 在 CyberGym 上取得 85.6% 的成绩,高于 GPT-5.5 的 81.8%。这一成绩也超过了 Anthropic Mythos 5 的 83.8%。

打开网易新闻 查看精彩图片

OpenAI CEO 奥特曼表示,「OpenAI 希望与美国政府和安全生态合作,帮助所有企业提升安全性。GPT-5.5-Cyber 完整版现已发布,并在 CyberGym 上取得当前 SOTA 表现。」

打开网易新闻 查看精彩图片

OpenAI 总裁 Greg Brockman 写到,「通过 OpenAI Daybreak,我们正在用新的工具和模型加速漏洞修补,而不只是加速漏洞发现。OpenAI 的模型现在已经能够为主流浏览器、网络基础设施和操作系统中的关键漏洞发现并生成补丁,涉及 FreeBSD、Linux 内核等系统;同时也帮助 cURL、Go、Python、Sigstore 等项目推进漏洞修复。」

打开网易新闻 查看精彩图片

不过,网友们似乎并不买账,大家更期待 OpenAI 发布的是 GPT-5.6。

打开网易新闻 查看精彩图片

此次的几大更新包括如下:

  • GPT-5.5-Cyber:在最初仅开放预览版之后,OpenAI 将通过持续的受限发布机制,向可信防守方推出 GPT-5.5-Cyber 的完整版本。该模型在 CyberGym 上取得了新的最佳表现,得分达到 85.6%,高于 GPT-5.5 的 81.8%。
  • Codex Security:OpenAI 将发布 Codex Security 插件更新,把其从内部使用和客户使用模型过程中积累的经验,整合成一套解决方案,用于加速现有系统中漏洞的发现与修复,并自动阻止新的漏洞进入生产环境。
  • Patch the Planet:这是 OpenAI 与 Trail of Bits 共同发起的项目,并与 HackerOne、Calif、研究人员和维护者合作,帮助被广泛使用的开源项目从发现漏洞走向真正修复。
  • Daybreak Cyber Partner Program:OpenAI 将通过这一计划,让安全合作伙伴在自己的产品和服务中,以可信访问方式使用其最强的模型,把这些能力扩展到更多组织。

更新 GPT-5.5-Cyber:能力与更开放的使用边界并行

OpenAI 正在发布 GPT-5.5-Cyber 的更新版本。这是一个面向高级、授权网络安全工作的模型,既更具能力,也更少出现不必要拒答。

GPT-5.5-Cyber 的最初预览版,主要目标是减少专业工作流中的不必要拒绝。这次更新更进一步。它是 OpenAI 迄今在发现并帮助修补软件漏洞方面最强的模型,同时保留了 GPT-5.5 的通用智能,以及处理长期、复杂任务的能力。

该模型可以在大型代码库中持续进行更深入分析:识别与安全相关的组件,追踪存在漏洞的代码是否可达,在受控环境中验证可能的问题,开发并测试补丁,并为人工审查准备证据。目标是帮助防守方走完整个修复闭环,而不只是产生更多漏洞发现。

在 CyberGym 上,更新后的 GPT-5.5-Cyber 在单模型评估中达到 85.6%,高于 GPT-5.5 的 81.8%。CyberGym 衡量的是一个智能体能否在软件环境中复现已知漏洞。这也是 OpenAI 测得的单模型最高 CyberGym 分数。

打开网易新闻 查看精彩图片

GPT-5.5-Cyber 在另外两个要求很高的真实安全基准上也超过了 GPT-5.5。在 ExploitGym 上,GPT-5.5-Cyber 得分 39.5%,高于 GPT-5.5 的 25.95%。ExploitGym 测试的是智能体能否把已知漏洞转化为可工作的漏洞利用,并实现未经授权的代码执行。在 SEC-bench Pro 上,GPT-5.5-Cyber 得分 69.8%,高于 GPT-5.5 的 63.1%。SEC-bench Pro 评估的是复杂软件目标上的长周期漏洞发现和概念验证生成能力。

打开网易新闻 查看精彩图片

基准测试只是故事的一部分。真正重要的是,在实际场景中,模型能否发现真实漏洞,能否从噪声中识别出可行动的问题,并帮助防守方安全地完成修复。随着协调披露工作的结束,OpenAI 会继续在复杂代码库和真实修复工作流中评估该模型的表现。

围绕 OpenAI 的网络安全方法,包括今天发布的内容,以及即将发布模型前的准备工作,OpenAI 一直与美国政府保持沟通。这包括继续与 Center for AI Standards and Innovation,即 CAISI,在 GPT-5.5 和 GPT-5.5-Cyber 的部署前测试方面展开合作;也包括与 Office of the National Cyber Director,即 ONCD,以及 Office of Science and Technology Policy,即 OSTP,就近期行政令和相关行业标准的落地展开合作。

对大多数防守方来说,GPT-5.5 加 Trusted Access for Cyber,再配合 Codex Security,仍然是合适的起点。GPT-5.5-Cyber 面向的是经过验证的防守方,他们的授权工作需要 OpenAI 最先进的网络安全能力和更宽松的模型行为,同时也需要更强的验证、监控、范围控制和审查机制。在早期 Daybreak 工作中,GPT-5.5 和 Codex Security 已经帮助防守方在多个广泛使用的系统中识别并验证漏洞,包括 Firefox、V8、Safari、OpenBSD、FreeBSD 和 HTTP/2 实现。

用 Codex Security 把发现变成修复

自 3 月 Codex Security 云端版以研究预览形式推出以来,它已经扫描了超过 3000 万次提交,覆盖 3 万多个代码库;人工审查者已经手动将 7 万多个发现标记为已修复,另有超过 50 万个发现被自动判定为已修复。

这正是今天漏洞修补所需要达到的规模。

打开网易新闻 查看精彩图片

OpenAI 构建 Codex Security 时,基于一个简单前提:通过直接集成到 Codex 中,把相当于一名安全工程师的能力放到每一位软件开发者身边。

Codex Security 不只是生成告警。它会理解团队的代码及其威胁模型;如果威胁模型不存在,它也可以生成一个;它会识别可能存在的漏洞,判断受影响代码是否可达,收集证据并提供验证步骤,开发有针对性的补丁,并验证修复结果。人类仍然掌控关键决策:调查哪些发现、应用哪些变更、分享哪些信息。

今天,OpenAI 正在发布 Codex Security 插件更新,使其支持开箱即用的防御型安全工作流。开发者可以运行深度扫描,也可以审查近期变更;可以生成包含严重程度、受影响代码位置、验证证据和修复建议的报告;可以追踪攻击路径,构建威胁模型,验证发现,并生成面向具体代码库的补丁供审查。

打开网易新闻 查看精彩图片

用户可以设置扫描范围,覆盖整个代码库、代码库的一部分,或某个特定变更和提交。

该插件还可以对来自扫描器、安全公告、漏洞赏金报告或工单系统的既有发现进行分级和验证,然后大规模自动生成补丁,帮助快速清理积压漏洞。当 Codex Security 完成扫描后,它还可以导出到现有漏洞管理系统,或通过 SARIF 文件、CodeQL 查询等方式接入其他工具。该插件让这些能力更容易被使用,既可以配合 Codex CLI 支持自动化流水线,也可以集成进 Codex 应用中的开发者工作流。

Patch the Planet:让开源修复真正落地

Patch the Planet 是一个帮助维护者从漏洞发现走向真正修复的项目。该项目由 OpenAI 与 Trail of Bits 共同发起,并与 HackerOne 和 Calif 合作。OpenAI 将资助专业安全研究人员,并为他们配备 Codex Security 和高级模型,让他们直接与开源维护者合作。

开源软件支撑着各行各业的产品、公共服务、开发者工具和关键基础设施。一个被广泛使用的网络库中的漏洞,可能影响数千个下游系统。然而,许多这类项目由规模很小的团队维护,时间和资金都非常有限。Linux Foundation 和 Harvard 的研究发现,在其研究的广泛使用项目中,94% 的项目由不到 10 名开发者负责一年内新增代码的 90% 以上。

随着 AI 让更快发现和修补更多漏洞成为可能,它也给维护者带来了更多工作。维护者需要从成千上万份报告中筛选真正有价值的问题,其中很多报告质量很低,甚至是误报。维护者不应该只得到更多报告,却没有更多能力去修复。因此,Patch the Planet 的核心是专家级人工安全审查。

每一次合作都会先从安全研究人员与受帮助维护者之间的沟通开始。维护者会定义自己的优先事项、偏好和既有披露流程。随后,Patch the Planet 的安全研究人员会端到端管理相关工作,在漏洞和补丁提交给维护者之前,先完成验证和去重,从而显著降低维护者负担,并加快修复速度。

参与项目的开源项目将获得 ChatGPT Pro、Codex Security 的条件访问权限,以及用于核心开发、维护者自动化和发布工作流的 API 额度。

首个为期五天、覆盖多个项目的冲刺工作,已经发现了数百个待审查问题,合并了数十个补丁,并推动更多补丁继续推进。同时,该项目还构建了可复用的模糊测试、变体分析、差分测试和基于规范的测试工作流。

发现漏洞很重要,但真正保护世界的,是让修复落地。而这需要协作,也需要社区支持。

与安全生态合作

作为此次扩展的一部分,OpenAI 还将与领先的安全软件和服务提供商共同推出 OpenAI Daybreak Cyber Partner Program。

通过该计划,参与合作伙伴可以在其提供给客户的安全产品和服务中,使用带有 Trusted Access for Cyber 的 GPT-5.5。这是 OpenAI 面向大多数防御型网络安全工作流的主力模型。这样一来,客户可以受益于模型的防御能力,提升软件韧性,同时直接模型访问仍然掌握在参与计划的合作伙伴手中。

打开网易新闻 查看精彩图片

OpenAI 还将与该计划的合作伙伴协作,继续强化在安全生态中负责任部署这些能力所需的保障措施、监控机制和防滥用标准。OpenAI 将首先与一批初始合作伙伴推出该计划,并计划在未来几个月继续扩展到更多组织。

接下来

Daybreak 将模型、Codex Security、Patch the Planet、专家研究人员、维护者、安全合作伙伴、关键基础设施运营方和可信访问控制整合在一起,帮助人类防守方面对这一挑战。

公共部门和私营部门组织都可以与 OpenAI Daybreak 合作,识别、验证并修复它们构建和依赖的软件中的漏洞。开发者和维护者可以在自己拥有的代码上运行 Codex Security,审查发现,并推动修复落地。安全合作伙伴和从业者可以使用 OpenAI 的前沿模型,强化自己的防御工具,并把这些能力快速带给更多组织。

目标是超越「用模型发现更多漏洞」这一阶段,走向一个软件更安全、网络韧性更强的世界。

https://x.com/OpenAI/status/2069104283824640023

https://openai.com/index/daybreak-securing-the-world/

https://x.com/sama/status/2069121360744550796

https://x.com/gdb/status/2069112120206332130