战胜Mythos 5，OpenAI安全专用GPT-5.5-Cyber完全体来了|cyber|openai|代码库|工作流|网络安全

机器之心编辑部

OpenAI 在网络安全领域又往前推了一步。

今天，OpenAI 宣布扩展 Daybreak 安全计划，推出更新版 GPT-5.5-Cyber、Codex Security 插件、Daybreak Cyber Partner Program，以及面向开源生态的 Patch the Planet 计划等。

其中最受关注的，是 GPT-5.5-Cyber 完整版的发布。OpenAI 称，更新后的 GPT-5.5-Cyber 在 CyberGym 上取得 85.6% 的成绩，高于 GPT-5.5 的 81.8%。这一成绩也超过了 Anthropic Mythos 5 的 83.8%。

OpenAI CEO 奥特曼表示，「OpenAI 希望与美国政府和安全生态合作，帮助所有企业提升安全性。GPT-5.5-Cyber 完整版现已发布，并在 CyberGym 上取得当前 SOTA 表现。」

OpenAI 总裁 Greg Brockman 写到，「通过 OpenAI Daybreak，我们正在用新的工具和模型加速漏洞修补，而不只是加速漏洞发现。OpenAI 的模型现在已经能够为主流浏览器、网络基础设施和操作系统中的关键漏洞发现并生成补丁，涉及 FreeBSD、Linux 内核等系统；同时也帮助 cURL、Go、Python、Sigstore 等项目推进漏洞修复。」

不过，网友们似乎并不买账，大家更期待 OpenAI 发布的是 GPT-5.6。

此次的几大更新包括如下：

GPT-5.5-Cyber：在最初仅开放预览版之后，OpenAI 将通过持续的受限发布机制，向可信防守方推出 GPT-5.5-Cyber 的完整版本。该模型在 CyberGym 上取得了新的最佳表现，得分达到 85.6%，高于 GPT-5.5 的 81.8%。
Codex Security：OpenAI 将发布 Codex Security 插件更新，把其从内部使用和客户使用模型过程中积累的经验，整合成一套解决方案，用于加速现有系统中漏洞的发现与修复，并自动阻止新的漏洞进入生产环境。
Patch the Planet：这是 OpenAI 与 Trail of Bits 共同发起的项目，并与 HackerOne、Calif、研究人员和维护者合作，帮助被广泛使用的开源项目从发现漏洞走向真正修复。
Daybreak Cyber Partner Program：OpenAI 将通过这一计划，让安全合作伙伴在自己的产品和服务中，以可信访问方式使用其最强的模型，把这些能力扩展到更多组织。

更新 GPT-5.5-Cyber：能力与更开放的使用边界并行

OpenAI 正在发布 GPT-5.5-Cyber 的更新版本。这是一个面向高级、授权网络安全工作的模型，既更具能力，也更少出现不必要拒答。

GPT-5.5-Cyber 的最初预览版，主要目标是减少专业工作流中的不必要拒绝。这次更新更进一步。它是 OpenAI 迄今在发现并帮助修补软件漏洞方面最强的模型，同时保留了 GPT-5.5 的通用智能，以及处理长期、复杂任务的能力。

该模型可以在大型代码库中持续进行更深入分析：识别与安全相关的组件，追踪存在漏洞的代码是否可达，在受控环境中验证可能的问题，开发并测试补丁，并为人工审查准备证据。目标是帮助防守方走完整个修复闭环，而不只是产生更多漏洞发现。

在 CyberGym 上，更新后的 GPT-5.5-Cyber 在单模型评估中达到 85.6%，高于 GPT-5.5 的 81.8%。CyberGym 衡量的是一个智能体能否在软件环境中复现已知漏洞。这也是 OpenAI 测得的单模型最高 CyberGym 分数。

GPT-5.5-Cyber 在另外两个要求很高的真实安全基准上也超过了 GPT-5.5。在 ExploitGym 上，GPT-5.5-Cyber 得分 39.5%，高于 GPT-5.5 的 25.95%。ExploitGym 测试的是智能体能否把已知漏洞转化为可工作的漏洞利用，并实现未经授权的代码执行。在 SEC-bench Pro 上，GPT-5.5-Cyber 得分 69.8%，高于 GPT-5.5 的 63.1%。SEC-bench Pro 评估的是复杂软件目标上的长周期漏洞发现和概念验证生成能力。

基准测试只是故事的一部分。真正重要的是，在实际场景中，模型能否发现真实漏洞，能否从噪声中识别出可行动的问题，并帮助防守方安全地完成修复。随着协调披露工作的结束，OpenAI 会继续在复杂代码库和真实修复工作流中评估该模型的表现。

围绕 OpenAI 的网络安全方法，包括今天发布的内容，以及即将发布模型前的准备工作，OpenAI 一直与美国政府保持沟通。这包括继续与 Center for AI Standards and Innovation，即 CAISI，在 GPT-5.5 和 GPT-5.5-Cyber 的部署前测试方面展开合作；也包括与 Office of the National Cyber Director，即 ONCD，以及 Office of Science and Technology Policy，即 OSTP，就近期行政令和相关行业标准的落地展开合作。

对大多数防守方来说，GPT-5.5 加 Trusted Access for Cyber，再配合 Codex Security，仍然是合适的起点。GPT-5.5-Cyber 面向的是经过验证的防守方，他们的授权工作需要 OpenAI 最先进的网络安全能力和更宽松的模型行为，同时也需要更强的验证、监控、范围控制和审查机制。在早期 Daybreak 工作中，GPT-5.5 和 Codex Security 已经帮助防守方在多个广泛使用的系统中识别并验证漏洞，包括 Firefox、V8、Safari、OpenBSD、FreeBSD 和 HTTP/2 实现。

用 Codex Security 把发现变成修复

自 3 月 Codex Security 云端版以研究预览形式推出以来，它已经扫描了超过 3000 万次提交，覆盖 3 万多个代码库；人工审查者已经手动将 7 万多个发现标记为已修复，另有超过 50 万个发现被自动判定为已修复。

这正是今天漏洞修补所需要达到的规模。

OpenAI 构建 Codex Security 时，基于一个简单前提：通过直接集成到 Codex 中，把相当于一名安全工程师的能力放到每一位软件开发者身边。

Codex Security 不只是生成告警。它会理解团队的代码及其威胁模型；如果威胁模型不存在，它也可以生成一个；它会识别可能存在的漏洞，判断受影响代码是否可达，收集证据并提供验证步骤，开发有针对性的补丁，并验证修复结果。人类仍然掌控关键决策：调查哪些发现、应用哪些变更、分享哪些信息。

今天，OpenAI 正在发布 Codex Security 插件更新，使其支持开箱即用的防御型安全工作流。开发者可以运行深度扫描，也可以审查近期变更；可以生成包含严重程度、受影响代码位置、验证证据和修复建议的报告；可以追踪攻击路径，构建威胁模型，验证发现，并生成面向具体代码库的补丁供审查。

用户可以设置扫描范围，覆盖整个代码库、代码库的一部分，或某个特定变更和提交。

该插件还可以对来自扫描器、安全公告、漏洞赏金报告或工单系统的既有发现进行分级和验证，然后大规模自动生成补丁，帮助快速清理积压漏洞。当 Codex Security 完成扫描后，它还可以导出到现有漏洞管理系统，或通过 SARIF 文件、CodeQL 查询等方式接入其他工具。该插件让这些能力更容易被使用，既可以配合 Codex CLI 支持自动化流水线，也可以集成进 Codex 应用中的开发者工作流。

Patch the Planet：让开源修复真正落地

Patch the Planet 是一个帮助维护者从漏洞发现走向真正修复的项目。该项目由 OpenAI 与 Trail of Bits 共同发起，并与 HackerOne 和 Calif 合作。OpenAI 将资助专业安全研究人员，并为他们配备 Codex Security 和高级模型，让他们直接与开源维护者合作。

开源软件支撑着各行各业的产品、公共服务、开发者工具和关键基础设施。一个被广泛使用的网络库中的漏洞，可能影响数千个下游系统。然而，许多这类项目由规模很小的团队维护，时间和资金都非常有限。Linux Foundation 和 Harvard 的研究发现，在其研究的广泛使用项目中，94% 的项目由不到 10 名开发者负责一年内新增代码的 90% 以上。

随着 AI 让更快发现和修补更多漏洞成为可能，它也给维护者带来了更多工作。维护者需要从成千上万份报告中筛选真正有价值的问题，其中很多报告质量很低，甚至是误报。维护者不应该只得到更多报告，却没有更多能力去修复。因此，Patch the Planet 的核心是专家级人工安全审查。

每一次合作都会先从安全研究人员与受帮助维护者之间的沟通开始。维护者会定义自己的优先事项、偏好和既有披露流程。随后，Patch the Planet 的安全研究人员会端到端管理相关工作，在漏洞和补丁提交给维护者之前，先完成验证和去重，从而显著降低维护者负担，并加快修复速度。

参与项目的开源项目将获得 ChatGPT Pro、Codex Security 的条件访问权限，以及用于核心开发、维护者自动化和发布工作流的 API 额度。

首个为期五天、覆盖多个项目的冲刺工作，已经发现了数百个待审查问题，合并了数十个补丁，并推动更多补丁继续推进。同时，该项目还构建了可复用的模糊测试、变体分析、差分测试和基于规范的测试工作流。

发现漏洞很重要，但真正保护世界的，是让修复落地。而这需要协作，也需要社区支持。

与安全生态合作

作为此次扩展的一部分，OpenAI 还将与领先的安全软件和服务提供商共同推出 OpenAI Daybreak Cyber Partner Program。

通过该计划，参与合作伙伴可以在其提供给客户的安全产品和服务中，使用带有 Trusted Access for Cyber 的 GPT-5.5。这是 OpenAI 面向大多数防御型网络安全工作流的主力模型。这样一来，客户可以受益于模型的防御能力，提升软件韧性，同时直接模型访问仍然掌握在参与计划的合作伙伴手中。

OpenAI 还将与该计划的合作伙伴协作，继续强化在安全生态中负责任部署这些能力所需的保障措施、监控机制和防滥用标准。OpenAI 将首先与一批初始合作伙伴推出该计划，并计划在未来几个月继续扩展到更多组织。

接下来

Daybreak 将模型、Codex Security、Patch the Planet、专家研究人员、维护者、安全合作伙伴、关键基础设施运营方和可信访问控制整合在一起，帮助人类防守方面对这一挑战。

公共部门和私营部门组织都可以与 OpenAI Daybreak 合作，识别、验证并修复它们构建和依赖的软件中的漏洞。开发者和维护者可以在自己拥有的代码上运行 Codex Security，审查发现，并推动修复落地。安全合作伙伴和从业者可以使用 OpenAI 的前沿模型，强化自己的防御工具，并把这些能力快速带给更多组织。

目标是超越「用模型发现更多漏洞」这一阶段，走向一个软件更安全、网络韧性更强的世界。

https://x.com/OpenAI/status/2069104283824640023

https://openai.com/index/daybreak-securing-the-world/

https://x.com/sama/status/2069121360744550796

https://x.com/gdb/status/2069112120206332130