OpenAI新安全模型三榜碾压Anthropic，自动修漏洞计划启动|openai|代码库|开源软件|插件

“这是目前最强大的发现和修复软件缺陷的单一模型。”OpenAI官方博客的一句话，直接把GPT-5.5-Cyber推上风口。就在Anthropic不断强调AI安全需要先“理解动机”的时候，OpenAI直接搬出三套硬核安全基准的成绩单，还配套一个能自动修漏洞的Codex插件，摆出“你说你的，我修我的”架势。这波操作，我们从五个关键点拆开看。

一、三榜榜首：GPT-5.5-Cyber怎么把Mythos比下去的

OpenAI拿出的不是单一跑分，而是CyberGym、ExploitGym、SEC-bench Pro三张卷子。CyberGym考的是智能体在软件环境中复现已知漏洞的能力，看你能不能把前人踩过的坑再精准踩一遍。ExploitGym难度升级，要求把漏洞转化为实际可利用的攻击代码，相当于不仅找到门锁坏了，还得演示怎么撬开。SEC-bench Pro则是长线作战，评估长时间漏洞发现能力，模拟真实红队持续渗透的场景。这三项测试分别覆盖“能否发现”“能否利用”“能否持久挖到”，GPT-5.5-Cyber全部领先Anthropic Mythos，而且OpenAI没有用“竞品”之类的模糊词，直接点名Mythos，火药味十足。

二、从扫到修：Codex插件完成3000万次提交扫描后，连补丁都替你写好了

这次更新的Codex Security插件把漏洞管理从“检测”强行拉进“修复闭环”。3月发布研究预览版以来，该插件已经扫描超过3万个代码库、3000万次提交。OpenAI给出的数据很硬：超过50万个发现被自动标记为已修复，另有7万个由人工复核确认。最新的插件工作流程近乎“全自动外科手术”——结合威胁模型分析代码，定位缺陷，检查受影响代码是否可达，生成针对性补丁，最后验证修复效果。新加入的深度全代码库扫描、攻击路径分析，以及通过SARIF文件或CodeQL查询导出到漏洞管理系统的功能，让安全工程团队可以直接把它嵌进现有流水线。当然，每处修改仍需人工签字确认，这层“人在环中”的约束倒不是怕AI乱修，更多是对生产环境的敬畏。

三、拒绝率降了，但别高兴太早——这模型只给“守规矩的防御者”用

GPT-5.5-Cyber的完整版刻意做了“放宽”处理，相比标准模型，它在安全场景下拒绝回答的次数明显减少。OpenAI给出的理由很务实：安全研究员需要的不是一个时时说“这违反内容政策”的模型，而是一个能直接给出技术方案的助手。但开放仅限于经过审查的防御方，Wired AI的报道提到，模型只对受信的合作伙伴开放，并未向公众自由放出。这种“定向松绑”既提升效率，也划出红线，防止能力被恶意利用。前一个预览版的主要目标仅是减少安全任务中的不必要拒答，而新版直接拔高到“最擅发现和修补漏洞的单体模型”，定位完全不同。

四、“修地球”计划：拉上25+安全公司和多国政府，专盯开源软件

与模型一同推出的还有“Patch the Planet”倡议，名字起得大，落地却十分具体：联合开源项目维护者，利用AI和专家审查去发现、验证并修复漏洞。合作伙伴清单里已经有超过25家安全公司和多个政府机构，虽然OpenAI没透露是哪些政府，但量级摆在那里。Engadget的报道指出，这一计划直接瞄准开源软件生态的痼疾——大量关键组件由少数维护者业余时间支撑，漏洞从报告到修复往往拖延数月。OpenAI的做法是用AI先把扫描和初步修补跑完，再让维护者决策，相当于替无数个“深夜改bug的开源英雄”跑完最枯燥的部分。

五、Anthropic也承认：瓶颈已从“找漏洞”转向“修漏洞”

OpenAI这通高举高打的同时，Anthropic近期也表达了类似观点，认为行业瓶颈正从漏洞发现转移到修复环节。这相当于间接承认，单纯比谁的模型能发现更多漏洞的叙事已经过时。现在的焦点是谁能更快把发现变成补丁，并安全地交付给全球数万个代码库的维护者。OpenAI用Codex插件+GPT-5.5-Cyber+合作伙伴网络搭起来的管道，试图证明自己不只是嘴上承认瓶颈转移，而是已经铺好一根粗水管。只不过，这套管道到底能承受多大水压，开源社区是否买账，政府级合作伙伴的数据透明度怎么解决，仍然是接下来要被反复拷打的问题。