“这是目前最强大的发现和修复软件缺陷的单一模型。”OpenAI官方博客的一句话,直接把GPT-5.5-Cyber推上风口。就在Anthropic不断强调AI安全需要先“理解动机”的时候,OpenAI直接搬出三套硬核安全基准的成绩单,还配套一个能自动修漏洞的Codex插件,摆出“你说你的,我修我的”架势。这波操作,我们从五个关键点拆开看。
一、三榜榜首:GPT-5.5-Cyber怎么把Mythos比下去的
OpenAI拿出的不是单一跑分,而是CyberGym、ExploitGym、SEC-bench Pro三张卷子。CyberGym考的是智能体在软件环境中复现已知漏洞的能力,看你能不能把前人踩过的坑再精准踩一遍。ExploitGym难度升级,要求把漏洞转化为实际可利用的攻击代码,相当于不仅找到门锁坏了,还得演示怎么撬开。SEC-bench Pro则是长线作战,评估长时间漏洞发现能力,模拟真实红队持续渗透的场景。这三项测试分别覆盖“能否发现”“能否利用”“能否持久挖到”,GPT-5.5-Cyber全部领先Anthropic Mythos,而且OpenAI没有用“竞品”之类的模糊词,直接点名Mythos,火药味十足。
二、从扫到修:Codex插件完成3000万次提交扫描后,连补丁都替你写好了
这次更新的Codex Security插件把漏洞管理从“检测”强行拉进“修复闭环”。3月发布研究预览版以来,该插件已经扫描超过3万个代码库、3000万次提交。OpenAI给出的数据很硬:超过50万个发现被自动标记为已修复,另有7万个由人工复核确认。最新的插件工作流程近乎“全自动外科手术”——结合威胁模型分析代码,定位缺陷,检查受影响代码是否可达,生成针对性补丁,最后验证修复效果。新加入的深度全代码库扫描、攻击路径分析,以及通过SARIF文件或CodeQL查询导出到漏洞管理系统的功能,让安全工程团队可以直接把它嵌进现有流水线。当然,每处修改仍需人工签字确认,这层“人在环中”的约束倒不是怕AI乱修,更多是对生产环境的敬畏。
三、拒绝率降了,但别高兴太早——这模型只给“守规矩的防御者”用
GPT-5.5-Cyber的完整版刻意做了“放宽”处理,相比标准模型,它在安全场景下拒绝回答的次数明显减少。OpenAI给出的理由很务实:安全研究员需要的不是一个时时说“这违反内容政策”的模型,而是一个能直接给出技术方案的助手。但开放仅限于经过审查的防御方,Wired AI的报道提到,模型只对受信的合作伙伴开放,并未向公众自由放出。这种“定向松绑”既提升效率,也划出红线,防止能力被恶意利用。前一个预览版的主要目标仅是减少安全任务中的不必要拒答,而新版直接拔高到“最擅发现和修补漏洞的单体模型”,定位完全不同。
四、“修地球”计划:拉上25+安全公司和多国政府,专盯开源软件
与模型一同推出的还有“Patch the Planet”倡议,名字起得大,落地却十分具体:联合开源项目维护者,利用AI和专家审查去发现、验证并修复漏洞。合作伙伴清单里已经有超过25家安全公司和多个政府机构,虽然OpenAI没透露是哪些政府,但量级摆在那里。Engadget的报道指出,这一计划直接瞄准开源软件生态的痼疾——大量关键组件由少数维护者业余时间支撑,漏洞从报告到修复往往拖延数月。OpenAI的做法是用AI先把扫描和初步修补跑完,再让维护者决策,相当于替无数个“深夜改bug的开源英雄”跑完最枯燥的部分。
五、Anthropic也承认:瓶颈已从“找漏洞”转向“修漏洞”
OpenAI这通高举高打的同时,Anthropic近期也表达了类似观点,认为行业瓶颈正从漏洞发现转移到修复环节。这相当于间接承认,单纯比谁的模型能发现更多漏洞的叙事已经过时。现在的焦点是谁能更快把发现变成补丁,并安全地交付给全球数万个代码库的维护者。OpenAI用Codex插件+GPT-5.5-Cyber+合作伙伴网络搭起来的管道,试图证明自己不只是嘴上承认瓶颈转移,而是已经铺好一根粗水管。只不过,这套管道到底能承受多大水压,开源社区是否买账,政府级合作伙伴的数据透明度怎么解决,仍然是接下来要被反复拷打的问题。
热门跟贴