英国人工智能安全研究所的一项最新评估发现,GPT-5.5在识别安全漏洞方面的表现已与Claude Mythos相当。这两款模型目前均已向公众开放,这一能力平价引发了业界对网络攻击门槛降低的深切担忧——对手如今可以借助唾手可得的大模型开展漏洞研究。

技术层面的细节揭示了更复杂的图景。安全专家指出,基于大语言模型的漏洞发现存在明显边界:其能力局限于已知的攻击模式,无法自主创造全新的攻击向量。这意味着模型更像是一位经验丰富的"模式匹配者",而非真正的"漏洞发明家"。

打开网易新闻 查看精彩图片

然而,这种局限并未带来足够的安全感。评估报告特别提到,各类越狱手段的存在使得模型的防护机制只能提供部分缓解效果。当攻击者可以绕过内置的安全护栏时,技术能力的边界便不再是决定性的防御因素。

打开网易新闻 查看精彩图片

这一发现的核心矛盾在于技术民主化的双面性。一方面,安全研究人员获得了更强大的工具来主动发现系统弱点;另一方面,恶意行为者也获得了同等的能力加持。当专业级的漏洞挖掘能力从少数安全团队的专属,变成任何拥有API密钥的人皆可调用的服务时,攻防博弈的基本假设正在被改写。

打开网易新闻 查看精彩图片

评估结论并未给出简单的乐观或悲观判断,而是指向了一个需要持续关注的动态平衡:如何在开放模型能力与管控滥用风险之间找到可持续的中间路径。随着模型能力的迭代速度持续加快,这一问题的紧迫性只会愈发凸显。