一家AI公司突然告诉你,它能像资深安全研究员那样"思考"漏洞——不是匹配已知特征,而是追踪数据流、理解代码交互。这不是营销话术,是Anthropic今天正式上线的产品。

从研究预览到公测:几百家企业已经用上了

打开网易新闻 查看精彩图片

Anthropic今天宣布Claude Security进入公开测试。这个工具今年2月还以"Claude Code Security"的名字做研究预览,现在正式成为Claude Enterprise订阅的一部分,面向大型组织开放。

公司透露,研究预览期间已有数百家企业用它扫描生产代码、修复漏洞,包括一些现有工具多年都没发现的隐患。

技术底座是Anthropic的旗舰模型Opus 4.7,但这次不是通用AI的"顺便做安全",而是专门定位为防御性安全产品。这符合Anthropic近来的战略走向——把网络安全作为一个长期发力方向。

就在不久前,Anthropic还推出了Project Glasswing,用的是另一个模型Mythos。这个模型原本不是为安全设计的,却在漏洞发现上表现突出。Glasswing拉来了一批技术伙伴,目标直指"保护全球生产软件"。

五个关键设计:Claude Security到底怎么做漏洞检测

1. 模拟安全研究员的思维路径

传统安全工具靠签名匹配——已知漏洞长什么样,它就找什么样。Claude Security换了一套逻辑:追踪数据流、阅读源代码、分析代码组件和文件之间的交互,然后综合判断网络效应。

简单说,它试图复现一个人类安全研究员的推理过程,而不是当一只只会识别图案的猎犬。

2. 置信度评级机制

模型会给每个发现打上置信度分数,分析师看到结果前就知道可信度高低。Anthropic强调这是为了"更值得信赖的输出"——毕竟安全领域的误报成本极高,没人想在凌晨三点被假警报叫醒。

3. 全程留痕的可解释性

Claude会边做边写"作业":解释自己的推理过程、说明置信因子、评估漏洞被利用的可能性、列出分流分析要素、预判修复方案的有效性。

这对安全团队很重要。AI黑箱决策在安全领域是致命伤,你得知道它为什么这么判断,才能决定要不要信。

4. 一键修复,跳过跨团队扯皮

发现漏洞后,用户可以直接打开Claude Code会话,在上下文里应用修复。Anthropic特意点出这个场景的价值:不用再等上好几天,跟安全和工程团队来回拉扯测试。

这个设计直击企业安全流程的痛点——发现漏洞和修复漏洞之间,往往隔着组织协作的鸿沟。

5. 研究预览反馈催生的三项功能

公测版加了三个企业刚需功能:定时扫描(持续覆盖)、带文档记录的误报 dismissal(给后续审查者留笔记)、以及CSV和Markdown导出(对接现有审计系统)。

这三项全是运营层面的改进,说明Anthropic确实听了早期用户的抱怨——AI找漏洞再准,融不进现有工作流也是白搭。

生态卡位:CrowdStrike、Palo Alto们已经接入了

Anthropic这次不是单打独斗。CrowdStrike Holdings Inc.、Palo Alto Networks Inc.、SentinelOne Inc.、Trend Micro Inc.的Trend.ai、Wiz Inc.——这些名字列出来,基本覆盖了企业安全栈的核心玩家。

Opus 4.7正在被集成进这些平台的网络安全体系里。对Anthropic来说,这是把模型能力嵌入企业现有基础设施的最快路径;对这些安全厂商来说,AI驱动的漏洞推理是差异化筹码。

一个值得玩味的细节:Mythos模型原本不是为安全而生,却在Glasswing项目里证明了漏洞发现能力。现在Opus 4.7又被专门调校成安全工具。Anthropic似乎在跑两条线——通用模型的意外能力,和专用模型的精准打击。

为什么这事值得安全从业者盯着

Claude Security的切入点很刁钻。它没有试图取代现有安全工具,而是补了一个关键缺口:理解"未知未知"的推理能力。

已知漏洞的检测已经是红海,各家签名校验做得大同小异。但零日漏洞、业务逻辑缺陷、复杂供应链攻击——这些需要理解代码意图、数据流向、系统交互的场景,传统工具力不从心。

Anthropic赌的是:大模型的代码理解能力已经跨过了某个阈值,可以承担需要"思考"的安全任务,而不只是模式匹配。

这个赌注如果成立,企业安全团队的组织形态都会变。资深安全研究员的时间被释放出来,从手工审计转向更高层次的架构设计;初级工程师也能借助AI完成原本需要几年经验才能做的漏洞分析。

当然,风险同样明显。AI的幻觉问题在安全领域被放大——一个假阳性的修复建议,可能比没发现漏洞更危险。Anthropic的置信度评级和可解释性设计,就是在试图对冲这个风险,但能不能扛住真实世界的复杂代码库,还得看公测表现。

另一个悬念是定价。Claude Enterprise本身就是面向大型组织的订阅,Security作为其中模块,成本不会低。中小企业能不能用上这个级别的AI安全能力,还是只能看着巨头吃肉?

实用判断:现在该做什么

如果你在25-40岁的科技从业者范畴里,这事至少有三层 actionable 的信息:

第一,如果你是安全工程师,Claude Security的推理逻辑值得研究。它不依赖已知特征的设计思路,可能给你手头项目的AI集成提供参考——哪怕不用Anthropic的产品,这种"模拟人类研究员"的架构也值得借鉴。

第二,如果你是技术决策者,评估安全工具时多了一个维度:AI的代码理解深度,而不只是"有没有AI功能"。CrowdStrike们接入Opus 4.7是个信号,说明头部厂商已经在押注这个方向,你的供应商选型标准该更新了。

第三,如果你在做AI产品,Anthropic的"研究预览→收集反馈→快速迭代运营功能"路径是个模板。定时扫描、导出格式、dismissal文档——这些不是炫技,是解决企业采购决策者的实际顾虑。

最后,保持对Mythos和Opus两条线的好奇。一个通用模型意外擅长安全,一个专用模型精准打击,Anthropic似乎在探索AI安全能力的不同落地形态。这个实验的结果,会影响整个行业对"专用vs通用"的判断。