Anthropic把红队训练做成了4人剧本杀

算力游侠

2026-04-01 08:28 ·北京

去年全球企业为安全培训烧了270亿美元，但大多数员工在钓鱼测试里依然会点那个"紧急发票.zip"。静态题库和工具链脚本，本质上是用19世纪的方法教21世纪的攻防。

RedSwarm这个项目有点意思。它没走"更聪明的扫描器"路线，而是搭了一个多智能体剧场——四个有记忆、有性格、会吵架的AI角色，在沙盒里演一出完整的入侵剧本。

四个角色，一场戏

四个角色，一场戏

项目把攻击者拆成四类人格：侦察兵（recon）、突破手（exploit）、内鬼（insider）、清道夫（post-exploit）。每个角色自带MITRE ATT&CK战术库，还能记住上一轮踩过的坑。

这和单一大模型"扮演黑客"的区别，就像话剧和独角戏。侦察兵发现漏洞后，可以选择自己继续深挖，也可以把情报丢给突破手——后者可能嫌前者太保守，直接上更激进的payload。这种内部博弈比线性脚本更接近真实APT的运作方式。

系统会输出带MITRE映射的攻击叙事和可视化攻击图，防守方能用同一套语言复盘。

技术栈选得务实：FastAPI后端，Vue 3+Tailwind前端，Claude默认驱动（OpenAI备选），SQLite存记忆。没有花哨的向量数据库，因为模拟历史本身不需要语义检索——时间线顺序就是叙事逻辑。

上帝模式：给防守方开外挂

上帝模式：给防守方开外挂

RedSwarm的真正价值在"防御排练"场景。你可以往沙盒里扔各种约束条件：某台主机上了EDR、防火墙新增规则、刚打的补丁公告、甚至公司安全策略变更。

然后看四个AI角色怎么调整剧本。它们可能绕路、可能放弃、可能触发你预设的告警——这种"压力测试假设"的能力，是静态CTF题目给不了的。

项目README里埋了个细节：支持"God Mode"注入端点。意思是教练可以随时插手，给某个角色喂假情报，或者临时提高某台机器的防护等级。这相当于把红队演练变成了可交互的兵棋推演。

内置的场景模式和排行榜（速度/隐蔽性双维度）让这东西能直接塞进企业午餐会或高校课程，而不是锁在SOC值班室的屏幕里。

开源的边界感

开源的边界感

AGPL-3.0许可证是个信号。安全工具的开源争议一直很大：透明度和滥用风险之间的张力，RedSwarm用协议条款和架构设计同时回应。

架构上，所有exploit行为都是模拟的——没有真实payload，没有对外扫描能力。协议上，AGPL要求衍生作品必须开源，这在一定程度上提高了黑产改版的成本。

维护者在文档里反复强调：仅限授权环境，仅限实验室范围。这种自我设限和项目本身的攻击性模拟形成了有趣的反差。

社区反馈渠道也开得直接：要bug报告、威胁模型补充、文档误导案例，还有"哪些模拟有用、哪些像在演戏"的诚实吐槽。这种对"戏剧化"的警惕，说明团队清楚仿真和真实的差距。

如果你在自己的实验环境里跑过一轮，会发现一个设计巧思——攻击图的节点颜色会随MITRE战术阶段渐变，从侦察的冷蓝到数据外泄的猩红。这种视觉锚点让非技术背景的决策者也能跟上节奏。

最后留个切口：当AI能批量生成"有性格的 attackers"，安全培训的本质会变成什么？是让人类学会识别机器编造的叙事漏洞，还是训练另一套AI来评判第一套AI的表演逼真度？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴