curl轻松扛住了最强安全模型Mythos“拷打”——17.6万行C代码仅发现1个低危漏洞|curl|分析器|安全模型|源代码

Anthropic最新推出的AI安全分析模型Mythos近期引发广泛关注，该公司称其在发现源代码安全漏洞方面表现异常出色而具有高危险性，甚至因此暂缓公开发布。然而，当Mythos被用于扫描全球最广泛使用的开源命令行HTTP工具curl时，结果却出人意料——在17.6万行代码中，仅确认发现1个低危漏洞。

作为curl项目的创始人和首席开发者，Daniel Stenberg长期对AI工具持谨慎态度。2024年初，他曾发表博客痛陈AI生成的安全报告如何浪费开发者时间：“处理垃圾邮件会耗尽你的精力。”

他列举的案例显示，AI生成的漏洞报告往往看起来像真的一样，却混杂着事实与幻觉，让维护者不得不花费大量时间验证其真实性。2026年初，面对AI生成的安全报告泛滥成灾，Stenberg甚至宣布curl项目停止支付漏洞赏金——目的就是移除“用AI批量生成垃圾报告换钱”的激励机制。他形容这些报告为"AI slop"（AI泔水），并警告说“越好的垃圾越糟糕”，因为维护者需要花费更多时间才能识别出它们是假的。

从“危险级AI”到“营销噱头”？

今年4月，Anthropic宣布其新模型Mythos“危险地擅长”发现源代码安全漏洞，以至于不打算立即公开发布，而是通过"Project Glasswing"项目向部分公司和开源项目有限开放，以便在公众使用前先修复最紧迫的问题。这一表态在业界引发轩然大波，被视为“成功的营销噱头”。

curl项目创始人Daniel Stenberg作为开源项目负责人之一，通过Linux基金会的Alpha Omega项目获得了Mythos的扫描机会。curl是目前全球使用最广泛的网络传输工具之一，安装量超过200亿次，运行在110多个操作系统和28种CPU架构上，从智能手机、汽车到服务器无处不在。

17.6万行代码的“严苛测试”

curl代码库堪称C语言安全工程的标杆：

代码规模：17.6万行生产代码（不含空行），相当于66万个单词，比英文版《战争与和平》还多12%
代码质量：平均每行代码被重写4.14次，历经精雕细琢
贡献者：573位独立作者参与当前代码，累计1,465人贡献过代码
安全记录：已发布188个CVE漏洞公告
测试覆盖：长期接受OSS-Fuzz模糊测试、Coverity静态分析、CodeQL扫描及多次付费审计

Mythos扫描了curl源码库master分支的src/和lib/目录，共计17.8万行代码，覆盖了所有主要协议（HTTP/1/2/3、FTP）、TLS后端验证路径、认证机制、内容编码、连接复用等关键模块。

结果：5个“确认漏洞”缩水为1个低危问题

Mythos报告最初声称发现了“5个已确认的安全漏洞”。然而，curl安全团队经过数小时的深入审查后，这一数字被大幅削减：

3个误报：AI指出的问题实际上是API文档中已明确说明的行为
1个普通bug：被团队认定为“只是一个bug”，不构成安全漏洞
1个确认漏洞：最终确认为低危（severity low）CVE，计划随curl 8.21.0版本（6月底发布）同步公开

Stenberg在博客中略带调侃地写道：AI自己说“已确认”，但curl安全团队有不同的看法。

AI安全工具的真实表现

值得注意的是，curl项目此前已使用多款AI安全工具进行扫描，包括AISLE、Zeropath和OpenAI Codex Security。这些工具在过去8-10个月内帮助curl修复了200-300个bug，其中确认的漏洞已发布为十余个CVE。

Stenberg总结道：“从发现问题数量来看，我们之前使用的AI工具带来的修复量更大。这很正常——第一批工具发现的都是更容易找到的bug。随着问题被逐步修复，发现新问题变得越来越难。”

AI代码分析的优势与局限

Mythos在报告中正确地指出：“curl是现存被模糊测试和审计最多的C代码库之一，在热门路径（HTTP/1、TLS、URL解析核心）中发现问题几乎不可能。”结果也证实了这一点——这些关键区域确实没有发现漏洞。

Stenberg认为，AI代码分析工具相比传统静态分析器有显著优势：

■能识别代码与注释不符的情况
■可检查无法实际运行的平台和配置
■“了解”第三方库API细节，检测滥用或错误假设
■“了解”协议规范，质疑可能违反规范的代码实现
■擅长总结和解释漏洞，而传统工具在这方面往往表现笨拙
■常能生成修复补丁（尽管通常不是100%正确的方案）

但他同时强调：“AI工具发现的仍然是已知类型的错误，只是找到新的实例。我们尚未看到AI报告过全新类型的漏洞。”

结论：AI是辅助工具，而非银弹

Stenberg的个人结论直言不讳：“围绕这个模型的大肆炒作主要是营销。我没有看到证据表明这个模型比其他工具能发现更高级或更复杂的问题。也许它稍微好一点，但即使如此，程度也不足以在代码分析领域产生显著影响。”

不过他也重申：“AI驱动的代码分析器在发现源代码安全缺陷方面，确实显著优于过去的传统分析器。任何尚未使用AI工具扫描代码的项目，都很可能发现大量漏洞。”curl项目的经验表明，良好的安全工程实践——包括capped dynbufs、显式数值解析上限、溢出保护、格式字符串强制检查、协议响应大小限制等防御性基础设施——能够系统性地消除传统上容易出问题的bug类别。

可以看到，这位曾激烈批评AI生成垃圾报告的“严父”，对Mythos的态度却相对务实。他没有因为过往经历而全盘否定AI工具，而是基于实际测试结果给出评价。这种态度或许正是开源社区面对AI浪潮时应有的理性姿态。

参考来源