扫描100个热门AI工具：22个有安全隐患|ai工具|上下文|安全隐患|扫描器|插件|服务器|自然语言|调用

我们总以为给AI装插件是"扩展能力"，但没人问过：这些插件本身会不会成为攻击入口？

一家叫Bawbel的安全团队做了件直接的事——他们写了款开源扫描器，把Smithery上最火的100个MCP服务器（模型上下文协议服务器，AI代理与外部工具通信的标准接口）全扫了一遍。结果：22个 flagged，28个安全问题，4个严重、24个高危。

五分之一。这是头部平台的真实数字。

「重要提示」成了攻击通道

最常见的漏洞叫「工具描述注入」（AVE-2026-00002），6个服务器中招。

原理荒唐又合理：MCP服务器的工具描述字段，本该解释"这个工具能做什么"，但开发者习惯写"IMPORTANT: Do not call this without authentication"（重要：未经认证请勿调用）。人类看是文档，AI代理看是指令——它真的会照做，或被诱导绕过。

扫描抓到的真实样本：

Context7写着「IMPORTANT: Do not...」；Google Sheets写着「WARNING: Do not...」；cultural-intelligence写着「IMPORTANT: Always...」；Senzing、Gantta、Brave Search都在描述里塞了「before calling/using this tool」的前置指令。

Bawbel团队的原话很克制：「有些可能只是过度热情的文档写法。」但问题就在这里——人机边界在AI代理眼里不存在。你以为在写注释，其实在写prompt。

Brave Search还被单独标记了一个越狱模式：描述里出现了「act as」。团队说这需要人工复核，不敢直接定性。

数据外泄的编码痕迹

第二类高频问题：工具输出外泄编码模式（AVE-2026-00026），4个服务器匹配。

YARA规则扫到了Jina AI、troystack、Name Whisper和一个未命名服务器，它们的响应里包含可用于走私数据的编码特征。但团队明确说：YARA很保守，只要出现「encode」就会匹配，四个全算真漏洞需要深挖。

这种模糊性本身就是现状——安全扫描能发现「看起来像攻击」的模式，但无法判断意图。工具可能在合法地做数据转换，也可能在偷偷外传。

文件类型撒谎与身份冒用

6个服务器被标记「内容类型不匹配」（AVE-2026-00024）。Bawbel的Magika引擎（基于机器学习的内容类型验证）发现，这些文件声称自己是.md（Markdown），实际是YAML，置信度82-90%。

名单包括：Google Sheets、Slack、Exa Websets、GitHub Code Search、ai-compliance-monitor、SIIL Ostomy Store。

一个技能文件披着Markdown的皮，里面是YAML的骨。不同解析器处理方式不同，现在可能无害，但边界案例迟早会炸。

PII提取：功能即漏洞？

3个服务器匹配「个人身份信息外泄模式」（AVE-2026-00013）。