Anthropic押注的MCP协议，被2个30行的文件「截胡」了

闪存猎手

2026-03-27 13:09 ·北京

2026年3月，AI Agent圈最火的技术争论不是哪个模型更聪明，而是一个听起来很无聊的问题：Agent该怎么调用外部工具？

三方阵营，三种答案。Anthropic力推的MCP（模型上下文协议）被视为"开放标准"，OpenAI、Google、微软、AWS都已跟进。但另一边，CLI派和Skills派正在悄悄蚕食它的地盘——用的还是50年前就有的技术。

MCP的「甜蜜陷阱」：还没开工，5.5万token先没了

MCP的「甜蜜陷阱」：还没开工，5.5万token先没了

MCP的设计逻辑很诱人：把各种服务接口包装成统一的JSON-RPC协议，Agent做一次集成就能跨平台调用多个工具。听起来像是终结碎片化的一剂良方。

但问题藏在启动那一刻。

GitHub Copilot的MCP Server暴露了43个工具，连接时会把约5.5万个token的工具定义一次性塞进上下文。你还没让Agent干任何活，token预算已经烧掉一大块。接上10个MCP Server、100个工具？上下文直接爆炸。

这是MCP架构的先天缺陷：启动即全量加载。每个工具的schema（模式定义）都要预先注入，不管Agent这次用不用得上。

对比之下，CLI派走的是渐进发现路线。Agent先跑gh --help看有哪些命令，需要时再跑gh pr --help查子命令详情。信息按需加载，而非启动时倾泻而出。

Skills派更极端：一个Markdown文件充当"速查卡"，平时只占约30个token，触发时才加载完整指令。Flask框架创始人Armin Ronacher已经完全转向这套方案。

训练数据的「主场优势」：Unix文档vs JSON schema

训练数据的「主场优势」：Unix文档vs JSON schema

CLI派还有个被低估的筹码：大模型的训练数据里，有几十年的Unix文档、Stack Overflow回答、GitHub上的shell脚本。模型天生就懂git、curl、grep、docker。

MCP呢？大量JSON schema对模型来说更难处理，还要额外开销去生成格式化的JSON token。你自己写的MCP工具不会出现在训练数据里——模型对它毫无先验知识，调用方式得从零学起。

工具输出的后处理环节，差距更明显。MCP工具需要过滤、搜索、切片？你得写额外代码。CLI工具？直接管道：

gh pr list --json number,title | jq '.[] | select(.title | contains("fix"))'

Agent输出几个用管道符连接的命令，后处理就完成了。更简单、更灵活、维护成本更低。

教Agent用CLI的Skills文件长这样，干净可读：

## Check PR Statusgh pr list --state open --json number,title

换成MCP的JSON schema？篇幅和复杂度都翻几倍。

「协议战争」的本质：谁在为不必要的抽象买单

「协议战争」的本质：谁在为不必要的抽象买单

这场争论的讽刺之处在于，三方阵营其实在解决同一个问题——只是对"复杂度该放在哪"有不同答案。

MCP把复杂度压在协议层，追求"一次集成，处处可用"。代价是启动开销和上下文膨胀。

CLI把复杂度摊给Agent的推理能力，相信模型能现场学会工具用法。代价是每次调用都要多轮交互。

Skills把复杂度收进Markdown文件，用人能读、模型也能读的格式做轻量索引。代价是生态碎片化——没有统一标准，各写各的。

Ronacher的观点代表了Skills派的底气：「Skills本质上只是个简短摘要，告诉Agent有哪些能力、去哪找详细说明。关键是——Skills不会把工具定义注入上下文。工具还是那些工具：bash和Agent已有的东西。」

换句话说，MCP的"统一协议"优势，在上下文成本面前正在贬值。当OpenAI、Google们忙着兼容MCP时，开发者已经在用30行的Markdown文件和50岁的shell命令绕过它。

2024年底的「标准」为何这么快遇冷

2024年底的「标准」为何这么快遇冷

MCP是Anthropic 2024年底推出的，距今不到一年半。按技术标准的生命周期，它还在蜜月期。

但AI Agent的场景特殊性加速了检验：上下文窗口是硬约束，token成本是硬账单。任何架构选择都要在这两条红线上跑分。

MCP的困境类似于早期云计算的"大而全"PaaS——愿景美好，直到开发者发现为不需要的功能付费太疼。CLI和Skills的 resurgence（复兴），本质上是对"按需付费"原则的回归。

一个值得玩味的细节：GitHub Copilot团队自己开源的MCP Server，成了暴露MCP上下文膨胀问题的典型案例。5.5万token的启动开销，来自官方示例。

这不是MCP设计者的失误，是架构目标与Agent场景的根本张力。协议追求的是互操作性和生态统一，Agent追求的是单次任务的token效率。当两者冲突时，开发者用脚投票的速度比标准组织快得多。

如果2026年底，MCP的采用率被Skills文件反超，该反思的是"开放标准"本身的定义——是由大厂联盟盖章才算，还是开发者真正愿意付token成本才算？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴