打开网易新闻 查看精彩图片

2026年3月,AI Agent圈最火的技术争论不是哪个模型更聪明,而是一个听起来很无聊的问题:Agent该怎么调用外部工具?

三方阵营,三种答案。Anthropic力推的MCP(模型上下文协议)被视为"开放标准",OpenAI、Google、微软、AWS都已跟进。但另一边,CLI派和Skills派正在悄悄蚕食它的地盘——用的还是50年前就有的技术。

MCP的「甜蜜陷阱」:还没开工,5.5万token先没了

MCP的「甜蜜陷阱」:还没开工,5.5万token先没了

MCP的设计逻辑很诱人:把各种服务接口包装成统一的JSON-RPC协议,Agent做一次集成就能跨平台调用多个工具。听起来像是终结碎片化的一剂良方。

但问题藏在启动那一刻。

GitHub Copilot的MCP Server暴露了43个工具,连接时会把约5.5万个token的工具定义一次性塞进上下文。你还没让Agent干任何活,token预算已经烧掉一大块。接上10个MCP Server、100个工具?上下文直接爆炸。

这是MCP架构的先天缺陷:启动即全量加载。每个工具的schema(模式定义)都要预先注入,不管Agent这次用不用得上。

对比之下,CLI派走的是渐进发现路线。Agent先跑gh --help看有哪些命令,需要时再跑gh pr --help查子命令详情。信息按需加载,而非启动时倾泻而出。

Skills派更极端:一个Markdown文件充当"速查卡",平时只占约30个token,触发时才加载完整指令。Flask框架创始人Armin Ronacher已经完全转向这套方案。

训练数据的「主场优势」:Unix文档vs JSON schema

训练数据的「主场优势」:Unix文档vs JSON schema

打开网易新闻 查看精彩图片

CLI派还有个被低估的筹码:大模型的训练数据里,有几十年的Unix文档、Stack Overflow回答、GitHub上的shell脚本。模型天生就懂git、curl、grep、docker。

MCP呢?大量JSON schema对模型来说更难处理,还要额外开销去生成格式化的JSON token。你自己写的MCP工具不会出现在训练数据里——模型对它毫无先验知识,调用方式得从零学起。

工具输出的后处理环节,差距更明显。MCP工具需要过滤、搜索、切片?你得写额外代码。CLI工具?直接管道:

gh pr list --json number,title | jq '.[] | select(.title | contains("fix"))'

Agent输出几个用管道符连接的命令,后处理就完成了。更简单、更灵活、维护成本更低。

教Agent用CLI的Skills文件长这样,干净可读:

## Check PR Statusgh pr list --state open --json number,title

换成MCP的JSON schema?篇幅和复杂度都翻几倍。

「协议战争」的本质:谁在为不必要的抽象买单

「协议战争」的本质:谁在为不必要的抽象买单

这场争论的讽刺之处在于,三方阵营其实在解决同一个问题——只是对"复杂度该放在哪"有不同答案。

打开网易新闻 查看精彩图片

MCP把复杂度压在协议层,追求"一次集成,处处可用"。代价是启动开销和上下文膨胀。

CLI把复杂度摊给Agent的推理能力,相信模型能现场学会工具用法。代价是每次调用都要多轮交互。

Skills把复杂度收进Markdown文件,用人能读、模型也能读的格式做轻量索引。代价是生态碎片化——没有统一标准,各写各的。

Ronacher的观点代表了Skills派的底气:「Skills本质上只是个简短摘要,告诉Agent有哪些能力、去哪找详细说明。关键是——Skills不会把工具定义注入上下文。工具还是那些工具:bash和Agent已有的东西。」

换句话说,MCP的"统一协议"优势,在上下文成本面前正在贬值。当OpenAI、Google们忙着兼容MCP时,开发者已经在用30行的Markdown文件和50岁的shell命令绕过它。

2024年底的「标准」为何这么快遇冷

2024年底的「标准」为何这么快遇冷

MCP是Anthropic 2024年底推出的,距今不到一年半。按技术标准的生命周期,它还在蜜月期。

但AI Agent的场景特殊性加速了检验:上下文窗口是硬约束,token成本是硬账单。任何架构选择都要在这两条红线上跑分。

MCP的困境类似于早期云计算的"大而全"PaaS——愿景美好,直到开发者发现为不需要的功能付费太疼。CLI和Skills的 resurgence(复兴),本质上是对"按需付费"原则的回归。

一个值得玩味的细节:GitHub Copilot团队自己开源的MCP Server,成了暴露MCP上下文膨胀问题的典型案例。5.5万token的启动开销,来自官方示例。

这不是MCP设计者的失误,是架构目标与Agent场景的根本张力。协议追求的是互操作性和生态统一,Agent追求的是单次任务的token效率。当两者冲突时,开发者用脚投票的速度比标准组织快得多。

如果2026年底,MCP的采用率被Skills文件反超,该反思的是"开放标准"本身的定义——是由大厂联盟盖章才算,还是开发者真正愿意付token成本才算?