Anthropic把Claude Code藏了1年

薛定谔的BUG

2026-04-13 17:40 ·北京

Claude Code上线一年，多数人还在用它写单行代码。有个开发者做了件反直觉的事：关掉所有高级功能，裸机测试。

结果Plan Mode（规划模式）的表现，和网上传的完全不一样。

裸机测试：一个极简CLI的诞生

测试者选了Typer框架，目标很简单——做一个带3个命令的Python CLI工具。没有CLAUDE.md文档，没有MCP（模型上下文协议）扩展，没有自定义钩子。

这种"裸奔"配置，恰恰是理解Claude Code出厂能力的唯一方式。

Typer被选中的理由很产品经理：用终端命令造终端工具，有种递归的爽感。测试者原话：「There’s something inherently satisfying about using a terminal-based command to build more terminal tools」——翻译过来就是，用命令行写命令行，套娃快乐。

Plan Mode的隐藏逻辑

Plan Mode的隐藏逻辑

裸机状态下，Claude Code的Plan Mode暴露了一个设计细节：它会在执行前生成结构化步骤，而非直接蹦代码。

这和AutoGPT时代的"想一步做一步"有本质区别。Plan Mode先把需求拆成可验证的子任务，每个子任务带明确的完成标准。测试者发现，这种预规划让3命令CLI的代码生成零返工。

零返工的前提是：需求边界足够清晰。

当测试者尝试模糊描述时，Plan Mode会主动追问——不是猜，是确认。这种"保守型交互"在AI工具里很少见，多数产品选择先给答案再让用户擦屁股。

为什么裸机测试有意义

为什么裸机测试有意义

开发者社区有个惯性：拿到新工具先堆配置。CLAUDE.md写500行，MCP接7个服务，钩子调得飞起。

测试者的反套路在于：先测下限，再堆上限。裸机表现决定了工具的容错空间——当网络断了、MCP挂了、文档丢了，Claude Code还能不能干活？

答案是能，但有个条件。Plan Mode依赖的上下文窗口（context window）必须够大，才能把完整规划塞进一次对话。测试者没提具体数字，但暗示了"长规划"和"短执行"的拆分策略。

这种策略的代价是：用户得习惯"先等它想，再看它做"。急性子的人可能会直接切回普通模式。

下一步的悬念

下一步的悬念

测试者预告了续篇：同一项目，叠满CLAUDE.md + MCP + 自定义技能后的对比。

裸机已经能零返工，加完配置会飞成什么样？或者反过来——当高级功能互相打架时，裸机的稳定性会不会反而更香？

你平时用AI写代码，是先堆配置还是先裸机试错？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴