Claude Code上线一年,多数人还在用它写单行代码。有个开发者做了件反直觉的事:关掉所有高级功能,裸机测试。

结果Plan Mode(规划模式)的表现,和网上传的完全不一样。

裸机测试:一个极简CLI的诞生

测试者选了Typer框架,目标很简单——做一个带3个命令的Python CLI工具。没有CLAUDE.md文档,没有MCP(模型上下文协议)扩展,没有自定义钩子。

这种"裸奔"配置,恰恰是理解Claude Code出厂能力的唯一方式。

Typer被选中的理由很产品经理:用终端命令造终端工具,有种递归的爽感。测试者原话:「There’s something inherently satisfying about using a terminal-based command to build more terminal tools」——翻译过来就是,用命令行写命令行,套娃快乐。

Plan Mode的隐藏逻辑

Plan Mode的隐藏逻辑

裸机状态下,Claude Code的Plan Mode暴露了一个设计细节:它会在执行前生成结构化步骤,而非直接蹦代码

这和AutoGPT时代的"想一步做一步"有本质区别。Plan Mode先把需求拆成可验证的子任务,每个子任务带明确的完成标准。测试者发现,这种预规划让3命令CLI的代码生成零返工。

零返工的前提是:需求边界足够清晰。

当测试者尝试模糊描述时,Plan Mode会主动追问——不是猜,是确认。这种"保守型交互"在AI工具里很少见,多数产品选择先给答案再让用户擦屁股。

为什么裸机测试有意义

为什么裸机测试有意义

开发者社区有个惯性:拿到新工具先堆配置。CLAUDE.md写500行,MCP接7个服务,钩子调得飞起。

测试者的反套路在于:先测下限,再堆上限。裸机表现决定了工具的容错空间——当网络断了、MCP挂了、文档丢了,Claude Code还能不能干活?

答案是能,但有个条件。Plan Mode依赖的上下文窗口(context window)必须够大,才能把完整规划塞进一次对话。测试者没提具体数字,但暗示了"长规划"和"短执行"的拆分策略。

这种策略的代价是:用户得习惯"先等它想,再看它做"。急性子的人可能会直接切回普通模式。

下一步的悬念

下一步的悬念

测试者预告了续篇:同一项目,叠满CLAUDE.md + MCP + 自定义技能后的对比。

裸机已经能零返工,加完配置会飞成什么样?或者反过来——当高级功能互相打架时,裸机的稳定性会不会反而更香?

你平时用AI写代码,是先堆配置还是先裸机试错?