我用Claude Opus 4.6做了同一个功能,两次。

第一遍:116次提交,7次回滚,15天后整段代码硬重置。第二遍:第5天进测试环境,第9天合并上线。模型没变,人没变,代码库没变,变的只有"规格说明"存在哪里。

打开网易新闻 查看精彩图片

作者把这个问题叫"规格漂移"(specification drift)——AI重写的代码与预期行为之间的缝隙。第一遍用的"氛围编程"(vibe coding),早期快得惊人:bug显眼,修复简单,每次提交都有成就感。但系统耦合度上去之后,陷入死循环:修编排器→ webhook崩了,修webhook→ 凭证失效,修凭证→ 编排器又坏。15天下来,修复记录散落在生成的代码和聊天记录里,AI下一轮重写时,旧修复被削弱、矛盾或直接覆盖。代码一直在动,规格说明一直在消失。

第二遍改用"提示驱动开发"(Prompt-Driven Development)。同样的开发者、功能、模型、仓库、云测试环境,唯一区别是"真相"的位置:不再是代码,而是提示词和行为测试。代码变成可替换的,规格说明成为需要构建、测试、版本控制、可再生的核心产物。

作者的经验是:简单脚本、原型、独立功能,氛围编程依然快;但一旦系统耦合到"每修一处必引发另一处回退", durable artifact(持久化产物)就至关重要。AI编程的未来,可能不是"聊天框里写更好的提示词",而是把规格说明本身当作需要工程化管理的对象。