开发者用AI写代码3年，发现1个文件夹能让错误率暴跌|log|代码|工作流|插件|电子表格

GitHub上有个叫Yoav Abrahami的人，去年干了一件事：他把和AI结对编程的经验，压缩成了一个文件夹的命名规则。结果这个叫Design-Log的方法，正在悄悄改变一小撮开发者的工作流——不是那些写CRUD的，是做安全工具、搞复杂系统的。

我花了两周跟踪这个方法的实际用例，发现它的核心就一句话：别再把AI当搜索引擎用，把它当同事。而那个文件夹，就是你们俩的共享大脑。

上下文墙：每个用AI写过1000行以上代码的人都撞过的墙

有个做网络安全工具的研究者跟我描述过他的典型一天：早上让Claude Sonnet 3.7写个漏洞扫描器的认证模块，下午加新功能时AI已经忘了早上的加密方案，晚上部署时发现密钥管理逻辑前后矛盾。他算过，平均每个复杂功能要经历12-17轮"复制终端输出→贴到聊天框→等AI道歉→再复制回去"的循环。

这不是模型能力问题。Claude 3.5/3.7、GPT-4、Gemini 1.5 Pro他都重度用过，Warp的agentic终端、WaveTerm的多路复用也订阅了一年多。瓶颈在于对话本身的结构——它是一次性的、线性的、不可追溯的。

Yoav Abrahami给这个现象起了个名字：上下文墙（Context Wall）。当代码库超过某个阈值，AI对项目历史的记忆就像金鱼，每次新对话都是重启。你喂给它50页的需求文档，它点头；三天后你问"为什么这里用RSA而不是EC"，它开始编。

更隐蔽的伤害是决策漂移。研究者举了个例子：他让AI实现"失败三次后锁定账户"的安全策略，第一轮代码是对的；第二轮加日志功能时，AI为了"优化"把锁定逻辑改成了可配置参数，默认关闭。没有恶意，只是忘了为什么当初要硬编码。

Design-Log：一个文件夹如何重构人机协作

Yoav的解法朴素到让人尴尬：在Git仓库里建一个./design-log/目录，用Markdown把每个设计决策写下来。不是文档，是日志——带时间戳、带讨论过程、带被否决的方案。

三条铁律：

1. 写之前先读（Read Before You Write）

任何AI会话开始前，先加载相关的设计日志。不是可选步骤，是强制流程。研究者现在的习惯：新建功能分支时，第一件事是把./design/下的相关.md文件塞进Claude的上下文窗口，比喂代码库高效10倍——代码是"是什么"，设计日志是"为什么"。

2. 实现之前先设计（Design Before Implementation）

不再直接说"给我写个OAuth中间件"。而是先写./design-log/auth-middleware.md，里面包含：威胁模型（哪些攻击向量要防）、决策记录（为什么选JWT而不是session）、验收标准（什么日志级别、超时策略）。AI在这个阶段是评审者，不是执行者。

3. 历史不可篡改（Immutable History）

设计日志一旦提交，只追加不修改。需要变更？新建文件，引用旧决策，说明废止原因。研究者展示了他的一个案例：最初用bcrypt做密码哈希，后来迁移到Argon2，文件夹里有完整的决策链——AI永远不会再问"为什么不用bcrypt"，因为它能读到当时的性能测试数据。

一个真实用例：从12轮循环到3轮定稿

研究者允许我引用他最近的一个项目：基于LLM的日志异常检测工具。按老方法，这种涉及数据流设计、模型选择、隐私合规的三端系统，他预估需要200+轮对话。

用Design-Log后，结构变成：

./design-log/00-threat-model.md — 数据驻留要求、PII处理边界
./design-log/01-pipeline-arch.md — 为什么流式处理优于批处理
./design-log/02-model-selection.md — 本地小模型 vs API大模型的成本矩阵
./design-log/03-implementation-log.md — 实际编码中的妥协和债务

关键转变发生在第三天。他发现初始架构在高峰流量下会丢日志，需要改缓冲策略。在老工作流里，这意味着向AI解释整个系统重来一遍；现在，他追加./design-log/01-pipeline-arch-v2.md，引用v1的瓶颈分析，AI在15秒内理解了变更范围。

最终统计：设计阶段4个文件，实现阶段7个日志条目，总对话轮次31轮——其中28轮是单轮确认（"按设计日志第3节实现，对吗？"），只有3轮需要实质性纠偏。