90%大模型失败源于同一个错误：提示词工程该换思路了|agent|工作流|示例|自然语言|调用|预设

一个扎眼的数据正在AI圈流传：90%的大型语言模型项目失败，罪魁祸首不是算力不够，也不是数据太差，而是"过度规约"——提示词写得太细、太死、太想一口吃成胖子。这听起来反直觉，毕竟我们被教导要把需求描述清楚。但问题恰恰出在这里。

这篇文章的作者把这种现象称为"单体提示词"（Monolith Prompt）陷阱。所谓单体，就是把所有指令、约束、示例、输出格式塞进一个巨型提示词里，指望模型一次性消化并执行。这种做法在早期小模型时代或许可行，但在复杂任务场景下，它正在成为性能瓶颈的主要来源。

作者列出了三大设计陷阱。第一是过度预设输出格式，把模型逼成填空机器，扼杀了其推理灵活性；第二是试图用单一提示词覆盖全场景，结果每个子任务都得不到足够关注；第三是忽视错误处理链路，一旦模型输出偏离预期，整个流程直接崩溃。这些错误在业内反复出现，不是因为技术不够，而是因为思路没转过来。

更深层的矛盾在于：提示词工程被简化成了一门"写句子"的手艺，而真正的挑战是系统设计。当AI Agent需要调用工具、管理状态、处理多轮交互时，扁平化的单体提示词就像用一份Excel表格管理整个公司——结构上的错配注定带来摩擦成本。

作者给出的解决方向是"重启"：把Agent拆分为多个专注模块，用工作流替代单点指令，让提示词从"控制脚本"变成"协调接口"。这不是否定提示词的价值，而是承认它的边界。模型能力在进化，我们的设计范式也得跟上。

这篇文章本身是一篇Medium帖子的引流入口，核心论点并不新鲜——模块化、分层设计在软件工程里喊了几十年。但它把这套逻辑对准了当下最热的AI Agent赛道，时机选得精准。对于正在搭建Agent的开发者来说，与其在提示词里堆砌更多约束，不如先问自己：这个任务真的适合用一个提示词解决吗？

90%大模型失败源于同一个错误：提示词工程该换思路了