写功能文档、画架构图、拆任务、写代码、测bug、过评审——正常工程团队里,这些是5个不同工种的活。现在大多数AI编程工具却想用一个模型全包,结果往往是架构想不清楚、测试覆盖不全、代码风格混乱。

SPEC TO SHIP走了另一条路。它在单个Node.js进程里编排了5个专门化的AI智能体:架构师、规划师、工程师、QA、评审员。原始需求进去,经过测试、评审的提交级代码出来。

打开网易新闻 查看精彩图片

5个智能体按流水线串行,但工程和QA之间有个紧循环。每个角色有明确的输出格式和交接点,没人被塞超出设计范围的活。

架构师是第一个环节。它接收原始需求,输出涵盖概述、目标、API契约、数据模型、安全的技术规格书,格式为Markdown,下游所有智能体都基于这份文档工作。用的是google/gemini-2.0-flash-001,通过OpenRouter调用

规划师拿到规格书后,把它拆成带依赖关系的可执行任务,输出拓扑排序的JSON任务数组,附带验收标准。工程师按这个顺序写代码,输出带类型、错误处理和JSDoc的TypeScript源文件。

QA为每个任务写Vitest测试套件,覆盖验收标准和边界情况。代码必须经过测试,评审员才能看到。评审员做最终审计,从安全、性能、正确性维度打分,0到100分,给出是否可发布的结论。

这套流水线在基础设施层埋了几处容错:生成代码禁用any类型;遇到429/529错误按1秒、2秒、4秒、8秒、16秒指数退避重试;智能体返回畸形JSON时,自动触发修复指令而非直接崩溃。