一个YAML文件省下300行Python|python|yaml|上下文|代码|编程

去年有个数据挺有意思：GitHub上带"agent"标签的新项目，平均每个需要写2.3万行配置代码才能让多智能体跑起来。不是业务逻辑，是胶水——节点定义、状态机、握手协议。一位做了七年ML infra的工程师在Hacker News吐槽："我花了80%时间让两个AI互相认识，剩下20%才是让它们干活。"

这个痛点被一个叫aqm的开源项目盯上了。它做的事情听起来简单到可疑：用单个YAML文件描述整个多智能体流程，然后直接跑。没有SDK，没有环境地狱，甚至不需要API key——如果你本地已经配好了Claude或Gemini的CLI。

YAML不是偷懒，是把"代码"变成"配置"

作者的原话很直接：「我想说出'Agent A交给Agent B，质量检查不过就退回A'，而不碰任何.py文件。」这背后是产品思维的经典取舍。Python框架确实强大，LangChain、CrewAI、AutoGen都能做复杂编排，但它们默认你享受写代码的过程。

aqm的假设是：大多数场景下，流程结构比代码表达更重要。一个30行的YAML文件能描述的开发-审查-部署流水线，在传统框架里需要300行以上的类定义、状态模式和边条件。更关键的是可移植性——把文件甩给同事，对方秒级复现相同流程，不需要对齐Python版本或解释你的抽象设计。

技术实现上，aqm做了几件事来兑现这个承诺。

多LLM原生：让Claude写代码，Gemini做安全审查

这是第一个被验证的需求。不同模型有不同脾气，Claude在代码生成上更听话，Gemini的长上下文适合安全审计，GPT-4在特定场景下性价比更高。传统做法是为每个模型写适配层，aqm直接在YAML里指定runtime字段。

一个典型配置长这样：developer节点绑claude，handoffs指向reviewer；reviewer绑gemini，gate字段里塞一个LLM判断"这能投产吗"，on_approve走deployer，on_reject打回developer。整个循环逻辑可视化程度极高，改流程就是改缩进。

作者提到一个细节：token成本省了55%-85%。不是靠模型降价，是靠上下文策略——只给每个智能体看它必须看的，而不是把整个对话历史塞过去。这5种策略的具体实现没开源，但思路是清晰的：编排层的价值不仅是连线，是懂什么时候不连。