同一笔钱，36倍差距：OpenCode Go的模型路由省钱法则|opencode|token|人工智能模型|工作流|省钱|调用|路由

大多数OpenCode Go教程从模型讲起。我想从多数教程搞错的地方开始：限额按美元计算，不是按请求次数。

听起来像个小差别。其实不是。

OpenCode Go首月5美元，之后每月10美元。使用上限为每5小时窗口12美元，每周30美元，每月60美元。花12美元在5小时窗口内调用DeepSeek V4 Flash，大约能发31650次请求。同样的12美元花在GLM-5.1上，只能发880次。预算相同，体量差36倍。

这就是路由真正重要的原因。如果挑一个模型通吃所有任务，要么把高端请求浪费在不需要的地方，要么低估便宜模型的能力。正确的做法是根据任务实际需求分配模型。

MiniMax M2.5每月硬上限10万次请求，与成本无关。它只激活约100亿参数，输入token价格比Claude Opus 4.6便宜16.7倍。高量低复杂度的活，它是 obvious choice，多数人却不知道它的存在。

假设所有请求都走DeepSeek V4 Pro：每5小时窗口10200次。轻度使用听起来够用。但Oh My OpenAgent并行运行多个agent——Prometheus拆解任务，Metis合成上下文，Atlas管理序列，Sisyphus执行操作，Librarian读取文档。单个复杂任务能自动扇出30-50次请求。几小时活跃工作就把5小时预算烧光。

问题不在质量差距。V4 Pro的80.6%与Claude Opus 4.7的87.6%只差7个百分点，大多数常规工单里这个差距根本看不见。问题在于多agent工作流的每一步并不需要这种质量。

以下是各模型在编码基准测试中的得分，以及决定路由计算的API定价（按每次请求平均2500 token计算5小时窗口内的请求数）：

Claude Opus 4.7以87.6%稳居当前编码任务最强模型，比V4 Pro高7分。但每百万token 5美元的价格，比DeepSeek V4 Flash贵35倍。12美元/5小时窗口内，Opus 4.7只能发约480次请求，Flash能发17000次。

DeepSeek V4 Flash基准性能与V4 Pro只差1分，但每token成本低约3倍。大多数常规编码任务里，这个差距实践中不会出现。V4 Flash总参数2840亿，激活130亿；V4 Pro总参数1.6万亿，激活490亿。

Kimi K2.6是万亿参数MoE模型，激活参数320亿，SWE-Bench Verified得分80.2%。注：Kimi K2.6原版系列已于2026年5月25日停止更新，模型本身仍可用。DeepSeek V4 Pro促销价0.435美元/百万token将于5月31日结束，之后涨价将改变每窗口请求数的计算。