大多数OpenCode Go教程从模型讲起。我想从多数教程搞错的地方开始:限额按美元计算,不是按请求次数。
听起来像个小差别。其实不是。
OpenCode Go首月5美元,之后每月10美元。使用上限为每5小时窗口12美元,每周30美元,每月60美元。花12美元在5小时窗口内调用DeepSeek V4 Flash,大约能发31650次请求。同样的12美元花在GLM-5.1上,只能发880次。预算相同,体量差36倍。
这就是路由真正重要的原因。如果挑一个模型通吃所有任务,要么把高端请求浪费在不需要的地方,要么低估便宜模型的能力。正确的做法是根据任务实际需求分配模型。
MiniMax M2.5每月硬上限10万次请求,与成本无关。它只激活约100亿参数,输入token价格比Claude Opus 4.6便宜16.7倍。高量低复杂度的活,它是 obvious choice,多数人却不知道它的存在。
假设所有请求都走DeepSeek V4 Pro:每5小时窗口10200次。轻度使用听起来够用。但Oh My OpenAgent并行运行多个agent——Prometheus拆解任务,Metis合成上下文,Atlas管理序列,Sisyphus执行操作,Librarian读取文档。单个复杂任务能自动扇出30-50次请求。几小时活跃工作就把5小时预算烧光。
问题不在质量差距。V4 Pro的80.6%与Claude Opus 4.7的87.6%只差7个百分点,大多数常规工单里这个差距根本看不见。问题在于多agent工作流的每一步并不需要这种质量。
以下是各模型在编码基准测试中的得分,以及决定路由计算的API定价(按每次请求平均2500 token计算5小时窗口内的请求数):
Claude Opus 4.7以87.6%稳居当前编码任务最强模型,比V4 Pro高7分。但每百万token 5美元的价格,比DeepSeek V4 Flash贵35倍。12美元/5小时窗口内,Opus 4.7只能发约480次请求,Flash能发17000次。
DeepSeek V4 Flash基准性能与V4 Pro只差1分,但每token成本低约3倍。大多数常规编码任务里,这个差距实践中不会出现。V4 Flash总参数2840亿,激活130亿;V4 Pro总参数1.6万亿,激活490亿。
Kimi K2.6是万亿参数MoE模型,激活参数320亿,SWE-Bench Verified得分80.2%。注:Kimi K2.6原版系列已于2026年5月25日停止更新,模型本身仍可用。DeepSeek V4 Pro促销价0.435美元/百万token将于5月31日结束,之后涨价将改变每窗口请求数的计算。
热门跟贴