大多数AI编程助手都是"一人包办":解析提示词、理解代码库、生成回复、格式化输出——全交给同一个通用模型。DeepClaude换了个思路:把工作拆给两个专家,再塞进同一个Agent循环里。

分工很明确:DeepSeek R1负责推理,输出显式的思维链;Claude读这条思维链,然后合成最终代码或解释。R1想,Claude写,各干各的。

打开网易新闻 查看精彩图片

双模型循环怎么跑?当你往DeepClaude风格的Agent发提示词,它不会只调一个接口。编排层跑三轮:

打开网易新闻 查看精彩图片

第一轮:推理(DeepSeek R1)

R1是DeepSeek的推理特调模型,会在给出答案前先吐一个结构化的块,暴露它的思考过程。Agent截住这条思维链,把R1的最终答案扔掉——只留推理过程。

第二轮:合成(Claude)

R1的思维链变成Claude的上下文。Claude被提示词引导,基于这条"规划文档"产出实际响应:代码、修改、解释。

第三轮:循环(如有需要)

对于Agent任务(跑测试、读文件、重试),循环会在工具调用和双模型流程之间弹跳,直到目标达成。

重点不是R1比Claude聪明,或者反过来。R1的训练方向是穷尽式逐步推理,Claude的指令跟随和代码生成则针对输出质量优化。叠在一起,两者兼得——代价是多一次API调用,推理环节的延迟大概翻倍。

打开网易新闻 查看精彩图片

DeepSeek-R1是开源权重,托管API的token单价比Claude便宜。DeepClaude配置里,推理成本大头其实落在Claude的合成调用上,而非R1的推理链——尽管R1通常输出更多token。

什么时候能打赢单模型助手?Cursor、GitHub Copilot、Claude Code都是单模型单轮。它们快、和编辑器集成好,自动补全或小修改够用。但单模型在需要两种认知模式的任务上会崩:

· 多文件重构,得先理清调用关系再动代码

· 调试陌生代码,推理步骤是"这玩意到底在干嘛"才能修

· 架构决策,模型得显式权衡利弊,而非模式匹配一个常规答案

这些任务上,单模型经常跳过推理直接跳到看起来合理的修改。DeepClaude强制分离:推理模型必须产出思维链,合成模型必须照它执行。你能先看到计划,再看到diff。

代价也是真的。自动补全式工作想要300毫秒内出建议,DeepClaude是错的选择——你得等两次顺序API调用。