省了多少钱?数百万美元切换背后的工程代价中国模型正在改写规则这件事为什么会发生

昨天,美国 AI Agent 初创公司 Lindy 创始人 Flo Crivello 在 X 上投下一枚炸弹:公司已将 100% 的流量切换到 DeepSeek V4,全面停用 Anthropic 的 Claude 模型。

一家美国公司,主动放弃美国本土的顶级模型,转向中国开源模型——这听起来像是一个标志性事件。

打开网易新闻 查看精彩图片

Crivello 的原话很直白:这次切换每年能为公司节省数百万美元

对于一家 AI Agent 初创公司来说,模型调用成本是最大的单项支出之一。Agent 场景的典型特征是高频调用——每一次用户交互背后,可能对应着十几次甚至几十次模型推理。在 Claude 上跑,单次调用成本乘以调用量,很快就变成一个让人睡不着觉的数字。

切换到 DeepSeek V4 之后,成本大幅下降的同时,Crivello 表示在多个核心使用场景中还看到了性能提升。

省钱又提效,这种组合拳在商业决策中几乎不需要犹豫。

Crivello 提到一个容易被忽视的细节:团队为了完成这次切换,建设了大量基础设施和内部工具,实际工作量比最初预想高出100 倍

这说明什么?模型切换从来不是改一行 API 调用地址那么简单。

不同模型的输入输出格式、上下文窗口特性、推理延迟分布、并发处理能力、错误模式——每一个维度都需要重新适配和测试。对于 Agent 产品来说,模型的行为一致性尤其关键,因为 Agent 的决策链路通常涉及多轮推理和工具调用,任何一个环节的偏差都可能导致连锁反应。

100 倍的工作量差距,意味着 Lindy 团队在这件事上投入了巨大的工程资源。也说明他们对这次切换的决心非常坚定——不是试试看,而是 All in。

Crivello 在发文中也表达了对 Anthropic 的认可:他仍然看好 Anthropic 的企业客户关系、开发者品牌、模型迭代和算力扩张。

但现实就是,中国模型正在快速追赶,并且在某些维度上已经具备了实质性的竞争力。DeepSeek V4 的出现,让性价比这个天平发生了倾斜——当性能差距缩小到可接受范围,价格优势就成了决定性因素。

对于开发者来说,这是一个好消息。更多的选择意味着更强的议价能力,也意味着可以根据具体场景选择最合适的模型,而不是被锁定在某一家生态里。

Lindy 的这次切换不是孤例。过去几个月,越来越多的团队开始在多模型之间做对比测试,并在生产环境中采用混合策略。单一模型"通吃所有场景"的阶段正在过去。

Agent 产品对模型的诉求与传统 Chatbot 不同。Agent 需要的是稳定性、可控性和成本效率,而不仅仅是对话流畅度。DeepSeek V4 在性价比上的表现,恰好击中了这个痛点。

这次切换的信号意义可能比金额本身更值得关注:当美国公司开始主动选择中国模型作为主力推理引擎,这个行业的竞争格局正在被重新定义。

你觉得国产模型能持续缩小差距吗?欢迎在评论区聊聊你的看法。