如果5月31日下午4点,你有一个跑了6小时的AI代理还没结束,后3小时的费用突然变成4倍——你的系统会怎么处理?
这不是假设。DeepSeek V4-Pro的75%促销折扣将在2026年5月31日15:59 UTC(北京时间23:59)准时失效。27天后,同样的API调用,账单数字将从$87跳到$348。
促销结束不是新闻,没人准备才是
DeepSeek的定价时间表公开挂在官网上,没有隐瞒。但过去两周我和多个团队聊下来,发现一种奇怪的集体盲区:大家都知道"在用DeepSeek省钱",但没人写过一行应对涨价的代码。
几个没人回答过的问题:
• 一个跨午夜的长会话,计费是按请求时间还是按发票周期?
• 你的计费仪表盘会不会实时刷新,还是月底才暴露真相?
• 备用供应商的切换逻辑,有没有绑定到具体的UTC时间戳?
这和Stripe突然调价但不发通知的区别只在于:DeepSeek确实公布了,但工程师侧的消费端没有任何警报机制。过去两个月,很多团队把60-80%的代理流量切到V4-Pro,6月份的账单将是第一次真实反馈。
正方:4倍涨价仍然划算
支持继续使用的观点很直接:即使涨价,V4-Pro的绝对价格仍有竞争力。
按官方定价表,所有层级统一4倍。缓存命中(cache-hit)从$0.036/百万token涨到$0.145/百万token,缓存未命中(cache-miss)从$0.14涨到$0.56,输出token从$0.60涨到$2.40。
但这里有个反直觉的点:缓存命中的"便宜感"是陷阱。促销期$0.036/M几乎等于免费,大多数团队第一周后就停掉了这部分的监控。涨价后$0.145/M依然不贵,但缓存命中量通常是缓存未命中的5-10倍,绝对金额差可能超过输出token的涨幅。
近期Hacker News热帖DeepClaw(把Claude Code包装成DeepSeek的代理工具)里,到处可见"$0.06一个任务"的分享。6月1日起,这个数字变成$0.24。个人开发者月预算$30变$120,企业级代理集群$4k变$16k。模型没变,端点没变,响应没变,只有电表转速变了。
反方:隐性成本和架构债务
反对继续押注的声音集中在三个层面。
第一,计费透明度问题。DeepSeek的API响应不会告诉你这次请求按哪个费率计费——你得等发票。对于跨价格切换点的长会话,这是一个黑箱。假设一个代码仓库分析任务从5月31日12:00 UTC跑到18:00 UTC,前3小时59分钟按促销价,后2小时1分钟按新价,单次任务成本可能从$0.40跳到$1.60。你的成本预测模型能处理这种阶梯计费吗?
第二,缓存策略的重新评估。促销期的缓存命中率数据可能失真——因为便宜,团队没有动力优化提示词复用。涨价后,5-10倍的缓存命中量意味着微小的命中率下滑都会放大成显著的账单波动。
第三,供应商锁定风险。两个月前切到DeepSeek的决策基于特定价格点,现在这个前提消失了。但回退到之前的供应商(Claude、GPT-4o等)需要重新跑基准测试、调整提示词工程、可能还要面对不同的延迟和输出格式。这些迁移成本在促销期被"省钱"的兴奋感掩盖了。
我的判断:这不是价格问题,是财务工程问题
真正值得关注的不是4倍这个数字,而是团队对可变成本的结构化无知。
我拉了我们自己过去30天的LLM支出数据,按促销后价格重新计算,三个发现:
第一,缓存命中支出占比从6%跳到22%,输出token的"4倍故事"掩盖了实际的资金流向。
第二,跨时段会话的计费边界是真实存在的风险敞口,但现有可观测性工具链完全没有覆盖。
第三,最危险的假设是"到时候再看"——6月1日是周日,很多团队的财务流程是月初批量审批,等他们看到账单,已经是既成事实。
DeepSeek的定价策略本身没有道德问题:公开、透明、日历确定。但它暴露了一个行业习惯——我们把LLM调用当成"差不多就行"的可变成本,而不是需要精算的长期负债。
建议做的三件事:在5月31日23:55 UTC设置一个 cron 任务,强制终止所有长会话;把缓存命中率的监控重新打开,设定<90%的警报线;用过去30天数据跑一次涨价模拟,把结果贴到下次站会。
涨价本身不会杀死任何项目。但把$16k的账单当成$4k来规划,会。
热门跟贴