2.5折活动原本5月6日截止,现在悄悄延到5月底。DeepSeek的API文档更新得有多"安静"?IT之家发现时,新价格已经生效两天了。
一、价格表变了什么
缓存命中价格砍到首发价的1/10,这是4月26日晚8点15分生效的。什么概念?deepseek-v4-pro现在缓存命中输入0.025元/百万tokens,未命中3元,输出6元。
两个旧模型名——deepseek-chat和deepseek-reasoner——即将弃用。官方给的兼容方案是:分别对应deepseek-v4-flash的非思考与思考模式。老用户迁移成本不算高,但命名体系彻底换血。
2.5折本身不是新闻,延期才是信号。原定两周促销,现在变成两个月长跑。
二、Pro版的尴尬:参数拉满,算力卡脖子
DeepSeek-V4-Pro的纸面参数确实旗舰:1.6万亿总参数,单次激活490亿,MoE架构,百万级上下文窗口。这些数字放在任何技术发布会上都足够炸裂。
但官方自己承认了:「受限于高端算力,目前Pro版本的服务吞吐较为有限」。
翻译一下——模型做好了,卡不够。想买Pro的API?可以,但排队和稳定性自己掂量。这跟 flash 版的流畅体验形成刺眼对比。
更微妙的是定价策略。缓存命中价格砍到1/10,本质是用低价把用户往"重复调用、高频缓存"的场景赶。新用户尝鲜成本低,老用户复购率高,平台算力压力小。一石三鸟。
三、国产算力的救命稻草:昇腾950下半年批量上市
DeepSeek明确给了时间表:预计下半年昇腾950超节点批量上市后,Pro价格还将大幅下调。
这不是空头支票。华为云已经首发适配V4,提供免部署一键调用;昇腾超节点全系列官宣支持。寒武纪、摩尔线程的Day-0适配也在列——虽然各家芯片的性能档位差异明显。
英伟达GB200 NVL72的开箱数据是150 tokens/sec/user,国产方案还没公布对等数字。但DeepSeek把降价预期绑在昇腾 timeline 上,态度很清楚了。
四、延期背后的商业算盘
促销活动延期通常两种解读:卖爆了续杯,或者卖不动续命。Pro版的吞吐限制让第一种可能性存疑。
更合理的推测是:DeepSeek需要更长窗口期完成两件事。一是等国产算力产能爬坡,把Pro的QoS做到能卖正价;二是用低价锁定开发者,在生态层面提前卡位。
缓存命中1/10定价、2.5折延期、flash与pro的命名分层——这三板斧组合起来,是一套典型的"用价格歧视管理供给缺口"的操作。
开发者现在面临的选择很现实:要便宜大碗去flash,要性能天花板去Pro但接受不稳定,还是等下半年昇腾放量后的再降价?
五、开源与商业化的张力
V4系列同时走两条路。模型预览版上线即开源,但Pro的API服务明显在算力约束下做饥饿营销。这种"开源引流、API变现"的架构,每家大模型公司都在试,DeepSeek的特殊之处在于把算力瓶颈摆上了台面。
当官方文档开始用「吞吐有限」这种直白表述,说明行业已经从"模型能力竞赛"进入"工程交付竞赛"阶段。参数多不等于能服务好,这个道理现在写进了定价策略里。
延期到5月31日之后呢?如果昇腾950的批量上市推迟,Pro版会不会继续打折续命?国产算力产能爬坡的速度,会不会成为大模型API定价的新变量?
热门跟贴