DeepSeek-V4-Pro 打折延期，算力困局藏不住了？

码上闲叙

2026-04-28 13:13 ·北京

2.5折活动原本5月6日截止，现在悄悄延到5月底。DeepSeek的API文档更新得有多"安静"？IT之家发现时，新价格已经生效两天了。

一、价格表变了什么

缓存命中价格砍到首发价的1/10，这是4月26日晚8点15分生效的。什么概念？deepseek-v4-pro现在缓存命中输入0.025元/百万tokens，未命中3元，输出6元。

两个旧模型名——deepseek-chat和deepseek-reasoner——即将弃用。官方给的兼容方案是：分别对应deepseek-v4-flash的非思考与思考模式。老用户迁移成本不算高，但命名体系彻底换血。

2.5折本身不是新闻，延期才是信号。原定两周促销，现在变成两个月长跑。

二、Pro版的尴尬：参数拉满，算力卡脖子

DeepSeek-V4-Pro的纸面参数确实旗舰：1.6万亿总参数，单次激活490亿，MoE架构，百万级上下文窗口。这些数字放在任何技术发布会上都足够炸裂。

但官方自己承认了：「受限于高端算力，目前Pro版本的服务吞吐较为有限」。

翻译一下——模型做好了，卡不够。想买Pro的API？可以，但排队和稳定性自己掂量。这跟 flash 版的流畅体验形成刺眼对比。

更微妙的是定价策略。缓存命中价格砍到1/10，本质是用低价把用户往"重复调用、高频缓存"的场景赶。新用户尝鲜成本低，老用户复购率高，平台算力压力小。一石三鸟。

三、国产算力的救命稻草：昇腾950下半年批量上市

DeepSeek明确给了时间表：预计下半年昇腾950超节点批量上市后，Pro价格还将大幅下调。

这不是空头支票。华为云已经首发适配V4，提供免部署一键调用；昇腾超节点全系列官宣支持。寒武纪、摩尔线程的Day-0适配也在列——虽然各家芯片的性能档位差异明显。

英伟达GB200 NVL72的开箱数据是150 tokens/sec/user，国产方案还没公布对等数字。但DeepSeek把降价预期绑在昇腾 timeline 上，态度很清楚了。

四、延期背后的商业算盘

促销活动延期通常两种解读：卖爆了续杯，或者卖不动续命。Pro版的吞吐限制让第一种可能性存疑。

更合理的推测是：DeepSeek需要更长窗口期完成两件事。一是等国产算力产能爬坡，把Pro的QoS做到能卖正价；二是用低价锁定开发者，在生态层面提前卡位。

缓存命中1/10定价、2.5折延期、flash与pro的命名分层——这三板斧组合起来，是一套典型的"用价格歧视管理供给缺口"的操作。

开发者现在面临的选择很现实：要便宜大碗去flash，要性能天花板去Pro但接受不稳定，还是等下半年昇腾放量后的再降价？

五、开源与商业化的张力

V4系列同时走两条路。模型预览版上线即开源，但Pro的API服务明显在算力约束下做饥饿营销。这种"开源引流、API变现"的架构，每家大模型公司都在试，DeepSeek的特殊之处在于把算力瓶颈摆上了台面。

当官方文档开始用「吞吐有限」这种直白表述，说明行业已经从"模型能力竞赛"进入"工程交付竞赛"阶段。参数多不等于能服务好，这个道理现在写进了定价策略里。

延期到5月31日之后呢？如果昇腾950的批量上市推迟，Pro版会不会继续打折续命？国产算力产能爬坡的速度，会不会成为大模型API定价的新变量？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴