来源:市场资讯

(来源:AI信息Gap)

刚刚,DeepSeek 官宣了一条「API 降价通知」。

DeepSeek-V4-Pro 模型 API 价格,将于 2026 年 5 月 31 日结束 2.5 折优惠活动后,正式调整为原定价的 1/4。

2.5 折变正价。改成永久了!

打开网易新闻 查看精彩图片

好家伙,DeepSeek 还顺便卖了个萌。2.5 折 优惠结束了,正式调整为原价的 1/4。

2000 多条的评论区,最高赞毫无疑问是这一条。

「不是,4 分之一和 2.5 折的区别是?」

区别可能就是,2.5 折意味着是促销价,随时可能恢复原价。1/4 是正式定价,写进了官方文档。

所以,现在你去翻 DeepSeek 官方文档,描述是这样的。

打开网易新闻 查看精彩图片

之前的优惠原定 5 月 5 日截止,后来延长到了 5 月 31 日。不少开发者都在观望,6 月 1 日会恢复原价吗。

这下不用担心了。价格不变,从限时「促销」变成永久「正价」。

DeepSeek-V4-Pro 永久定价,每百万 token。

输入(缓存命中)0.025 元。不到 3 分钱。

输入(缓存未命中)3 元。输出 6 元。

要知道,一个成熟的 AI Agent 工具,缓存命中率能达到 90% 以上。以 Claude Code 为例,来看我下面这张截图。

这是我 Claude Code 30 天以来的 token 使用统计。缓存 Token 命中 18.7 亿,命中率 96.6%。

打开网易新闻 查看精彩图片

换算一下。这 18.7 亿 token 如果按照 DeepSeek-V4-Pro 的缓存命中价格来算,1871 百万 × 0.025 元 = 46.8 元。不到 50 块钱。

所以说,DeepSeek-V4-Pro 这个价格 ≈ 包月制的 Coding Plan,一点毛病都没有。

V4-Flash 更便宜。每百万 token 输入 1 元,输出 2 元。

两个模型都支持 1M 上下文,最大输出 384K token。

对比一下。

GPT-5.5 每百万 token 输出定价 30 美元,折合人民币大约 204 元/百万 token。Claude Opus 4.7 25 美元,大约 170 元。

DeepSeek-V4-Pro 永久 6 元。是 GPT-5.5 的 1/34。

4 月 24 日,DeepSeek 发布 V4 系列模型。V4-Pro 和 V4-Flash 同时上线,MIT 协议开源。

4 月 25 日,V4-Pro 开启 2.5 折限时优惠,原定 5 月 5 日截止。

4 月 26 日,API 输入缓存命中价格降低至首发价的 1/10,永久的。

4 月 28 日,2.5 折优惠延长到 5 月 31 日。

5 月 22 日,2.5 折变正价。永久生效。

不到一个月,降了四次。还得是 DeepSeek。

DeepSeek 创始人梁文锋曾说过这么一句话。

「我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。」

从模型 API 定价来看,他确实做到了。

V4 的混合稀疏注意力架构让 V4-Pro 单 token 算力消耗只有上一代的 27%,KV 缓存降到了 10%。推理成本真的降下来了,不是靠烧钱补贴。

刚发布 V4 时,DeepSeek 说过,「下半年昇腾 950 超节点批量上市后,V4-Pro 的价格还有进一步下调空间。」

难道后面还有惊喜?

我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。