这几天,AI圈炸了。

不是又出了什么新模型,而是DeepSeek发了一条公告——V4-Pro API永久降价至原价的1/4。

打开网易新闻 查看精彩图片

我第一反应是:这玩意儿是不是疯了?

然后我仔细算了笔账。

缓存命中0.025元/百万Tokens。这是什么概念?你让AI写一篇1000字的文章,成本大约0.0001元。一毛钱能写1000篇。

打开网易新闻 查看精彩图片

一、先算笔账:到底便宜到什么程度?

直接看数字。

DeepSeek-V4-Pro原价:输入(缓存命中)1元/百万Tokens,输入(缓存未命中)12元,输出24元。

现在呢?输入(缓存命中)0.1元,输入(缓存未命中)3元,输出6元。

降幅分别是90%、75%、75%。

再跟竞品比。

OpenAI GPT-5.5 Pro:输入约216元/百万Tokens,输出约1296元。

DeepSeek-V4-Pro:输入3元,输出6元。

价差?V4-Pro的输入价格是GPT-5.5的1/72,输出是1/216。

缓存命中价更夸张——V4-Pro叠加优惠后0.025元/百万Tokens,是GPT-5.5 Pro的七百分之一。

七百分之一。

这意味着什么?意味着一个开发者用GPT-5.5 Pro跑一天的费用,用DeepSeek可以跑将近两年。

二、为什么敢这么降?不是赔本赚吆喝

很多人第一反应:这是在烧钱抢市场吧?

还真不是。

DeepSeek这次降价,背后是实打实的技术突破。

V4-Pro的核心架构:1.6万亿总参数,490亿激活参数,MoE稀疏激活,100万Tokens上下文窗口。

什么意思?

相当于你有一支1600人的军队,但每次打仗只调用49人,其余人原地待命。

这就是MoE的核心优势:用极少的计算量,撬动极大的知识储备。推理成本自然大幅下降。

更关键的是,V4-Pro引入了全新的混合注意力架构(Hybrid Attention)。

处理1M token上下文,V4-Pro所需的FLOPs仅为V3.2的27%,KV Cache仅需10%。

这不是营销话术,是工程突破。

所以降价不是资本补贴,是技术把成本打了下来。

三、性能到底行不行?别只看价格

便宜归便宜,好不好用才是关键。

看数据。

数学平均分:90.68。

推理平均:82.69。

语言平均水平:78.13。

数据分析平均:74.54。

这说明什么?说明它在数学计算、逻辑推理、数据分析、文档总结这些高频任务上表现稳定。

当然,也要客观看待短板。

编码平均分是69.99,代理编码平均值是56.67。

这意味着它在复杂编程、Agent编码、多文件工程理解等任务上并不是最顶级。

所以更准确的说法是:

DeepSeek V4-Pro不是最强编程模型,但它是一个通用能力稳定、成本极低、适合高频调用的性价比模型。

这个定位比单纯说"DeepSeek编程很强"更准确,也更经得起对比。

四、谁最疼?价格战的真实影响

DeepSeek每降一次价,全球AI圈就抖一次。

4月25日,V4-Pro限时2.5折,行业震动。

4月26日,全系缓存命中价永久降至1/10,再震一次。

5月22日,2.5折变永久,第三次震动。

谁最疼?

第一,国内中小模型厂商。你刚把成本优化到跟DeepSeek原价持平,它直接砍到1/4。你的定价体系瞬间崩塌,要么跟着降(亏本),要么不降(没客户)。

第二,OpenAI。GPT-5.5 Pro定价输入30美元/百万Tokens,是DeepSeek的72倍。开发者不傻,同样的任务,谁便宜用谁。

第三,所有靠API差价生存的中间商。套壳生意的利润空间被压缩到几乎为零。

五、700亿融资:梁文锋的钱从哪来,到哪去?

同一天,还有两条消息。

彭博社报道:DeepSeek首轮融资规模从500亿跳升到700亿。投前估值450亿美元。创始人梁文锋个人出资200亿。

ACM金牌大神崔添翼3月加盟DeepSeek,带队研发对标Claude Code的编程智能体——DeepSeek Code。

三条新闻,同一天爆发。这不是巧合,这是一套组合拳。

但最值得注意的不是金额,而是梁文锋在投资者会议上的两项承诺:

继续开发开源AI模型。

将AGI列为公司最重要的长期目标,不优先追求短期商业化。

一个创始人拿了700亿融资,说"我不急着赚钱"——这在商业史上极为罕见。

梁文锋的逻辑是什么?

他不需要靠DeepSeek赚钱。他创办的幻方量化,资产管理规模突破千亿。他个人财富足以支撑DeepSeek烧很多年。他搞AI不是为了上市套现,是为了做AGI。

2月份DeepSeek就已经实现盈亏平衡了。API收入加上应用端的用户付费,已经覆盖了运营成本。

所以700亿融资不是为了活下去,是为了加速。

六、给开发者的建议:别只看价格,看场景

说了这么多,到底该不该用?

我的建议是:别只看价格,看场景。

如果你每天要处理大量数学计算、数据分析、文档总结、知识问答、业务归因这些任务,DeepSeek V4-Pro非常值得考虑。

如果你要做复杂编程、架构设计、代码审查、多模态推理,GPT-5.5或Claude Opus 4.7仍有优势。

如果你是中小开发者,预算有限,调用量大,DeepSeek V4-Pro是目前性价比最高的选择。

如果你是企业用户,需要稳定服务、长上下文、低成本,DeepSeek V4-Pro也值得评估。

一句话总结:DeepSeek V4-Pro不是最强模型,但它是最适合规模化调用的高性价比模型。

七、最后说两句

这个世界,终于魔幻到我看不懂的程度了。

一个1.6万亿参数的开源模型,价格砍到原价的1/4,性能还能打,这事儿本身就很抽象。

更抽象的是,创始人拿了700亿融资,说"我不急着赚钱"。

但仔细想想,这好像才是AI该有的样子。

技术把成本打了下来,价格自然跟着降。开源让更多人用得起,生态自然跟着长。AGI不是短期商业化,是长期技术追求。

最近听到太多类似的焦虑。

"同行都在试AI,我要是跟不上,会不会被淘汰?"

"我想让孩子早点接触AI,怕将来跟不上时代。"

这些焦虑,我理解。

但焦虑解决不了问题,行动才能。

所以我决定建个微信群。

专门把AI和各行各业的实际业务场景结合起来。

我自己是AI从业者,对技术、产品都比较了解。大部分AI工具,我自己都能手搓出来。大模型训练,也能自己搞。

但我更想做的,是听到真实的业务场景,然后帮大家找到真正能落地的解决方案。

不是泛泛而谈的"AI很强",而是"你的这个具体问题,用这个工具,这样操作,就能解决"