5月22日晚,DeepSeek宣布最新旗舰模型永久降价75%,6月1日生效。这不是简单的价格战。亚马逊AWS新加坡区域生成式AI技术负责人吉里什·迪利普·帕蒂尔(Girish Dilip Patil)在一篇爆火文章里提出一个反常识判断:DeepSeek正以低价为叙事手段,撬动整个AI产业链的结构性重组。
吉里什的身份值得关注。他每天接触AI全栈——大模型架构、GPU、云服务、企业部署、开发者生态。所以他分析DeepSeek时,视角不是"模型好不好",而是从底层技术一路谈到硬件和产业格局。
文章核心论点:DeepSeek的"便宜"不是抢流量,而是一种"解绑"——让AI不再绑定特定硬件。
关键数据来自KV Cache的对比。在100万token上下文、8bit KV精度和16bit索引精度下,DeepSeek V4的KV Cache仅占5.48GB HBM。GLM5需要60GB,Qwen3-235B-A22B需要89GB。差距不在参数大小,在架构设计。DeepSeek V4的MoE、MLA、DSA、CSA、HCA,本质上是把长上下文从"显存黑洞"变成可压缩、转存、重新加载的系统工程。
一旦KV Cache被压缩到极小规模,模型推理就能更多放在SSD、NAND闪存、LPDDR内存这些廉价存储介质上。这意味着:少买HBM,少买英伟达GPU。
这是一个结构性机会。国产芯片不必正面追平英伟达顶级GPU,而是先找到能真实承接负载的场景。DeepSeek把模型做得更省显存、更适合长上下文、更容易拆到不同硬件运行,等于给国产GPU、存储厂商、服务器厂商和异构计算框架留出接口。
以前AI硬件的压力全压在GPU和HBM上,英伟达、SK海力士、三星、美光收入暴涨。DeepSeek把国产厂商拉进游戏,让他们参与推理、缓存、存储、调度每一个环节。模型不再只为最强硬件服务,硬件也不必只有最强那一类才有价值。
API定价是另一环信号。DeepSeek V4 Pro输入token价格降至每百万0.435美元,缓存命中低至0.0036美元。比Claude Opus 4.7便宜19倍,比GPT-5.5便宜12倍。
但这不是赔本赚吆喝。梁文锋在首次融资后就向投资人表态,要给DeepSeek健康的商业模式。低价API本质是生态策略:让足够多的开发者、企业、硬件厂商围绕这套技术体系做适配和投入。试错成本极低——几十到几百块就能适配,对企业极具吸引力。
当生态形成,DeepSeek就不是基座模型公司,而是AI基础设施公司,负责制定标准、定义产业。技术选择和商业策略背后有一条清晰逻辑链:降低对顶级硬件依赖→让更多硬件厂商参与→分散风险、降低整体成本→支撑更低API价格→吸引更多开发者和应用→产生更大推理负载→需要更多数据中心、存储、电力和散热设施。DeepSeek站在这个循环的起点。
这里出现一个反直觉现象。推理成本下降,按理说应降低硬件和电力需求。实际情况相反:降本触发需求膨胀。API价格从每百万token几美元降到几毛钱人民币,过去嫌贵不敢多用的场景开始大量调用。使用量增长速度远超单次推理成本下降速度,最终总推理负载不是减少,而是大幅增加。
需求膨胀的必然结果是基础设施压力爆炸。更多硬件支撑业务,更多硬件需要更多电。数据中心的供电能力、散热效率、能源成本,会成为AI公司核心竞争力。OpenAI与AMD的战略合作协议中,已明确约定以千兆瓦为单位的能源合作。
这解释了宁德时代投资DeepSeek的逻辑。AI基础设施不等于GPU,而是数据中心、供电系统、散热方案、储能设备和电网调度能力的总和。DeepSeek的10万亿美元,指向的就是这个基于新标准而牵动的完整产业链机会。
热门跟贴