DeepSeek降价75%背后：一场10万亿产业链重构|deepseek|gpu|上下文|产业链

5月22日晚，DeepSeek宣布最新旗舰模型永久降价75%，6月1日生效。这不是简单的价格战。亚马逊AWS新加坡区域生成式AI技术负责人吉里什·迪利普·帕蒂尔（Girish Dilip Patil）在一篇爆火文章里提出一个反常识判断：DeepSeek正以低价为叙事手段，撬动整个AI产业链的结构性重组。

吉里什的身份值得关注。他每天接触AI全栈——大模型架构、GPU、云服务、企业部署、开发者生态。所以他分析DeepSeek时，视角不是"模型好不好"，而是从底层技术一路谈到硬件和产业格局。

文章核心论点：DeepSeek的"便宜"不是抢流量，而是一种"解绑"——让AI不再绑定特定硬件。

关键数据来自KV Cache的对比。在100万token上下文、8bit KV精度和16bit索引精度下，DeepSeek V4的KV Cache仅占5.48GB HBM。GLM5需要60GB，Qwen3-235B-A22B需要89GB。差距不在参数大小，在架构设计。DeepSeek V4的MoE、MLA、DSA、CSA、HCA，本质上是把长上下文从"显存黑洞"变成可压缩、转存、重新加载的系统工程。

一旦KV Cache被压缩到极小规模，模型推理就能更多放在SSD、NAND闪存、LPDDR内存这些廉价存储介质上。这意味着：少买HBM，少买英伟达GPU。

这是一个结构性机会。国产芯片不必正面追平英伟达顶级GPU，而是先找到能真实承接负载的场景。DeepSeek把模型做得更省显存、更适合长上下文、更容易拆到不同硬件运行，等于给国产GPU、存储厂商、服务器厂商和异构计算框架留出接口。

以前AI硬件的压力全压在GPU和HBM上，英伟达、SK海力士、三星、美光收入暴涨。DeepSeek把国产厂商拉进游戏，让他们参与推理、缓存、存储、调度每一个环节。模型不再只为最强硬件服务，硬件也不必只有最强那一类才有价值。

API定价是另一环信号。DeepSeek V4 Pro输入token价格降至每百万0.435美元，缓存命中低至0.0036美元。比Claude Opus 4.7便宜19倍，比GPT-5.5便宜12倍。

但这不是赔本赚吆喝。梁文锋在首次融资后就向投资人表态，要给DeepSeek健康的商业模式。低价API本质是生态策略：让足够多的开发者、企业、硬件厂商围绕这套技术体系做适配和投入。试错成本极低——几十到几百块就能适配，对企业极具吸引力。

当生态形成，DeepSeek就不是基座模型公司，而是AI基础设施公司，负责制定标准、定义产业。技术选择和商业策略背后有一条清晰逻辑链：降低对顶级硬件依赖→让更多硬件厂商参与→分散风险、降低整体成本→支撑更低API价格→吸引更多开发者和应用→产生更大推理负载→需要更多数据中心、存储、电力和散热设施。DeepSeek站在这个循环的起点。

这里出现一个反直觉现象。推理成本下降，按理说应降低硬件和电力需求。实际情况相反：降本触发需求膨胀。API价格从每百万token几美元降到几毛钱人民币，过去嫌贵不敢多用的场景开始大量调用。使用量增长速度远超单次推理成本下降速度，最终总推理负载不是减少，而是大幅增加。

需求膨胀的必然结果是基础设施压力爆炸。更多硬件支撑业务，更多硬件需要更多电。数据中心的供电能力、散热效率、能源成本，会成为AI公司核心竞争力。OpenAI与AMD的战略合作协议中，已明确约定以千兆瓦为单位的能源合作。

这解释了宁德时代投资DeepSeek的逻辑。AI基础设施不等于GPU，而是数据中心、供电系统、散热方案、储能设备和电网调度能力的总和。DeepSeek的10万亿美元，指向的就是这个基于新标准而牵动的完整产业链机会。