当所有人盯着英伟达的显卡时,另一个更隐蔽的战场正在决定AI能走多远——DRAM(动态随机存取存储器)的供应正在断裂。

这不是普通的缺货。标准内存的交货周期已拉长到40周以上,合同条款越来越苛刻,现货价格波动回归。一家曾被视为大宗商品的基础组件,突然成了整个科技生态系统的战略瓶颈。

打开网易新闻 查看精彩图片

问题变得尖锐:AI的爆发式增长,是否正在被内存的物理极限所反噬?

正方:内存危机是结构性转折点

支持"危机论"的证据链条相当完整。首先看需求端的质变。

AI服务器对内存的吞噬是指数级的。单颗先进AI加速器所需的DRAM容量,可达标准服务器的数倍。大语言模型、训练集群、推理环境——这些系统天生就是内存黑洞,而且对高带宽内存(HBM)的依赖越来越深。

hyperscaler(超大规模云服务商)正在以万台为单位采购这类系统。分析师估算,2026年四大巨头(亚马逊、微软、谷歌、Meta)的AI基础设施支出将同比增长36%,达到5270亿美元。

当这些买家吸走全球DRAM产量的不成比例份额时,连锁反应不可避免。标准内存的供给被挤压,交货周期延长,定价权向卖方市场倾斜。

美光科技CEO的表态印证了供应端的紧张:「在中期内,我们只能为关键客户提供他们需求的50%到三分之二。」即便增加资本支出,缺口仍在扩大。

更深层的结构性变化在于市场逻辑的重构。内存曾是半导体栈中最商品化的部分,周期性供需波动是可预测的。现在它变成了AI增长的定义性约束——不是算力,而是内存,在决定AI能铺多快。

这种转变正在重塑产业链的权力结构。原始设备制造商(OEM)正在利用这种失衡,将内存捆绑为战略筹码。

反方:这只是周期性阵痛,供需终将再平衡

质疑"危机论"的声音同样有其逻辑。

半导体行业的历史充满类似的恐慌叙事。2000年的互联网泡沫、2008年的金融危机、2018年的存储器超级周期——每次都有"这次不一样"的断言,最终都回归均值。

内存制造商的资本支出具有滞后性,但反应并非缺席。美光已宣布增加生产支出,三星和SK海力士的HBM产能扩张计划也在推进。供给端的弹性需要时间兑现,而非能力缺失。

需求端的叙事也可能存在夸大。AI基础设施的5270亿美元支出预测,包含计算、存储、网络等多类资产,内存只是子集。将总支出等同于内存需求,可能混淆了概念边界。

更关键的反驳在于技术替代路径。模型压缩、量化技术、存算一体架构——这些方向正在削弱"内存墙"的刚性。如果算法效率提升的速度快于硬件扩张,需求曲线的陡峭程度可能被高估。

此外,hyperscaler的囤货行为本身具有自我强化的投机属性。当预期短缺成为共识,提前锁定库存的理性选择会人为放大需求信号,形成"预期-行动-验证"的循环。这种由恐慌驱动的超额订购,在历史上多次造成后续的库存修正。

交货周期延长和合同条款硬化,究竟是结构性短缺的确证,还是周期性紧张期的典型症状?区分二者需要更长时间维度的观察。

判断:瓶颈真实存在,但形态被误读

综合双方论据,我的判断是:内存约束是真实的,但其性质和持续时间被部分误读。

首先,HBM与标准DRAM的分化被低估了。真正的瓶颈集中在高带宽内存——这是AI训练的核心依赖,技术门槛高,产能爬坡慢。标准DRAM的紧张更多是HBM产能挤压的溢出效应,而非独立的需求爆炸。

这意味着危机的分布极不均匀。拥有HBM直接采购渠道的hyperscaler,与依赖标准内存的中下游厂商,处于完全不同的处境。所谓"全球内存短缺",掩盖了这种结构性分层。

其次,"内存决定AI增长"的命题需要限定。它更多适用于训练阶段的规模化扩张,而非推理阶段的成本优化。随着行业重心向推理倾斜,计算效率与内存带宽的权衡可能发生变化,约束条件的权重会动态调整。

第三,地缘政治变量被原文叙事悬置。内存制造的地理集中度(韩国、美国、中国台湾的产能分布)与出口管制政策,可能比市场供需更能决定中长期格局。这种外部性难以纳入纯商业分析框架,但不容忽视。

回到核心问题:谁在囤货,谁在裸泳

hyperscaler正在用资本深度换取供应链安全,将内存转化为战略储备资产。这种行为的理性前提是——AI基础设施的部署窗口期具有稀缺价值,延迟部署的机会成本高于溢价采购的财务成本。

但对于无法参与这场军备竞赛的参与者,40周的交货周期意味着项目延期或架构妥协。内存正在从成本项转变为筛选机制,重塑行业准入门槛。

冷幽默的结尾:当历史学家回顾2024-2026年的AI狂热期,他们可能会发现,决定技术革命速度的不是算法的优雅,也不是算力的暴力,而是一种诞生于1970年代的存储技术——DRAM。人类花了五十年把它变成大宗商品,又用了十八个月把它变回硬通货。供应链的记忆力,似乎比DRAM本身的刷新周期还要短。