来源:市场资讯

(来源:君实财经)

花旗:英伟达采用推理上下文存储,NAND短缺加剧!

一、核心事件解读:英伟达 ICMS 技术是什么?为何影响深远?

Q:英伟达推出的 Inference Context M

是英伟达为 Vera Rubin 平台打造的 AI 原生存储架构,核心目的是解决大规模 AI 推理计算中的内存瓶颈。简单说,AI 大模型推理时会产生大量键值对(KV Cache),这些数据需要临时存储以避免重复计算,而 ICMS 的核心就是将原本依赖 GPU 高带宽内存(HBM)和系统内存(DRAM)的 KV Cache,转移到更具扩展性的 SSD 存储中,通过这种 “卸载” 优化提升模型运行效率。

其核心作用体现在三点:一是提升处理速度,令牌生成速率最高可提升 5 倍;二是优化功耗,能效比最高提升 5 倍;三是降低延迟,让 AI 推理响应更迅速。该技术采用 16TB TLC SSD 作为存储载体,在传统本地 SSD(G3 层)和共享企业存储(G4 层)之间新增了 G3.5 层 KV Cache 存储层,能实现冷数据到暖数据的高效转换,同时与 HBM 协同工作,全方位增强 AI 推理性能。

Q:KV Cache 是什么?它在 AI 推理中扮演什么角色?

A:KV Cache 是大模型的内存优化机制,全称 “键值缓存”,作用是存储模型计算过程中生成的键(Key)和值(Value)对,后续计算时直接调用这些缓存数据,避免重复运算,就像我们做数学题时记下中间步骤结果一样,能大幅提升运算效率。

从存储层级来看,KV Cache 分为三类:活跃 KV 缓存(存储在 GPU HBM,G1 层,访问速度最快,延迟 10-100 纳秒)、过渡 / 溢出 KV 缓存(存储在系统 DRAM,G2 层)、暖 KV 缓存(存储在本地 SSD,G3 层),而 ICMS 本质就是对 G3 层的升级优化,通过新增中间层让数据流转更高效,进一步释放 AI 推理的性能潜力。

二、市场影响:ICMS 将如何加剧 NAND 供应短缺?

Q:ICMS 技术对 NAND 需求的拉动有多大?具体测算数据是什么?

A:ICMS 技术将带来显著的 NAND 新增需求,成为加剧供应短缺的核心推手。根据花旗测算,单台 Vera Rubin 服务器搭载 72 块 GPU,每块 GPU 需配套 16TB TLC SSD 用于 ICMS 运行,意味着单台服务器的 ICMS 部分就需要 1152TB 的 SSD NAND 容量。

按出货量情景预测:2026 年 Vera Rubin 服务器预计出货 3 万台,将新增 3460 万 TB(折合 346 亿 8Gb 当量)的 NAND 需求,占 2026 年全球 NAND 总需求的 2.8%;2027 年出货量预计增至 10 万台,新增 NAND 需求将达 1.152 亿 TB(折合 1152 亿 8Gb 当量),占全球总需求的 9.3%。这一增量需求叠加当前 NAND 行业的供需紧平衡格局,将直接导致短缺进一步加剧。

Q:当前 NAND 行业的供需背景是什么?ICMS 的影响为何不可忽视?

A:近年来全球 NAND 行业正处于供需紧平衡状态,一方面,AI、数据中心等高端需求持续增长,拉动 SSD 等 NAND 应用需求上升;另一方面,行业产能扩张相对克制,头部厂商聚焦技术升级而非大规模扩产,导致供应弹性不足。

而 ICMS 带来的新增需求具有 “集中爆发、量级可观” 的特点:2027 年 9.3% 的需求增量相当于凭空多了一个大型终端市场的需求,且集中在高端 TLC SSD 领域,这类产品的 NAND 芯片需求更密集。对于本就紧张的 NAND 供应链来说,这种突发性的增量将进一步打破供需平衡,推动 NAND 芯片价格上涨,同时让供应链的交付周期延长。

三、投资机会:哪些企业将直接受益?

Q:ICMS 技术落地,哪些 NAND 相关企业将成为核心受益者?

A:花旗明确指出,NAND 供应商将是此次技术变革的直接受益者,核心标的包括全球五大 NAND 巨头:三星电子(Samsung Electronics)、SK 海力士(SK Hynix)、闪迪(SanDisk)、铠侠(Kioxia)和美光科技(Micron)。

这些企业受益的逻辑很直接:它们是全球 NAND 芯片的主要供应商,占据了绝大多数市场份额,ICMS 带来的新增需求将直接转化为其订单增长。尤其是高端 TLC NAND 芯片的供应,这些头部企业具备技术和产能优势,将优先承接英伟达及下游服务器厂商的增量订单,进一步巩固市场地位并提升盈利水平。

Q:除了 NAND 厂商,还有哪些环节可能间接受益?

A:间接受益的环节主要包括 SSD 模组厂商和 AI 服务器厂商。SSD 模组厂商将承接更多 16TB TLC SSD 的组装订单,尤其是具备 AI 服务器配套资质的厂商,将直接受益于 Vera Rubin 平台的出货增长;AI 服务器厂商在搭载 ICMS 技术后,产品性能竞争力提升,出货量有望增长,进而带动对 NAND 芯片和 SSD 模组的配套需求,形成产业链传导效应。

四、行业展望:NAND 短缺将持续多久?后续趋势如何?

Q:花旗对 NAND 行业后续供需格局有何判断?短缺将持续至何时?

A:花旗认为,ICMS 技术的落地将让原本就紧张的 NAND 供需格局进一步失衡,供应短缺预计将从当前持续至 2027 年甚至更久。核心原因是需求端增量明确且集中,而供应端短期难以快速响应:NAND 芯片产能建设周期长(通常 1-2 年),头部厂商当前并无大规模扩产计划,且高端 TLC 芯片的产能爬坡需要时间,无法在短期内满足 ICMS 带来的新增需求。

此外,AI 推理服务器的出货量增长可能超预期 —— 若 2027 年 Vera Rubin 服务器出货量突破 10 万台,NAND 需求增量将远超当前测算,短缺程度可能进一步加深,推动 NAND 芯片价格进入上行周期