来源:市场资讯

(来源:塔子哥的随笔)

近期美股存储股明显下行,除了获利了结,美光财报开支指引过高和高价导致下游需求被抑制外,谷歌的最新技术也引起了抛售:

谷歌新的AI内存压缩技术TurboQuant宣称能将大模型缓存内存缩减到原来的1/6~1/7(原文为压缩6倍的病句,笔者推测为1/6~1/7),还能有效改善单个GPU的性能,例如在英伟达H100 GPU上测试部分开源模型,性能较未优化的32位方案提升了最高8倍。由于目前存储需求巨大,且大量用于推理,故市场认为该技术可能大量减少存储的运用,使得存储股遭遇新一轮抛售。

然而,正如deepseek之于英伟达一样,杰文斯悖论无处不在:deepseek暴击,英伟达们何去何从?在技术有效降低单位成本(特别是存储最近价格过高)的情况下,总需求会大幅提升。相关存储会从云端大量迁移到本地,使得许多应用场景得以落地,提振更多需求。

摩根士丹利就此发表了报告,认为短期可能被抛售,但长线来看可以忽略甚至是利好,原文如下:

在一个正常周期中,现货价格持平、资本支出增加、生产效率提升可能预示着周期顶点——而这些情况已经发生,并已导致获利了结。

但此次周期绝非寻常——内存已成为人工智能(以及智能体CPU)构建的瓶颈,且日益成为主要瓶颈,这一情况似乎具有持续性。

结果——短缺正在加剧,且客户因确信短缺将持续,正为大额交易预付货款。

二阶导数减速不可避免,但在4倍市盈率的情况下,持续时间才至关重要,而相关指标均显示积极迹象。

KV缓存优化——当前拖累股价的因素——仅仅是正常的生产力改进。

正如我们在上周美光财报前所强调的,市场对其近期业绩的乐观情绪显而易见,但对这种强势能否持续的信心极低。鉴于账面价值倍数以及远高于历史任何时期的估值水平,获利了结的意愿已显现一段时间,且是健康的。遵循历史剧本导致了抛售,因为毛利率正接近历史高点,需求正受到短缺的负面影响,而资本支出的大幅增加预示着供应增长将有所加速。我们关注这些担忧,并严肃对待,但我们认为需求足够强劲以超越这些挑战。也存在一些我们相对不那么担忧的问题——现货价格在远高于合约价的水平趋于平稳,这意义不大;以及二阶导数的担忧,当一季度价格涨幅接近90%时,这种担忧似乎不那么相关。

但我们的观点是,从以往周期中寻找卖出信号会错失重点。内存不仅受人工智能需求制约——内存正日益成为人工智能需求的主要制约因素。三年来,我们听到其他人提出此观点,而我们曾不认同,因为当时DRAM供应显然有富余,但现在这种富余已消失。人工智能消耗了如此多的DRAM,以至于没有足够的余量留给其他领域,而且我们处处可见迹象表明它已构成真正的瓶颈。它正在拖累个人电脑和智能手机的制造。云客户正以高于预期的二季度价格支付溢价,要求六周内加急交货;我们认为这些客户支付这些溢价是为了将内存囤积在仓库里吗?

更高的资本支出无疑将推动更多供应,但我们讨论的需求驱动力,已不再是增长3-5%的个人电脑、智能手机和服务器市场。

……基于处理器公司的评论,人工智能支出的增长超过50%——或许远超50%——每年都更为重要,因为人工智能在整体支出中的占比越来越大。HBM4的复杂性将吸收产能,明年随着Rubin Ultra的推出,其容量将翻倍——但同时,机架用的低功耗DDR5内存需求异常旺盛,企业存储需求也呈爆发式增长。

因此,我们并不认为81%的毛利率是新的常态,但也很难预见毛利率在未来几个季度——甚至可能在接下来的两年内——出现恶化。两年内以超过800亿美元年化速率产生的盈利,即使假设此后会出现周期性波动,也无疑预示着周期内的盈利能力的提升——随之而来的大约1500亿美元自由现金流可以投入到生产性用途中。芯片法案的限制约束了现金回报,因此,如果没有其他现金用途出现,SNDK和MU这两家公司都将降低杠杆并积累大量现金余额。我们长期以来一直认为,用现金流匹配股票回购并非最优,因为这意味着你总是在高位买入,所以这些限制可能反而是积极的。

那么,谷歌的“TurboQuant”内存优化技术呢?2025年4月,谷歌发布了一份关于“TurboQuant”的白皮书,本质上是一种数据压缩算法,允许在“键值缓存”中为常用数据存储更多数据,且不影响模型性能。该公司在今天的一篇博客文章中跟进宣布,将很快引入这项技术。广泛报道称谷歌已将内存使用量减少了六倍,但这忽略了他们仅指KV缓存内存,而非整体内存。内存类股票再次下跌,至少部分原因是由于这种夸张的说法。

我们在今天与业内相关人士就此交流后得出的看法是,这对内存而言是一项渐进式的发展,基本没有意外。内存使用量是人工智能性能的关键决定因素之一,这使得内存成为渐进式改进的关键方面。当然,谷歌是该领域最具创新力的公司之一,因此一项增量改进并不特别令人意外,而且根据我们的联系人透露,KV缓存的压缩算法多年来一直是关注焦点——“最大的改进并不会宣传”,因为它们可以成为业务中的竞争优势。同样值得注意的是,谷歌的Gemini 3和2.5 Pro模型具有100万词元的上下文窗口,但公司已披露他们曾用Gemini 1.5 Pro测试了高达1000万词元,效果很好,但选择不发布该模型,部分原因是推理成本(。因此,我们预计,随着此类及其他创新带来的成本下降,资源将被用于提供更高智能、计算更密集的产品。

此外,更高效地使用KV缓存并无太大直接影响。绝大多数情况下,KV缓存保存在高带宽内存中,其内容是固定的,无法更改;如果需要额外的缓存卸载,通常会被移至“统一地址空间”——即机架中容量同样固定的18 TB LPDDR5内存。如果需要三级卸载,它可以位于SSD或HDD中,英伟达已提及我们预计明年开始的一层SSD KV缓存存储。效率提升可能对该第三级存储产生影响,但普遍的看法是,这些改进主要是为了允许扩展上下文窗口——提升能力——而非试图降低三级存储成本。在我们的所有联系人中,均未发现内存或存储需求下降的任何迹象。

英伟达曾描述他们可以实现每十年100万倍的性能提升,这并非不切实际——并且部分源于生态系统的改进,这在当前市场推动着持续不断的创新流。偶尔,这些颠覆会引发一些担忧,认为芯片正变得过于高效,但这正是生态系统增长的核心所在。

打开网易新闻 查看精彩图片

关于OpenAI暂停Sora,我们是否应该担忧?

据报道,OpenAI已决定暂停其Sora AI视频生成应用,这引发了显著的市场忧心。我们的观点是,这明确印证了我们的投资主题:当前的算力根本无法支撑每周两位数的Token增长。需求过于旺盛,而供应严重不足。盈利担忧可能也起了一定作用,但核心问题在于算力短缺。尽管如此,生成视频同样非常消耗存储资源,因此内存和HDD存储的短缺也可能是影响因素之一。然而,对于需求好到无法被完全满足、且估值处于当前水平的大宗商品类产品,我们很难过度悲观。

关于长期合同,情况如何?

在美光公布财报后,我们曾表示希望获得更多关于长期交易结构的信息——目前相关信息正在浮现,我们有报告称,其中一些交易将涉及数十亿美元的预付款。即使美光不愿描述具体交易细节,我们也将在其资产负债表上的现金及收入储备中观察到端倪。我们认为这一点很重要——倒不是说这些合同将牢不可破(一切皆可谈判),更重要的是,这传递出一个信号:客户确信内存短缺将是持续数年的问题。

我们认为,把握通用服务器增长的最佳方式将是投资内存。AMD和英特尔固然会从价格上涨中受益,但涨幅有限——处理器并非大宗商品。这两家公司的股票因其各自在晶圆代工(英特尔)和AI(AMD)领域的前景而被赋予了更高的估值倍数,而这些前景在我们看来仍存在不确定性;在当前水平买入内存股票,似乎是把握这股智能体驱动增长趋势的杠杆率更高的方式。

市场显而易见的忧虑之墙,反而可能为投资创造良好条件。这些股票的估值仅为个位数市盈率,所依据的盈利数字虽不能永久维持,但足以维持数个季度。按照当前的盈利水平,美光和闪迪两家公司年度产生的现金流可达其当前市值的15%-25%(具体金额取决于预付款的规模)。虽然这种状况不会永远持续,但足以维持足够长的时间,推动股价出现实质性上涨。

打开网易新闻 查看精彩图片