文章来源:半导体行业观察

打开网易新闻 查看精彩图片

人工智能处理市场年轻而充满活力,拥有多家关键参与者,每家都有独特的优势和增长轨迹。通常,供应链有时间适应新趋势,但人工智能革命发展迅速。

Nvidia 的数据中心业务增长迅猛,利润率极高。 本季度,该公司将把业务从 H100 转变为 Blackwell,这可能会进一步提高利润率。 AMD 的业务也在增长,尽管速度较慢。 尽管人们对 Gaudi 3 寄予厚望,但似乎不尽如人意。

所有大型云提供商都在争相获得 Nvidia 的 AI 系统,但他们发现这些系统太贵了,所以他们开始开发自己的芯片。除了大公司之外,许多新玩家也如雨后春笋般涌现。但最后他们就会因为软件、硬件等原因而失败……或者……

唯一可以肯定的是,一切都围绕着 Nvidia 旋转,而每个人对 Nvidia 的统治将持续多久都有自己的看法。深入 AI 的地下室可能会发现更多见解,有助于预测 AI 硬件的未来发展。

打开网易新闻 查看精彩图片

半导体时光机

半导体行业拥有错综复杂的全球供应链,其中存在多个循环依赖关系,这些依赖关系既复杂又令人着迷。考虑一下:半导体工具需要非常先进的芯片来制造更先进的芯片,而现在正在为人工智能系统制造芯片的半导体工厂需要人工智能系统才能运行。这是一个相互依赖的网络,让这个行业充满活力。

您听说过:“一切都始于一粒沙子。”事实并非如此——一切都始于北欧大学城的一台极其先进的机器。事实也并非如此。一切都始于德国的一面高精度镜子。现在您明白了。材料和设备不断传播和流通,直到芯片离开晶圆厂,安装到运行并观察供应链的 AI 服务器系统中(我相信您会用您最喜欢的 LLM 查看这篇文章)。

从制造工具到开始生产芯片的时间线可以延长。在最好的情况下,可能需要几个季度到几年的时间。这个延长的时间线允许观察。可以看到材料和子系统在链条中的传播,并预测会发生什么。

虽然这些观察并不总是能提供准确的答案,但它们是验证假设和为决策过程增加见解的绝佳工具。

挑战在于供应链和观察模型在不断变化。但每个季度都必须应用一种新的模型。

打开网易新闻 查看精彩图片

天鹅与丑小鸭

我可能会失去一些客户,但 Nvidia 和它最接近的竞争对手之间存在巨大差异。丑小鸭都有机会成为天鹅,但不是在未来几年内。

最新的加工收入记分卡如下。这是不包括内部制造且未对外交易的芯片的市场观点:

打开网易新闻 查看精彩图片

这种观点让 AMD 和博通很恼火,但对英特尔来说却是致命的。英特尔无法再通过留存收益为其战略提供资金,必须与投资者群体合作才能获得新的融资。英特尔不再是自己命运的主宰者。

这些是 Nvidia 的一些关键客户和其他数据中心所有者,他们不愿意接受 AI 领域的新统治者,并已开始构建内部架构。

Nvidia 的四大客户各自都有处于不同阶段的架构正在进行中或生产中:

  • 谷歌张量

  • Amazon Inferentium 和 Trainium

  • 微软Maia

  • Meta MTIA

与老牌芯片制造商不同,谷歌只有 TPU 架构才具有真正的制造吸引力。这项研究表明,有传言称,它不仅仅是普通的吸引力。

打开网易新闻 查看精彩图片

我们去买一些半导体产能吧

由于 GPU 硅片所需的半导体技术非常先进,显然所有新玩家都必须购买半导体产能。台湾的台积电是一个很好的起点。后来,三星和英特尔将加入台积电,但目前,台积电是唯一的主角。英特尔正在大谈人工智能和成为一家代工厂,但事实是,他们目前 30% 的芯片是在外部制造的,这种情况需要一段时间才能改变。即使英特尔获得了制造能力,他们仍然需要客户转换,这不是一项容易或便宜的任务。有了爱尔兰和以色列的新 ASML 设备,它们就像是英特尔第一批上线的工厂。

对于新玩家来说,问题在于获取先进半导体产能是一场基于长期联盟的战略博弈,它不像买薯片那么简单。

台积电最重要的联盟

了解台积电客户关系的最好方式是通过技术收入。

打开网易新闻 查看精彩图片

台积电最重要的盟友是苹果。随着苹果从依赖英特尔转向依赖其自制芯片,联盟不断壮大,以至于苹果是唯一一家能够使用台积电最先进工艺 3nm 的客户。随着台积电推出 2nm 技术,这种情况将发生改变,苹果将试图再次垄断该技术 。你可以理所当然地嘲笑这家消费巨头缺乏足够的创新能力或输掉了人工智能转型,但有史以来最先进的芯片只能在苹果产品中找到,而且这种情况不会很快改变。

顺便提一下,有趣的是,每季度 87 亿美元的高性能计算机部门推动了数据中心业务的总收入接近 250 亿美元,以及 75 亿美元的 MAC 生产以及一些其他产品。台积电所获得的价值不如客户所获得的价值多。

Nvidia和台积电

Nvidia 和台积电之间的关系也非常紧密,如果 Nvidia 还不是台积电最重要的客户,那很快就会成为台积电最重要的客户。Nvidia 的业务前景比苹果的业务要好。

苹果和 Nvidia 与台积电的关系都是 C 级的,因为它们对所有公司都具有战略重要性。你看到黄仁勋和张忠谋在台湾一起吃街头小吃的自拍照并非巧合。

就像苹果拥有 3nm 工艺一样,Nvidia 也拥有 4nm 工艺。尽管三星正试图吸引 Nvidia,但它不太可能成功,因为台积电关系还有其他吸引力,我们将在后面深入探讨。

台积电和其他公司

由于历史悠久、前景良好,台积电与AMD的关系也十分密切,而与英特尔的交易则稍微有趣一些。台积电有一个明确的战略,那就是不与客户竞争,而当英特尔代工服务不再只是梦想时,英特尔肯定会与客户竞争。英特尔 30% 的芯片都是在外部制造的,虽然该公司没有透露具体地点,但不难猜测。台积电为英特尔代工,直到英特尔足够强大到可以与台积电竞争。虽然台积电并不担心与英特尔的竞争,但我相信他们会保持一定的距离,而且英特尔并不是台积电的第一个对手。

上面谈到的英伟达四大客户也在台积电的客户名单上,但吸引力不如半导体公司。然而,如果代工产能成为问题,他们将不会占据强势地位。

打开网易新闻 查看精彩图片

随着苹果转向 2nm,它将释放 3nm 产能。然而,这一产能仍是未知数,收入约为每季度 20 亿美元,需要大幅扩张才能覆盖计划迁入 3nm的所有新架构。四家公司致力于 3nm,但其余公司可能很快就会跟进。

台积电预计 2024 年 3nm 产能将是 2023 年产能的 3 倍。目前,台积电的产能充足,但这种情况可能会迅速改变。尽管英特尔和三星潜伏在幕后,但它们还没有太大的吸引力。三星已获得高通的 2nm 工艺,英特尔则赢得了微软。目前尚不清楚这是否包括 Maia AI 处理器。

台积电的投资

台积电正在不断扩大产能,以至于很难确定其是否足以推动人工智能革命。

打开网易新闻 查看精彩图片

这些都是台积电目前的动向,除了表明台湾的芯片霸主地位还能维持几年之外,也表明取代3nm技术所需的新2nm技术还要一年多的时间。

还有其他扩大产能的方法 。可以通过在现有晶圆厂增加更多或更快的生产线来扩大产能。深入了解供应链的另一个部分可以帮助了解台积电是否正在增加产能。

打开网易新闻 查看精彩图片

综合工具销售额下降,主要是在台积电的总部台湾和 2nm 的另一个扩张地区美国。这与台积电的资本支出与收入支出(收入中有多少用于资本投资——新工具和工厂)相匹配。

打开网易新闻 查看精彩图片

尽管台积电正在增加大量产能,但让所有新参与者获得扩张所需的产能可能为时已晚。台湾设备销量低迷表明短期产能不在台积电的议程上;相反,该公司正专注于美国芯片法案推动的扩张,这将推迟产能。

三星的代工业务并未引起人们的关注,而英特尔距离有所作为还需一段时间。尽管长期前景良好,但也有充分理由担心,目前在短期内扩大尖端半导体产能方面投资不足。

短缺可能会严重影响人工智能硬件领域的新参与者。

当前容量限制

目前,限制 Nvidia 收入的并不是硅,而是新型 AI 服务器所需的高带宽内存容量和先进封装。

最简单的描述方式是,电子和距离不是朋友。如果你想要高速,你需要让处理器彼此靠近,并靠近大量高带宽内存。为了实现这一点,半导体公司正在推出新的 GPU 封装方法。

传统方法是将芯片放置在基板上并将它们连接在一起(2D),但这对于 AI 应用来说还不够近。他们目前使用的是 2.5D 技术,其中内存堆栈安装在 GPU 旁边并通过中介层进行通信。

Nvidia 计划在其下一代处理器中全面实现 3D 技术,该处理器将在 GPU 上配备内存。

打开网易新闻 查看精彩图片

好吧,就像我的老板常说的那样,“这听起来很简单——现在就去做吧!”封装公司和我一样有很多借口。

除了必须将微小的芯片翻转并粘合在一起并祈祷其能够工作之外,DRAM 还必须非常靠近烤箱 - GPU。

“DRAM 讨厌高温。它在 85°C 左右就开始失去意识,在 125°C 左右则完全失去意识。”Cadence 集团总监 Marc Greenberg说。

这就是您还会听说 Nvidia 新款 Blackwell采用液体冷却的原因。

最重要的是,目前这项技术极其有限。只有台积电有能力实现它(台积电术语为 CoWoS — Chip-on-Wafer-on-Substrate)。

这对于 Nvidia 来说并不意外,因为它已经趁机 提前预订了台积电未来 3 年(三年?) 50% 的CoWoS 产能。

当前的人工智能供应链洞察

通过调查供应链,我们可以预测到 2029 年,届时台积电计划中的最后一座晶圆厂将投入生产。我的重点是近期,直到 2025 年底,这就是我得出结论的基础(如果观众中还有人的话)。您可以根据本文提供的事实得出不同的结论:

  • Nvidia 是镇上唯一赢家,并且在可预见的未来仍将如此。

  • Nvidia 受到多年来建立的强大的供应商关系的保护。

  • AMD 会做得很好,但缺乏规模。英特尔……这需要时间和金钱(他们没有——如果他们成功了,他们就会成为大赢家)

  • 云供应商喜欢 Nvidia 系统,但是价格不太公道,所以他们正试图推出自制芯片。

  • 当前的人工智能供应链结构使得不良企业很难将其芯片产量扩大到有意义的水平。

  • CoWoS 容量是 Nvidia 的 Joker – 保证 3 年的容量,并且他们可以比其他任何人出价获得额外的容量。

责任编辑 | 陈斌