文 | 字母AI

黄仁勋近年来的变化,就是头发比以前白了。

打开网易新闻 查看精彩图片

有人说白头发是因为基因、岁数,也有一部分人认为,是因为焦虑、压力。

2026年5月,黄仁勋在斯坦福大学面向在校学生的公开演讲中说到,“我90%的工作都是硬撑,但任何工作,我都努力做到最好。”

实际上早在33年前,黄仁勋在采访中就曾表示过他自己的压力,黄仁勋说“英伟达距离倒闭只有30天。”

最近黄仁勋又多了一个头发变白的理由,那就是OpenAI和博通一起发布了Jalapeño芯片。

这是OpenAI第一颗自研的推理芯片。从设计到流片只用了九个月,目标部署10GW,而且这颗芯片已经可以跑GPT-5.3了。

OpenAI跟Anthropic不一样,后者又有谷歌的TPU,又有亚马逊的Trainium。OpenAI此前一直是坚定的英伟达用户,现在有了Cerebras还不够,又和博通混到了一起。

英伟达还在狂奔,但英伟达有敌人了

5月20日,英伟达公布了最新一个季度的财报。单季营收816亿美元,毛利率是74.9%,自由现金流接近490亿美元。数据中心收入752亿美元,同比增长92%。

显然,英伟达仍然在春风得意。

但现在的局面就是,英伟达正在被围攻。

就拿博通来说吧,他们最近的财报就很亮眼。在最新一个季度里,公司AI半导体业务收入达到108亿美元,同比增长143%。

而博通预计,2026财年这块业务的收入将达到约560亿美元,而上一个财年约为200亿美元。

博通跟英伟达不一样,博通做的是ASIC,也就是“按客户需求定做的AI芯片”。客户想要什么芯片,它就帮客户专门做什么芯片。

现在的AI算力不是一颗芯片在工作,而是几万、几十万颗芯片组成一个集群一起工作。模型训练时,芯片要不断交换参数;推理时,尤其是专家模型和长上下文任务,芯片之间也要频繁传数据。

也就是说你芯片算得再快,如果网络跟不上,整个算力集群就会被最慢的通信环节拖住。

这就是博通的优势了,博通本质上是一个通信公司。它除了做ASIC以外,还给它的客户做连接这些芯片的高速以太网交换芯片。

比如博通最新的Tomahawk 6交换芯片,单颗交换能力达到102.4Tbps,面向的就是超大规模AI集群。OpenAI与博通的10GW合作公告里就明确写到,合作内容也不只包括定制AI加速器,还明确包括配套的Ethernet网络方案。

还有一点,博通足够“中立”。

这是很多人都会忽略的地方。无论是OpenAI也好,还是Anthropic也好,他们都不希望把自己的核心芯片计划交给另一家也在做大模型、做云服务的公司。

而博通刚好不做模型、不卖云,它也不和客户抢最终用户。 就是因为这层身份在,所以OpenAI和Anthropic才会都选择它。

英伟达现在的对手可不只有博通,还有亚马逊。

AWS虽然不单独披露Trainium的收入,但亚马逊CEO安迪·杰西(Andy Jassy)在今年4月的股东信里表示,包括Trainium、Graviton和Nitro在内,亚马逊的自研芯片业务,年化收入已经突破200亿美元。

关键后面他还补了一刀,说如果把这个芯片部门当成独立公司,让亚马逊在2026年生产的所有芯片,按市场价卖给AWS和外部客户,那么年收入大约是500亿美元。

其实亚马逊的Trainium芯片,正在成为亚马逊第二大生意。

谷歌这边,情况也是一样的。

Anthropic在去年10月拿到了最多100万颗谷歌TPU的使用权,超过1GW的算力容量在2026年上线。今年4月,Anthropic又跟谷歌和博通签了新的协议,锁定了约3.5GW的下一代TPU算力,2027年开始交付。

与此同时,谷歌云的单季收入在2026年第一季度首破200亿美元,同比增长63%,谷歌还披露其AI Agent相关收入同比增长了800%。

OpenAI和Anthropic正在 脱离英伟达的管控

英伟达除了要面对四面八方围过来的友商,还得去应付OpenAI和Anthropic这两个小弟。

OpenAI现在把算力分成了两条路线,一条还是英伟达,另一条线是Cerebras和博通。

Cerebras做的东西跟市面上所有AI芯片都不一样,它用的是晶圆级芯片,一整片晶圆就是一个处理器,上面有几十万个计算核心。这种架构的核心优势是数据移动极少,延迟极低。

对推理来说,延迟低意味着模型输出更快。

今年1月,OpenAI跟Cerebras签了一份价值超过200亿美元的多年期协议,承诺部署750MW的Cerebras推理算力,交付时间横跨到2028年。

基于这笔合同,Cerebras拿到了OpenAI给的10亿美元运营资金贷款,随后在5月完成了64亿美元的IPO。

Cerebras的年收入指引还不到9亿美元,但一份OpenAI的合同就给这家公司带来了超过200亿美元的收入。

甚至我可以断言,Cerebras现在就是OpenAI的硬件部门。

博通跟Cerebras不同的地方在于,后者签的订单是算力合同。要在规定的时间内,给OpenAI提供一定规模的推理服务。

而前者的订单内容,是OpenAI自己主导设计芯片。OpenAI最清楚自家模型推理时,算力、内存、KV Cache、网络通信分别卡在哪里。

这就跟买车一样,你只开公路,那就没必要选配越野轮胎、四驱和底盘护板,这些配置只有越野的时候才有用,公路完全用不上。你就能把这钱省下来去升级别的地方。

这是OpenAI的第一颗自研推理芯片,从架构设计到流片只用了九个月。

博通说这是先进半导体历史上最快的ASIC开发周期。Jalapeño从一张白纸开始,完全围绕ChatGPT的推理进行设计。

GPT-5.3-Codex-Spark已经在实验室里跑在Jalapeño工程样片上,跑的是生产环境的目标频率和功耗。OpenAI的说法是,每瓦性能“远超当前最先进水平”。

Jalapeño的目标部署规模是10GW,相当于10座大型核电站。

虽然在训练端,OpenAI仍然离不开英伟达GPU。因为前沿大模型训练对算力密度和互联带宽的要求非常高,目前只有英伟达的GPU能够满足OpenAI的标准。

但推理不同。推理是稳定、海量、重复的工作负载。每天几亿人问ChatGPT同样类型的问题,模型结构不变,计算模式高度可预测。

这种负载最适合被专用化,把通用GPU里那些用不上的电路全都砍掉,只保留大模型推理需要的部分,便宜而且高效。

Anthropic走的是另一条路。

它把推理和训练一起押在了AWS Trainium上。Trainium是AWS自己的AI芯片,兼顾训练和推理。

今年4月,亚马逊又向Anthropic投了50亿美元,累计投资达到130亿美元,并保留了追加至多200亿美元的权利。

礼尚往来,Anthropic承诺未来十年在AWS上花费超过1000亿美元,锁定5GW的Trainium算力,覆盖Trainium2到Trainium4三代芯片、数千万颗Graviton CPU。

围绕这个超级大合同,亚马逊在印第安纳州建了两个巨型数据中心园区,名为“Rainier项目”,规划总容量约4.7GW。

我简单算了算,如果OpenAI和Anthropic两个大型园区全天运行,一年要消耗掉1288亿度电,相当于15座大型核电站。

这个数字可能看着有点虚,我换成热量你就能看懂了。14.7GW功率下,每秒消耗是147亿焦耳(14.7 × 10⁹ J),那么每天就是1.27 × 10¹⁵焦耳。相当于30.4万吨TNT。

然而,就是这么大一笔订单,却全然和英伟达一毛钱关系都没有。

博通突然上位

最后回过头来看博通。

你有没有想过这么一个问题,为什么OpenAI、Anthropic的“去英伟达”路线,最后都得经过博通?

就拿OpenAI来说,明明它可以仰仗微软,毕竟OpenAI本来就有很大一部分算力是从微软的Azure买来的。但现实就是,OpenAI正在远离微软。

这里面的核心逻辑是,OpenAI和Anthropic都想要芯片的“定义权”。

看似OpenAI跟博通开发Jalapeño芯片的整个过程中付出了很多,设计了整个芯片。可如果你了解芯片行业你就清楚,设计芯片其实是行业内最简单的部分,难的是后面的工程化、量产和网络系统。而这些部分,全都掌握在博通手里。

一颗AI芯片,真正跟模型推理直接相关的计算逻辑,可能只占整个芯片面积的一半不到。

剩下这些用来搬运数据、串行接口、主机通信的模块,每一块都极其复杂,从头设计任何一块都要几十个工程师干大半年。

博通做了几十年通信芯片,这些IP全是现成的。之所以Jalapeño九个月能从图纸到流片,其实跟新闻稿中提到的OpenAI用AI设计芯片关系不大,真正靠的是博通丰富的基础设施。

2023年AI刚火起来的时候,所有人的眼睛都盯着英伟达。GPU是稀缺品,H100一卡难求,英伟达的市值从几千亿一路冲到几万亿。博通那阵子反而没什么声音。

随着行业的发展,博通开始意识到,想自己造芯片的AI公司越来越多。不过大家都不想从头开始研究芯片,又累又苦又费时间精力。

所以就催生出了一个新词,叫做“芯片自主权外包”。

博通的位置刚好卡在这里,我能帮你设计,我帮你找代工厂,我帮你管供应链,我帮你做网络。最后芯片是你的,你想怎么用怎么用,不用跟我分成。

博通赚的不是产品的钱,是服务的钱。这就导致博通的客户越成功,博通的生意就越大。

而这件事,英伟达做不了。不是技术上做不了,是商业模式上做不了,因为英伟达卖的是成品,它只懂成品那套逻辑。

博通是把整套链路全都铺满了,你任何一个环节有需求,博通都能给你找到对应的价码。

还有一层。英伟达的客户之间是竞争关系。

它如果帮OpenAI设计芯片,Anthropic会怎么想?谷歌会怎么想?Meta会怎么想?

而且英伟达现在还需要面对一个问题:造芯片的钱,很大一部分根本不是它赚的。

一颗GPU,最贵的部分不是核心,是旁边堆的那几层HBM。HBM是一种堆叠式高带宽内存,模型参数越大,需要的HBM越多。

全球能大规模量产HBM的,就那么几家。比如三星和SK 海力士,这两家几乎平分了这个市场。

换句话说,英伟达卖一颗 GPU,里面相当一部分收入转手就交给了韩国人。更何况HBM的产能本身就紧张,扩产周期极长。一座HBM工厂从规划到量产要好几年,比建GPU的先进封装产线还慢。

所以这就是今天的黄仁勋,前有狼后有虎,手里牵着的两个娃还不老实。