打开网易新闻 查看精彩图片

最高级的捕食者,往往只吃热量最高的内脏,而不是把猎物吃干抹净。

作者|杨知潮

如果一家公司赚走行业九成的利润,那么所有玩家都会是他的敌人。

拥有九成市占率的英伟达是半导体领域最强大的公司,但如果全世界的巨头都在针对它,它的资金、人才、技术,也会显得有些难以招架。

随着谷歌TPU的崛起,AMD收入创下历史新高,英伟达9成市场份额的地位,似乎并不是那么百分百的稳固。

不过吃掉全部蛋糕,似乎并不是英伟达和黄仁勋的目标,“吃掉蛋糕上最甜的奶油”才是。

01 达子的让步

眼下硅谷的大厂只有两个阵营,一个叫英伟达,另一个叫“反英伟达”,几乎所有大厂都是后者的成员。

“反英伟达联盟”以算力厂商AMD和应用厂商OpenAI为绝对核心,谷歌、微软、Meta也是这个联盟的成员,他们之间签订各种合同,依靠利益捆绑,组建成了一个松散的联盟。他们最终只有一个目的:破除英伟达的垄断,从而少给英伟达交钱。

打蛇打七寸,反英伟达联盟自然要瞄准英伟达的核心护城河:NVLink和Cuda。

2024年,AMD、Intel、Meta、Microsoft、Google等9家科技巨头成立了一个UALink联盟,针对的是英伟达的护城河——NVLink。它的地位相当于电脑的“主板”,是GPU之间连接的底层规则。

如果成功,未来的算力集群将可以绕开英伟达的标准,英伟达虽然卖的是硬件,但护城河来自生态和标准的钱,如果NVLink被绕开,这会极大地冲击英伟达的潜在销量。

CUDA作为英伟达的核心护城河,也是OpenAI的重点打击对象,它通过自己的编译器Triton,试图绕开CUDA的“语言垄断”。

毕竟英伟达的护城河之一,就是CUDA带来强大的粘性,工程师十几年来都主要使用这种语言进行开发。这让大厂不得不买英伟达的GPU,否则工程师就失去了自己最常用的语言,代码都不会写,基于CUDA的老代码也得重写。但Triton的存在,让工程师可以直接使用Python编程,哪怕切换到AMD,工程师也能适应。

——如果CUDA是英伟达专属的方言,过去人们都得学,那么现在Triton就是普通话,可以通用,部分消解了英伟达的语言护城河。

CUDA当然没有被颠覆,它仍然不可替代。但至少它一小部分的优势已经被绕开了,工程师哪怕切换到AMD的显卡,也能使用Triton这种“普通话”进行开发。

并且由于“反英伟达联盟”的存在,Triton生态的推行非常顺畅,大家都愿意为了少给英伟达交钱和尝试这种语言,比如微软最新推出的Maia 200就支持Triton,最坚固的盟友AMD更是为了其开发了特定优化策略。

打开网易新闻 查看精彩图片

反英伟达联盟的绑定程度还在加深,2025年10月,AMD和OpenAI签署了一项协议:OpenAI向AMD购买最高达900亿美元的GPU,作为回报,AMD以近乎免费的价格向OpenAI“赠送”了1.6亿股的股票。

什么是拉帮结派?这就是拉帮结派。

拉帮结派背后,还有另一个坏讯号:OpenAI敢下如此大规模的订单,说明对OpenAI来说,AMD的算力已经具备更大的价值了。这不是个秘密:2025年三季度,AMD收入创下历史新高,这背后是越来越多的客户转向AMD,比如2025年12月,Meta、微软和OpenAI在AMD投资者活动上表态,未来他们将会使用AMD最新的人工智能(AI)芯片Instinct MI300X。

英伟达的优势当然还非常巨大,大到“打着灯笼照不到老二”,但相比此前,老二与老大之间的距离毫无疑问已经近了那么一点点。

AMD之外,还有一个更强大的对手——谷歌。

2025年11月,谷歌通过Gemini 3.0在大模型领域开启逆袭,几个月过去,谷歌已经基本被公认为多模态大模型的第一名,在部分领域超越了OpenAI。Gemini对英伟达的威胁在于:它是主要基于谷歌自己的TPU训练的。Gemini的成功证明了,离开英伟达,也能做出优秀的大模型。

我们仍然无法判断英伟达的护城河是否会被颠覆,但如果站在英伟达的城墙上眺望,人们一定能嗅到一丝危险的气息。

那英伟达是怎么应对的呢?

答案是让步。

客户和竞争对手想在NVLink之外另起炉灶?

那英伟达就直接开放NVLink。英伟达在2025年年中推出了NVLink Fusion,过去的算力集群,只能用英伟达的芯片,但现在英伟达出让了一部分权限,将NVLink开放给行业,客户可以把其他品牌的芯片也混进算力集群里。

打开网易新闻 查看精彩图片

图注:如果说过去的英伟达只卖电脑,那现在的英伟达开始卖“主板”和“操作系统”了。

这是一种“割地求和”:以少卖卡为代价,换取对NVLink统治地位的维持。

面对Triton的威胁,英伟达也没有坚持,而是直接和OpenAI合作,目前Triton编译器已经支持NVIDIA Blackwell架构。既然大家用Triton是无法逆转的,那英伟达自己也未尝不能上车。

更狠的是,2025年12月,英伟达自己发布了一个类似Triton的技术:CUDA Tile,让开发者可以用Python写代码。知名芯片架构师吉姆·凯勒亲自发文提出质疑:这是否意味着英伟达自己终结了自己的CUDA护城河?

看起来,英伟达似乎出让了一部分利益,但这不是退缩,而是为了更好的赚钱。

02 吃蛋糕,只吃奶油

华为拥有造车需要的绝大部分资源,但他们坚持不造车。谷歌完全有能力自己做一个电商平台出来,但他们却只做搜索,为电商引流。

他们当然不是不想分蛋糕,而是想吃蛋糕上最甜的奶油。

谷歌不做电商,但却可以向所有电商平台收钱,这是没有任何基础设施成本的纯利润,不需要承担客服、物流、运营的成本。最终,谷歌的广告利润比所有电商平台都高。华为不造车,但却可以把持住汽车利润最丰厚的智驾和设计环节,赚取比汽车行业更高的利润率。减少重资产带来的折旧风险,和杠杆风险。

就像在自然界,最高级的捕食者,往往只吃热量最高的内脏,而不是把猎物吃干抹净。

过去三年,英伟达赚到了AI行业100%以上的利润——因为大多数AI业务的利润是负数。但作为一个规模数万亿美元产值的行业,一家公司赚走8-9成收入,终究是难以持续的。而英伟达作为AI产业链上最顶级的企业,可以选择只吃蛋糕上最甜的奶油。

NVLink Fusion就是那个“奶油”。

虽然通过英伟达可以接受用户使用竞争对手的芯片,但这些芯片,仍然在英伟达的“操作系统”下运行,那英伟达就还是能收到钱。NVLink Fusion的商业模式还不完全透明,但方向是显然是清晰的:首先英伟达可以卖“配件”,比如机箱、冷却系统、交换机。

打开网易新闻 查看精彩图片

图注:NVLink的交换机是非常昂贵的,没准它的毛利率比GPU还高。

另一方面,虽然“大芯片”可以换成非英伟达的,但一个芯片组里还有五花八门的小型芯片,它们虽然客单价不高,但利润率却非常高,卖这种“小芯片”的博通,在AI时代来临之前也是硅谷著名的现金奶牛。

最后,英伟达可以收“税费”,就像苹果此前拥有独家的Lighting数据线接口,每一根充电线,都必须购买苹果的芯片,该芯片的价格一度高达4美元——也难怪苹果被全球政府针对,强制要求它使用TypeC接口。此外,苹果还会收取会员费、审核费、检测费,甚至一度直接向厂商收取消费分成。

复杂的规则翻译过来只有一句话:交钱,交钱,交钱。

Litghting只是个充电口,NVLink Fusion则是一整套底层架构,能收钱的理由,只会更加五花八门。当然,这种收费的规模肯定相对GPU小一些,但这却是几乎没有成本的纯利润,——就像高通的专利业务和苹果APP Store,利润率几乎可以当成是100%。

更重要的是,因为绝对的价格更低了,它更容易被客户所接受,不那么容易引起“反英伟达联盟”的抵触。

已经有巨头在响应了。2025年12月,亚马逊宣布将NVLink Fusion部署于自家芯片,包括Trainium4 、Graviton CPU、 Nitro System。通过NVLink Fusion,亚马逊可以大量使用自家芯片替代英伟达,省了买卡的钱,英伟达虽然出让了部分市场份额,但却赚走了利润率最高的“规则”部分。

除了卖标准,卖生态,英伟达目前还有一个发展趋势:直接卖服务,把自己客户的活给干了。

2023年,英伟达推出了自己的云服务DGX Cloud,客户不用买卡自己搭建数据中心,可以直接向英伟达购买这种服务。这部分收入增长非常快,据瑞银分析师预计其年收入规模有望超过100亿美元。

“卖铲子”的企业,最忌讳直接下场和客户抢生意,因为这会使得客户产生警惕,从而威胁自己的市场份额。比如高通不会直接生产手机,宁德时代也不会直接生产整车,这都会阻碍他们在上游的统治地位。

但如果英伟达本来就不打算吃下所有蛋糕呢?那直接卖服务,就会成为提升利润的一个非常有效的手段,毕竟卖全套服务,一定比只卖卡的收入更高——至于客户因为英伟达的直接竞争而流失?没关系,他们本来也想流失。

段永平表达过对英伟达的一个顾虑:英伟达的护城河虽然很强大,但这么多巨头针对它,不能改变一些什么吗?

现在来看,这种担忧或许是可以解释的:英伟达的市场份额当然有可能被侵蚀,当然可能被抢走蛋糕,但在此之前,它可能已经抓住蛋糕上最甜的奶油。

头图来源|AI制图