作者:我是阿闯
来源:阿闯走大道(ID:ChuangDaDao)
1
过去两三年,黄仁勋的发言实在太多了。
多到很多人听他讲AI,已经不太分得清哪些是他真看到的东西,哪些是他希望市场相信的未来。
但他讲的话依然值得认真读,因为他所处的位置太重要了。
黄仁勋是AI时代卖铲子的人。
他不押注哪一个大模型会赢,也不靠某一个AI应用赚钱。他卖算力给所有人,OpenAI、谷歌、Meta、xAI、各国政府,还有大量创业公司,只要要建AI基础设施,很多都会绕不开英伟达。
这个位置,让他能看到整个行业的算力横截面:客户到底怎么部署,卡在哪里,钱往哪个环节流,哪一种计算正在替代哪一种计算。
2
当然,正是因为他所处的位置,也会让他的话带来偏差。
卖铲子的人,天然希望所有人相信金矿足够大,所以当他讲市场空间有多大,长期需求是几万亿,每个国家都需要主权AI时,就要打个折扣。
这些未必全是他看到的现实,更像是他希望市场相信的未来。
这几天,我把这三年黄仁勋的发言通读了一遍,总结出了三个关键内容,也是本文要分享的重点。
第一,AI时代的计算单位,不再是一颗芯片,而是一整座数据中心。
第二,英伟达面对的竞争,不只是GPU对ASIC,而是谁能在同样的电力和机房里产出更多token。
第三,推理需求确实变了,它不再只是一次性回答,而会变成持续消耗算力的过程,但最后还要看多出来的推理开销,能不能被答案质量和生产效率的提升覆盖回来。
同时,我也读到一些比较夸张的说辞,比如“十亿倍”、“几万亿”、“每个国家都需要主权AI”这类说法,它们未必错,但太难验证,不能和上面这3点放在一起。
3
先说第一点,AI时代的计算机,不再是一颗芯片,而是一整座数据中心。
过去我习惯把英伟达看成一家卖GPU的公司。
顺着这个看法,观察问题的视角就变成了:GPU会不会被更便宜的ASIC替代,大客户会不会自己研芯片,芯片价格会不会随着供给增加往下走。
尽管这些问题都成立,但它们默认的是同一个前提:英伟达卖的是一颗芯片。然而,黄仁勋反复讲的,不是一颗芯片,而是一整座数据中心。
比如,2023年5月,英伟达FY2024 Q1财报电话会上,有分析师问他怎么看来自专用芯片的竞争。
他的回答没有停在芯片性能的比较上,而是说,计算机就是数据中心,数据中心就是计算机,它不是一颗芯片。
这句话当时更像是一句即兴判断,用来回应一个具体的竞争质疑。
一年后,这个判断变成了英伟达的正式语言。
2024年5月,英伟达在FY2025 Q1官方财报稿里写下,很多公司和国家正在与英伟达合作,把传统数据中心转向加速计算,并建造一种新型数据中心——AI工厂——用来生产人工智能这种新商品。
2024年8月,英伟达又在FY2025 Q2财报稿里把Blackwell放在full-stack、data center-scale platform的语境里讲,而不是只把它当成一颗GPU。
到这一步,“数据中心就是计算机”已经不只是一次反驳,而变成了英伟达描述自己产品时的默认框架。
再往后,这个框架收敛成了一句更彻底的自我定义。2026年4月,黄仁勋在Dwarkesh Patel的访谈里说,英伟达的心智模型是:输入是电子,输出是token,中间是英伟达。
这说明英伟达已经把自己放在了电力和token之间的转换环节上。
三年时间,AI工厂从黄仁勋一句回应竞争的即兴话,变成了英伟达对自己的定义,也影响着英伟达怎么组织产品和客户关系。
4
如果计算机变成一整座数据中心,竞争的单位也就变了。
问题就不再只是“谁的芯片更快、更便宜”,而是整套系统在同样的电力、同样的机房里,谁能产出更多token。
这也是为什么我后来再看GPU和ASIC的竞争时,不再只看芯片价格。
因为在黄仁勋这套框架里,便宜的芯片如果不能带来更高的每瓦token产出,反而可能是更贵的选择。
值得注意的是,黄仁勋也并不回避竞争。
早在2023年5月,英伟达FY2024 Q1财报电话会上,他就主动承认,竞争来自四面八方,有初创公司,有半导体大厂,也有云厂商自己研的芯片。
但他的反驳点没有落在“我的芯片更快”,而是落在两个地方:一是全栈,二是最低的总拥有成本。他还提到,别人交付一套系统到能用,可能要按月、按年算,而英伟达可以按周算。
到了2025年9月,BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》这场访谈里,他把这件事讲得更锋利。
在他的论证里,即便竞争对手把芯片定价为零,客户也未必会转向对手。
理由很简单,每个人都受电力限制。
假设你只有一定的电力,就会希望这点电力换来尽可能多的收入。如果英伟达每瓦性能是对手的两倍,同样的数据中心就能产出两倍收入。
他给的数字是,Blackwell相比上一代Hopper,性能提升约三十倍。在一吉瓦的电力里放弃三十倍的产出,机会成本太高了。高到对手就算把芯片白送,也未必补得回来。
这个论证之所以有力,是因为它把竞争的落点从“芯片标价”挪到了“每瓦产出”和“机会成本”上。
一旦这么算,ASIC便宜不便宜,就不再是唯一的问题。上线速度、集群效率、网络、软件、利用率、供电限制,全都进入了同一个公式。
5
2026年4月,Dwarkesh Patel在访谈里继续追问ASIC和自研芯片的问题。
对方质疑,大客户完全有能力自己写软件,绕开英伟达的护城河。黄仁勋的回应,是把InferenceMAX这个公开基准摆出来:它就在那里,对手可以来证明自己的推理成本优势,但TPU不来,Trainium不来。
他的意思是,我欢迎他们来证明自己宣称的成本优势。
他还拆了一个很常见的假设。
很多人以为自研ASIC一定更省钱,因为省掉了英伟达很高的毛利。但黄仁勋指出,ASIC本身的毛利也很高,甚至大约65%,客户仍然要付钱给ASIC供应商。
两者一比,省下的并没有想象中多。
6
最后一点,推理是真的变了,但推理这一点,必须分开看,因为同一段叙事里,既有真东西,也有包装。
先看真实变化。
以前很多人理解的推理,更像是一次性响应:你问一句,模型答一句。
但黄仁勋在2025年9月BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》这场访谈里讲的新推理,不只是给出一个答案,而是模型在回答前先多想一会儿。它会尝试、检索、核对,再想一轮,然后才生成答案。
他把AI需求的增长分成三层:先是预训练,然后是后训练,最后是推理时的思考。
第三层最关键。因为推理本身,从一个一次性的动作,变成了一个会持续消耗算力的过程。
这个变化不是空谈,它有财报口径支撑。英伟达管理层在2024年至少两次给过明确口径:推理已经贡献了数据中心收入约40%,甚至超过40%。
也就是说,在“推理时思考”这个概念被讲得很热之前,推理作为算力需求,就已经不是纯愿景。
这是真实发生的需求变化,不能忽略,但这件事还要再往商业上问一步。
推理时多“想一会儿”,确实会消耗更多算力,也可能带来更好的答案,但更好的答案不等于客户一定愿意长期买单。
最后还是要看这些reasoning模型,能不能在代码、客服、搜索、金融、医疗、企业工作流这些场景里,创造出足够高的增量价值,覆盖掉更高的推理成本。
所以我愿意相信推理需求正在变重,但这不等于可以盲目乐观。
真正要观察的,是客户愿不愿意为更多token带来的更高推理开销持续付费,以及这些开销能不能换来更高的生产效率或收入。
7
正因为如此,同一段叙事里贴着的另一个东西,就不能照收了:十亿倍。
在BG2 Pod那场访谈里,黄仁勋说,推理的算力需求会增长十亿倍,并且又说,自己当年讲十亿倍时还低估了。
这就是需要注意的地方。推理性质变了,是一个可以观察、可以验证的判断。
但“十亿倍”不是判断,它更像是一个标签,一个贴在真实变化上的、无法验证的数量级。你没办法去验证它,也很难去证伪它,这也就不应该成为判断公司的依据。
更要小心的是,当一个方向大致对了之后,他再回头说“当年讲十亿倍还低估了”,等于用一个很难证伪的数字,反过来追认自己的远见。
软件这条线也要单独看。
英伟达这几年一直在讲它的软件栈,AI Enterprise、NIM、Omniverse,这些可以继续观察,但不能和推理硬需求混成同一个确定结论。
推理作为算力需求,有收入数据撑着。企业软件作为一门生意能做多大,目前的验证程度,远没有硬件那么硬。
因此,两者要分开看。
8
到了主权AI,他的话就不在同一个层级了。
前面几条判断,有一个共同特征:越被追问,越落到具体的东西上。比如数据中心、TCO、每瓦token、公开基准。
但黄仁勋的发言里,还有一类判断,不能和前面几条放在同一层。
最典型的是主权AI。他在BG2 Pod那场访谈里讲到主权AI时说,每个国家都需要自己的AI能力,也把AI和能源、通信、互联网基础设施放在一起。
我想说清楚,这个方向未必错,各国确实在建自己的算力,但问题是,这类话很难被证伪。它不限定时间,不限定规模,也不限定“需要”到底是什么意思。
它和“推理占数据中心收入四成”不在一个层级上。
后者是一个带时间、带数字、可以核对的事实。前者是一句听上去很难反驳,但什么都没说死的话。
9
怎么正确读黄仁勋?我分享一下个人经验。
如果你看到他被追问时,那些越具体,越指向客户部署、工程约束、公开基准的内容,就越值得重视;越转向长期总量、国家叙事和难以证伪的大判断,就越要打折。
说到底,正是因为黄仁勋和其他业内人士不一样。
其他人预测未来,说对说错,事后才知道。但黄仁勋手里握着GTC、供应链、和所有大客户的关系,还有几百亿美元的投资。
他在2026年4月Dwarkesh Patel的访谈里其实自己说破了这一点:他会把各行业的CEO召集到一起,告诉他们这个行业会有多大,和他们一起推理,让他们像他一样推理。
他也承认,GTC的演讲被设计成一场教育和布道,目的是让整个上下游都理解、都相信将要发生什么。
这意味着,他不只是在判断未来,他还有能力下场,让一部分判断变成现实。
他说AI工厂是未来,然后真的去投资,把AI工厂建出来;他说推理需求会增长,然后真的去动员供应链准备产能。
他过去的乐观预测之所以常常应验,有一部分原因是,他能让整个生态围着他的叙事行动。
10
这也提醒我们,要尽量客观看待黄仁勋的发言。
他的发言更有价值,是因为他真能看到、也真能推动结构性的变化;但也正因为如此,我们更要分清楚:哪些是他已经看到的产业变化,哪些是他正在推动市场相信、并试图一起做成的未来。
所以我个人觉得读黄仁勋,不能把他当先知,但也不能因为他是英伟达利益相关方就急于否定他。
而是把他说的话拆开:留下那些能被追问、能被验证、能解释结构变化的部分,剥掉那些只能制造震撼、很难证伪、服务于市场扩张的部分。
总的来说,对我们研究公司而言,最关键的是面对一个既有信息、又有立场、还能推动现实的人,能不能把他的话放回具体事实和商业逻辑里重新检验。
版权声明:部分文章推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。
热门跟贴