读完黄仁勋这几年发言，我重新理解了AI 和英伟达|asic|gpu|知名企业|谷歌|黄仁勋

作者：我是阿闯

来源：阿闯走大道（ID：ChuangDaDao）

过去两三年，黄仁勋的发言实在太多了。

多到很多人听他讲AI，已经不太分得清哪些是他真看到的东西，哪些是他希望市场相信的未来。

但他讲的话依然值得认真读，因为他所处的位置太重要了。

黄仁勋是AI时代卖铲子的人。

他不押注哪一个大模型会赢，也不靠某一个AI应用赚钱。他卖算力给所有人，OpenAI、谷歌、Meta、xAI、各国政府，还有大量创业公司，只要要建AI基础设施，很多都会绕不开英伟达。

这个位置，让他能看到整个行业的算力横截面：客户到底怎么部署，卡在哪里，钱往哪个环节流，哪一种计算正在替代哪一种计算。

当然，正是因为他所处的位置，也会让他的话带来偏差。

卖铲子的人，天然希望所有人相信金矿足够大，所以当他讲市场空间有多大，长期需求是几万亿，每个国家都需要主权AI时，就要打个折扣。

这些未必全是他看到的现实，更像是他希望市场相信的未来。

这几天，我把这三年黄仁勋的发言通读了一遍，总结出了三个关键内容，也是本文要分享的重点。

第一，AI时代的计算单位，不再是一颗芯片，而是一整座数据中心。
第二，英伟达面对的竞争，不只是GPU对ASIC，而是谁能在同样的电力和机房里产出更多token。
第三，推理需求确实变了，它不再只是一次性回答，而会变成持续消耗算力的过程，但最后还要看多出来的推理开销，能不能被答案质量和生产效率的提升覆盖回来。

同时，我也读到一些比较夸张的说辞，比如“十亿倍”、“几万亿”、“每个国家都需要主权AI”这类说法，它们未必错，但太难验证，不能和上面这3点放在一起。

先说第一点，AI时代的计算机，不再是一颗芯片，而是一整座数据中心。

过去我习惯把英伟达看成一家卖GPU的公司。

顺着这个看法，观察问题的视角就变成了：GPU会不会被更便宜的ASIC替代，大客户会不会自己研芯片，芯片价格会不会随着供给增加往下走。

尽管这些问题都成立，但它们默认的是同一个前提：英伟达卖的是一颗芯片。然而，黄仁勋反复讲的，不是一颗芯片，而是一整座数据中心。

比如，2023年5月，英伟达FY2024 Q1财报电话会上，有分析师问他怎么看来自专用芯片的竞争。

他的回答没有停在芯片性能的比较上，而是说，计算机就是数据中心，数据中心就是计算机，它不是一颗芯片。

这句话当时更像是一句即兴判断，用来回应一个具体的竞争质疑。

一年后，这个判断变成了英伟达的正式语言。

2024年5月，英伟达在FY2025 Q1官方财报稿里写下，很多公司和国家正在与英伟达合作，把传统数据中心转向加速计算，并建造一种新型数据中心——AI工厂——用来生产人工智能这种新商品。

2024年8月，英伟达又在FY2025 Q2财报稿里把Blackwell放在full-stack、data center-scale platform的语境里讲，而不是只把它当成一颗GPU。

到这一步，“数据中心就是计算机”已经不只是一次反驳，而变成了英伟达描述自己产品时的默认框架。

再往后，这个框架收敛成了一句更彻底的自我定义。2026年4月，黄仁勋在Dwarkesh Patel的访谈里说，英伟达的心智模型是：输入是电子，输出是token，中间是英伟达。

这说明英伟达已经把自己放在了电力和token之间的转换环节上。

三年时间，AI工厂从黄仁勋一句回应竞争的即兴话，变成了英伟达对自己的定义，也影响着英伟达怎么组织产品和客户关系。

如果计算机变成一整座数据中心，竞争的单位也就变了。

问题就不再只是“谁的芯片更快、更便宜”，而是整套系统在同样的电力、同样的机房里，谁能产出更多token。

这也是为什么我后来再看GPU和ASIC的竞争时，不再只看芯片价格。

因为在黄仁勋这套框架里，便宜的芯片如果不能带来更高的每瓦token产出，反而可能是更贵的选择。

值得注意的是，黄仁勋也并不回避竞争。

早在2023年5月，英伟达FY2024 Q1财报电话会上，他就主动承认，竞争来自四面八方，有初创公司，有半导体大厂，也有云厂商自己研的芯片。

但他的反驳点没有落在“我的芯片更快”，而是落在两个地方：一是全栈，二是最低的总拥有成本。他还提到，别人交付一套系统到能用，可能要按月、按年算，而英伟达可以按周算。

到了2025年9月，BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》这场访谈里，他把这件事讲得更锋利。

在他的论证里，即便竞争对手把芯片定价为零，客户也未必会转向对手。

理由很简单，每个人都受电力限制。

假设你只有一定的电力，就会希望这点电力换来尽可能多的收入。如果英伟达每瓦性能是对手的两倍，同样的数据中心就能产出两倍收入。

他给的数字是，Blackwell相比上一代Hopper，性能提升约三十倍。在一吉瓦的电力里放弃三十倍的产出，机会成本太高了。高到对手就算把芯片白送，也未必补得回来。

这个论证之所以有力，是因为它把竞争的落点从“芯片标价”挪到了“每瓦产出”和“机会成本”上。

一旦这么算，ASIC便宜不便宜，就不再是唯一的问题。上线速度、集群效率、网络、软件、利用率、供电限制，全都进入了同一个公式。

2026年4月，Dwarkesh Patel在访谈里继续追问ASIC和自研芯片的问题。

对方质疑，大客户完全有能力自己写软件，绕开英伟达的护城河。黄仁勋的回应，是把InferenceMAX这个公开基准摆出来：它就在那里，对手可以来证明自己的推理成本优势，但TPU不来，Trainium不来。

他的意思是，我欢迎他们来证明自己宣称的成本优势。

他还拆了一个很常见的假设。

很多人以为自研ASIC一定更省钱，因为省掉了英伟达很高的毛利。但黄仁勋指出，ASIC本身的毛利也很高，甚至大约65%，客户仍然要付钱给ASIC供应商。

两者一比，省下的并没有想象中多。

最后一点，推理是真的变了，但推理这一点，必须分开看，因为同一段叙事里，既有真东西，也有包装。

先看真实变化。

以前很多人理解的推理，更像是一次性响应：你问一句，模型答一句。

但黄仁勋在2025年9月BG2 Pod《NVIDIA:OpenAI,Future of Compute,and the American Dream》这场访谈里讲的新推理，不只是给出一个答案，而是模型在回答前先多想一会儿。它会尝试、检索、核对，再想一轮，然后才生成答案。

他把AI需求的增长分成三层：先是预训练，然后是后训练，最后是推理时的思考。

第三层最关键。因为推理本身，从一个一次性的动作，变成了一个会持续消耗算力的过程。

这个变化不是空谈，它有财报口径支撑。英伟达管理层在2024年至少两次给过明确口径：推理已经贡献了数据中心收入约40%，甚至超过40%。

也就是说，在“推理时思考”这个概念被讲得很热之前，推理作为算力需求，就已经不是纯愿景。

这是真实发生的需求变化，不能忽略，但这件事还要再往商业上问一步。

推理时多“想一会儿”，确实会消耗更多算力，也可能带来更好的答案，但更好的答案不等于客户一定愿意长期买单。

最后还是要看这些reasoning模型，能不能在代码、客服、搜索、金融、医疗、企业工作流这些场景里，创造出足够高的增量价值，覆盖掉更高的推理成本。

所以我愿意相信推理需求正在变重，但这不等于可以盲目乐观。

真正要观察的，是客户愿不愿意为更多token带来的更高推理开销持续付费，以及这些开销能不能换来更高的生产效率或收入。

正因为如此，同一段叙事里贴着的另一个东西，就不能照收了：十亿倍。

在BG2 Pod那场访谈里，黄仁勋说，推理的算力需求会增长十亿倍，并且又说，自己当年讲十亿倍时还低估了。

这就是需要注意的地方。推理性质变了，是一个可以观察、可以验证的判断。

但“十亿倍”不是判断，它更像是一个标签，一个贴在真实变化上的、无法验证的数量级。你没办法去验证它，也很难去证伪它，这也就不应该成为判断公司的依据。

更要小心的是，当一个方向大致对了之后，他再回头说“当年讲十亿倍还低估了”，等于用一个很难证伪的数字，反过来追认自己的远见。

软件这条线也要单独看。

英伟达这几年一直在讲它的软件栈，AI Enterprise、NIM、Omniverse，这些可以继续观察，但不能和推理硬需求混成同一个确定结论。

推理作为算力需求，有收入数据撑着。企业软件作为一门生意能做多大，目前的验证程度，远没有硬件那么硬。

因此，两者要分开看。

到了主权AI，他的话就不在同一个层级了。

前面几条判断，有一个共同特征：越被追问，越落到具体的东西上。比如数据中心、TCO、每瓦token、公开基准。

但黄仁勋的发言里，还有一类判断，不能和前面几条放在同一层。

最典型的是主权AI。他在BG2 Pod那场访谈里讲到主权AI时说，每个国家都需要自己的AI能力，也把AI和能源、通信、互联网基础设施放在一起。

我想说清楚，这个方向未必错，各国确实在建自己的算力，但问题是，这类话很难被证伪。它不限定时间，不限定规模，也不限定“需要”到底是什么意思。

它和“推理占数据中心收入四成”不在一个层级上。

后者是一个带时间、带数字、可以核对的事实。前者是一句听上去很难反驳，但什么都没说死的话。

怎么正确读黄仁勋？我分享一下个人经验。

如果你看到他被追问时，那些越具体，越指向客户部署、工程约束、公开基准的内容，就越值得重视；越转向长期总量、国家叙事和难以证伪的大判断，就越要打折。

说到底，正是因为黄仁勋和其他业内人士不一样。

其他人预测未来，说对说错，事后才知道。但黄仁勋手里握着GTC、供应链、和所有大客户的关系，还有几百亿美元的投资。

他在2026年4月Dwarkesh Patel的访谈里其实自己说破了这一点：他会把各行业的CEO召集到一起，告诉他们这个行业会有多大，和他们一起推理，让他们像他一样推理。

他也承认，GTC的演讲被设计成一场教育和布道，目的是让整个上下游都理解、都相信将要发生什么。

这意味着，他不只是在判断未来，他还有能力下场，让一部分判断变成现实。

他说AI工厂是未来，然后真的去投资，把AI工厂建出来；他说推理需求会增长，然后真的去动员供应链准备产能。

他过去的乐观预测之所以常常应验，有一部分原因是，他能让整个生态围着他的叙事行动。

这也提醒我们，要尽量客观看待黄仁勋的发言。

他的发言更有价值，是因为他真能看到、也真能推动结构性的变化；但也正因为如此，我们更要分清楚：哪些是他已经看到的产业变化，哪些是他正在推动市场相信、并试图一起做成的未来。

所以我个人觉得读黄仁勋，不能把他当先知，但也不能因为他是英伟达利益相关方就急于否定他。

而是把他说的话拆开：留下那些能被追问、能被验证、能解释结构变化的部分，剥掉那些只能制造震撼、很难证伪、服务于市场扩张的部分。

总的来说，对我们研究公司而言，最关键的是面对一个既有信息、又有立场、还能推动现实的人，能不能把他的话放回具体事实和商业逻辑里重新检验。

读完黄仁勋这几年发言，我重新理解了AI 和英伟达

热搜

热门跟贴

热搜

热门跟贴

相关推荐

欢迎进入3T时代——算力主权、智能经济与灵识社会的范式革命

一文看懂芯片产业链：谁在撑起AI时代的算力帝国

英伟达CEO黄仁勋：Token就是资产、已经成为获利的营收单位

2026，国产AI芯片，跨越天堑：从“推理”走向“训练”

虎嗅【作·嗅之星】周榜第319～320期

黄仁勋：AI时代“孩子学什么专业并不重要”

黄仁勋：高通手机芯片做得非常好，买他们的股票

100多万人围观！没头没腿，神似充电宝的机器人全网走红？

Nvidia都在点赞的LoopWM世界模型

破天荒！DeepSeek V4正式版居然要涨价，而且翻着倍地涨

黄仁勋：华为太强了！

超仿生人形机器人来了，售价11.98万起

“框架”比“模型”本身对Agent成功的影响大7倍！“推理成本”和“部署效率”才是创业公司的核心竞争优势

黄仁勋：算力就是收入，AI时代正在全速前进

AI开始等不起云了

Anthropic推出Claude Science：AI开始接管科研流水线

Rubin缩水背后，英伟达的CUDA神话正在松动

引入应用人工智能技术 “硅基员工”不替代人力 而是协同实现100%的客户服务

旧手机除了放转转，还能放数据中心提供算力

蒂尔、辛顿、李飞飞齐站台：AI芯片初创Etched估值达50亿美元

引入应用人工智能技术 “硅基员工”不替代人力而是协同实现100%的客户服务