公众号记得加星标⭐️,第一时间看推送不会错过。
英伟达是人类文明史上最重要、最具影响力的公司之一,也是人工智能革命的引擎。英伟达的成功很大程度上归功于黄仁勋作为领导者、工程师和创新者所展现出的强大意志力和诸多卓越的决策。
近日,Lex Fridman再度采访了黄仁勋,谈到了很多方面。
以下为采访原文速记,仅供参考
极致的协同设计和机架级工程
F(Lex Fridman):我认为可以公平地说,NVIDIA 长期以来的成功之道在于打造尽可能最好的 GPU,现在依然如此,但你们已经将目标扩展到 GPU、CPU、内存、网络、存储、电源散热、软件、机架本身、你们发布的 pod,甚至数据中心的极致协同设计。那么,我们来谈谈极致协同设计。对于一个包含如此多复杂组件和设计变量的系统来说,协同设计中最难的部分是什么?
Jensen Huang:是的,谢谢你的提问。首先,之所以需要极致的协同设计,是因为问题已经无法用一台计算机或单个GPU来加速解决。你试图解决的问题是,你希望速度比增加的计算机数量更快。假设你增加了1万台计算机,但你希望速度提升一百万倍。那么,突然之间,你必须对算法进行拆分、重构,对管道、数据和模型进行分片。现在,当你以这种方式分散问题时——不仅仅是扩展问题规模,而是分散问题本身——所有因素都会相互干扰。
这就是阿姆达尔定律的问题:某项任务的加速程度取决于它在整个工作负载中所占的比例。例如,如果计算任务占整个问题的 50%,即使我将计算速度无限提升一百万倍,也只能使整个工作负载的加速程度翻倍。现在,你不仅需要分布式计算,还需要对流水线进行分片(shard )。此外,你还需要解决网络问题,因为所有这些计算机都是连接在一起的。因此,在我们这种规模的分布式计算中,CPU 是个问题,GPU 是个问题,网络是个问题,交换机也是个问题。将工作负载分配到所有这些计算机上也是个问题。
这的确是一个极其复杂的计算机科学问题。因此,我们必须调动所有技术手段。否则,我们只能线性扩展,或者根据摩尔定律的能力进行扩展,而摩尔定律的扩展速度已经大幅放缓,因为丹纳德定律的扩展速度已经下降。
Jensen 如何运营英伟达
F:我相信这里面肯定有权衡取舍。而且这里面涉及的学科完全不同。我相信你们每个领域都有专家,比如高带宽内存、网络和NVLink、网卡、光模块和铜缆、电源传输、散热等等。我的意思是,每个领域都有世界级的专家。你们怎么才能把他们聚在一起,共同探讨解决方案呢?
Jensen Huang:是的,这就是我员工人数众多的原因。
你能给我讲讲专才和通才的工作流程吗?比如,当你知道需要把哪些东西放进货架上时,该如何组装货架?整个设计过程是怎样的?
是的。第一个问题是:什么是极致协同设计?我们正在对整个软件栈进行优化,从架构到芯片,再到系统、系统软件、算法和应用程序。这是其中一层。你我刚才谈到的第二点,则超越了CPU、GPU、网络芯片、纵向扩展交换机和横向扩展交换机。当然,你还得考虑电源、散热等等,因为所有这些计算机都非常耗电。它们虽然工作量很大,而且能效很高,但总体而言仍然消耗大量电力。所以,这是第一点。第一个问题是,它到底是什么?
二个问题是,为什么?我们刚才也讨论过原因,你知道,你想分散工作负载,这样才能获得比单纯增加计算机数量更大的收益。然后,第三个问题是,如何做到?
这就是这家公司的奇迹所在。你知道,设计电脑时,你必须要有操作系统。设计公司时,首先应该思考的是公司想要生产什么。我见过很多公司的组织结构图,它们看起来都一样。汉堡包式的组织结构图、软性组织结构图、汽车公司式的组织结构图,都千篇一律。这让我很费解。你知道,公司的目标在于成为生产产品的机器、机制和系统。而这个产品就是我们想要创造的产品。公司的架构也应该反映其所处的环境。
它几乎直接告诉你应该如何管理这个组织。我的直接下属有60人。你知道,我不可能和他们一对一谈话,因为这根本不可能。如果你想把工作做好,就不能让60个人同时工作。
F:所以你还有 60 份报告。你还有跨部门的。
Jensen Huang:是的,更多。
F:不仅如此。而且大多数明星至少都与工程学有一定联系。
Jensen Huang:几乎所有人。有内存专家,有CPU专家,有光驱专家。所有——
F:那真是难以置信。
Jensen Huang:是的,GPU以及架构、算法、设计——
F:所以,你们要时刻关注整个技术栈,并且需要就整个技术栈的设计进行深入的讨论?
Jensen Huang:而且,任何对话都不是一个人的。这就是为什么我不做一对一会议。我们会提出问题,然后大家一起解决。你知道,因为我们采用的是极致的协同设计。实际上,公司一直都在采用极致的协同设计。
F:所以,即使你谈论的是某个特定组件,比如散热、网络,所有人都会听吗?
Jensen Huang:对,没错
F:他们可以提出这样的意见:“嗯,这种电力分配方式行不通。这种方式不行——”
Jensen Huang:当然可以
F:“……这对内存不起作用。这对这个不起作用。”
Jensen Huang:没错。谁想置身事外,就置身事外吧。你明白我的意思吗?原因在于,工作人员知道什么时候该注意。有些事他们本来可以参与,但他们没有,他们本可以指出来,你知道吗?所以,他们就说:“嘿,来吧,咱们进去看看。”
F:正如您所说,NVIDIA 是一家不断适应环境的公司。那么,您认为环境是从什么时候开始发生变化,NVIDIA 又是如何悄然做出调整的呢?……从早期 GPU 用于游戏,到早期深度学习革命,再到如今我们开始将其视为人工智能工厂?NVIDIA 的业务是什么?它生产人工智能;让我们建造一座生产人工智能的工厂。
Jensen Huang:我可以系统地分析这个问题。我们最初是一家加速器公司。但加速器的问题在于其应用领域过于狭窄。它的优势在于针对特定任务进行了高度优化。你知道,任何专业公司都具备这种优势。高度专业化的问题在于,当然,你的市场覆盖范围会更窄,但这本身并没有什么问题。问题在于,市场规模也决定了你的研发能力。而你的研发能力最终决定了你在计算机领域可能产生的影响力。因此,当我们最初作为一家非常专业的加速器起步时,我们始终清楚这将是我们的第一步。
我们必须找到一条通往加速计算的道路。但问题在于,一旦成为一家计算公司,业务范围就会过于宽泛,从而削弱我们的专业优势。我把两个实际上存在根本矛盾的词放在一起。我们越是成为一家优秀的计算公司,我们在专业领域的专长就越弱。我们越是专注于特定领域,我们进行整体计算的能力就越弱。因此,我特意把这两个词放在一起,公司必须找到一条真正狭窄的道路,一步一步地拓展我们的计算能力,但又不能放弃我们最重要的专业领域。好的,所以,我们在加速计算之外迈出的第一步是发明了一种可编程像素着色器。
所以,这是我们迈向可编程性的第一步,也是我们进入计算领域的第一步。我们做的第二件事是创建了着色器,并加入了FP32。这一步,即符合IEEE标准的FP32,是计算领域迈出的一大步。正因如此,所有从事流处理器和其他类型数据流处理器开发的人员都发现了我们。他们说:“嘿,突然之间,我们或许可以使用这款计算能力极其强大的GPU了,而且它现在符合IEEE标准。”
我可以把我之前在CPU上编写的软件,尝试用GPU来运行。这促使我们开发了基于FP32的C语言,我们称之为Cg。Cg最终引领我们走向了CUDA。CUDA,一步一步地……嗯,把CUDA集成到GeForce显卡上,这是一个非常非常艰难的战略决策,因为它让公司损失了巨额利润,而我们当时根本负担不起。但我们还是这么做了,因为我们想成为一家计算机公司。一家计算机公司必须拥有自己的计算架构。而计算架构必须与我们生产的所有芯片兼容。
F:你能详细解释一下这个决定吗?所以,在GeForce显卡上加入CUDA,是你们负担不起的?你能解释一下这个决定吗?为什么当初你们会如此大胆地选择这样做?你能解释一下这个决定吗?
Jensen Huang:是的,太好了。那……我认为那是第一个最接近生死存亡的战略决策。
对于那些不了解情况的人来说,剧透一下,这最终成为了公司有史以来最英明的决定之一。CUDA 最终成为了人工智能基础设施领域计算能力的强大基石。所以,所以……我只是想交代一下背景。事实证明,这是一个明智的决定。
是的,事实证明这是个明智的决定。我想……事情是这样的。我们发明了 CUDA,它扩展了我们加速器能够加速的应用范围。问题是,我们如何吸引开发者使用 CUDA?因为计算平台的核心在于开发者。开发者选择某个计算平台,并非仅仅因为它能实现一些有趣的功能,而是因为其庞大的用户群。因为开发者和其他人一样,都希望开发出能够触达大量用户的软件。所以,用户群实际上是架构中最重要的一部分。架构本身可能会招致大量的批评。
例如,没有任何一种架构比 x86 架构招致了更多批评……你知道,它被认为是一种不够优雅的架构,但它却是当今的标志性架构。这说明,事实上,许多由世界上最杰出的计算机科学家精心设计的 RISC 架构,尽管架构精美,却大多以失败告终。所以我举了两个例子,一个优雅,另一个则几乎称不上美观,但 x86 架构却存活了下来,原因在于——
F:安装基础至关重要
Jensen Huang:安装基础决定了架构。不是……其他一切都是次要的,明白吗?当时确实存在其他架构。CUDA 出现了,OpenCL 也出现了。你知道,还有其他几种竞争架构。但我们做出的明智决定是:“嘿,归根结底,关键在于安装基础,以及我们如何才能以最佳方式将新的计算架构推向市场。” 到那时,GeForce 已经取得了成功。
我们当时每年已经卖出数百万块GeForce GPU,于是我们说:“我们应该把CUDA集成到GeForce显卡里,装进每一台PC,不管用户用不用,都把它作为拓展用户群的起点。”与此同时,我们开始吸引开发者,我们走进大学,写书,开课,把CUDA推广到各个角落。最终人们会发现……当时,PC是主要的计算工具。还没有云计算,我们可以把超级计算机送到每个学校的研究人员、科学家、每个工程学院的学生手中,最终奇迹就会发生。
问题在于,CUDA大幅增加了我们GPU的成本,而GPU是消费级产品,成本增加之大,几乎吞噬了公司所有的毛利润。当时,公司的市值大概是……呃,大概80亿美元吧?或者60亿、70亿美元左右。CUDA发布后,我意识到它会增加很多成本,但我们仍然坚信它的价值。结果,我们的市值跌到了15亿美元左右。我们一度陷入低谷,然后慢慢地艰难复苏,但我们始终坚持在GeForce平台上使用CUDA。我常说,NVIDIA是GeForce一手打造的,因为正是GeForce将CUDA带给了所有人。
研究人员、科学家们在GeForce显卡上发现了CUDA,因为他们都是游戏玩家。而且他们中的许多人自己组装电脑。在大学实验室里,他们中的许多人用电脑组件搭建集群。所以,你知道,这就是我们起步的经过。
F:然后,它成为了深度学习革命的平台和基础。
Jensen Huang:那也是一个非常棒的见解,是的。
F:你还记得那个决定命运的时刻吗……那些会议是什么样的?那些讨论是什么样的?作为一个公司,我们要做决定,要冒一切风险?
Jensen Huang:我必须向董事会明确说明我们的目标,管理团队也知道我们的毛利率会大幅下降。你可以想象一下,如果GeForce承担了CUDA的重担,玩家们既不会欣赏它,也不会为此买单,那会是怎样一番景象。你知道,他们只会支付固定的价格,成本多少对他们来说无关紧要。所以……你知道,我们的成本增加了50%,这消耗了……而我们原本的毛利率只有35%,所以……这是一个非常艰难的决定。但你可以想象,未来这项技术可能会应用到工作站和超级计算机领域,在这些领域,或许我们能获得更高的利润。
所以你可以通过理性分析来证明自己能够负担得起,但这仍然需要……需要十年时间。
F:但是,这更像是与董事会沟通并说服他们,而你从心理层面来说……随着英伟达不断进行大胆的押注,预测未来,并且在某种程度上,尤其是在现在,定义了未来。所以我几乎是在寻求关于你们公司如何做出这些决策、如何实现飞跃的智慧……
Jensen Huang:首先,我的很多想法都源于好奇心。在某个时刻,我会形成一套逻辑体系,让我确信某个结果一定会发生,这件事一定会发生。所以我会在心里相信它,你知道,当我心里相信的时候,事情就是这样。你想象出一个未来,而这个未来如此令人信服,它就一定会发生。当然,这中间会经历很多苦难,但你必须相信你所相信的。
F:所以,你,你,你构想未来——……然后你基本上是从某种工程角度将其变为现实?
Jensen Huang:是的。你会思考如何实现目标。你会思考它存在的意义。你知道,我会思考……我们这里所有人都会思考这个问题。管理团队也会思考这个问题。所有和我在一起的人……我们花了很多时间思考这个问题。接下来要说的可能是一种技能,你知道,在领导层中,领导者常常保持沉默,或者他们了解了一些事情,然后就发布一些宣言,新的一年开始了,不知怎么的,到了年底,明年,我们就会有一个全新的计划。大规模裁员,大规模组织变革,新的使命宣言……全新的标志,你知道,诸如此类。
我从来不那样做事。当我了解到某件事,并且它开始影响我的思考方式时,我会非常清楚地告诉身边的每个人,这件事很有意思,它会产生影响,它会带来一些改变。我会一步一步地思考问题。很多时候,我已经有了自己的想法,但我会抓住每一个机会——外部信息、新的见解、新的发现、新的工程突破、新的里程碑——我会利用这些机会来影响其他人的信念体系。我每天都在这样做。我与董事会这样做,与管理团队这样做,与员工这样做。
我正在努力塑造他们的信念体系,这样,当我宣布“嘿,我们收购Mellanox吧”的时候,每个人都会毫不犹豫地认为我们绝对应该这么做。就像我宣布“嘿,伙计们,我们全力投入深度学习吧”那天一样,让我来解释一下原因。我已经在公司内部各个部门铺垫了一番。每个部门、每个人,很多人可能都听到了全部内容。当然,公司里的大多数人都听到了部分内容。所以,当我正式宣布的时候,大家基本上都认同了其中的大部分内容。
在很多方面,我喜欢宣布这些事情,我猜员工们会说:“老黄,你怎么才宣布?” 事实上,我一直在塑造他们的信念体系,也就是他们的领导力。有时候,这看起来像是在幕后领导,但实际上,我一直在潜移默化地影响他们,直到我宣布那天,他们百分之百地认同。但这正是你想要的。你想让每个人都参与进来。否则,如果我们宣布要全面投入深度学习,大家都会问:“你在说什么?” 你知道,如果你宣布要全力投入,你的管理团队、董事会、员工、客户都会问:“这到底是怎么回事?”
你知道,这简直太疯狂了。”所以,GTC效应,如果你回顾过去,看看那些主题演讲,你会发现我不仅在塑造行业合作伙伴的信念体系,而且还在利用这种信念体系来塑造我自己的员工的信念体系。所以,当我宣布一些事情的时候,比如我们刚刚宣布的Grok,我们已经晚了……我已经谈论这些基础建设两年半了。你回过头来看,你会惊呼:“我的天哪,他们已经谈论了两年半了!”所以我一直在一步一步地打基础,这样当时机成熟,你宣布的时候,每个人都会问:“你知道吗,你到底花了多长时间?”
F:但这不仅仅局限于公司内部。你正在塑造整个格局,更广阔的全球创新格局。就像,当你把这些想法付诸实践时,你实际上是在将现实变为现实。
Jensen Huang:我们不造电脑。实际上,我们也不建云。我们不……结果发现,我们是一家计算平台公司。所以没人能从我们这里买到任何东西。这很奇怪。你知道,我们采用垂直设计、垂直整合的方式来设计和优化,但之后我们会将整个平台的每一层都开放,以便集成到其他公司的产品、服务、云平台、超级计算机和OEM电脑中。所以神奇的是,如果我不先说服他们,我就无法开展我的工作。因此,GTC的大部分内容都是在描绘一个未来,等到……我的产品准备就绪时,他们会问:“你们怎么花了这么长时间?”
AI scaling laws
F:是的。你一直以来都相信scaling laws,广义上的scaling laws。那么你现在还相信scaling laws吗?
Jensen Huang:当然,而且我们现在有更多的scaling laws了。
F:所以,我认为您已经概述了四个方面:训练前(Pre-training)、训练后(post-training)、测试时间(test time)和智能体扩展(agentic scaling)。当您思考未来、长远未来和近期未来时,您认为最令您担忧、最让您夜不能寐、必须克服才能持续扩展的障碍是什么?
Jensen Huang:我们可以回顾一下人们最初认为的阻碍因素。一开始,我们面临的是……预训练scaling law。人们当时认为(这种想法不无道理),我们拥有的数据量,尤其是高质量数据量,会限制我们所能达到的智能水平。而这条scaling law确实非常重要。模型越大,相应的数据量就越多,人工智能也就越智能。这就是预训练。伊利亚·苏茨克维尔(Ilya Sutskever)曾说过:“我们没有足够的数据了”,或者类似的话。“预训练已经结束了”,或者类似的话。整个行业都恐慌了,认为人工智能的末日到了。当然,这显然是错误的。
我们将持续扩大用于训练的数据量。其中很多数据可能是合成的,这也让人们感到困惑,你知道吗?人们没有意识到的是,他们似乎忘记了我们用来训练、互相学习、互相启发的大部分数据都是合成的。之所以说是合成的,是因为它并非源于自然。它是你创造的,我使用它,我修改它,增强它,我重新生成它,然后其他人使用它。因此,我们现在已经达到了这样的水平:人工智能能够获取真实数据,对其进行增强……改进,并合成生成海量数据。
后训练的这一部分规模会持续扩大,因此我们能够使用的由人类生成的数据量会越来越小。用于训练模型的数据量将继续扩大,直到我们不再受限于……训练不再受限于……数据现在受限于计算能力。原因在于,大部分数据都是合成数据。接下来是测试阶段,我还记得有人跟我说:“推理?哦,那很简单。预训练,那才难。”人们谈论的是庞大的系统。推理肯定很简单。所以推理芯片将会是很小的芯片,而且——
你知道,它们不一样,它们不像英伟达的芯片。哦,那些芯片会很复杂也很贵,而且,你知道,我们可以制造……而且,在未来,推理将成为最大的市场,它会变得很容易,我们会把它商品化。你知道,每个人都可以制造自己的芯片。而且,这对我来说一直都不合逻辑,因为推理就是思考,而我认为思考很难。思考比阅读难得多。
你知道,预训练只是死记硬背和归纳总结,以及寻找关系中的模式。你只是不停地阅读,而不是思考、推理、解决问题,也不是将未曾探索过的经验、新的经验分解成……分解成可解决的部分,然后我们再根据这些部分,通过第一性原理推理,或者通过之前的例子和经验,或者仅仅是探索和搜索,尝试不同的方法。整个测试时间尺度推理的过程,实际上都是关于思考的。它关乎推理,关乎计划,关乎搜索,关乎……
那么,这怎么可能算得上轻量级计算呢?我们的判断完全正确。你知道,测试阶段的扩展计算量非常大。那么问题来了,好了,现在我们已经到了推理阶段,也达到了测试阶段的扩展,接下来呢?显然,我们现在创建了一个智能体,这个智能体拥有我们开发的大型语言模型。但在测试阶段,这个智能体系统会进行研究,访问数据库,使用各种工具,其中最重要的功能之一就是派生出大量的子智能体。这意味着我们现在需要创建庞大的团队。相比于我自己扩展规模,通过雇佣更多员工来扩展英伟达要容易得多。
因此,下一个扩展定律是智能体scaling laws。它有点像人工智能的倍增。人工智能倍增意味着我们可以随心所欲地快速生成智能体。所以,你知道,我……你知道,我有四个scaling laws。随着我们使用智能体系统,它们会产生更多的数据,也会产生大量的经验。其中一些经验我们会说:“哇,这真不错。我们应该记住它。”
最终,这个数据集会一直回到预训练阶段。我们会记住它并进行泛化。然后,我们会对其进行精炼和微调,进入后训练阶段。之后,我们会通过测试进一步增强它,最终,智能系统会将它应用到行业中。如此循环往复,永无止境。归根结底,智能的发展取决于一个因素,那就是计算能力。
F:但这里有个棘手的问题需要预先考虑和预测,那就是某些组件需要不同的硬件才能真正发挥最佳性能。所以你必须预测人工智能创新将把我们引向何方。例如,混合使用——
Jensen Huang:例如,人工智能模型架构大约每六个月就会出现一次,对吧?系统架构和硬件架构则大约每三年出现一次。所以你需要预测未来两三年可能发生的事情。有几种方法可以做到这一点。首先,我们可以进行内部研究,这也是我们开展基础研究和应用研究的原因之一。
我们自主研发模型,因此我们拥有丰富的实践经验。这正是我所说的协同设计的一部分。我们也是全球唯一一家与世界上所有人工智能公司都有合作的人工智能公司。我们会尽最大努力了解人们面临的挑战。
F:所以你正在倾听整个行业,特别是人工智能实验室的传言。
Jensen Huang:没错。你得倾听并向所有人学习。而且……最后一点是,架构要灵活,能够适应变化,顺应潮流。CUDA 的优势之一在于,一方面,它是一个强大的加速器;另一方面,它又非常灵活。因此,在专业化(否则我们就无法加速 CPU)和通用化(以便适应不断变化的算法)之间取得平衡至关重要。这正是 CUDA 一方面如此强大,另一方面我们又不断对其进行改进的原因。
我们现在使用的是 CUDA 13.2,因此我们的架构也在快速演进,以跟上现代算法的发展。例如……当混合专家模型出现时,我们用 NVLink 72 取代了 NVLink 8。现在,我们可以将一个包含 4 万亿甚至 10 万亿个参数的模型放在同一个计算域中运行,就像它只在一个 GPU 上运行一样。我之前说过,大家可能没注意到,但如果你看看 Grace Blackwell 机架的架构,就会发现它完全专注于一件事:处理 LLM。而仅仅一年之后,你就看到了 Vera Rubin 机架。它配备了存储加速器,搭载了名为 Vera 的全新强大 CPU,并配备了 Vera Rubin 和 NVLink 72 来运行 LLM。
它还新增了一个名为 Rock 的机架。因此,整个机架系统与之前的完全不同,它包含了所有这些新组件。原因在于,之前的机架系统是为运行 MoE 大型语言模型和推理而设计的,而这个机架系统则是为运行智能体以及智能体与工具的直接交互而设计的。
显然,这套系统的设计肯定是在 Claude Code、Codex 和 OpenClaw 出现之前完成的。所以本质上,你是在预见未来。而这一切,又源于什么呢?源于那些耳语,源于对所有现状的理解——
F:这门艺术是关于什么的?
Jensen Huang:不,其实没那么复杂。你只要好好想想就行了。首先,你只要好好想想就行了。不管怎样,不管发生什么,为了让这个大型语言模型成为一个数字员工……我们就用这个比喻吧。假设我们想让这个语言模型成为一个数字员工。它需要做什么呢?它必须能够访问真实数据。那就是我们的文件系统。它必须能够进行研究。它不可能无所不知。我们也没有……我不想等到这个人工智能变得无所不知,无所不能,包括过去、现在和未来,才让它发挥作用。所以,我不如让它去做研究。这很显而易见;如果它想帮我,就必须使用我的工具。
你知道,很多人会说:“人工智能会彻底摧毁软件。我们不再需要软件了。我们甚至不再需要工具了。”这太荒谬了。我们来做个思想实验。你可以坐在那里,喝杯威士忌,好好想想这些问题,答案就会变得显而易见。比如说,如果我在未来十年内创造出我们能想象到的最神奇的智能体,假设它是一个人形机器人。如果这个人形机器人真的被创造出来,它更有可能走进我的房子,使用我现有的工具来完成它需要做的工作吗?
或者,这只手一会儿变成一把十磅重的锤子,一会儿又变成一把手术刀,为了烧开水,它还能从指尖发射微波?或者,它更有可能直接使用微波炉?第一次用微波炉的时候,它可能不知道怎么用。不过没关系。它连着互联网。它会阅读微波炉的使用手册,读完之后,瞬间就成了专家。然后它就能用了。所以我觉得……我刚才描述的,实际上几乎涵盖了OpenClaw的所有特性。
你知道,它会使用各种工具,会访问文件,还能进行研究。它有一个I/O子系统。当你完成对它的推理,以这种方式进行推理之后,你会说:“我的天哪,它对未来计算的影响是极其深远的。” 原因在于,我认为我们刚刚重新发明了计算机。然后你可能会问:“好吧,我们什么时候推理过这一点?我们什么时候推理过OpenClaw?” 如果你看看我在GTC上使用的OpenClaw示意图,你会发现它早在两年前就出现了。确切地说,两年前的GTC上,我谈论的智能体系统与今天的OpenClaw完全吻合。当然,这一切的发生离不开诸多因素的共同作用。
首先,我们需要 Claude 和 GPT 以及所有这些模型达到一定的水平。所以,它们的创新、突破和持续进步至关重要。当然,之后还需要有人创建一个足够强大、足够完善的开源项目,供我们所有人使用。我认为 OpenClaw 之于智能体系统,正如 ChatGPT 之于生成系统。我认为这意义非凡。
F:是的,这确实是一个非常特殊的时刻。我不太确定为什么它吸引了全世界如此多的关注,但它确实做到了,甚至超过了Claude Code和Codex等等。
Jensen Huang:因为消费者能够够得着。
F:拥有如此强大的技术,确实存在着非常严重且复杂的安全问题:如何交出你的数据,让他们能够做有用的事情?但这同时也伴随着一些可怕的后果。而我们,作为一个文明,作为个体,作为一个文明整体,都在努力寻找合适的平衡点。
Jensen Huang:是的,我们立即着手处理,并派了一批安全专家过来。我们开发了一个叫做 OpenShell 的东西,它已经集成到 OpenClaw 中了。
我们赋予您三项权限中的两项。代理系统可以访问敏感信息、执行代码并进行外部通信。如果我们在任何时候只赋予您这三项权限中的两项,而不是全部三项,就能确保安全。在这两项权限的基础上,我们还根据企业授予您的权限提供访问控制。然后,我们将其连接到所有企业都已拥有的策略引擎。因此,我们将尽最大努力帮助 OpenClaw 成为一个更强大的工具。
AI scaling laws的最大障碍
F:您刚才精彩地解释了我们过去是如何克服那些我们原本以为会成为阻碍的难题的。但现在展望未来,既然智能体将无处不在,您认为未来可能出现的阻碍是什么?显然,我们需要计算能力。那么,这种扩展的障碍又是什么呢?
Jensen Huang:功耗固然重要,但并非唯一需要考虑的问题。正因如此,我们才如此大力推进极限协同设计,力求每年将每瓦每秒的token产量提升几个数量级。过去十年,摩尔定律本应使计算能力提升约100倍,而我们却实现了百万倍的飞跃。我们将继续通过极限协同设计来实现这一目标。能源效率,也就是每瓦性能,直接影响着公司和工厂的收益。我们将竭尽全力,不断降低token成本。
你知道,我们的电脑价格在上涨,但我们的token生成效率提升速度远超电脑价格,因此token成本正在下降。它每年都在下降一个数量级。
所以,功率是个很有意思的问题。要解决功率瓶颈,就要想办法提高每瓦每秒产生的token数量,从而不断提升效率。当然,问题在于如何获得更多功率。我们应该获得更多的电能。
供应链
F:这确实是个很复杂的问题。您之前谈到过小型模块化核电站。关于能源,有很多不同的想法。这些问题是不是让您夜不能寐?比如人工智能供应链中的瓶颈,像ASML的EUV光刻机、台积电的先进封装技术(如CoWoS)以及SK海力士的高带宽内存?
Jensen Huang:我们一直在努力,也一直在为此奋斗。历史上没有任何一家公司能像我们这样,在保持增长的同时还能加速增长。这简直令人难以置信。人们甚至很难理解这一点。在整个人工智能计算领域,我们的市场份额正在不断扩大。因此,供应链,包括上游和下游,对我们至关重要。我花了很多时间向所有与我合作的CEO们解释:哪些因素将推动增长持续甚至加速?这也是为什么我右边的所有人几乎都是整个IT行业上游和下游基础设施行业的CEO的原因之一。
他们全都来了……有好几百位CEO。我想,从来没有哪个主题演讲能吸引这么多CEO参加。一方面,我要向他们介绍我们目前的业务状况,以及近期内的增长动力和正在发生的事情。我还要阐述我们下一步的发展方向,以便他们能够利用所有这些信息和动态因素来指导他们的投资决策。我向他们介绍情况的方式,就像我向自己的员工介绍情况一样。
存储
Jensen Huang:当然,之后我还会亲自去拜访他们,确保他们明白:“嘿,听着,我想让你们知道,这个季度、明年、后年,这些事情将会发生。” 如果你看看DRAM行业的CEO们——当时全球排名第一的DRAM是数据中心CPU使用的DDR内存。大约三年前,我成功说服了几位CEO,尽管当时HBM内存的使用率很低,几乎只在超级计算机上使用,但它未来将成为数据中心的主流内存。起初这听起来很荒谬,但几位CEO相信了我,并决定投资研发HBM内存。
还有一种存储器用在数据中心里相当奇怪:就是我们手机里用的那种低功耗存储器。我们希望他们能把这种存储器改造一下,用在数据中心的超级计算机上。他们问:“手机存储器用在超级计算机上?” 我向他们解释了原因。你看这两种存储器,LPDDR5 和 HBM4。它们的容量简直惊人。这三种存储器都创下了历史纪录,而且它们所在的公司都有 45 年的历史了。所以,你知道,我的工作之一就是传播知识、塑造理念、启发灵感。
F:所以你不仅是在描绘未来,或许还能激励英伟达和公司里的其他工程师,你更是在描绘未来的供应链。所以你正在和台积电、阿斯麦等公司进行对话。
Jensen Huang:上游,下游。
F:是啊,整个过程都是如此。我的意思是,这太……整个半导体行业涉及太多极其复杂的工程技术,供应链的复杂性、零部件的数量之多,都让人感到害怕,但它最终还是运转了。
Jensen Huang:没错,关键在于深厚的科学技术、精湛的工程技术、卓越的制造工艺,以及大量的机器人制造环节。但我们仍然有数百家供应商为我们那拥有130万个组件的机架提供技术支持。每个机架包含130万个组件。Vera Rubin机架共有200家供应商。
F:所以,有趣的是,你并没有把这件事列为让你夜不能寐的障碍之一。
Jensen Huang:……是啊,你看?我可以睡觉了,因为我已经把它完成了。我说,“好了,”你知道,我可以睡觉了,然后我想,“嗯,我们来想想,什么对我们来说最重要?”因为我们得好好想想。因为我们把系统架构从你还记得的最初的DGX-1改成了NVLink-72机架式计算……这……这意味着什么?这对软件意味着什么?对工程意味着什么?对我们的设计和测试方式意味着什么?对供应链又意味着什么?嗯,其中一点就是,我们把数据中心的超级计算机集成转移到了供应链中的超级计算机制造环节。
如果你要这么做,你也必须意识到你将要搬迁……假设你要建造的数据中心总占地面积为50吉瓦,并且所有超级计算机都要同时运行,而制造这50吉瓦的超级计算机需要一周时间,那么在供应链中,这些超级计算机每周都需要1吉瓦的电力。因此,我们需要供应链增加电力供应,以便在发货前完成超级计算机的制造和测试。
嗯,NVLink-72 实际上是在供应链中组装超级计算机,每个机架一次就要运送两三吨。以前它们是分部件运输的,我们在数据中心内部组装。但现在这不可能了,因为 NVLink-72 的密度太高了。这就是一个例子。我得飞到供应链里,去见我的合作伙伴,跟他们说:“嘿,”我说,“猜猜怎么着?我要这么做……我们以前就是这么组装 DGX 的。现在我们要用这种方式组装。这样会好得多,因为我们需要它们来进行推理。” 推理市场正在崛起。推理的转折点即将到来。这将是一个巨大的市场。
所以我首先向他们解释事情的来龙去脉,以及事情发生的原因,然后要求他们每人进行数十亿美元的资本投资。因为他们信任我,我也非常尊重他们,所以我给了他们充分的机会提问,花时间向他们解释,并进行逻辑推理。我会画图,并从基本原理出发进行论证。等我解释完之后,他们就明白该怎么做了。
F:所以很多时候都关乎人际关系以及构建对未来的共同愿景。但您是否担心某些瓶颈?我的意思是,供应链中最大的瓶颈是什么?您是否担心ASML的EUV光刻工具?您是否担心台积电的CoWoS封装技术,以及它能否快速扩展产能?正如您所说,你们不仅增长迅猛,而且还在加速增长。因此,感觉供应链上的每个人——这些当然都是瓶颈——都必须扩大产能。您是否正在与他们沟通,探讨如何更快地扩大产能?
Jensen Huang:一直如此。
F:你担心吗?
Jensen Huang:不,因为我告诉了他们我的需求。他们理解了我的需求。他们告诉我他们打算怎么做,我相信他们要做的。
电力
F:有意思。听到这个消息真好。那么,我们不妨再花点时间谈谈电力问题。您对解决能源问题有什么期望?
Jensen Huang:Lex,我想和你谈谈一个方面,也想传达一个信息:我们的电网设计时预留了应对最坏情况的余量。但实际上,99% 的时间里,我们远未达到最坏情况,因为最坏情况通常只出现在冬季的几天、夏季的几天以及极端天气条件下。大多数时候,我们的用电量远低于最坏情况,大概只有峰值的 60% 左右。
因此,99% 的时间里,我们的电网都有过剩电力,这些电力都闲置着。但它们必须闲置,因为以防万一,一旦需要,医院、基础设施、机场等等都需要电力供应。所以我的问题是,我们是否可以帮助他们理解并制定合同协议,设计计算机架构系统和数据中心,以便在社会基础设施需要最大电力供应时,减少数据中心的用电量。
但这种情况非常罕见。在那段时间里,我们要么会启用备用发电机来应对那一小部分负载,要么会让计算机将工作负载转移到其他地方,或者降低计算机的运行速度。你知道,我们可以降低性能,减少能耗,并接受稍长的延迟响应,比如当有人请求答案时。所以我认为,这种使用计算机、构建数据中心的方式,而不是期望100%的正常运行时间——以及那些非常严格的合同,给电网带来了很大的压力,因为他们必须提高负荷能力。我只是想利用他们的剩余电力。这些电力就闲置在那里。
F:是的,这一点讨论得不够多。那么,究竟是什么阻碍了这一进程?是监管?还是官僚作风?
Jensen Huang:我认为这是一个三方问题。首先是最终客户。最终客户对数据中心的要求是绝对不能出现故障,明白吗?也就是说,最终客户期望的是完美。为了实现这种完美,你需要备用发电机和电网供应商的配合。所以,每个人都必须保证六个九的可用性。首先,我认为现在我们应该让每个人都明白,当客户提出这些要求时,数据中心运营团队中负责处理这些事情的人可能与CEO脱节。我敢肯定CEO并不了解这一点。我要和所有CEO谈谈。
CEO们可能根本没关注正在签署的合同,所以当然,每个人都想签最好的合同。然后他们去找云服务提供商,找那两个负责合同谈判的人员……我仿佛都能看到他们谈判多年合同的场景了。双方都想要最好的合同。结果,云服务提供商又得去找公用事业公司,而公用事业公司期望的是九个九,甚至六个九。所以我认为,首先要确保所有客户,包括CEO和用户,都清楚他们想要的是什么。其次,我们必须建设能够优雅降级的数据中心。
所以,如果电力公司、公用事业公司或电网告诉我们:“听着,我们得把你们的负载降到80%左右”,我们会说:“这完全没问题。” 我们只需要转移工作负载。我们会确保数据不会丢失,但可以降低计算速率,减少能源消耗。服务质量会略有下降。对于关键工作负载,我会立即将其转移到其他地方,这样就不会出现问题。这样,你知道,哪个数据中心还能保持100%的正常运行时间,等等……
F:在数据中心实现智能、动态的电力分配,这究竟是一个多难的工程问题?
Jensen Huang:只要你能明确具体要求,就能设计出来。说得真好。只要它符合基本的物理定律,我想就没问题了。
F:你刚才提到的第三件事是什么?
Jensen Huang:所以第二点是数据中心。第三点是我们需要电力公司也意识到这是一个机会——……他们不应该说,“你看,我需要五年时间才能提升电网容量”,而是应该说,如果你愿意接受这种级别的电力保障,我下个月就能以这个价格为你提供电力。如果电力公司也能提供更多分段式的电力输送承诺,那么我认为大家都会找到解决办法。是的,但目前电网的浪费实在太多了。我们应该着手解决这个问题。
Elon和Colossus
F:您曾高度赞扬埃隆·马斯克和xAI在孟菲斯建造Colossus超级计算机的成就,他们仅用了四个月就完成了这项壮举,速度之快堪称创纪录。如今,Colossus已拥有20万个GPU,并且还在快速增长。您能否谈谈他的方法,以便让更多人理解,特别是那些促成这一成就的数据中心建设者?例如,他对工程设计、整个建设管理等方面的理念?
Jensen Huang:首先,埃隆涉猎广泛,涉猎极深。同时,他也是一位非常优秀的系统思考者。因此,他能够从多个学科的角度进行思考,并且他显然会不断挑战现状,质疑一切。他会首先问自己:第一,这件事有必要吗?第二,这件事必须以这种方式完成吗?第三,这件事必须花费这么长时间吗?他有能力质疑一切,直到所有环节都精简到必要的最低限度,再也没有任何多余的东西。然而,产品所需的必要功能却依然保留。所以,他可以说是极简主义者,而且他是在系统层面做到这一点的。我认为……我也很喜欢他能够亲自参与其中。他出现在行动的关键时刻。
你知道,他会直接去那里。如果出了问题,他会直接去那里,然后说:“把问题告诉我。” 你知道,当你把所有这些结合起来做的时候,你就能克服很多以前那种“我们一直都是这么做的”、“我在等他们”之类的借口。你知道,我的意思是,每个人都有很多借口。所以,最后一点是,当你以如此紧迫的态度亲自行动时,会带动其他人也以紧迫的态度行动,你知道吗?每个供应商都有很多客户在忙。每个供应商都有很多项目在进行,而他会确保自己成为所有其他项目最重要的合作伙伴。所以他通过实际行动来做到这一点。
F:是啊,我参加过很多这样的会议。看着挺有意思的,因为很少有人会问这样的问题:“好吧,这件事能不能做得更快?怎么做?为什么非得花这么长时间?”
Jensen的工程和领导力方法
F: NVIDIA Extreme Systems 的协同设计方法与埃隆·马斯克的系统工程方法之间是否存在相似之处?
Jensen Huang:首先,协同设计本质上是一个系统工程问题。因此,我们开展工作正是基于这一基本原则。其次,我们秉持着一种理念,或者说是一种思维方式、一种心境,或者说是一种方法论,这种方法论是我30年前提出的,它被称为“光速”。光速不仅仅指速度,它是我用来指代物理学极限的简写。因此,我们所做的每一件事都会与光速进行比较:内存速度、数学运算速度、功耗、成本、时间、精力、人员数量、生产周期等等。
当你考虑延迟与吞吐量、成本与吞吐量、成本与容量时,所有这些因素都需要与光速进行比较,才能分别满足各种不同的约束条件。而当你综合考虑所有这些因素时,你会发现必须做出妥协,因为实现极低延迟的系统与实现极高吞吐量的低成本系统,其架构本质上是不同的。但你想知道实现高吞吐量的系统的光速是多少,实现低延迟的系统的光速又是多少?然后,当你考虑整个系统时,你就可以进行权衡取舍。因此,我要求每个人都思考最基本的原则和限制——
在做任何事情之前,我们都要先确定所有事物的物理极限。然后我们用这些极限来测试一切。所以这是一种很好的思维方式。我不喜欢其他方法,比如持续改进。持续改进的问题在于……首先,你应该从第一性原理出发,以光速思维来设计事物。只受限于物理极限和物理学极限。之后,当然你会随着时间的推移而改进它。但我不喜欢遇到问题时,有人说:“嘿,你知道,今天做这件事需要74天——”“……现在。我们可以在72天内帮你完成。”你知道,我宁愿把一切都从零开始——
然后说:“首先,请解释一下为什么一开始是74天。我们不妨想想,现在能做到什么程度。如果我从零开始完全重建,需要多长时间?” 通常你会感到惊讶,可能只需要六天。当然,剩下的六天,也就是74天,可能有很多合理的理由,比如妥协、成本削减等等。但至少你知道这些原因是什么。既然你知道六天就能完成,那么从74天到六天的讨论就会出奇地有效。
F:在您所处理的如此极其复杂的系统中,有时追求简洁是否是一种有效的启发式方法?我的意思是,如果我能……我的意思是,您发布的 Vera Rubin 处理器简直令人难以置信。它包含七种芯片类型,五种专用机架类型,40 个机架,1.2 千万亿个晶体管,近 2 万个 NVIDIA 芯片,超过 1100 个 Rubin GPU,60 exaflops 的运算能力,以及每秒 10 PB 的扩展带宽。这仅仅是其中之一……
Jensen Huang:那只是一个Pod
F:我的意思是,在……所以你有……而且即使是 NVL72 机架本身,也有 130 万个组件、1300 个芯片、4000 个模块,全部塞进一个 19 英寸宽的机架中。
Jensen Huang:这么说吧,我们可能每周要生产大约 200 个这样的Pod。
F:组件种类繁多,我想简洁性是不可能实现的,但这是否是你在设计产品时会追求的一个指标呢?
Jensen Huang:你知道,我最常说的一句话是,我们需要事物既要足够复杂,又要尽可能简单。所以问题是,所有这些复杂性都是必要的吗?我们应该检验这一点。我们必须质疑这一点。之后,除此之外的一切,你知道,都是多余的。
F:但这仍然令人难以置信。整个半导体行业,尤其是英伟达,正在做的事情堪称历史上最伟大的工程之一。所以这些系统真的是名副其实的工程奇迹。
Jensen Huang:它是世界上迄今为止制造出的最复杂的计算机。
F:是啊,工程团队嘛……我不知道,这不是比赛,但我也说不准。如果这是工程团队的奥运会,台积电的工程技术确实非常出色。就像我说的,ASML在各个方面都很厉害,但英伟达肯定会给他们带来不小的挑战。这些团队都非常非常优秀。
Jensen Huang:这里汇聚了各个体育项目的金牌得主。
有关中国的一些讨论
F:您最近去了中国。所以,我想问问您,中国在科技领域取得了巨大的成功。您如何看待中国在过去十年中打造了如此多世界一流的公司、世界一流的工程团队,以及如此庞大的科技生态系统,并由此孕育出如此多令人惊叹的产品?
Jensen Huang:原因有很多……好吧,首先,我们先来看一些事实。全球约有50%的人工智能研究人员是中国人,而且他们大多仍然在中国。我们这里也有很多,但中国仍然有很多杰出的研究人员。他们的科技产业恰逢其时。在移动云计算时代,他们贡献的方式是软件开发,因此,中国拥有非常优秀的科学和数学人才,培养出了许多受过良好教育的孩子。他们的科技产业正是在软件时代诞生的。他们对现代软件非常熟悉。中国并非一个单一的经济体。它由许多省市组成,各省市的市长之间相互竞争。
这就是为什么会有这么多电动汽车公司,这么多人工智能公司,以及你能想到的所有公司都在开发人工智能技术的原因。因此,他们内部竞争异常激烈。最终,剩下的就是一家卓越的公司。他们还有一种独特的企业文化,那就是家庭第一,朋友第二,公司第三。所以,他们之间会进行大量的交流……他们基本上一直都是开源的。
所以他们为开源项目贡献更多是理所当然的,因为他们可能会想:“我们到底在保护什么?”你知道,我的工程师们,他们的兄弟在那家公司,他们的朋友在那家公司,他们都是校友。你知道,校友情谊就是这么回事。一个校友,就是一辈子的兄弟。所以他们能够非常迅速地分享知识。因此,把技术藏起来毫无意义。不如把它开源。这样一来,开源社区就能放大并加速创新进程。所以,由于开源、朋友间的友谊以及激烈的竞争,我们才能看到如此迅速、令人难以置信的优秀人才和快速的创新。
在公司内部,涌现出了许多令人惊叹的成果。这个国家是当今世界上创新速度最快的国家,它拥有我刚才提到的所有要素,这些要素对孩子们的成长至关重要:他们接受良好的教育,他们的父母希望他们在学校取得好成绩,他们的文化也秉持着这样的理念。这些都是他们国家的独特之处,而他们恰好赶上了科技呈指数级增长的时代。
F:而且从文化角度来看,当工程师也很酷。它与你提到的所有方面都有关联……
Jensen Huang:是的,这是一个建设性国家。我们国家的领导人很了不起,但他们大多是律师。他们的国家领导人——正因为他们努力保障我们的安全,维护法治——他们的国家是从贫困中建立起来的。所以他们的大多数领导人都是杰出的工程师,一些最聪明的头脑。
F:感谢您发布开源的 Nemotron 3 Super,您也可以在 Perplexity 中使用它来查找信息。这是一个拥有 1200 亿参数的开放权重 MoE 模型。您对开源有何愿景?您提到了中国,以及 DeepSeek 和 MiniMax 等公司,它们都在积极推动开源 AI 的发展,而 NVIDIA 在接近最先进的开源 LLM 方面也处于领先地位。您对开源的未来有何展望?
Jensen Huang:如果所有东西都是专有的,研究就很难开展,创新也难以进行。因此……开源对于许多行业加入人工智能革命至关重要。英伟达拥有规模,我们也有动力——不仅仅是技能、规模和动力——去构建并持续构建这些人工智能模型,直到我们有生之年。因此,我们应该这样做。我们可以开放,我们可以激活每个行业、每个研究人员、每个国家,让他们都能加入人工智能革命。第三个原因也由此而来,那就是认识到人工智能不仅仅是语言。这些人工智能很可能会使用基于其他信息模式训练的工具、模型和子智能体。
首先,如果我们想成为一家伟大的人工智能计算公司,我们就必须了解人工智能模型是如何演变的。
我非常喜欢Nemotron 3的一点是,它不仅仅是一个纯粹的Transformer模型,而是Transformer和SSM的结合。我们很早就开始开发条件生成对抗网络(Conditional GANs),也就是渐进式生成对抗网络(Progressive GANs),它逐步推动了扩散型生成对抗网络(Driving GANs)的发展。因此,我们在模型架构和不同领域开展基础研究,使我们能够更清晰地了解哪些计算系统能够更好地支持未来的模型。这也是我们高度协同设计策略的一部分。其次,我认为我们理所当然地认识到,一方面,我们希望打造世界一流的模型产品,并且这些模型应该是专有的。另一方面,我们也希望人工智能能够普及到各个行业、各个国家、每个研究人员、每个学生。
如果所有东西都是专有的,研究就很难开展,创新也难以进行。因此……开源对于许多行业加入人工智能革命至关重要。英伟达拥有规模,我们也有动力——不仅仅是技能、规模和动力——去构建并持续构建这些人工智能模型,直到我们有生之年。因此,我们应该这样做。我们可以开放,我们可以激活每个行业、每个研究人员、每个国家,让他们都能加入人工智能革命。第三个原因也由此而来,那就是认识到人工智能不仅仅是语言。这些人工智能很可能会使用基于其他信息模式训练的工具、模型和子智能体。
也许是生物学、化学,或者物理定律,又或者流体力学和热力学,这些并非都能用语言结构表达。因此,必须有人确保天气预报、生物学、人工智能、生物学人工智能、物理人工智能等等这些领域能够得以保留,并被推向极限,开拓前沿。我们不造车,但我们希望确保每家汽车公司都能获得优秀的模型。我们不研发药物,但我希望确保礼来公司拥有世界上最好的生物学人工智能系统,以便他们能够利用这些系统进行药物研发。这三个根本原因在于:首先,我们认识到人工智能不仅仅是语言,它的范畴非常广泛;其次,我们希望让每个人都参与到人工智能的世界中来;最后,我们希望人工智能能够协同设计。
台积电和台湾
F:这真是太不可思议了。您来自台湾,而且与台积电关系密切。所以我必须问问您,台积电在工程团队和他们所做的卓越工程方面也堪称传奇公司。您对台积电的企业文化和发展理念有何理解,才能解释他们如何在半导体领域取得如此举世无双的成功?
Jensen Huang:首先,人们对台积电最大的误解就是认为他们的技术就是他们的一切。好像他们只有一款非常出色的晶体管,一旦有人拿出另一款晶体管,一切就都结束了。其实,真正让台积电与众不同的是他们的技术,当然,我指的不仅仅是晶体管,还有金属化系统、封装、3D封装、硅光子学等等,他们拥有的所有技术。正是这些技术造就了台积电的独特之处。他们的技术成就了台积电的独特地位。
但他们能够统筹协调全球数百家公司不断变化的需求,这些公司不断扩张、转型、扩张、收缩、拓展、拓展、拓展客户、晶圆生产启动、晶圆生产停止、紧急晶圆生产启动等等,所有这些世界格局瞬息万变的复杂动态,他们却依然能够高效运营工厂,保持高产量、高良率、极低的成本和卓越的客户服务。他们认真履行自己的承诺。
他们知道晶圆是帮助你公司运营的,所以当晶圆按时交付时,晶圆就会如期交付,这样你才能正常运营公司。因此,他们的系统,他们的制造系统,可以说是非常神奇的。其次是他们的企业文化。这种文化一方面注重技术,不断推进技术发展;另一方面又以客户服务为导向。很多公司非常注重客户服务,但他们的技术水平并不高,也并非处于技术前沿。
很多公司都是科技公司,处于技术前沿,但它们的客户服务却不尽如人意。所以,关键在于它们能否在这两者之间取得平衡,并在两方面都达到世界一流水平。第三点,也是我最看重的一点,是它们所创造的信任——这种无形的东西。我相信它们能把我的公司放在首位。这至关重要。
F:当他们信任你时,我的意思是,你们之间建立了一种非常紧密的关系,这种信任是基于多年的表现而建立的,但其中也涉及到人际关系。
Jensen Huang:三十年来,我们通过他们完成了数以百亿计的业务,我都记不清了,而且我们还没有签合同。这真是太棒了。
F:太棒了。好吧,有个故事……据说2013年,台积电的创始人张忠谋曾邀请你担任台积电的首席执行官,而你说你当时已经有工作了。这个故事是真的吗?
Jensen Huang:故事属实。我没有,也从未拒绝过。但我深感荣幸,当然,我当时就知道,现在也依然知道,台积电是历史上最具影响力的公司之一。Morris是我一生中最受尊敬的高管之一,也是我的商业和私人朋友。他向我发出邀请,我感到无比荣幸和谦卑。但我目前的工作非常重要,我已经在脑海中构想了英伟达的未来,以及我们能够产生的影响。这是一项非常重要的工作。实现这一切是我的责任,是我唯一的责任。所以我拒绝了,并非因为这份邀请不够诱人。它的确非常诱人,但我实在无法接受。
F:我认为英伟达,以及台积电,都是人类文明史上最伟大的两家公司。运营其中任何一家,我确信都是极其复杂且需要付出巨大努力的……你必须全身心投入。不仅是CEO,公司上下,每个层级的每个人都必须如此。每个人都必须真正地全身心投入。
Jensen Huang:是的,毫无疑问。
英伟达的护城河
F:英伟达现在是全球市值最高的公司。我不得不问,正如科技界人士所说,英伟达最大的护城河是什么?就是那种能让你免受竞争冲击的优势。
Jensen Huang:作为一家公司,我们最重要的资产是我们计算平台的安装基础。如今,我们最看重的是CUDA的安装基础。当然,20年前,CUDA的安装基础几乎为零。但究竟是什么造就了现在的局面呢?即便有人开发出GUDA或TUDA,也丝毫不会改变现状。原因在于,CUDA的成功从来不仅仅取决于技术本身。当然,这项技术本身非常出色,极具远见。但真正重要的是公司对它的投入、坚持和不断拓展。CUDA的成功并非仅仅归功于三个人,而是43000名员工的共同努力。
数百万开发者相信我们,相信我们会继续开发 CUDA 1、2、3、13,因此他们决定将自己的软件移植到 CUDA 之上,构建庞大的软件库。所以,庞大的用户群是我们最重要的优势。这个庞大的用户群,再加上我们如此高效的执行速度,在如此巨大的规模下,历史上没有任何一家公司构建过如此复杂的系统。而且,每年只开发一次是不可能的。这种速度加上庞大的用户群,在开发者看来,如果支持 CUDA,明天就能提升十倍。我只需要平均等待六个月。
不仅如此,如果我用 CUDA 开发,就能触及数亿用户和计算机。我的应用遍布所有云平台、所有计算机公司、所有行业、所有国家。所以,如果我创建一个开源软件包,并首先将其发布到 CUDA 平台,就能同时获得这两个优势。不仅如此,我百分之百相信 NVIDIA 会一直维护 CUDA,不断改进和优化库,直到它停止发展。这一点毋庸置疑,尤其是最后一点——信任。综合所有这些因素,如果我是今天的开发者,我会首先选择 CUDA。我会优先考虑 CUDA。这就是为什么我认为最终 CUDA 才是我们的首要目标,甚至是我们的首要目标——
我们的第二个优势是我们的生态系统。我们不仅垂直整合了这个极其复杂的系统,还将其水平整合到每一家公司的计算机中。我们与谷歌云、亚马逊云、Azure 都有合作。你知道,我们现在正在疯狂地扩展 AWS 的规模。我们还与 CoreWeave 和 Nscale 等新兴公司合作。我们在礼来公司的超级计算机中也有应用。我们在企业级计算机中也有应用。我们在无线基站的边缘计算领域也有应用。你知道,我的意思是,这简直太疯狂了。一个架构就能应用于所有这些不同的系统。我们在汽车中应用,我们在机器人中应用,我们在卫星中应用,我们在太空中应用。因此,拥有这样一个架构,并且生态系统如此广泛,它几乎涵盖了世界上的每一个行业。
F:那么,随着人工智能工厂的崛起,CUDA 的用户基础未来将如何发展?你认为……NVIDIA 的未来发展方向是否有可能完全围绕人工智能工厂展开
Jensen Huang:以前对我们来说,计算单元是GPU。后来变成了计算机,再后来变成了集群。现在它已经是一个完整的AI工厂了。以前,当我看到一台计算机,看到NVIDIA的产品时,我会想象芯片的形态。然后,当我发布新产品、新一代产品时,比如“女士们先生们,我们今天发布Ampere架构”,我会拿起芯片。那就是我当时的思维模型……也就是我所构建的产品的模型。现在,我不会……拿起芯片的举动现在看来仍然有点可爱。
但它很可爱。这跟我设想的完全不一样。我设想的是一个巨型千兆瓦级装置,它连接着多个发电厂和电网。它有极其庞大的冷却系统和网络,你知道的。一万人在里面安装,数百名网络工程师在里面,还有数千名工程师在后面负责启动它。你知道,启动一个这样的工厂,不是某个人说“启动了”就能完成的。它需要成千上万的人才能启动。
所以从心理上来说,你实际上是……当你思考单个计算单元时,你晚上睡觉时想的其实是一堆机架,也就是一个个模块,而不是单个芯片。
整个基础设施。我希望我的下一次点击,是在思考如何制造行星级规模的计算机的时候。那将是我的下一次点击。
太空人工智能数据中心
F:那么,你如何看待埃隆谈到的太空角度,即利用太空计算来解决一些问题……这可以更容易地解决能源规模化方面的一些能源问题。
Jensen Huang:是的,散热问题确实不容易解决。
F:散热。嗯,这其中涉及很多复杂的工程问题。所以……你知道,英伟达也已经宣布过,你们肯定已经在考虑这个问题了。
Jensen Huang:是的,我们已经做到了。NVIDIA 的 GPU 是首批进入太空的 GPU。我之前都没意识到这一点,这太有趣了……我本来可能会宣布的。我们已经进入太空了。你知道,就像我们 GPU 上装了一套小小的宇航服。但我们确实已经进入太空了。那里是进行大量成像工作的理想场所。
你知道,因为那些卫星配备了非常高分辨率的成像系统,它们正在持续不断地扫描地球。你需要的是厘米级分辨率的全球连续成像,这样你就能实时掌握所有事物的遥测数据。你不想把这些数据传回地球,因为那可是PB级的数据。你必须在边缘进行人工智能处理,丢弃所有不需要的、以前见过的、没有变化的数据,只保留你需要的。所以人工智能必须在边缘进行。显然,如果我们把人工智能放在极地,就能获得全天候的太阳能。但是,你知道,那里没有传导,也没有对流。
所以,你知道,你基本上就只是辐射而已。但是,你知道,太空浩瀚无垠。我想,我们大概只能在那里放置巨大的散热器了。
F:你觉得这个想法有多疯狂?比如,它还需要五年、十年还是二十年才能实现?所以我们讨论的是人工智能规模化发展的障碍。
Jensen Huang:你知道,我这个人比较务实。我总是先寻找下一个机会。与此同时,我也在开拓太空领域。所以我派工程师去解决相关问题。我们正在……我们正在深入了解这方面。我们该如何应对辐射?如何应对性能下降?如何进行持续的缺陷测试和验证?还有,我们该如何实现冗余?如何实现优雅降级等等?所以我们可以……软件方面呢?你如何看待太空环境下的软件、冗余和性能问题?
让电脑永远不会出故障,只会变慢,你知道的。而且……所以我们可以先进行大量的工程探索。但与此同时,我最喜欢的答案是消除浪费。你知道,我们有很多闲置的电力,我想尽快把它们消耗掉。
英伟达的市值会达到10万亿美元吗?
Jensen Huang:我认为英伟达的增长极有可能,在我看来,甚至是不可避免的。让我解释一下原因。我们是历史上最大的计算机公司。单凭这一点就足以引出一个问题:为什么?当然,原因有两个。首先,是两个基础性的技术原因。第一个原因是,计算机已经从基于检索的文件检索系统发展成为……几乎所有东西都是文件……我们预先编写内容,预先录制内容。你知道,我们画一些东西,把它放到网上,然后保存到一个文件中。我们使用推荐系统,或者某种智能过滤器,来确定应该为你检索什么。所以,我们曾经是一个预先录制、人工预先录制、然后检索文件的系统。这基本上就是计算机的本质。
如今,人工智能计算机已经具备上下文感知能力,这意味着它必须实时处理和生成词元。因此,我们从基于检索的计算系统转向了基于生成的计算系统。在这个新世界里,我们需要比旧世界多得多的处理能力。旧世界需要大量的存储空间,而新世界需要大量的计算能力。这就是第一部分。我们从根本上改变了计算以及计算的方式。唯一可能导致它倒退的因素是……
也就是说,这种计算方式——这种能够生成与上下文相关、感知情境、并在生成信息之前就基于新洞察的信息的计算方式——这种计算密集型的计算方式,只有在无效的情况下才会被放弃。所以,如果……在过去10到15年从事深度学习研究的过程中,如果我曾经得出过这样的结论:“你知道吗?这行不通。我觉得这是条死路。”或者,“它无法扩展,它解决不了这种模态的问题,它无法用于这种应用。”那么,当然,我对它的看法会截然不同。但我认为,过去五年比之前的十年给了我更大的信心。
第二个想法是计算机,因为它最初是一个存储系统,很大程度上是一个仓库。而我们现在建造的是工厂。仓库赚不了多少钱,工厂的收益却与公司的收入直接相关。所以,计算机带来了两方面的变化。它不仅改变了工作方式,也改变了其在世界上的用途。它不再仅仅是一台计算机,而是一座工厂。作为一座工厂,它被用来创造收入。我们现在看到的不仅是这座工厂在生产人们想要消费的产品和商品,而且这些商品对众多不同的受众群体来说都极具吸引力和价值,以至于代币也开始像iPhone一样进行细分。有免费代币,有高级代币,还有一些介于两者之间的代币。
所以,事实证明,智能是一种可扩展的产品。市面上存在着一些智能水平极高的产品,比如代币,它们可以用于一些特定用途,人们愿意为此付费。要知道,有人愿意为每百万个代币支付 1000 美元的想法指日可待。这不是会不会发生的问题,而是何时发生的问题。因此,我们现在看到,这家工厂生产的商品实际上是有价值的,而且能够产生收入和利润。现在的问题是,世界需要多少这样的工厂?世界需要多少代币?社会愿意为这些代币支付多少钱?如果生产力大幅提高,世界经济将会发生什么变化?将会发生什么……
我们是否会发现新药、新产品、新服务?综合考虑这些因素,我绝对相信世界GDP将会加速增长。我也绝对相信,用于计算的GDP占比将比过去增长100倍——嗯——因为计算不再仅仅是存储,而是产品创造。所以,从这个角度来看,再回到NVIDIA的定位,NVIDIA的业务是什么,以及我们将如何从这种新的经济模式和产业中受益,我认为我们将发展壮大得多。
对我来说,剩下的问题是:英伟达是否有可能在不久的将来成为一家年收入3万亿美元的公司?答案当然是肯定的。原因在于它不受任何物理限制。我没看到任何迹象表明3万亿美元的营收是不可能的。事实上,英伟达的供应链——由200家公司共同承担——承担着巨大的压力。我们依靠这个生态系统的合作来实现规模扩张,问题是:我们是否有足够的精力做到这一点?答案是肯定的,我们肯定有足够的精力做到这一点。所以,综合所有这些因素,3万亿美元只是一个数字而已。
我至今仍记得,英伟达第一次市值突破十亿美元的时候,一位CEO跟我说过:“你知道吗,詹森,理论上来说,一家没有晶圆厂的半导体公司不可能市值超过十亿美元。” 我就不赘述原因了,但显然这不合逻辑,而且有很多证据表明我们做到了。后来有人跟我说:“你知道吗,詹森,你永远不可能超过250亿美元,因为其他公司占了上风。” 有人跟我说:“你永远不可能,你知道,因为……” 这些都不是基于原则的理性思考。其实,最简单的思考方式是:我们究竟在生产什么?我们能创造多大的机会?
现在,NVIDIA 并不追求市场份额。我刚才提到的几乎所有事情都不存在。这才是难点所在。你知道,如果 NVIDIA 是一家市值 100 亿美元的公司,试图抢占 NVIDIA 的市场份额,那么股东们很容易理解,哦,是的,如果他们能抢占 10% 的市场份额,他们的规模就能扩大这么多。但人们很难想象我们能发展到多大规模,因为我根本无法从任何竞争对手那里抢占市场份额。你明白吗?所以我认为,对未来的想象是世界面临的挑战之一。但我还有很多时间,我会继续思考,继续讨论,每一次 GTC 大会都会让这些设想变得越来越真实。
你知道,然后越来越多的人会谈论这件事,总有一天,我们会实现的。但我百分之百肯定我们会实现的。
F:是的,这种观点本质上就是代币工厂,也就是每秒每瓦产生一个代币,每个代币都有价值。它就像一个实实在在的东西,能带来价值,而且能为不同的人带来不同类型的价值,价值的多少也不同。这就是实际的产品——它其实可以被粗略地理解为代币。所以你就有了一堆代币工厂。然后,从基本原理上很容易想象,考虑到人工智能能够解决的所有潜在问题,未来你需要数量呈指数级增长的代币工厂。
Jensen Huang:是的。真正有趣的是,也是我如此兴奋的原因,代币的iPhone来了。
F:你管它叫什么?等等,你是说OpenClaw的iPhone吗?
Jensen Huang:是的
F:那很有意思。
Jensen Huang:没错,OpenClaw 无疑是代币界的 iPhone。
压力下的领导力
F:多么令人振奋的未来!我读到您将自己的成功很大程度上归功于您比任何人都更努力、更能承受苦难。那么,这其中必然包含很多方面。比如,应对失败、我们之前讨论过的成本和工程问题;人际关系问题、不确定性、责任、疲惫、尴尬、您提到的公司濒临倒闭的时刻,以及巨大的压力。作为一家举国上下都围绕其制定战略、规划财政分配、构建人工智能基础设施的公司的首席执行官,您是如何应对如此巨大的压力的?鉴于如此多的国家和人民都依赖着您,是什么赋予了您力量?
Jensen Huang:我深知英伟达的成功对美国至关重要。它为美国创造了巨额税收,并确立了美国的科技领先地位。科技领先地位对国家安全至关重要。这里所说的国家安全并非指某一方面,而是所有方面。国家越繁荣,我们就能更好地制定国内政策,提升社会福利。由于我们在美国推动了大规模的再工业化,我们创造了大量的就业机会。我们正在帮助众多工厂——包括芯片、计算机,当然还有人工智能工厂——将生产方式重新带回美国。我完全明白这一点……
而我则受益匪浅,这真是一份厚礼,因为我接触到了主流投资者、教师、警察,他们不知何故投资了英伟达,或者因为他们看了吉姆·克莱默的节目,买了一些股票,现在都成了百万富翁。
我完全了解这种情况。我知道英伟达在我们背后以及下游拥有一个庞大的生态系统合作伙伴网络,而这个网络的核心地位至关重要。因此,我处理这种情况的方式正是我刚才所做的。我会思考……我们正在做什么?它造成了什么后果?它对其他人有什么影响?是积极的,还是会带来巨大的负担,例如对供应链的影响?因此,问题是,你打算怎么做?几乎在我感受到的所有事情中,我都会进行分析,思考:“好吧,情况是什么?发生了什么变化?有什么困难?我打算怎么做?”然后我……
我把问题分解开来,把情况分解成我可以处理的小事。之后我唯一能做的就是:“你做了吗?是你自己做的,还是找别人做的?如果你自己没做,你觉得你应该做,但你没做,也没找别人做,那就别再抱怨了。”……你懂的?就这样,就这样——
所以我对自己要求很高。而且,我还会把事情分解开来,这样就不会惊慌失措。我可以安心入睡,因为我已经列出了需要做的事情清单,并且确保所有可能危及公司、危及合作伙伴、危及整个行业的事情,我都告诉了相关人员。所有我认为可能危及任何人的事情,我都告诉了相关人员。而且我告诉了那些能够解决问题的人。所以,我已经把事情说出来了,或者正在采取行动。那么,莱克斯,在那之后,你还能做些什么呢?
F:鉴于在创建 NVIDIA 的过程中所经历的种种疯狂而艰辛的痛苦,你是否在心理上经历过低谷?
Jensen Huang:哦,当然,一直都是。
F:你是不是把问题分解成一个个小部分?看看你能做些什么?
Jensen Huang:莱克斯,其中一部分在于遗忘。你知道,人工智能学习最重要的特性之一就是系统性遗忘。你需要知道什么时候该忘记一些事情。你不可能记住所有东西,也不可能记住所有东西,而且你也不想背负所有东西。我经常做的一件事就是快速分解问题,思考问题,然后分担它的负担。我说“告诉所有人”,本质上就是在分担这个负担。
越快越好。不管我担心什么,都告诉别人。别憋在心里。你知道,别吓到他们。把问题分解成更小的部分,让人们参与进来,激励他们采取行动。但其中一部分就是放下。你知道,很多时候你得对自己严格一点。你知道,振作起来,别再哭了。我们继续前进。你知道吗?然后你就起床了。另一部分是你会被下一个闪光点、下一个未来、下一个机会、下一个“好了,这都过去了。接下来是什么?”所吸引。我觉得很多时候都是这样,你知道,你看看那些伟大的运动员就知道了。他们只关心下一个分数。上一个分数已经过去了。尴尬,你知道的……挫折。
你知道,因为我的工作很多时候都是公开进行的,所以你知道,我说的很多话当时听起来很合理或者很有趣,主要是因为当时我觉得好笑。然后,你知道,当你反思之后,就没那么好笑了,但是……继续朝着这个目标努力。我的意思是,你确实说过,你曾说过一句很出名的话,如果你知道创建英伟达会有多难——结果比你预想的难一百万倍——你就不会去做了。
没错。顺便说一句,我刚才想解释的就是,拥有孩童般的思维是一种不可思议的超能力。你知道吗?我经常这样想,几乎每次看到什么东西,我的第一反应都是:“这能有多难?”你知道吗?然后你就进入这种状态,心想这能有多难?而且从来没有人做到过。它看起来无比庞大。它要花费数千亿美元。它需要,你知道,所有这些……然后你就会想,“是啊,但这能有多难?”你知道吗?这能有多难?
所以,你得让自己进入那种状态。你不想过度模拟所有的事情,包括所有的挫折、考验、磨难和失望。你不想提前模拟所有这些。你不想知道这些。你想带着完美的心态去体验一段新的经历,相信它会很棒,会非常有趣。然后,当你身处其中时,你需要有毅力,你需要有勇气,这样当挫折真正发生时——那些挫折会让你措手不及,那些失望会让你措手不及,那些尴尬会让你措手不及,那些屈辱会让你措手不及——你才能应对自如。
你不能就此放弃……现在你只需要开启另一部分,那就是忘掉它。继续前进,不断向前。只要我对未来以及未来为何会实现的假设和输入没有发生实质性的改变,那么我就应该预期结果也不会改变。因此,我对未来的模拟结果仍然会发生。如果它仍然会发生,我仍然会去追求它。
我相信会成功的,你知道,这其中融合了两到三种人类特质:以全新的心态投入新事物的能力,忘记挫折的能力,以及相信自己并坚持信念的能力。但你也要不断地重新评估。
我认为这三、四、五件事的结合对韧性至关重要。你知道,我很幸运,无论人生经历如何造就了现在的我,我都具备了这四、五件事。你知道,我总是充满好奇心,总是不断学习。我总是向所有人学习,你知道吗?我总是问我的……而且因为我对所有事情都保持谦逊,我总是想,“哇,他们做得真好。他们做得太棒了。”你知道,我会思考他们是怎么想的。他们是怎么……所以我在模仿每个人。在很多方面,你知道,我几乎在模仿我观察的每个人,对吧?你会对他们所做的一切感同身受,并尊重他们,你会不断地学习。
F:你现在是世界上最富有的人之一,也是世界上最成功的人之一。保持谦逊是否更难了?你是否觉得金钱、权力和名望让你更难承认自己的错误?让你难以倾听与你意见相左的人的观点并从中学习?诸如此类的事情。
Jensen Huang:出乎意料的是,答案是否定的。而且我其实会选择相反的做法。因为我的很多工作都是公开进行的,所以一旦我犯了错,几乎所有人都能看到。
当我犯错的时候——当我错了,或者事情没有按预期发展,或者你知道,我的意思是,我私下里说的大部分话我都相当肯定。原因在于,这些话会影响到其他人,所以我对此非常关注,也非常谨慎。至于我在会议中思考的事情,你知道,很多事情都可能朝着不同的方向发展。所以,但这从不会阻止我继续思考。我的管理和领导方式,就是不断地在众人面前进行思考。即使是在和你说话的时候,你也能看出我是在思考问题。我希望确保你理解我的意思,不是因为我告诉你。
因为我对自己即将要说的话非常谦虚。我会先向你展示我得出结论的步骤。然后,你可以自己决定是否相信我最后说的。所以我在会议上每天都这样做。对于我的所有员工,我都会不断地阐述我的想法:“让我来告诉你我是怎么看待这件事的。”然后我会进行推理。这让每个人都有机会插话,说:“我不同意这部分。” 推理并让大家参与讨论的好处在于,他们不必反对你的结论。他们可以反对你的推理步骤。他们可以引导我得出不同的结论,然后我们就可以继续前进。所以,我们就像是一个集体探索路径的方法。这真的很棒。
电子游戏
F:我很高兴你保持了丹尼餐厅的那种精神,还有你的工作。我的意思是,那真是太棒了。你从丹尼餐厅开始的整个职业生涯都非常精彩。我想问问你关于电子游戏的事。我是个游戏迷。所以我要感谢NVIDIA多年来提供的令人惊叹的图形效果
Jensen Huang:顺便说一句,GeForce 至今仍然是我们最重要的营销策略。没错。人们在青少年时期就开始了解 NVIDIA。然后他们上了大学,知道 NVIDIA 是谁,一开始只是玩《使命召唤》和《堡垒之夜》之类的游戏。后来他们开始使用 CUDA,再后来他们开始使用 NVIDIA 的产品,比如 Blender、Dassault 和 Autodesk 的产品。
F:是的。我是说,我跟一个朋友提过我在跟你聊天。他说:“哦,他们生产的显卡是游戏显卡中的佼佼者。”
Jensen Huang:对,没错。
F:你知道,这其中还有很多原因,但没错,人们真的很喜欢它。它确实给很多人带来了快乐。硬件确实让这些世界栩栩如生。DLSS 5 曾引发一些争议。你能跟我说说这场风波的缘由吗?我猜想,玩家们担心它会让游戏看起来像人工智能制作的粗糙作品。你对这场风波有什么看法?
Jensen Huang:是的。我觉得他们的观点很有道理,我能理解他们的想法,因为我自己也不喜欢AI生成的粗糙作品。你知道,所有AI生成的内容看起来都越来越相似,而且都很漂亮,所以我很能理解他们的想法。但DLSS 5的目标并非如此。我之前展示过几个例子。DLSS 5是基于3D的,由3D数据引导的。它是基于真实结构数据引导的。因此,几何形状是由艺术家决定的。我们完全忠实地保留了每一帧的几何形状。它受到纹理和艺术家技法的影响。所以每一帧,它都在增强画面,但不会改变任何东西。
现在的问题在于增强效果。DLSS 5 还允许你训练自己的模型来判断,甚至将来还可以进行自定义。比如,你可以说“我想要卡通着色器效果,我想要它看起来像这样”,你可以举个例子。它就会按照那个风格生成图像,完全符合艺术家的艺术理念、风格和意图。所有这些都是为了方便艺术家创作,让他们能够创作出更精美、但又符合自己风格的作品。我认为他们误以为游戏会以现在的样子发布,然后再进行后期处理。但这并非 DLSS 的设计初衷。
DLSS与艺术家融为一体,所以它的目的是为艺术家提供人工智能工具,也就是生成式人工智能工具。当然,他们也可以选择不使用它,你知道吗?
F:我认为人们对人脸非常敏感。而我们现在正生活在这样一个我认为很美好的时代,那就是人们对人工智能的瑕疵非常敏感。它就像一面镜子,帮助我们意识到我们追求的其实是瑕疵。我们追求的有时并非完美的画面。它帮助我们理解,在我们创造的世界中,真正吸引我们的是什么。这很美好。只要这些工具能够帮助我们创造这些世界——
Jensen Huang:是的,没错。
又一个工具,他们居然想让生成模型生成与照片级真实感截然相反的效果。是啊,它也能做到。所以它只不过是又一个工具而已。我想玩家们可能也会喜欢这一点:过去几年里,我们向游戏开发者引入了皮肤着色器。很多游戏都使用了包含次表面散射的皮肤着色器,让皮肤看起来更像真人皮肤。所以,游戏行业,也就是游戏开发者,一直在寻找越来越多的工具来表达他们的艺术。而这只不过是又一个工具而已,至于他们用哪个,就由他们自己决定了。
AGI 时间线,编程的未来
F:精美的画面可以增强沉浸感,让人感觉仿佛置身于另一个世界。啊,你说的很对,通用人工智能(AGI)的时间线问题取决于你对AGI的定义。那么,我想问问你关于AGI可能的时间线。
Jensen Huang:我认为我们已经实现了通用人工智能(AGI)。
举个例子……Claude完全有可能开发出一个网络服务,或者某个有趣的小应用,突然之间,你知道,几十亿人以50美分的价格使用它,然后不久之后又倒闭了。在互联网时代,我们见过很多这类公司,而它们大多数网站的复杂程度并不比Open-Claude今天能生成的网站高多少。
顺便说一句,这事儿现在正在发生,对吧?你知道,你去中国的时候会看到,你会看到很多人教他们技能,让他们的毕业生出去找工作,赚钱。我其实并不……如果出现某种社交现象,或者有人创造了一个超级可爱的数字网红,或者开发出某种社交应用,比如那种可以喂养电子宠物之类的,然后突然爆红,我一点也不会感到惊讶。很多人用了几个月之后,它就慢慢销声匿迹了。但是,10万个这样的“代理人”最终创建英伟达的概率是零。
然后,还有一点我必须强调,那就是要意识到大家都很担心自己的工作。我想提醒大家,工作的目的、工作内容以及完成工作所使用的工具是相关的,但并不完全相同。我已经从事这份工作33年了。我是全球在职时间最长的科技公司CEO,34年。在过去的34年里,我使用的工具一直在不断变化,有时甚至在短短两三年内就会发生翻天覆地的变化。我最想让大家听到的一点是,计算机科学家和人工智能研究人员预测第一个会消失的职业是放射科医生。
因为计算机视觉将会达到超人类的水平,而它也确实做到了。计算机视觉……在2019年、2020年,或许稍晚一些,2020年,就已经达到了超人类的水平?
明白了吗?计算机视觉超越人类能力已经很久了。因此,有人预测放射科医生会消失,因为研究放射影像已成为过去式,人工智能会取代他们。事实证明,他们的预测完全正确。计算机视觉已经完全超越了人类能力。如今,所有放射学平台和软件包都由人工智能驱动,然而放射科医生的数量却在增长。那么问题来了,为什么?现在,全球放射科医生短缺。首先,之前的危言耸听的警告矫枉过正,吓跑了很多人,让他们不敢从事这个对社会至关重要的职业。这确实造成了伤害。那么,为什么这种警告是错误的呢?原因在于,放射科医生的职责是诊断疾病,帮助患者和医生诊断疾病。
因为我们现在能够更快地分析扫描结果,所以你可以分析更多扫描结果,做出更准确的诊断,更快地处理住院病人,接诊更多病人。医院的收入也更高了。住院病人更多了,就需要更多放射科医生。我的意思是,最令人惊讶的是,这一切的发生似乎是理所当然的。NVIDIA 的软件工程师数量将会增长,而不是减少。原因在于,软件工程师的职责和编写代码的任务是相关的,但并不相同。我希望我的软件工程师解决问题。我并不在意他们写了多少行代码,你知道吗?但他们的工作,他们的工作目标并没有改变。
解决问题、团队合作、诊断问题、评估结果、寻找新的待解决问题、创新、融会贯通。你知道,这些都不会消失。
F:你认为有可能吗……就拿编程来说吧。你认为世界上程序员的数量会不会增加而不是减少?
Jensen Huang:是的。原因如下。编码的定义是什么?我认为……就目前而言,编码的定义很简单,就是描述、规范,如果你想更具体一些,甚至可以给它一个你想要编写的软件架构。所以问题是,有多少人能做到这一点?描述一个让计算机执行的规范……告诉计算机要构建什么。有多少人?我认为我们已经从3000万增长到了可能10亿。因此,未来每个木匠都会是程序员,只不过拥有人工智能的木匠同时也是架构师。他们能够为客户创造的价值大大提升了。他们的技艺得到了极大的提升。
我认为每个会计师同时也是你的财务分析师和财务顾问。所以,所有这些职业的地位都得到了提升……如果我是个木匠,看到人工智能,我肯定会欣喜若狂。你知道,如果我是个水管工,我能为客户提供的服务也会让我欣喜若狂。
F:我认为,目前从事编程和软件工程的人们,正处于理解如何运用自然语言与智能体进行直观交流,从而设计出最佳软件的最前沿。
Jensen Huang:没错,正是如此。
F:所以随着时间的推移,它们会趋于一致,但我认为学习编程仍然很有价值,比如学习编程语言是什么。传统的编程方式,编程语言的良好实践是什么,编程的设计原则是什么——
Jensen Huang:这是正确的
F:大型软件系统常用的编程语言?
Jensen Huang:莱克斯,原因就在于此,正如你刚才对观众所说,我认为规范的目标,或者说规范的艺术性,取决于你试图解决的问题。当我思考如何为公司制定战略、构建企业方向以及我们应该做的事情时,我会将其描述得足够具体,以便人们能够理解方向并付诸行动。它足够具体,可以让他们采取行动,但我又会刻意地保留一些细节,这样才能让43000名优秀的员工创造出比我想象中还要好的东西。
所以,当我与工程师合作,与其他人合作时,我会思考:我试图解决什么问题?我的合作伙伴是谁?规范的级别和架构定义的级别都与此相关。因此,每个人都必须学习如何在编码的光谱中定位自己。编写规范本身就是一种编码。你可能会选择非常具体的规范,因为你想要一个非常明确的结果。你也可能决定在这个领域进行更多探索,因此你可能会选择不太具体的规范,以便与人工智能反复沟通,甚至突破你自身的创造力边界。这种在光谱中定位的艺术性,正是编码的未来。
F:但抛开编程不谈,我觉得很多人,尤其是白领,都理所当然地担心自己的工作,焦虑不安。自动化和新技术到来时,总会伴随着动荡,我们谁也不知道该如何应对。首先,我认为我们都应该心怀同情,体会那些失去工作的个人和家庭所承受的痛苦。我认为,每当出现像人工智能这样具有变革性的技术时,都会伴随着巨大的痛苦,而我不知道该如何应对这种痛苦。
希望随着工具的不断发展,它能为这些人创造更多从事同类工作的机会,提高他们的工作效率,也让他们的工作更有趣,就像编程领域一样。说实话,我编程真的太有趣了,简直前所未有。所以,希望它能简化他们的工作,自动化那些枯燥乏味的部分,把创造性的部分留给人类。但即便如此,过程中仍然会有很多痛苦和磨难。
Jensen Huang:所以我之前的第一个建议是……这也是我现在应对焦虑的方法。事实上,我们刚才也讨论过。对于巨大的未来焦虑、巨大的压力焦虑、巨大的不确定性焦虑,我首先会把它们分解开来,然后告诉自己:“好吧,有些事情你可以做点什么,有些事情你无能为力。但对于那些你可以做点什么的事情,让我们好好思考,然后去做。”
如果今天我们要招聘一位应届大学毕业生,而我面临两个选择:一个对人工智能一无所知,另一个是人工智能专家,我会选择后者。如果我需要一位会计、一位市场营销人员、一位供应链专家、一位客户服务专家、一位销售人员、一位业务拓展人员或一位律师,我也会选择后者。因此,我建议每位大学生、每位教师都应该鼓励学生去学习和使用人工智能。每位大学生都应该毕业后成为人工智能专家。而且,无论你是木匠还是电工,都应该去学习和使用人工智能。去看看它能如何改变你目前的工作,提升你的职业技能。
如果我是个农民,我肯定会用人工智能。如果我是个药剂师,我也会用人工智能。我想看看它能如何提升我的工作,让我成为革新这个行业的创新者。所以,这会是我做的第一件事。然后我还会帮助他们……这项技术确实会颠覆甚至取代很多工作。因为它会实现自动化,如果你的工作就是完成任务——那么你很可能会受到冲击。如果你的工作目标包括你完成某些特定任务——那么学习如何使用人工智能来自动化这些任务就至关重要。当然,还有介于两者之间的广阔领域。
AI会有意识吗?
F:你认为人性中、人类意识中是否存在一些本质上无法用计算来解释的东西?或许有些东西是芯片无论多么强大都永远无法复制的?
Jensen Huang:我不知道芯片会不会感到紧张。当然,你知道,引发焦虑、紧张或其他情绪的条件是什么。我相信人工智能能够识别并理解这些情绪。我不认为我的芯片会感受到这些。因此,焦虑、紧张、兴奋等等这些情绪是如何体现在人类表现中的。例如,极其出色的人类表现、运动表现,以及平均水平或低于平均水平的表现。在完全相同的条件下,不同的人会表现出不同的结果,展现出不同的表现,这就是人类表现的整个光谱。
我不认为我们正在构建的任何东西会表明,两台不同的计算机在完全相同的环境下会表现出不同的性能。当然,它们会产生统计上不同的结果,但这并不是因为感觉不同。
所以,真正重要的是要弄清楚什么是智力。你知道,我们经常使用的这个词,它并不是一个神秘的词。智力是有含义的,你知道吗?
这是一个系统……你知道,它包含了感知、理解、推理和计划能力。你知道,这个循环,这个循环,从根本上来说,就是智能的本质。智能并不是一个词就能完全等同于人性。我认为区分这两者非常重要。我们有两个词来描述它们。我不会……我不会对智能抱有过高的幻想,也不会过度浪漫化它。智能是……人们以前也听我说过,我其实认为智能是一种商品。我身边都是聪明人。而且在他们所处的各个领域,都有比我更聪明的人。
然而,我在这个圈子里也扮演着一个角色。这其实挺有意思的。他们比我更有学识,上的学校也比我好,在各自的领域都比我更精通。他们每个人都比我强。我有六十个这样的人。在我眼里,他们个个都是超人。而我,却不知怎的,坐在中间,统筹着这六十个人。所以你得问问自己……一个洗碗工究竟有什么魔力,能让他在一群超人中间占据一席之地?这说得通吗?
所以,这就是我的观点。我的观点是,智力是一种功能性的东西。而人性并非以功能性来定义的。它是一个远比智力宽泛得多的概念。我们的人生经历、我们对痛苦的承受能力、我们的决心,这些都与智力是不同的概念。因此,如果我只能给听众一个明确的答案,那就是:智力这个词,随着时间的推移,我们把它提升到了一个非常高的概念。
所有这些品质。同情心、慷慨,你刚才说的所有这些,我相信都是超人的力量。而现在,智慧却要被商品化了。因为我们之前讨论过,最重要的就是你的教育。但是,即使他们说最重要的就是你的教育,当你上学的时候,你获得的也不仅仅是知识。
所以,很遗憾,我们的社会把一切都简化成了一个词,而生活远不止一个词。我只想说,我的经历表明,即使我的智力水平比周围的人低,也改变不了我最成功的事实。所以,我想说的是——我希望能够激励大家——不要让智力的民主化、智力的商品化让你感到焦虑。你应该从中汲取力量。
有关死亡的看法
F:NVIDIA 的成功以及我之前提到的数百万人的生活都与你息息相关。但正如我们所说,你只是一个普通人,和我们所有人一样,终有一死。你会思考死亡吗?你会害怕死亡吗?
Jensen Huang:我真的不想死。我的生活很美好,家庭美满,工作也非常重要。这并非“一生一次”的经历,并非暗示很多人都经历过,而是指我正在经历的人类历史上独一无二的事件。英伟达是历史上最具影响力的科技公司之一,我们正在从事非常重要的工作,我对此非常重视。当然,也有一些实际问题需要考虑,比如我们应该如何进行继任计划?我曾公开表示我不相信继任计划。
原因并非因为我永生不死。而是因为,如果你担心继任计划,如果你为此焦虑不已,那么你应该怎么做呢?那就把所有问题都归结到最根本的层面。如果你关心公司的未来,关心你之后的未来,那么你今天最重要的事情就是尽可能频繁、持续地传承知识、信息、洞察力、技能和经验。这就是为什么我总是当着团队的面讲解所有事情。每一次会议都是一次讲解会议。我在公司内外的每一分每一秒,都是为了尽快地将知识传递给他人。
我学到的东西,放在桌上的时间从来不会超过一瞬间。我会把这些信息、这些知识——天哪,这太酷了!——传递出去。我还没完全掌握,就已经把它推荐给别人了。“快去学这个!这太酷了!你肯定也想学!” 所以我不断地传递知识,赋能他人,提升周围每个人的能力,这样我追求的、我所期盼的,就是我能死在工作岗位上,你知道吗?最好是瞬间就死在工作岗位上,你知道吗?这样就不会有长时间的痛苦,你知道吗?嗯——
F:嗯,从粉丝的角度来看,鉴于你对人类文明的巨大积极影响,我当然希望你继续前进。而且,看着英伟达的所作所为也很有趣,你知道的。他们的创新速度令人惊叹。我本人也是工程学的忠实拥趸。英伟达一直在进行着许多令人难以置信的工程项目。看着他们不断取得成就,真是令人兴奋。这不仅是对人类的赞颂,也是对伟大创造者的赞颂,更是对伟大工程的赞颂。所以,它代表着一些特别的东西。因此,我希望你和英伟达继续前进。是什么让你对我们正在做的事情、对人类、对人类的未来充满希望?当你展望未来,当你思考未来10年、20年、50年、100年后的事情时,是什么让你充满希望?
Jensen Huang:我一直对人性的善良、慷慨、同情和能力充满信心。我对此一直无比确信,有时甚至过于自信。我有时会被人利用,但这从不会让我改变主意。我始终坚信,人们都渴望行善,都渴望帮助他人。而事实证明,我的想法是正确的,不断地被证明是正确的,而且往往超出我的预期。因此,我对人性的能力充满信心。我认为,真正让我充满希望的是,我看到了现在的可能性,并且基于我们正在做的事情,我推断出未来很可能发生的事情。
而且,我们想解决的事情太多了。我们想解决的问题太多了。我们想创造的东西太多了。我们想做的好事太多了,而且现在都触手可及,在我有生之年就能实现。你不可能不为此感到浪漫吧?你明白我的意思吗?
你怎么可能不为此感到浪漫呢?疾病的终结是可以预见的,污染大幅减少也是可以预见的,光速旅行终将成为现实。而且,你知道,不是长途旅行,而是短途旅行。人们问我怎么做。嗯,首先,很快,我就要把一个人形机器人送上宇宙飞船,就是我设计的那个,我们会尽快把它送出去,它会在飞行过程中不断改进和增强。
然后,时机一到,我的所有意识都已经——你知道,我生命中的大部分都已上传到互联网。把我所有的收件箱、我做过的一切、我说过的一切都上传到互联网上。你知道,它们都被收集起来,变成了我的人工智能。而我,只是,当时机到来时,我们会以光速发送它们,让我的机器人追上我。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4355内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
热门跟贴