智东西作者 陈骏达编辑 心缘
打开网易新闻 查看精彩图片
智东西作者 陈骏达编辑 心缘

智东西拉斯维加斯1月7日报道,今天,在备受关注的CES开幕演讲后,英伟达创始人兼CEO黄仁勋在当地接受了智东西等全球媒体近1个小时的深度采访,采访中,他点名表扬中国车企,回应RTX 5090的超高定价,承认AI PC人才不足、需求尚未爆发,提出三大Scaling Law将共存的观点,更详细剖析了英伟达昨日新发布、新动向背后的种种考量。

老黄今天还换下了昨天那件“开了光追”的皮衣,他称那件皮衣对今天的场合来说可能有点太过了。

打开网易新闻 查看精彩图片

黄仁勋在采访现场展示最小超算Digits(图源:智东西)

黄仁勋称,理想、小鹏、小米、蔚来、比亚迪等企业对智能驾驶趋势的影响可能比特斯拉的还大。

谈到贸易战,他相信政府将做出明确的决定,无论结果如何,英伟达都将尽力帮助客户和市场。

英伟达本次发布的RTX 5090旗舰产品与次旗舰在价格、性能上有显著差异,黄仁勋称这一选择是是为了满足极致发烧友的需求,而入门级产品较低的显存配置是为了和其算力平衡。现场有记者试图套话,让老黄分享60系列的细节,但他称自己无可奉告。

近期,Scaling Law终结和变化的讨论依旧持续,黄仁勋认为未来一段时间里,三大Scaling Law将会共存,即算力的提升、测试时计算和推理过程中的数据反哺,自己没有看到AI发展的物理瓶颈。

尽管英伟达市值已站稳3万亿美元大关,但黄仁勋展现出极为克制、精简、专注的发展策略。英伟达不会涉足电力等算力基建,近期没有新的收购计划,不过多涉足计算层和库层,也不打算直接服务企业,将集中精力去做那些只有英伟达才能做成的产品,最新的Digits个人超算、NVLink 72都是此类产品的代表。

AI PC领域发布不断,但销量还未完全起飞。黄仁勋认为设计师、开发者等群体的AI PC需求真实存在,他们将通过WSL2这一虚拟平台将云端的AI技术带到PC之中。

物理AI是老黄眼中的重要趋势之一,它将帮助AI理解世界,但我们至今仍然缺少一个物理世界的基础模型,英伟达希望通过Cosmos催生GPT-3级别的物理模型,这对机器人和智能驾驶的落地有重大意义。

Agent是AWS、微软等企业押注的重点,英伟达也推出了面向企业的agent蓝图,但老黄称英伟达不会与这些企业直接竞争,主要是为企业agent开发提供基础和帮助。

以下是对黄仁勋本次采访的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改):

一、黄仁勋:英伟达目前仍是小公司,暂无新收购计划

1、记者:首先恭喜你们。这是很棒的一年。你们仍然领先业界至少两年。去年你们为计算机定义了新的一年,也就是数据中心。我完全同意。你必须从建设工作开始,再往后发展。现在你们已经完成了整个系统的工作,包括GB200 NVL72。是不是该让英伟达开始考虑基础设施、电力和系统中的其他部分了?

黄仁勋:英伟达的规则是只做别人没做的事,或者我们能做得明显更好的事。所以我们开始做事的标准其实很高。这就是为什么我们实际上不算是一家老牌企业。我们之所以做我们做的事,是因为如果我们不去造NVL72,谁会去造呢?谁有能力制造?如果我们不制造Spectrum X这类交换机,谁能做呢?

我们虽然有32000人,还仍然是相对较小的公司,我们仍然是一家小公司,需要确保我们的资源高度集中在我们能做出独特贡献的领域。

2、记者:去年在GDC大会上,你分享了你们在以色列增加投资和活动的情况。加强了你们作为该国最大雇主之一的地位。你们在2024年继续扩张,收购了两家以色列公司。你们打算如何进一步增加在以色列的投资?具体来说,我们很快会听到一个正在进行中的新交易吗?

黄仁勋:我们在全球范围内吸引优秀人才。目前收到了超过一百万份简历申请,公司在以色列的员工已达到近5000人。我们已成为以色列发展最快的企业雇主之一,这让我感到非常骄傲。

即使在当前局势紧张的情况下,我们的以色列团队依然展现出卓越的表现。他们始终保持专注,交出了令人惊叹的成绩单。仅在过去七周内,团队就成功开发出了Spectrum X和Bluefield 3等重要产品。我为他们的专业能力和敬业精神深感自豪。

关于新的收购计划,今天暂时没有要宣布的消息。

二、AI PC需求确实存在,将实现云端级AI能力

3、记者:你们昨晚发布了很多关于AI PC的消息。这些产品的销量今年还没有真正起飞。你认为英伟达能帮助改变这种状况,推动这些产品的采用吗?是什么阻碍了它们的发展?

黄仁勋:这是一个很好的问题。AI技术最初是在云端环境下发展起来的。如果回顾英伟达过去几年的增长轨迹,你会发现主要集中在云计算领域,这是因为训练AI模型需要强大的超级计算机。这些模型规模庞大,在云端部署和通过API调用是很容易的。

我们认为,仍然有设计师、软件工程师、创意人员和爱好者喜欢使用PC来开发这些东西。当然,其中一个挑战是,由于AI在云端,而且云端投入了大量精力和工程开发,开发AI PC的人很少。

不过,我们也注意到有大量的设计师、软件工程师、创意人员和技术爱好者,他们更倾向于在PC上进行AI开发工作。其中一个挑战在于,由于AI生态系统主要集中在云端,加上云服务提供商投入了大量资源进行开发,导致端侧AI开发的人才相对较少。

但令人欣喜的是,Windows PC完全有能力支持AI开发。特别是通过WSL2(Windows Subsystem for Linux 2)这个强大的虚拟化平台,我们可以将原本为云端打造的AI技术引入到PC中。我们正在努力确保PC硬件和WSL2平台能够完美支持这些技术。

我坚信这是未来的正确方向。我个人对此充满热情,所有PC制造商也都表现出极大的兴趣。我们正在与合作伙伴一起,让所有PC都具备运行AI的能力,包括优化Windows系统,这样我们就能把云端的AI生态系统完整地带到个人电脑上。

三、需要打造物理世界基础模型,Cosmos将帮助AI理解世界

4、记者:昨晚CES开幕演讲的某些部分感觉就像是在SIGGRAPH大会上,非常技术性。现在你们的受众更广了,我想请你解释一下这些内容的意义。

黄仁勋:首先,我承认我的讲解不够清晰,但这不是主要问题。要知道,英伟达本质上是一家技术公司,而不是消费品公司。我们的技术会影响并塑造消费电子产品的未来。虽然他们很热情地邀请我们,但我们始终是一家专注技术的公司。当然,这并不能成为我没有把技术解释得更好的借口。

我们昨天宣布的一个最重要的突破是开发出了一个能够理解物理世界的基础模型。就像GPT是理解语言的基础模型,stable diffusion是理解图像的基础模型,我们现在创造了一个能够理解物理世界的基础模型

它能够理解摩擦、惯性、重力、物体的存在和持续性,以及几何和空间关系等概念。这些其实都是儿童与生俱来就能理解的东西,儿童对物理世界的理解方式是目前的语言模型所无法企及的。

我们坚信一个能理解物理世界的基础模型是必不可少的。现在有了这个模型,所有你能用GPT和stable diffusion完成的任务,都可以用Cosmos来实现。比如说,你可以与它进行对话。

你可以跟这个世界模型交谈,询问它当前环境中的情况。基于它通过摄像头获取的信息,它能理解并描述”有很多人围坐在桌前,他们在一个房间里”这样的场景。

Cosmos本质上是一个理解现实世界的模型。那么为什么我们需要这样的模型呢?因为如果你希望AI能在现实世界中自然地运作和互动,它就必须具备这种理解能力。

应用场景在哪里?自动驾驶汽车需要理解物理世界,机器人需要理解物理世界。这个基础模型就是实现这些应用的关键起点。Cosmos会让机器人成为现实。

四、三大Scaling Law将共存,测试时计算将构成良性循环

5、记者:昨晚你提到,我们在见证一些新的Scaling Law的出现,特别是测试时计算(Test-time Compute)。我认为OpenAI的o3模型表明,从计算机的角度来看,扩展推理的成本非常高。英伟达在提供更具成本效益的AI推理芯片方面做了什么?从更广的角度来看,你们如何从测试时计算的扩展中获益?

黄仁勋:首先,对于测试时计算来说,无论是在性能还是成本效益方面,最直接的解决方案就是提升我们的计算能力。新架构的推理性能可能比上一代Hopper高30到40倍。通过将性能提高30到40倍,我们就能将成本降低30到40倍。因为数据中心的其他成本基本保持不变。

所以改进的最佳方式,也是摩尔定律在计算历史上如此重要的原因,就是它降低了计算成本。我之所以提到我们的GPU性能在过去10年增长了1000到10000倍,是因为这反过来说明成本降低了1000到10000倍。在过去20年里,我们将计算的边际成本降低了100万倍。这使得机器学习变得如此合理。只需让计算机从这里到那里。

所以最好的改进方式就是降低计算成本,这也是为什么摩尔定律在计算发展史上如此重要。我提到过去10年我们的GPU性能提升了千倍到万倍,这同时也意味着成本以相同的幅度下降了。

在过去20年中,我们把计算的边际成本降低了百万倍。正是这种成本的大幅下降,让机器学习变得切实可行。未来我们会继续推动计算能力的提升,也将继续带来计算成本的降低。

从另一个角度来看这个问题。现在通过测试时计算的扩展来获得答案需要多次尝试。这些答案会被用作下一轮训练的数据。这些数据又会成为预训练数据。所有我们收集的数据都会被用于预训练和后训练的数据池中。通过不断改进超级计算机的性能并降低训练成本,我们最终可以让每个人使用AI推理的成本都变得更低。

这个过程需要一定时间。这三个扩展定律会在未来持续发挥作用,并且相互影响。从技术角度看,每一次迭代我们都在提升模型的智能水平。同时,用户对AI的要求也在不断提高,他们提出更具挑战性的问题,这就要求系统具备更强的智能。这种需求的增长会导致测试时扩展的持续发展,形成一个良性且不断扩大的循环。

五、DLSS 4是在“预测未来”,但渲染仍是重要基础

6、记者:关于DLSS4,你昨晚做了一些演示。我想请你详细讲解一下,比如多帧生成技术。它是否仍然是渲染两帧,然后在中间生成并进行插值?还有关于文本重压缩的内容,在你们的材料中,在视频里提到的。这是游戏开发商需要专门采用的技术吗?还是是驱动程序层面的功能,可以让所有游戏或至少大部分PC游戏受益?

黄仁勋:我们在Blackwell中让着色器处理器能够运行神经网络。这样就可以在着色器管线中混合使用代码和神经网络。这一点非常重要,因为纹理和材质都是在着色器中处理的。

如果着色器不能运行AI,就无法利用神经网络在算法上带来的进步,比如压缩技术。现在的纹理压缩效果比过去30年使用的算法要好得多。压缩比有了很大提升,对于很多纹理可以额外压缩5倍。考虑到现在游戏体积都很大,这是一个重要的进步。

第二点是关于材质。材质决定了光线在表面的传播方式,它的各向异性特性会让光线以特定方式反射,从而展现出金漆或纯金等不同效果。这种特性本质上是在原子层面发生的。用数学方法很难描述这个过程,但我们可以用AI来学习它。这种神经材质技术将是一个重大突破,能让计算机图形变得更加生动逼真。

关于DLSS,帧生成不是插值关系,而是字面意义上的预测。你是在预测未来。没错,你是在预测未来。你不是在对过去进行插值,你是在预测未来。这样做的原因是因为我们试图提高帧率。

7、记者:AI现在是不是在PC游戏中扮演了更决定性的作用,传统需要渲染的几何特征是不是都转向生成了?

黄仁勋:不是的,让我解释一下为什么。在ChatGPT最初推出时,虽然很多人认为可以直接进行生成,但内部人员都知道这并不现实。因为系统需要真实的基础数据作为条件。就像我们现在用上下文来引导聊天或提示一样,在回答问题前必须理解背景。这个背景可能是PDF文件、网络搜索结果,或者是明确的提示词。

游戏也是同样的道理。你需要提供上下文,不仅要考虑剧情,还要考虑空间关系。通过提供初始的几何形状或纹理作为条件,系统才能生成新内容或提升分辨率。这种方式和ChatGPT使用上下文是一样的。在企业应用中,我们称之为梯度检索增强生成。未来的3D图形将建立在这种3D条件生成的基础上。

以DLSS 4为例。4帧画面总共有3300万像素,但我们只渲染了其中的200万。神奇的是,我们用这200万像素生成了另外3100万像素。关键在于这200万像素必须精确定位。有了这个基础,我们就能生成剩余的3100万像素。更重要的是,因为节省了计算资源,这200万像素可以渲染得非常精美,为生成其他像素提供了优质的参考。

这种变革将影响游戏的方方面面,从像素到几何形状和动画。这个过程花了六年时间。当初宣布DLSS时很多人都不相信,部分原因是我没有解释清楚。但现在大家都认识到生成式AI就是未来。关键是要有条件设置,要有艺术家的创意指导。

Omniverse和Cosmos的关系也是如此。Omniverse作为Cosmos的3D引擎,本质上是一个生成引擎。我们可以精确控制渲染的程度,减少直接渲染来生成更多内容。当减少控制和模拟时,我们就能模拟更大的世界。因为在背后,我们有一个强大的生成引擎在创造真实世界。

六、5090面向极致发烧友,5070 12GB显存与算力达成平衡

8、记者:我有一个关于游戏玩家和消费者的问题。我们注意到RTX 5090和5080之间存在巨大差距。5090的CUDA核心数量是5080的两倍多,价格也翻了一番。为什么你们要在旗舰产品和次旗舰产品之间做出如此大的差异?

黄仁勋:原因是这样的,一旦有人想要最好的产品,他们就一定会选择最好的。你知道,市场并没有那么多细分。而且我们的发烧友们,如果他们想要最好的,给他们稍微好一点的,或者为了省下100美元而选择稍差一点的,他们是不会接受的。他们就是想要最好的。

当然,2000美元确实不是小数目,这确实是一个相当高的价值。但要记住,这项技术将用于你的家庭影院级别的PC环境。而那台PC,你已经在显示器和音响上投资了约1万美元,你肯定会想要最好的GPU。所以我们很多客户,他们就是追求绝对最好的。

9、记者:我是来自韩国的记者。作为一名游戏玩家,我感到非常兴奋。因为当您谈到内存时,特别提到了HBM,为什么没有选择三星的?

黄仁勋:我认为三星基本上不生产显卡的相关产品,是吗?他们生产吗?请不要告诉他们我说了这些。抱歉,是我的错。我不太清楚。

这没什么特别的原因。如您所知,SK和三星是两家最大的制造商。我不太确切知道具体情况,可能也不是什么重要的事情需要记录。他们正在努力。是的,他们正在努力,一定会成功的。我对三星能够成功开发HBM充满信心。

我对三星的成功充满信心。要知道,三星最早创造了HBM。英伟达使用的第一批HBM内存就来自三星。他们会重新崛起的,他们是一家伟大的公司。韩国人非常有雄心壮志,这是好事。虽然他们需要重新设计,但我相信他们一定能做到。他们正在快速推进,对此非常投入。SK和三星都是优秀的公司,尤其在内存领域。所以我相信他们会继续取得成功。你们昨天也看到了我们产品中使用了多少HBM内存,HBM内存对我们来说非常重要。

10、记者:我的问题是,为什么5070仍然只使用12GB显存?现在很多游戏都需要更大的显存,特别是在目标分辨率下。

黄仁勋:我们一直在寻找计算引擎、计算能力、带宽和显存容量之间的最佳平衡。虽然很难做到完美,但这是我们的目标。显存和计算能力必须相匹配——显存太多会浪费计算资源,计算能力太强又会受限于显存容量。所以找到这个平衡点是我们面临的一个重要课题。

11、记者:看到昨晚的5070的性能和4090差不多,价格还降了那么多,很让人兴奋。你对60系列有什么期待吗?

黄仁勋:昨晚我们发布了四款RTX Blackwell显卡,其中性能最低的一款都超过了当前市面上最强的GPU,这真是令人难以置信。这充分展示了AI技术的强大。如果没有AI、张量核心和DLSS4这些创新技术,我们不可能达到这样的性能水平。说到60系列,我其实没什么特别要说的。

12、记者:英伟达的Blackwell架构在统一性方面有什么优势?这种统一架构对开发者和最终用户带来了哪些好处?

黄仁勋:是的,这确实是一个重要的优势。我们的Blackwell架构GPU具有强大的通用性,能够支持从Agentic AI到完整机器人系统的各类应用。无论是在云端服务器、自动驾驶汽车、机器人还是游戏系统中,英伟达的架构都保持完全一致。这是我们深思熟虑后做出的战略决策。

选择统一架构的核心原因是为了给软件开发者提供一个无缝的开发平台。开发者只需要开发一次,就能确保他们的程序可以在任何搭载英伟达芯片的平台上运行。就像我昨天提到的,我们可以在云端开发AI模型,然后轻松地将其部署到个人电脑上运行。这种能力是独一无二的。

具体来说,云端的AI容器可以直接下载到PC上运行。比如SD-XL、Flux、Llama等模型,只需要从云端下载并部署到PC就能立即使用,这种便利性将在未来得到更广泛的应用。

七、英伟达不直接服务企业,不过多涉足计算层和库层

13、记者:虽然超大规模客户对你们产品的需求已经很明显,但我想了解你们在扩大收入来源方面的紧迫感。特别是在开拓新的企业客户和政府数据中心市场,以及在超大规模计算领域,尤其是在亚马逊等公司开发自己的AI芯片的情况下。你们感受到多大压力?能否详细介绍一下你们在企业和政府客户方面的进展?

黄仁勋:我们的紧迫感源自客户的实际需求。我很高兴看到客户在云端使用我们的技术。我们的技术进步速度非常快。每年性能翻一番,就意味着成本降低一半。这比摩尔定律最好时期的进步还要快。我们会继续积极满足客户需求,无论他们在哪里。

关于企业市场,现在主要有两大服务行业。我们的策略是与这两个领域合作,帮助他们打造解决方案。NeMo、NIMs和Blueprints都是开发Agentic AI的工具包。比如我们与ServiceNow的合作就很成功,他们即将推出一系列基于这些技术的agent服务。这就是我们的基本策略。我们也会与埃森哲等解决方案提供商合作。埃森哲在帮助客户采用这些系统方面做得很好。所以第一步就是提供帮助。

14、记者:许多公司都在开发Agentic AI,你们要如何与AWS、微软和ServiceNow这样的企业竞争或是合作呢?

黄仁勋:英伟达并不是一家直接服务企业的公司,而是一家技术平台公司。我们正在为ServiceNow开发工具包、库和AI模型。这是我们的工作重点。我们主要与ServiceNow、SAP、Oracle、Synopsys、Cadence、西门子等公司合作。

虽然我们在专业领域有很强的优势,但我们不想过多涉足AI的计算层和库层。我们的任务是为这些公司开发工具。这个工作很有挑战性,因为我们实际在做的事情就是得把ChatGPT整合到容器中。优化这些端点和微服务非常复杂。不过一旦完成,客户就可以在任何云平台上使用我们的产品。

这就是为什么我们开发了NIMs和NeMo。我们的目的不是与客户竞争,而是帮助他们。如果云服务提供商想使用这些技术,我们也会全力支持。事实上,已经有很多云服务提供商在用NeMo训练他们的逻辑模型,他们的应用商店里也有NIMS。

这些技术都是我们后来开发的。NIMs和NeMo的作用,就像CUDA和CUDAx库一样重要。CUDAx库对推广NVIDIA平台起到了关键作用。我们为行业开发这些库,就是为了让企业不必从零开始开发。

八、Digits主要面向数据科学家,小模型有望登上AI眼镜

15、记者:你们昨天发布了Digits,你认为当前非游戏PC市场最大的未满足需求是什么?

黄仁勋:感谢你的提问。让我先解释一下Digits。它是一个深度学习GPU智能训练系统,主要面向数据科学家。现在的数据科学家大多使用PC、Mac或工作站工作。对大多数PC用户来说,运行机器学习、数据科学软件如pandas或PyTorch都不是问题。

我们最近推出了一款小型设备。它体积小巧,可以放在桌面上,支持无线连接。使用起来就像在操作云服务一样方便,相当于一个私人AI云。为什么要开发这样的设备?因为开发者需要频繁使用计算资源。

如果完全依赖云服务,成本会很高。现在有了这个设备,相当于拥有了一个私人开发云。这对那些需要持续进行开发的数据科学家、学生和工程师来说非常有价值。

Digits的发展前景非常广阔。虽然AI起源于云端,未来可能仍然以云为主,但目前的计算设备已经跟不上AI发展的步伐。这就是为什么我们要开发新的解决方案。

说到超级智能,这其实并不是什么新鲜事。在我们公司,每个领域都有非常优秀的专家。我身边都是这样的人才,我很庆幸能和他们一起工作。我自己只是普通人,但我的管理团队、领导者和科学家们都是各自领域的佼佼者。

这就是我们即将迎来的未来。你会有各种AI助手帮你完成工作,比如写作、分析问题、规划供应链、编程、设计芯片等。它们还能帮你做营销活动和制作播客。这些AI助手随时待命,为你提供帮助。当然,这项技术的应用非常广泛。但要记住,是人在使用工具,机器终究是工具。

16、记者:我想问问昨天发布的新模型产品,特别是小型的模型。这些模型能在智能眼镜上运行吗?在开发时你们有考虑过智能眼镜吗?因为按照你们的发展方向,智能眼镜似乎会成为人们体验AI助手的重要平台。

黄仁勋:是的,我对能回答“我在看什么?怎么去那里?”这类问题的智能眼镜很感兴趣。它可以帮助阅读,与AI结合带来的可能性令人兴奋。我会这样使用Cosmos:云端的Cosmos负责视觉理解,如果要在设备本地运行,就用Cosmos提炼出一个小型模型。这样Cosmos就成了知识迁移的工具,可以把知识转移到更小的AI模型中。

这是可行的,因为小型AI模型虽然通用性较差,但在特定领域非常专注。这就是为什么可以进行定向的知识迁移。我们总是先建立基础模型,然后逐步提炼出更小的模型。

九、中国车企对智驾趋势影响更大,5年前还没有明确把握

17、记者:我想问一个关于自动驾驶汽车的问题。2017年英伟达在CES上展示了一辆演示车,并在5月GDC与丰田合作。从2017年到2025年,这项技术有了哪些变化?当时存在什么问题,现在又有什么技术突破?

黄仁勋:我认为,未来所有可移动的设备都会具备自动化功能。不会再有需要人力的普通工作。20年后如果还看到有人开着车回家,那会很有趣,但这显然毫无必要。未来的汽车虽然保留了手动驾驶选项,但都必须具备自动驾驶功能。现在路上的10亿辆汽车几乎都不能自动驾驶,但20年后,这10亿辆车都将具备自动驾驶能力。我们仍然可以选择自己开车,但这个趋势已经非常明显了。

5年前,我们对这项技术的稳定性(Robustness)还没有把握,但现在已经非常确定了。传感器、计算机和软件技术都已经相当成熟。有充分证据表明,新一代汽车,尤其是电动汽车,几乎都会配备自动驾驶功能。

我认为有两家公司推动了这个变革,让传统车企改变了想法。一个是特斯拉,影响很大,但更大的影响可能来自中国令人惊叹的技术进步。中国新兴电动车企的技术非常出色,比亚迪、理想、小鹏、小米、蔚来等等。他们的自动驾驶技术已经发展得很好,现在正在走向全球。这为未来的汽车树立了标准——必须具备强大的自动驾驶能力。我认为这个行业已经发生了根本性的改变。

技术的成熟和我们对它的认知都需要时间,但现在形势非常好。Waymo是我们重要的合作伙伴,他们在旧金山的表现非常出色。

十、物理AI成缺失关键因素,需打造GPT-3级别物理模型

18、记者:你们昨天发布产品是个好的开始,但神经渲染面临的一大挑战是DirectX中的各种窗口。你们需要做什么来减少引擎运行的阻力?你们是怎么和微软合作的?

黄仁勋:微软一直很配合我们的开发工作。如果API需要改变,他们都很配合。但我们在DLSS中的大部分工作不需要改变API,主要是要改变引擎。因为这涉及场景的语义理解,不只是简单的绘制调用。场景主要存在于虚幻引擎、磷火引擎等游戏引擎中。这就是为什么DLSS现在已经集成到了一百多个引擎里。

特别是从DLSS 2/3/4开始,一旦完成集成,即使游戏是为3开发的,也能享受到4带来的部分改进。所以我们必须为基于场景语义的AI处理搭建管道。这确实是必须要做的事。

19、记者:重大的技术变革从来不是一家公司能完成的。比如互联网、个人电脑,还有最近的绿色技术。但这些技术最终都会在某个时刻汇聚,带来巨大的转变。说到AI,你觉得现在还有什么缺失的部分会阻碍我们的发展,还是说一切都已经准备就绪了?我知道AI比较复杂,应用方式也很多,但我想知道你认为还有什么不足的地方。

黄仁勋:让我从两个方面说明。首先是语言和认知AI方面。我们正在提升AI的认知能力,让它具备多模态和良好的推理能力。其次是如何把这项技术应用到AI系统中。AI不是单个模型,而是一个知识系统。Agentic AI就是把各种模型整合在一起——有检索模型、搜索模型、图像生成模型、推理模型、规划模型等。这是一个完整的知识系统。

这几年,业界不仅在改进基础AI,也在探索AI的应用。但我们还缺少一个关键要素,那就是物理AI。物理AI需要像认知AI那样有基础模型。就像GPT-3是第一个达到实用水平的语言基础模型,让我们能在上面开发各种功能。

所以我们必须让物理AI也达到这样的水平。这就是我们在开发Cosmos的原因。一旦达到这个水平,把模型推向市场,就能激活大量应用场景。有了基础模型,下游任务就能顺利开展。这个基础模型也可以作为教师模型,就像我们之前说的。这对Cosmos来说很重要。

第二个缺失的部分是我们正在用Omniverse解决的问题——把Omniverse和Cosmos结合成一个物理系统。以物理学基础,这样我们就能用这个基础来控制生成过程,让Cosmos生成的内容更可靠,而不只是看起来逼真。Cosmos加上Omniverse很可能成为一个重要的突破点。

十一、AI发展没有物理限制,贸易战背景下将尽力满足需求

20、记者:关于贸易战,现在仍然还比较活跃。你担心这会影响大家的盈利前景吗?

黄仁勋:我不担心。我相信政府能在贸易谈判中做出明智的决定。我们要做的就是,无论结果如何,都尽力帮助客户和市场。我们可以再看看形势的发展。

21、记者:英伟达是如何考虑市场策略的?AI发展的下一步需要什么? 是否存在物理限制?

黄仁勋:我们只在市场真正需要我们的时候才会行动,只有当市场存在空白,而且我们确实应该去填补这个空白的时候。我们倾向于做那些与现有市场不同的事情,或者做那些如果我们不做就没人会做的事情。这就是我们的理念——不要重复别人已经在做的事。我们不是去抢占市场份额,而是去创造新的市场。

我们不会为了抢占份额而进入一个已有的市场,这不是我们的风格。我们更愿意开拓全新的市场。比如说,市场上没有Digits这样的产品。如果我们不开发它,可能永远都不会有人开发,因为软件系统太复杂了。同样,如果我们不开发高级神经图形学,也不会有其他人去做。这些都是我们必须承担的使命。

说到需求,我们当然需要更好的传感器和摄像头来解决问题。未来几年,随着更先进摄像头的普及,特别是智能摄像头和智能眼镜的出现,我们将收集到海量的视频数据,这让我非常期待。

22、记者:我来自以色列。在过去几年里,AI特别是生成式AI在经济上有了很大发展。我想请教您,那些参与这个浪潮的公司,它们现在的发展速度是否可持续?短期内能否维持这样的发展势头?

黄仁勋:谈到AI的发展前景,就我所知并没有物理限制。我们之所以能快速推进AI计算,是因为我们能够统一开发CPU、GPU、NVLink以及所有软件和系统。如果这些工作分散在20个不同的公司,整合起来会非常耗时。正是因为我们掌握了所有集成技术和软件支持,才能如此快速地推进系统发展。从Hopper、H100到H200再到下一代,我们将持续提升每个单元的性能。

第二点,由于我们能够优化整个系统,实际性能提升远超单纯的晶体管性能提升。虽然摩尔定律已经放缓,晶体管性能的代际提升不大,但我们的系统整体性能仍在逐年大幅提升。所以我认为目前没有明显的物理瓶颈。

随着计算能力的提升,几个重要的扩展定律将继续发挥作用:首先,研究人员可以用更大的模型训练更多数据;其次,强化学习和合成数据生成能力会不断提升。

第三,随着成本持续下降,应用范围会进一步扩大。只要没有物理上的根本限制,AI就会持续快速发展。

十三、与联发科合作很满意,未来可能会扩大台湾公司规模

23、记者:我来自中国台湾。主题演讲提到Digits AI超算CPU正在与联发科合作。您能谈谈与联发科和台积电等台湾企业的合作吗?英伟达还会在台湾建设总部吗?

黄仁勋:我们在台湾有很多员工,但现有的建筑太小了。我需要找到解决方案,可能会在Computex上宣布。我们正在物色地产,如果你知道好地方,请务必第一时间只告诉我一个人。

关于联发科,我们在多个领域都有合作。比如在自动驾驶汽车领域,我们一起为行业提供完全软件定义的智能汽车解决方案。

我们在汽车领域的合作非常顺利。此外,新的Grace GB10 CPU也是与联发科合作开发的。我们共同设计架构,实现了芯片间的互联以及CPU和GPU的内存一致性。

联发科在设计和制造方面都做得很出色。第一次就做出了完美的芯片,性能优异。大家都知道联发科在低功耗方面的优势,确实名不虚传。我们很高兴能与这样优秀的公司合作。

十四、计算机图形进入指数增长期,未来所有行业都将经历如此变革

24、记者:我来自印尼,想请教您对学生学习方向的建议。

黄仁勋:这是个很好的收尾问题。让我先分享下个人经历,再谈谈对新一代学生的建议。我这一代是第一个必须学会使用计算机做科研的世代。上一代人还在用计算器、计算尺和纸笔。我们这代人必须学会用计算机编程、设计芯片、模拟物理。计算机是我们工作的工具。而下一代则需要学会运用AI工作,因为AI就是新时代的计算机。

未来在生物学、林业、农业、化学、量子物理等各个领域,都需要思考如何借助AI开展工作。在计算机科学领域,则是研究如何用AI推进AI本身的发展。供应链管理、运筹学等领域也是如此。

如果想当记者,就要思考如何用AI提升报道质量;想当作家,就要思考如何用AI提升写作水平。未来每个学生都必须学会使用AI,就像现在的学生都必须会用电脑一样。

这就是根本区别,也体现了AI革命的深远影响。这不仅仅关乎大语言模型,AI将融入未来的方方面面。这是最具变革性的技术,发展速度惊人。

感谢大家的关注。对于游戏行业和玩家们,很高兴看到行业从最初用GPU推进AI,发展到现在用AI推进图形技术。

我们在RTX Blackwell、DLSS 4、神经渲染、神经着色等方面的工作,都得益于AI的进步,现在又反过来推动图形技术发展。值得注意的是,计算机图形学原本增长放缓,但AI的加入带来了超级加速。现在可以实现每秒200-400帧的完全光追画面。

我们进入了计算机图形的指数增长期,几乎每个领域都是如此。这就是为什么我认为不仅是我们行业,很快所有行业都会经历快速变革。

感谢大家,新年快乐!