【硬件资讯】老黄GTC大会带来全新Blackwell架构显卡！专业领域家用齐备，AI性能大幅提升！|gpu|nvidia|系列显卡|英伟达|黄仁勋

新闻①：英伟达发布Blackwell架构GPU，包括B200和GB200，大幅提升AI计算性能

在美国加州圣何塞会议中心举行的GTC 2024大会上，英伟达创始人兼CEO黄仁勋带来了Blackwell架构GPU，包括用于取代H100/H200的B200 GPU，另外还有与Grace CPU相结合的GB200。

B200采用了台积电（TSMC）改进的4NP定制工艺制造，整合了两个独立制造的Die，共有2080亿个晶体管，使用了新的NVLink 5.0技术来连接两块芯片。其拥有160组SM，对应20480个核心，搭配的使192GB的HBM3E，提供了高达8TB/s的带宽，功耗达到了700W。B200单个GPU提供了20 petaflops的AI性能，大概五倍于H100的4 petaflops。由于引入了第二代Transformer引擎，将有助于自动将模型转换为适当的格式以达到最佳性能。此外，Blackwell架构GPU还支持新的FP6格式，这是一种介于FP4和FP8两者之间的解决方案。

暂时还不清楚台积电4NP工艺的细节，但密度方面应该不会有明显的提升，而之前的H100基本上已经是一个完整的掩模版，芯片尺寸为814mm2，而理论最大值为858mm2。为此B200使用了两个全尺寸掩模版制造的芯片，每个对应四个HBM3E堆栈，每个堆栈的接口为1024-bit、容量为24GB、带宽为1TB/s。相比之下，每个H100芯片对应六个HBM3接口，意味着B200每个芯片可以减少内存控制器所需要的芯片面积，从而将更多的晶体管用于计算单元。此外，用于两个芯片互连的NV-HBI接口也会占用一些空间。

英伟达的Superchip被设计为人工智能（AI）和高性能计算（HPC）工作负载的典型平台，这次将Blackwell架构GPU与Grace CPU结合推出了GB200 Grace Blackwell Superchip。其配备了两个B200 GPU和一个Grace CPU，后者配有72核心的Arm Neoverse V2内核，可配置 TDP 高达2700W。新平台提供了40 PetaFlops的计算性能（INT8），并拥有864GB的庞大内存池，HBM3E具有16TB/s的内存带宽，芯片之间通过3.6TB/s带宽的NVLink进行互连。

英伟达还带来了全新的GB200 NVL72计算平台，这是一个全机架解决方案，有18个1U服务器。其提供的FP8性能为720 petaflops，FP4计算性能为1440 petaflops，可处理多达27万亿个AI LLM参数模型。每台服务器里带有两个GB200 Grace Blackwell Superchip，合计共有36个Grace CPU和72个Blackwell GPU。这些计算节点带有1.7TB的HBM3E内存、32TB/s的内存带宽，并且全部采用液冷MGX封装。

每个机架内还有ConnectX-800G Infiniband SuperNIC，以及一个用于网络内计算的Bluefield-3 DPU（80GB/s内存带宽）。另外还会有最新的NVLINK交换机，具有8个接口，速率为1.8TB/s，总带宽高达14.4TB/s。英伟达还推出了新款NVLink Switch芯片，拥有500亿个晶体管，采用了台积电4NP工艺制造，提供了7.2TB/s带宽，用于不同节点之间的通信互连。

英伟达通过八个GB200 NVL72计算平台，组成了新的DGX SuperPOD，合计共有288个Grace CPU和576个B200 GPU。这本身就是一台AI超级计算机，具有240TB内存，提供了11.5 exaflops的FP4计算能力。

英伟达通过发布Blackwell架构GPU，再次巩固了自身在人工智能市场的主导地位，开创了AI计算的新时代。Dell、思科、HPE、联想、Supermicro、Aivres、华擎、华硕、Eviden、富士康、技嘉、英业达、和硕、云达、纬创、Wiwynn和ZT Systems等OEM厂商也将在未来提供各自的解决方案。

原文链接：https://www.expreview.com/92824.html

先前就有消息称NVIDIA将会提前发布Blackwell架构的专业卡，果不其然的就在本次GTC大会上正式带来了Blackwell架构的B200 GPU以及与Grace CPU结合的GB200。在B200 GPU上，NVIDIA再度回归了双芯设计，采用了独立制造的两个Die，通过类Chiplet的工艺方式实现了新的多芯片封装，带来了超过H100五倍的AI性能！而GB200超级计算机，则是配备了两个B200 GPU和一个Grace CPU，这性能应当是相当恐怖的……从这种提升方向来看，B200 GPU应当是一个AI特化方向的产品，常规算力的提升并没有AI提升那么大，这样的变化可能会延续到同架构的家用产品上……

新闻 ②：英伟达RTX 50系列GPU或采用台积电4NP工艺，与Blackwell架构B100相同

在美国加州圣何塞会议中心举行的GTC 2024大会上，英伟达创始人兼CEO黄仁勋带来了Blackwell架构GPU，包括用于取代H100/H200的B200 GPU，另外还有与Grace CPU相结合的GB200。这些都属于数据中心产品，同样属于Blackwell架构的GeForce游戏显卡还要等上一些时日，最快也要到2024年底。

B200采用了台积电（TSMC）4NP定制工艺制造，只是现有4N工艺的改进，都属于台积电5nm制程节点的一部分，并非人们所期待的3nm/N3工艺。已经有网友透露，未来将取代AD102的GB202也将使用相同的工艺制造，密度方面提升了30%。此外，传闻 GB202的L1缓存在设计上相比AD102及GA102会有明显变化。

根据之前的说法，基于Blackwell架构的GeForce显卡将会有GB202、GB203、GB205、 GB206和GB207五款芯片，对应的显存位宽分别是512/384-bit、256-bit、192bit、128-bit和128-bit，与以往最大的不同，是AD104之后没有GB204这款x04芯片，而是变成了x05的GB205。新一代产品将采用16Gb（2GB）的GDDR7是模块，还可能支持24Gb（3GB）模块，速率为28 Gbps。

其中定位最高的GB202将用于GeForce RTX 50系列的旗舰型号，规模是GB203的两倍。从B200的情况来看，这样的设计的是有可能的，整合了两个独立制造的Die，再使用NVLink技术来连接两块芯片。有消息称，GB202拥有192组SM，而GB203为96组SM。

此外，GeForce RTX 50系列应该都会采用PCIe 5.0接口，支持DisplayPort 2.1显示输出，同时会配备新款的“12V-2×6”连接器。

原文链接：https://www.expreview.com/92860.html

GTC上仅仅亮相了Blackwell架构的专业卡，而没有家用卡，但按照相关的消息来看，这一代的RTX 50家用卡也将是使用与B200 GPU同样的Blackwell架构，而且很可能是同样的N4P工艺，这就很有看点了。但最重要的一点，如果RTX 50使用了同样的Blackwell架构，那应该也会集成B200 GPU的AI提升巨大而常规提升不大的特性……那对于游戏玩家来说会怎么样呢？

新闻 ③ ：英伟达 CEO 黄仁勋预测：十年内 AI 将能实时生成游戏中的所有像素

在英伟达 GTC 2024 大会上发布了全新 Blackwell GPU 架构之后，黄仁勋在问答环节中对游戏领域的 AI 未来做出了大胆预测。据 Tom's Hardware 报道，这位 CEO 认为，仅需十年甚至更短的时间，AI 就能够实时生成游戏中的所有像素。

“在我看来，科技领域的大部分进步都遵循着 S 曲线，一旦技术变得实用且更优秀，那么从萌芽到成熟往往只需要十年左右的时间。” 黄仁勋表示，“ChatGPT 就是一个很好的例子，它不仅实用，而且在很多方面还表现得更加出色。所以我认为这项技术距离我们不到十年。十年后，我们将到达 S 曲线的另一端。而五年后，我们可能正处于 S 曲线的中段，一切都将快速改变，人们会惊叹于发生的巨大变化。那么我们现在究竟处于这个十年的哪个阶段呢？或许是两年？很有可能。因此，我认为在未来五到十年之内，AI 实时生成游戏画面将成为主流。”

IT之家注意到，与黄仁勋的乐观态度相比，他的同事、英伟达应用深度学习研究副总裁 Bryan Catanzaro 则显得更为谨慎。早在六个月前，Catanzaro 就曾表示，DLSS 技术可能在第十代实现完全神经渲染的效果。

“我并不认为 AI 可以完全取代游戏制作，” Catanzaro 说道，“开发者无法仅仅通过几段文字描述创造出像《赛博朋克 2077》那样出色的作品。但我认为，在遥远的未来，DLSS 10 将会成为一套完全依靠神经网络渲染的系统，它将以全新的方式与游戏引擎交互，从而带来更加沉浸和绚丽的画面。”

需要指出的是，NVIDIA DLSS 1.0 版本发布于 2019 年 2 月份。而后续的 2.0 版本则花费了大约一年才推出，3.0 版本更是足足用了两年半的时间。由此可见，DLSS 10 问世需要远超十年的时间。

尽管如此，英伟达正持续加大对游戏领域 AI 技术的投入。在 GTC 大会上，黄仁勋展示了一款名为“Covert Protocol” 的全新 AI NPC 演示。该项目采用了英伟达的 Avatar 云引擎 (ACE) 和 Inworld AI 技术，与今年 GDC 2024 上展示的育碧 NEO NPC 演示使用了相同的技术组合。

原文链接：https://m.ithome.com/html/757253.htm

那，只有AI性能提升巨大的游戏显卡会怎么样呢？NVIDIA的答案是……直接用AI生成游戏不就好了？黄仁勋预测，未来十年内，AI将能实时生成游戏中的所有像素，完全不需要依赖传统的光栅化性能，直接“计算”游戏了。这样的技术并不是不可能出现的，目前的DLSS就是通过深度学习超采样技术，生成了原本游戏中不存在的像素，来进行画质补强，不知道完全实现AI计算游戏会是什么时代呢？

文章转载自网络（链接如上）。文章出现的任何图片，标志均属于其合法持有人；本文仅作传递信息之用。如有侵权可在本文内留言。

引用文章内容与观点不代表电脑吧评测室观点。