NVIDIA GTC 2024回顾：见证AI变革时刻（AI核弹B200、GR00T人型机器人）|ai核弹|gpu|nvidia|显卡|机器人|超级计算机|黄仁勋

每年春季，NVIDIA的GTC主题演讲都会成为科技行业的盛典，它让人们见识到当今的科技最前沿，而这些所展示的内容也并不是“空头支票”，而是实实在在发生在我们身边，或者说“身前”的。自2019年以 "GPU Computing: The Future of Computing" 揭开序幕，AI 便成了 GTC 年会的重头戏。NVIDIA 始终致力于将旗下产品的强大算力与 AI 技术的前沿需求无缝对接。正是老黄远见卓识的策略布局，使NVIDIA在AI的黄金时代巍然屹立，稳占行业霸主之位。

GTC 2024概览：

● B200芯片：采用双芯片设计，晶体管数量达到2080亿个。单GPU AI性能达20 PFLOPS（即每秒2万万亿次）。内存192GB，基于第五代NVLink，带宽达到1.8TB/s。● DGX GB200 NVL 72：内置36颗GRACE CPU和72颗Blackwell架构GPU，AI训练性能可达720PFLOPs（即每秒72万万亿次），推理性能为1440PFLOPs（每秒144万万亿次）。● 基于GB200的DGX SuperPOD超算：搭载8颗DGX GB200，即288颗Grace CPU和576颗B200 GPU，内存达到240TB，FP4精度计算性能达到11.5EFLOPs（每秒11.5百亿亿次）● Project GR00T：人型机器人项目——包含了人型机器人基础模型，ISAAC Lab开发工具库和Jetson Thor SoC片上系统开发硬件，带宽达到100GB/s，AI计算性能达到800TFLOPs。

在今年的 GTC 上，老黄再一次地刷新了世界 AI 商用算力的排行榜，发布了 Blackwell 架构和同名 AI 处理器 B100、B200 和 GB200，产品取名自杰出数学家和统计学家 David H. Blackwell，体现了其在概率计算、博弈论、统计学和动态规划等多个领域的杰出贡献。

此次发布的 Blackwell GPU B100 使用了两个台积电 4NP 工艺制造的芯片，芯片面积为 814 平方毫米，这个数据已经接近了 EUV 光刻技术的理论极限值（858 平方毫米），两个芯片通过 C2C-Interface 进行相连，组成一个 "1600 平方毫米 " 的超大处理单元。

单个 GPU 芯片含 1040 亿晶体管，整体达到 2080 亿个，比上一代的 Hopper 架构增加了 240 亿个。每个 GPU 连接了四个各有 24 GB 的 HBM3E 存储芯片，使得 B100 AI 处理器拥有 192 GB 的高速存储，并且存储带宽达到了 8 TB/s。

在日常的计算任务中，FP32（单精度浮点数）和 FP64 是最为普遍的数据格式，它们使用 32 位和 64 位分别对浮点数进行编码，既能提供较大的数值范围也保障了较高的数值精度，但相对地，也对内存和计算资源的需求更高。与之相对，FP16（半精度浮点数）和 FP4 提供的算力精度较低，特别是 FP4，其低精度下的性能并不理想，即使在大型语言模型（LLMs）中开启 FP4 精度运行也是如此。

功耗方面，NVIDIA 宣布 Blackwell 系列的 TDP 范围在 700 至 1200 W 之间。其中，风冷版本的 B100 和 B200 的 TDP 分别为 700W 和 1000 W，而 1200 W 版本的则需使用上水冷散热。此外，Blackwell GPU 还配备了支持 6.0 标准的 PCI-Express 控制器。

然后也放一下 B100 和 B200 的对比图，B200 在运算性能与显存上对比 B100 有了不小的提升，相当于 B100 的 " 官方灰烬版 "。同时 NVIDIA 还推出了 GB200。

GB200 就是将 2 个 B200 芯片和 1 个 Grace CPU整合到一起，" 合体之后 " 的性能表现将是单片 H100 的 30 倍左右的提升。当然 GB200 是应该是不会单独售卖的，如同去年推出的 HGX 100 72X 一样，GB200 主要还是通过整合，然后形成一个 GB200 NVL72 的计算中心进行出售。

NVIDIA 在本次的 GTC 2024 中进一步升级了其 Omniverse 平台，并将其企业技术扩展到了苹果生态系统。这一策略在于借助 Vision Pro 应用，使开发者得以在增强现实 / 虚拟现实（AR/VR）环境中利用 Omniverse 的强大工具。

在 GTC 大会上上，NVIDIA 展示了设计师如何利用 Vision Pro 中的汽车配置工具操作车辆模型，并能够以虚拟的方式 " 进入 " 车辆内部进行查看。这种交互是通过 Omniverse Cloud API 实现的，此外，图形内容还可以通过云计算服务直接流式传输至 Vision Pro，实现高效的图形传输网络服务。

这一升级意味着，Omniverse 和 Vision Pro 的结合将为 AR/VR 领域带来更加沉浸式和互动性强的体验。用户能够在三维空间中以更加自然和直观的方式进行设计、模拟和创作，这对于产品设计、建筑可视化以及互动娱乐等多个应用场景都将是一次质的飞跃。

正当我们以为今天的大会只会聚焦于算力话题时，老黄却给我们带来了意想不到的惊喜——备受瞩目的年度机器人环节如约而至，NVIDIA 宣布了其人形机器人项目 GR00T。

在今日的主题演讲中，黄仁勋展示了多款由 GR00T 平台驱动的人形机器人如何高效完成多项任务，这些机器人分别来自 Agility Robotics、Apptronik、傅利叶智能以及宇树科技。

GR00T 的诞生源自 NVIDIA 的 Isaac 机器人平台工具，它基于全新的通用基础模型设计，使得 GR00T 驱动的人形机器人能够接收并处理文本、语音、视频乃至现场示范的输入信息，从而执行精确的操作。这些操作包括理解自然语言、模仿人类行为、在现实世界中的导航和互动等。可以说，AI 已经变成了机器人的 " 灵魂 "。