每年春季,NVIDIA的GTC主题演讲都会成为科技行业的盛典,它让人们见识到当今的科技最前沿,而这些所展示的内容也并不是“空头支票”,而是实实在在发生在我们身边,或者说“身前”的。自2019年以 "GPU Computing: The Future of Computing" 揭开序幕,AI 便成了 GTC 年会的重头戏。NVIDIA 始终致力于将旗下产品的强大算力与 AI 技术的前沿需求无缝对接。正是老黄远见卓识的策略布局,使NVIDIA在AI的黄金时代巍然屹立,稳占行业霸主之位。

打开网易新闻 查看精彩图片

GTC 2024概览:

● B200芯片:采用双芯片设计,晶体管数量达到2080亿个。单GPU AI性能达20 PFLOPS(即每秒2万万亿次)。内存192GB,基于第五代NVLink,带宽达到1.8TB/s。● DGX GB200 NVL 72:内置36颗GRACE CPU和72颗Blackwell架构GPU,AI训练性能可达720PFLOPs(即每秒72万万亿次),推理性能为1440PFLOPs(每秒144万万亿次)。● 基于GB200的DGX SuperPOD超算:搭载8颗DGX GB200,即288颗Grace CPU和576颗B200 GPU,内存达到240TB,FP4精度计算性能达到11.5EFLOPs(每秒11.5百亿亿次)● Project GR00T:人型机器人项目——包含了人型机器人基础模型,ISAAC Lab开发工具库和Jetson Thor SoC片上系统开发硬件,带宽达到100GB/s,AI计算性能达到800TFLOPs。

在今年的 GTC 上,老黄再一次地刷新了世界 AI 商用算力的排行榜,发布了 Blackwell 架构和同名 AI 处理器 B100、B200 和 GB200,产品取名自杰出数学家和统计学家 David H. Blackwell,体现了其在概率计算、博弈论、统计学和动态规划等多个领域的杰出贡献。

此次发布的 Blackwell GPU B100 使用了两个台积电 4NP 工艺制造的芯片,芯片面积为 814 平方毫米,这个数据已经接近了 EUV 光刻技术的理论极限值(858 平方毫米),两个芯片通过 C2C-Interface 进行相连,组成一个 "1600 平方毫米 " 的超大处理单元。

打开网易新闻 查看精彩图片

单个 GPU 芯片含 1040 亿晶体管,整体达到 2080 亿个,比上一代的 Hopper 架构增加了 240 亿个。每个 GPU 连接了四个各有 24 GB 的 HBM3E 存储芯片,使得 B100 AI 处理器拥有 192 GB 的高速存储,并且存储带宽达到了 8 TB/s。

打开网易新闻 查看精彩图片

在日常的计算任务中,FP32(单精度浮点数)和 FP64 是最为普遍的数据格式,它们使用 32 位和 64 位分别对浮点数进行编码,既能提供较大的数值范围也保障了较高的数值精度,但相对地,也对内存和计算资源的需求更高。与之相对,FP16(半精度浮点数)和 FP4 提供的算力精度较低,特别是 FP4,其低精度下的性能并不理想,即使在大型语言模型(LLMs)中开启 FP4 精度运行也是如此。

打开网易新闻 查看精彩图片

功耗方面,NVIDIA 宣布 Blackwell 系列的 TDP 范围在 700 至 1200 W 之间。其中,风冷版本的 B100 和 B200 的 TDP 分别为 700W 和 1000 W,而 1200 W 版本的则需使用上水冷散热。此外,Blackwell GPU 还配备了支持 6.0 标准的 PCI-Express 控制器。

然后也放一下 B100 和 B200 的对比图,B200 在运算性能与显存上对比 B100 有了不小的提升,相当于 B100 的 " 官方灰烬版 "。同时 NVIDIA 还推出了 GB200。

打开网易新闻 查看精彩图片

GB200 就是将 2 个 B200 芯片和 1 个 Grace CPU整合到一起," 合体之后 " 的性能表现将是单片 H100 的 30 倍左右的提升。当然 GB200 是应该是不会单独售卖的,如同去年推出的 HGX 100 72X 一样,GB200 主要还是通过整合,然后形成一个 GB200 NVL72 的计算中心进行出售。

打开网易新闻 查看精彩图片

NVIDIA 在本次的 GTC 2024 中进一步升级了其 Omniverse 平台,并将其企业技术扩展到了苹果生态系统。这一策略在于借助 Vision Pro 应用,使开发者得以在增强现实 / 虚拟现实(AR/VR)环境中利用 Omniverse 的强大工具。

打开网易新闻 查看精彩图片

在 GTC 大会上上,NVIDIA 展示了设计师如何利用 Vision Pro 中的汽车配置工具操作车辆模型,并能够以虚拟的方式 " 进入 " 车辆内部进行查看。这种交互是通过 Omniverse Cloud API 实现的,此外,图形内容还可以通过云计算服务直接流式传输至 Vision Pro,实现高效的图形传输网络服务。

打开网易新闻 查看精彩图片

这一升级意味着,Omniverse 和 Vision Pro 的结合将为 AR/VR 领域带来更加沉浸式和互动性强的体验。用户能够在三维空间中以更加自然和直观的方式进行设计、模拟和创作,这对于产品设计、建筑可视化以及互动娱乐等多个应用场景都将是一次质的飞跃。

正当我们以为今天的大会只会聚焦于算力话题时,老黄却给我们带来了意想不到的惊喜——备受瞩目的年度机器人环节如约而至,NVIDIA 宣布了其人形机器人项目 GR00T。

打开网易新闻 查看精彩图片

在今日的主题演讲中,黄仁勋展示了多款由 GR00T 平台驱动的人形机器人如何高效完成多项任务,这些机器人分别来自 Agility Robotics、Apptronik、傅利叶智能以及宇树科技。

GR00T 的诞生源自 NVIDIA 的 Isaac 机器人平台工具,它基于全新的通用基础模型设计,使得 GR00T 驱动的人形机器人能够接收并处理文本、语音、视频乃至现场示范的输入信息,从而执行精确的操作。这些操作包括理解自然语言、模仿人类行为、在现实世界中的导航和互动等。可以说,AI 已经变成了机器人的 " 灵魂 "。

打开网易新闻 查看精彩图片

NVIDIA 还开发了一款新型的 " 机器人大脑 " 计算芯片—— Jetson Thor,该芯片能够执行复杂的任务,并借助 Transformer 引擎处理多元的传感器数据。

打开网易新闻 查看精彩图片

未来,NVIDIA 将人形机器人定位为公司的一个关键战略方向。正如黄仁勋所预示的,机器人界的 ChatGPT 时代可能即将来临。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

NVIDIA,这家成立于1993年的公司,给人更多的印象就是一个游戏显卡的制造商,很少有人能够想到在这几十年的时间里,NVIDIA 通过CUDA能够让GPU从一个游戏硬件概念变成改变世界的“数字石油”。

今年的GTC峰会主题完全围绕AI展开,2个小时的时间,老黄又一次带来了AI的变革时刻。不知道看完本次峰会,大家觉得NVIDIA能否推动AI Era的发展呢?