“这不是一场演唱会,而是一个开发者大会。”

当地时间3月18日中午,美国加州圣何塞SAP体育中心开始了一场科技届的盛宴。这是时隔5年以来,GTC大会首次回归线下。会上,英伟达CEO黄仁勋在开玩笑地说出了上述话语。这是属于黄仁勋的“黄氏幽默”。

这次大会,英伟达将GPU硬件性能提到了新高度,发布了最强AI加速卡Blackwell GB200,该产品预计将于2024年晚些时候发货。

而除了硬件产品,黄仁勋还发布了生成式AI微服务。

英伟达在每次GTC大会上,都会推出较多的细分行业进展。一如既往,英伟达此次也带来了其在医药、机器人等行业的进展。其中最值得关注的是,英伟达还发布了应用于机器人领域的GROOT通用基础大模型。

在GTC大会上,英伟达也展现了多家使用GROOT大模型的人形机器人,显示其在具身智能上的技术积累。

宇宙最强GPU

“通用计算已经失去动力,现在我们需要更大的模型,更大的GPU,更需要将GPU堆叠在一起。”黄仁勋表示。

在这场大会上,英伟达推出了最新一代的Blackwell架构。每新推出新一代架构,芯片的性能就会得到质的飞跃。与8年前的Pascal架构相比,英伟达将AI计算的性能提高了1000倍。

打开网易新闻 查看精彩图片

Blackwell的名字是为了纪念美国国家科学院首位黑人学者、数学家David Blackwell。据英伟达介绍,Blackwell架构的GPU将于2024年晚些时候出货。

Blackwell架构GPU采用了MCM(多芯片封装)设计,采用台积电定制的4NP(4N工艺的改进版本)工艺制造。它同时集成了两块GPU。两颗die之间的通信速度为10TB每秒,可以支持多达10万亿参数的AI大模型。

虽然多芯片封装、chiplet技术已经发展多时,但Blackwell GPU还是首颗采用MCM的GPU产品。值得一提的是,它的并联做得非常好,两颗die会被Cuda看作一颗GPU运算,不存在因数据传输、缓存等带来的问题。

在Blackwell架构下,英伟达同时推出了B200和GB200两个系列的产品。

B200拥有2080亿个晶体管, 在算力上可以提供20petafops的FP4吞吐量。GB200则是通由2个B200芯片(4个die)和Grace CPU构成,采用900GB /秒的超低功耗芯片连接。

据黄仁勋介绍,与H100相比,B200的算力是前者的6倍,对大模型性能提升了30倍,且能耗缩小到仅25分之一。

打开网易新闻 查看精彩图片

除了GB200芯片,英伟达还发布了DGX B200系统,可搭载36个GB200超级芯片,由36个Grace CPU和72个Blackwell GPU构成。

这款AI超级计算平台可以用于AI模型训练、微调和推理。GB200的推理性能可达1440 PFLOPS,传输量最大可达260TB,且其FP8精度训练算力可达720PFlops。

为了扩大Blackwell的规模,英伟达推出了NVLink Switch芯片,可以以每秒1.8 TB的速度连接四个NVLink,并通过减少网络内流量来消除流量拥塞。

可以说,当行业同行还在追逐H100、与H100竞争时,英伟达将AI核弹的算力又提高到了新高度。

如果训练一个1.8万亿的模型,需要用到8000张Hopper架构的GPU,消耗15兆瓦电力连续跑90天。而采用GB200 Blackwell GPU后,仅需2000张卡,同样运行90天情况下,电力消耗仅为之前的四分之一。

黄仁勋将NVIDIA Switch和GB200看作一个“巨型GPU”,他们也是构成NVIDIA GB200 NVL72的关键组件,该产品能为万亿参数模型提供计算动力,具有720 petaflops的AI训练性能和1.4 exaflops的AI推理性能。

英伟达的具身智能新动作

英伟达的具身智能新动作

纵观英伟达的思路,除了提供强大的算力基础设施,英伟达还提供了大量的软件产品,来与下游的产业链建立联系。

去年,英伟达便推出了DGX-Cloud、NVIDIA AI Enterprise 5.0等一系列软件产品。

而在今年的GTC大会上,英伟达推出了NIM推理微服务,能够对多个热门AI模型进行推理优化。它将开发者和数亿个GPU连接,可以部署各种定制AI。

NIM软件包是基于英伟达的加速计算库和生成式AI模型构建的,他们可以对GPU进行优化,并扫描安全漏洞。

此外,英伟达还推出了Omniverse Cloud API,此次一共推出5个全新的Omniverse Cloud应用编程接口(API),可以为客户提供模拟能力,帮助在虚拟世界中生成环境,训练产品,以无缝衔接到物理世界。

黄仁勋还希望将Omniverse引入Apple Vision Pro中,以便开发者可以将交互式工业数字孪生流式传输到VR头显中。

而在细分行业上,英伟达在电信、半导体设计和制造、气候、量子计算等方向都投入了较多精力。

本次发布会上最值得关注的是机器人领域。

英伟达发布了人形机器人项目GR00T大模型,可以理解文本、语音、视频等多种类型的信息,并对任务和指令进行执行。

打开网易新闻 查看精彩图片

此外,英伟达还带来了专用于机器人领域的“机器人大脑”计算芯片Jetson Thor,能用于复杂任务。

GTC大会上,黄仁勋带来还展示了Agility Robotics、Apptronik、傅利叶智能(Fourier Intelligence) 、宇树科技(Unitree Robotics)等公司的人形机器人产品,英伟达正在为他们构建AI平台。

打开网易新闻 查看精彩图片

据四木相对论了解,英伟达从2023年下半年开始,就开始发力人形机器人领域,并筹办了多场活动,宣传公司的产品,将机器人看作公司发展的重要业务方向之一。