九张图看懂：拆解英伟达黄仁勋的H200

墨染时光

2026-05-16 06:32 ·贵州

大脑：GPU 核心

H200干活的地方，是中间那块巴掌大的 GPU 核心。

其中专门负责 AI 运算的 Tensor Core，是大模型训练的主力。

核心旁边还有 L2 缓存（临时存常用数据）

寄存器（让算得更快）

调度模块（指挥任务分配）

内存控制器（连接显存）

高速互连接口（连 NVLink/PCIe）

记忆体:HBM3E 高带宽显存

GPU 算得再快，没数据吃也白搭。H200 配的是新一代 HBM3E 显存。

和我们手机、电脑的内存条不同，HBM 是多层 DRAM叠起来的。

好处是容量大、距离近、带宽超宽。GPU 想要的数据，几乎是"瞬间"送到。

桥梁：先进封装（CoWoS）

GPU 和 HBM 离得很近，靠是先进封装连起来的。

中间有一层"硅中介层"，像一座微型桥梁，把 GPU 核心和四组 HBM 显存堆栈连在一起。

再通过微凸点、封装基板、底部焊球，把整个封装焊到 PCB 上。

可以理解为：CoWoS 让 GPU 和显存"住在同一个屋檐下"，沟通几乎零延迟。这也是台积电赚钱的工艺之一。

躯干：基板 / PCB 电路板

GPU封装下面，是一块多层的PCB。

它就像整张卡的骨架，分好几层：

信号走线层负责传控制信号

电源层 / 接地层负责供电并减少干扰

高速数据通道让核心和其他部件快速通信

控制与监测芯片管温度、电压和运行状态

下面是外部连接接口，连到主板或其他高速设备。

一张卡能稳定跑满负载，PCB 设计功不可没。

心脏：供电模块

H200 的功耗高达 700W 左右，要稳稳供电，靠一整套电源模块。

外部电进来后，要经过 PWM 控制器（像指挥员，控制供电节奏）

MOSFET（高效转换）

电感 / Choke（让电流更稳）

电容阵列（过滤波动、减少噪声）

再通过供电走线分配到各个区域，送到 GPU 核心。

整个过程还有监控与保护模块实时盯着温度和电压，防止异常。

给 H200 供电这件事，难度不亚于设计芯片本身。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴