打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

大脑:GPU 核心

H200干活的地方,是中间那块巴掌大的 GPU 核心。

其中专门负责 AI 运算的 Tensor Core,是大模型训练的主力。

核心旁边还有 L2 缓存(临时存常用数据)

寄存器(让算得更快)

调度模块(指挥任务分配)

内存控制器(连接显存)

高速互连接口(连 NVLink/PCIe)

记忆体:HBM3E 高带宽显存

GPU 算得再快,没数据吃也白搭。H200 配的是新一代 HBM3E 显存。

和我们手机、电脑的内存条不同,HBM 是多层 DRAM叠起来的。

好处是容量大、距离近、带宽超宽。GPU 想要的数据,几乎是"瞬间"送到。

桥梁:先进封装(CoWoS)

GPU 和 HBM 离得很近,靠是先进封装连起来的。

中间有一层"硅中介层",像一座微型桥梁,把 GPU 核心和四组 HBM 显存堆栈连在一起。

再通过微凸点、封装基板、底部焊球,把整个封装焊到 PCB 上。

可以理解为:CoWoS 让 GPU 和显存"住在同一个屋檐下",沟通几乎零延迟。这也是台积电赚钱的工艺之一。

躯干:基板 / PCB 电路板

GPU封装下面,是一块多层的PCB。

它就像整张卡的骨架,分好几层:

信号走线层负责传控制信号

电源层 / 接地层负责供电并减少干扰

高速数据通道让核心和其他部件快速通信

控制与监测芯片管温度、电压和运行状态

下面是外部连接接口,连到主板或其他高速设备。

一张卡能稳定跑满负载,PCB 设计功不可没。

心脏:供电模块

H200 的功耗高达 700W 左右,要稳稳供电,靠一整套电源模块。

外部电进来后,要经过 PWM 控制器(像指挥员,控制供电节奏)

MOSFET(高效转换)

电感 / Choke(让电流更稳)

电容阵列(过滤波动、减少噪声)

再通过供电走线分配到各个区域,送到 GPU 核心。

整个过程还有监控与保护模块实时盯着温度和电压,防止异常。

给 H200 供电这件事,难度不亚于设计芯片本身。