大脑:GPU 核心
H200干活的地方,是中间那块巴掌大的 GPU 核心。
其中专门负责 AI 运算的 Tensor Core,是大模型训练的主力。
核心旁边还有 L2 缓存(临时存常用数据)
寄存器(让算得更快)
调度模块(指挥任务分配)
内存控制器(连接显存)
高速互连接口(连 NVLink/PCIe)
记忆体:HBM3E 高带宽显存
GPU 算得再快,没数据吃也白搭。H200 配的是新一代 HBM3E 显存。
和我们手机、电脑的内存条不同,HBM 是多层 DRAM叠起来的。
好处是容量大、距离近、带宽超宽。GPU 想要的数据,几乎是"瞬间"送到。
桥梁:先进封装(CoWoS)
GPU 和 HBM 离得很近,靠是先进封装连起来的。
中间有一层"硅中介层",像一座微型桥梁,把 GPU 核心和四组 HBM 显存堆栈连在一起。
再通过微凸点、封装基板、底部焊球,把整个封装焊到 PCB 上。
可以理解为:CoWoS 让 GPU 和显存"住在同一个屋檐下",沟通几乎零延迟。这也是台积电赚钱的工艺之一。
躯干:基板 / PCB 电路板
GPU封装下面,是一块多层的PCB。
它就像整张卡的骨架,分好几层:
信号走线层负责传控制信号
电源层 / 接地层负责供电并减少干扰
高速数据通道让核心和其他部件快速通信
控制与监测芯片管温度、电压和运行状态
下面是外部连接接口,连到主板或其他高速设备。
一张卡能稳定跑满负载,PCB 设计功不可没。
心脏:供电模块
H200 的功耗高达 700W 左右,要稳稳供电,靠一整套电源模块。
外部电进来后,要经过 PWM 控制器(像指挥员,控制供电节奏)
MOSFET(高效转换)
电感 / Choke(让电流更稳)
电容阵列(过滤波动、减少噪声)
再通过供电走线分配到各个区域,送到 GPU 核心。
整个过程还有监控与保护模块实时盯着温度和电压,防止异常。
给 H200 供电这件事,难度不亚于设计芯片本身。
热门跟贴