在黄仁勋的视角里,构建AI系统就像是做一块"五层蛋糕"
从顶层的应用、模型到中间的计算、网络,
再到最底层、也最核心的能源。
他曾明确定义,能源与动力是AI基础设施的底座:
没有稳定的能源供给,再强大的AI也是无米之炊。
然而随着这块”蛋糕“越做越大,
一个隐藏在能源层之上的致命瓶颈浮出水面:散热。
在AI数据中心里,几乎所有的能源最后都会转化成滚烫的热量。
我持续在关注的AI热管理技术栈解决方案公司Frore Systems最近专为AI系统设计了一体化液冷系统,这套系统被称作:LiquidJet Nexus。
为AI系统降降温
假设能源是AI的动力源泉,那热管理技术栈就是排汗系统,
在黄仁勋定义的AI基础设施中,散热效率直接决定了你能在这个”基础“上堆叠多少算力。
LiquidJet Nexus是专为针对½U 计算托盘设计的。
如果数据中心是一个巨大的书架,服务器就是书架上的书,
½U 计算托盘就是其中最薄的“半套书”。
在如此狭小的空间里,要给NVIDA Kyber等顶级AI服务器降温,
其难度相当于是在火柴盒里给暖宝宝散热那么难。
集成电路式散热
LiquidJet Nexus虽然是一体化液冷系统,
采用的液冷方案和传统的软管和接头完全不同,
提供的是类似”集成电路“般的散热形式,
整套一体液冷系统相较于传统液冷系统减重65%,
由于散热系统不再臃肿,同一个机柜里能塞进2倍数量的AI芯片,
在有限的空间内实现算力密度翻倍。
3D喷射降温
在小巧的½U 计算托盘服务器空间内,还能高效散热,
其核心技术就是多级三维短回路喷射通道,
传统的散热靠冷水慢慢流过,带走热量,
但路径长而且效率还低,
LiquidJet Nexus则是在极小空间内,用类似密集的微型喷头,
直接把冷却液精准的”喷“到芯片发热最凶的地方,
路径极短,散热效率提升75%,
让核心器件再降8℃。
热水都能用来降温
这套一体液冷系统最神奇的地方在于,
因为结构导致换热效率极高,
该系统支持53℃入口液温进行冷却,
这也意味着数据中心可以减少昂贵且耗电的大型空调制冷机组的采购预算,
使用LiquidJet Nexus一体液冷系统,整体功耗降低10%,
大大降低能源基础设施的整体TCO(总拥有成本)。
Frore Systems创始人Seshu Madhavapeddy曾经说过,
散热不再是附属品,它是支撑下一代AI的关键能力,
Frore Systems的散热方案从基于AI服务器的LiquidJet Nexus,
同样也有针对超薄本和无人机的AirJet系列
在黄仁勋的AI蛋糕里,能源夯实了地基,
Frore Systems则为这块蛋糕装上了冷却塔。
毕竟,在HPC领域,工程师们常说:
性能的上限却决于散热的极限。
热门跟贴