英伟达最近的液冷方案,其实是被算力逼出来的——当GPU功耗从H100的700瓦直接跳到B200的1000-1200瓦,风冷风扇转得再快也压不住热量,液冷成了唯一能让这些“算力怪兽”正常工作的办法。
毕竟液体的散热能力是空气的3000倍以上,能解决高功率密度设备的散热刚需,这才是液冷替代风冷的核心逻辑。
目前液冷里90%以上都是冷板式,就是用液体(比如水、乙二醇)通过冷板带走热量,比风冷高效太多。英伟达的GB300服务器直接上了机架级全液冷,还搞了MLCP技术——比如双相冷板和直接芯片液冷(D2C),利用相变潜热(液体变气体时吸收的热量),能搞定更高功率的场景。
比如GB300集成了72个Blackwell Ultra GPU和36个Grace CPU,算力比前代提升1.5倍,全靠液冷压得住热量。
未来两三年还是冷板为主,但之后会结合相变(冷却液从液态变气态,散热更强)和微通道(冷板结构升级,流道更细),到时候单机柜300-500千瓦的功率都能hold住。
液冷以前贵得吓人,现在单千瓦成本也就3000-3500元,只比风冷(2500-3000元)贵10%-20%,而且还在降——冷却液从去年的100多块/吨降到现在50-60块/吨,系统造价跟着往下走。
企业愿意买单,不是因为“洋气”,是因为液冷能解决功能性问题:如果不用液冷,GPU热量散不出去,性能会直接打折,反而更亏。
而且液冷的PUE更低(更节能),长期算下来电费能省不少,符合双碳策略,这也是企业愿意掏钱包的重要原因。
英伟达的液冷供应链里,CDU(冷却分配单元)是核心环节,维谛是最大的供应商——2024年英伟达官宣和维谛合作,GTC大会展示的Super产品用的就是维谛的SDU1350,用户采购系统时基本都会标配维谛的方案。
海外还有台达、保德这些厂商,但份额很少。国内厂商比如英维克、申菱环境技术不错,但因地缘政治限制,进不了英伟达的核心体系,只能走ODM路线:给海外品牌代工,提供产品、产能和技术,再由海外品牌卖给最终客户。
市场节奏上,海外2024-2025年就爆发了,因为B200在北美四大云厂商(AWS、谷歌、Meta、AWS)大规模落地;国内滞后一些,因为高端GPU进口受限,国产GPU的功耗还没到1000瓦,所以2025-2026年上半年,阿里、腾讯这些企业80%以上还是用风冷。
但国内潜力大,IDC预测2028年中国液冷服务器市场能到105亿美元,每年增长48%,后面肯定会起来。
现在液冷还有个趋势——和电源融合。科华、伊顿、施耐德这些电源厂商都在搞电暖一体化,因为高功率场景下,电源自己也需要液冷散热,而且把电源和液冷做成预制化方案,能缩短数据中心的搭建时间,早赚钱。
另外,就算未来推理场景的功率下降,只要用的是高功耗芯片,还是得用液冷——等液冷成本降到和风冷差不多,企业肯定选液冷,因为更节能,长期TCO更划算。
你觉得未来3-5年,液冷会彻底取代风冷成为数据中心的主流吗?欢迎在评论区聊聊你的看法~
热门跟贴