液冷行业的专业术语很多,但本质上可以分成六类:热源器件、服务器液冷部件、系统侧设备、冷却液与材料、运行控制指标、数据中心基础设施术语。
一、热源与芯片侧常见术语
这部分是“为什么要液冷”的源头,因为热量来自哪里,决定了液冷要覆盖哪里。
1. CPU
中央处理器。
在通用计算、控制调度、推理和部分训练场景中都是主要热源之一。
传统服务器 CPU 功耗较高,但在 AI 服务器里,通常 GPU 才是第一热源。
2. GPU
图形处理器,现在也是 AI 训练和高性能推理的核心计算芯片。
AI 服务器液冷系统最常围绕 GPU 做热设计,因为它通常是最高热流密度部件。
3. HBM
高带宽存储器。
通常与高端 GPU 封装在一起,带宽高、热密度也高。
在液冷设计里,HBM 常常不是独立考虑,而是和 GPU 一起作为关键散热对象。
4. VR / VRM
Voltage Regulator / Voltage Regulator Module,供电稳压模块。
主要给 CPU/GPU 等芯片稳定供电。
这是很多非专业读者容易忽略的热源,但实际项目里 VR 发热很高,经常决定风液混合散热是否成立。
5. NVSwitch
NVIDIA 高速互联交换芯片,用于多 GPU 之间高速通信。
在高端训练服务器里是重要热源,很多液冷方案会把它纳入冷板覆盖范围。
6. NIC / Smart NIC / DPU
网卡 / 智能网卡 / 数据处理单元。
高速网络(如 200G、400G、800G)下发热增加,部分高端系统会考虑其局部强化散热。
7. DIMM
内存条模组。传统上以内存风冷为主,但在超高密系统中,内存区域气流管理也变得关键。
8. TDP
Thermal Design Power,热设计功耗。表示器件在典型高负载下需要散掉的热量。它不是瞬时峰值功耗,但通常是液冷系统选型的重要参考值。
9. 热流密度
单位面积上的热量释放强度。这是判断风冷是否接近极限、液冷是否必要的关键指标。AI 芯片热流密度越高,越容易推动冷板甚至浸没式液冷。
二、服务器侧液冷系统常见术语
这部分是液冷在服务器内部的直接实现。
10. 冷板(Cold Plate)
贴在芯片或高热器件上的液冷热交换部件。
液体在冷板内部流动,把芯片热量带走。
这是目前最主流、最成熟的服务器液冷核心部件。
11. 微通道冷板
在冷板内部设计很细的流道,提高换热效率。
优点是解热能力强,缺点是压降更高、堵塞风险更敏感、加工要求更高。
12. 冷板压降
冷却液流过冷板时产生的压力损失。
压降越大,对泵和系统流量分配要求越高。
很多纸面上“性能很强”的冷板,工程上问题就出在压降太高。
13. 歧管(Manifold)
把液体分配到多个冷板支路的集流/分流部件。
可以理解为“液冷系统里的分配总管”。
14. 软管 / 硬管
液冷回路中的连接管路。
软管适合一定安装自由度,硬管更整齐、长期形变更小,但安装要求更高。
15. 快接头(Quick Disconnect, QD / QDC)
可快速连接和断开的液路接口。
用于服务器抽拉维护、模块更换。
它的核心不只是“方便”,而是低泄漏、低插拔损伤、可重复维护。
16. 无滴漏快接
断开时尽量减少液体泄漏的快接头。
这是液冷服务器维护体验和可靠性的关键。
17. 漏液检测
检测服务器或液冷系统是否发生液体泄漏。
可以通过液体传感器、导电绳、托盘检测等方式实现。
18. 盲插 / 热插拔
在尽量不影响系统整体运行的情况下进行模块插拔。
液冷系统里能不能真正做到“热插拔”,取决于接口、阀门、控制和运维规范,不是宣传语就能解决。
19. 二次侧回路
通常指靠近 IT 设备、服务器和机柜内部的液冷闭式回路。
这一侧对洁净度、材料兼容性、流量稳定性要求高。
三、液冷系统与机房侧常见术语
这部分是“从服务器走向机房”的系统级概念。
20. CDU
Coolant Distribution Unit,冷却液分配单元。
液冷系统核心设备之一。
它负责把一次侧冷源和二次侧服务器液路连接起来,同时完成换热、循环、流量控制、温度控制、过滤、补液、监测等功能。
21. In-row CDU
行级 CDU,通常部署在机柜列间。
适合中高密度场景,布置灵活。
22. Rack CDU
机柜级 CDU,通常服务单个或少量机柜。
适合小规模 PoC、实验室、高密独立部署。
23. Facility CDU
机房级或集中式 CDU。
适合规模化部署,但系统设计和运维复杂度更高。
24. 一次侧
通常指建筑或机房的外部冷源侧,比如冷水机组、冷却塔、板换、园区冷源。
一次侧决定系统总体能效和冷源边界。
25. 二次侧
通常指 IT 设备液冷回路侧,服务服务器、机柜和冷板。
二次侧对流量、洁净度、控制精度要求更高。
26. 板式换热器(PHE)
一次侧与二次侧之间进行热交换的设备。
CDU 中常用。
作用是把两侧液体隔离,降低污染扩散和系统耦合风险。
27. 泵组
为液体循环提供动力。
液冷系统里泵的选型直接影响流量、扬程、冗余、稳定性、能耗和噪音。
28. N+1 冗余
系统需要 N 台设备满足运行,再额外配置 1 台作为备份。
液冷系统中的泵、传感器、电源等常做 N+1 设计。
29. 旁通(Bypass)
系统中的备用流路,用于流量调节、保护设备或应对局部异常工况。
没有旁通的系统,很多情况下调试和异常处理会非常麻烦。
30. 过滤器
过滤液路中的颗粒、杂质、腐蚀产物。
液冷系统稳定性高度依赖过滤管理。
31. 补液箱 / 膨胀箱
用于补充液体、缓冲体积变化、维持系统稳定。
液冷系统温度变化会导致体积变化,没有这部分设计很容易出问题。
32. 定压补水
保持系统压力稳定的方式。
在较大液冷回路和机房级系统中尤其关键。
33. 流量计
监测液体流量。
液冷系统里很多故障不是“温度先报警”,而是“流量先异常”。
34. 压差传感器
测量两点之间压力差。
常用于判断过滤器堵塞、冷板阻力变化、泵工况异常。
35. 供液温度 / 回液温度
进入服务器前的液体温度、流出服务器后的液体温度。
两者差值反映系统带走热量的情况。
36. ΔT
温差,常指供回液温差。
液冷系统工程里非常关键,因为它直接关联换热能力、流量需求和系统能效。
37. ΔP
压差。
用于分析流阻、堵塞、泵能力和系统健康状态。
四、冷却液与材料相关术语
这是液冷里最容易“被材料化神话”的部分。实际上冷却液从来不是单一材料问题,而是系统工程问题。
38. 去离子水(DI Water)
去除了大部分离子的水。
导电性低,热性能好,但并不代表永远不导电,实际运行中会因污染和溶出而变化。
39. 水乙二醇(EG)
乙二醇水溶液。
常用于防冻和抑制低温环境风险,但热性能比纯水略差。
40. 水丙二醇(PG)
丙二醇水溶液。
毒性相对更低,部分场景更友好,但热性能和黏度方面也要综合权衡。
41. 添加剂包
加入冷却液中的缓蚀剂、杀菌剂、稳定剂等。
很多系统问题不是“液体基础材料不好”,而是添加剂体系和材料兼容没做好。
42. 电导率
衡量液体导电能力的指标。
液冷项目里常被过度简化。
实际上应结合污染、金属离子析出、长期运行状态一起看。
43. 材料兼容性
冷却液与金属、塑料、橡胶、密封件等长期接触后是否会腐蚀、溶胀、脆化、析出。
这是冷却液选型中的硬门槛,不是加个报告就能解决。
44. 腐蚀
材料被液体或环境逐渐破坏。
液冷系统中常见于铜、铝、不锈钢、焊点、镀层等部位。
45. 电化学腐蚀 / 电偶腐蚀
不同金属在电解质环境中形成腐蚀电池导致的腐蚀。
液冷系统混材设计时必须高度重视。
46. 溶胀
密封圈、塑料件等吸收液体后体积膨胀、性能下降。
在浸没式和某些特殊冷却液体系里尤为关键。
47. PFPE
全氟聚醚类绝缘液体。
绝缘性和化学稳定性好,但通常成本高。
48. HFE / HFO
含氟电子冷却液常见类别。
部分用于浸没或相变冷却,但要特别关注环保法规、GWP、供应稳定性和生命周期成本。
49. 矿物油 / 合成油 / 硅油
常见绝缘液体类别。
在浸没液冷中可能用到,但各自存在热性能、黏度、兼容性、氧化稳定性、维护性差异。
50. 介电液 / 绝缘液
电气绝缘性能较高、可与电子部件直接接触的液体。
浸没式液冷离不开这类液体。
51. 比热容
单位质量物质升高单位温度所需热量。
比热越高,通常越有利于带走热量。
52. 导热系数
反映材料传热能力。
冷却液、冷板材料、TIM 材料都离不开这个参数。
53. 黏度
液体流动阻力大小。
黏度高会提高泵耗、增加压降、影响换热。
五、液冷方式与路线相关术语
这是公众号最常写的“路线之争”部分。
54. 风冷
依靠空气和风扇进行散热。
优点是成熟、便宜、维护习惯成熟;缺点是在高热流密度、高功率机柜场景下逐渐接近极限。
55. 风液混合
部分热源走液冷,其他部件仍然走风冷。
这是目前最主流、最现实的过渡路线。
56. 冷板式液冷(Direct-to-Chip, D2C)
通过冷板直接带走 CPU/GPU 等主要热源热量。
当前产业最成熟、落地最多。
57. 单相液冷
冷却液在整个循环中不发生沸腾相变。
冷板液冷大多属于单相体系。
58. 单相浸没式液冷
设备直接浸没在绝缘液体中,液体不发生沸腾。
散热能力强、噪音低,但对运维、液体管理、兼容性要求高。
59. 双相浸没式液冷
绝缘液体在热源处沸腾,再经冷凝回收。
理论上解热能力更强,但工程复杂度、液体成本和法规约束更高。
60. 喷淋式液冷
通过喷淋冷却液到热表面进行换热。
属于较特殊路线,产业成熟度相对没那么高。
61. 全液冷
系统中主要热源和大部分辅热源均由液体承担散热。
但实际项目中,“全液冷”经常仍会保留一定风冷辅助,宣传与现实要区分。
62. Rear Door Heat Exchanger(后门换热器)
装在机柜后门上的换热装置,通过空气侧换热降低机柜排风温度。
适合作为风冷向液冷过渡的中间方案之一。
六、数据中心基础设施与能效术语
这部分帮助读者把液冷和机房系统联系起来。
63. PUE
Power Usage Effectiveness,电能使用效率。
数据中心总耗电 / IT 设备耗电。
数值越低通常代表能效越好,但要注意不能孤立看。
64. WUE
Water Usage Effectiveness,用水效率。
液冷和蒸发冷却场景下越来越值得关注,尤其在水资源敏感地区。
65. 自然冷却
利用室外环境低温直接或间接提供冷源,减少压缩机制冷运行。
液冷系统因为供液温度更高,往往更容易获得全年节能收益。
66. 冷冻水系统
通常由冷水机组提供较低温度的冷水。
适合需要稳定低温的场景,但能耗相对更高。
67. 冷却水系统
通常与冷却塔等设备配合使用。
温度相对较高,若液冷系统设计得好,可以更高比例利用这类水源。
68. 干冷器
利用空气冷却循环介质的设备。
在适宜气候区,和液冷结合有不错的节能潜力。
69. 热回收
把服务器废热用于供暖、生活热水或工业用途。
液冷比风冷更容易做高质量热回收,但商业闭环不一定总成立。
70. 高密机柜
单机柜功率较高的机柜。
AI 训练集群持续推高机柜功率密度,是液冷渗透最核心的驱动力之一。
71. AIDC
AI Data Center,人工智能数据中心。
通常指为 AI 训练/推理优化建设的数据中心,特点是高功率密度、高网络带宽、高热密度,对液冷更敏感。
七、运维与可靠性相关术语
液冷真正拉开差距的,不是“实验室性能”,而是长期稳定运行能力。
72. 水质管理
对液体洁净度、电导率、pH、颗粒物、微生物、腐蚀产物等进行控制。
是液冷运维的基本功。
73. 在线监测
系统运行中持续监测温度、流量、压力、电导率、液位、泄漏等指标。
没有在线监测的液冷系统,后期运维压力会很大。
74. 补液
运行过程中补充因维护、挥发、微渗漏等造成的液体损失。
补液策略决定了系统能否长期稳定。
75. 排气 / 脱气
去除系统中的空气或溶解气体。
液路中有气泡会影响流量稳定、换热效率和泵运行状态。
76. 冗余泵 / 备机策略
为防止关键泵故障导致系统中断而设计的备份方案。
液冷系统一定要强调“可维护性”和“失效后的可控退化”。
77. MTBF
Mean Time Between Failures,平均无故障时间。
衡量可靠性的常见指标,但要注意它不能替代真实项目经验。
78. 可维护性
出了问题能不能快速定位、隔离、修复。
这比纸面上的最高性能更重要。
79. 泄漏容忍设计
即使局部发生液体泄漏,也能把影响范围控制在最小。这是成熟液冷系统的重要工程思想。
八、高频缩写
CPU:中央处理器
GPU:图形处理器/AI 计算芯片
HBM:高带宽存储器
VRM:供电稳压模块
NIC:网卡
TDP:热设计功耗
CDU:冷却液分配单元
QD/QDC:快接头
D2C:芯片直冷/冷板液冷
PUE:电能使用效率
WUE:用水效率
AIDC:人工智能数据中心
ΔT:温差
ΔP:压差
DI Water:去离子水
热门跟贴