一、液冷机柜散热方案设计:从“风”到“液”的系统重构
1、技术路线选型:冷板式vs浸没式
(1)冷板式液冷(间接接触):目前主流方案。通过金属冷板紧贴CPU/GPU等高热器件,带走60%-80%热量,剩余热量仍需辅助风冷。适用于现有服务器改造或中高密度场景(单机柜10-40kW),技术成熟度高,改造成本相对较低。
(2)浸没式液冷(直接接触):将服务器整机浸入绝缘冷却液(如氟化液、矿物油)中,散热效率极高,PUE可低至1.05-1.10。适用于AI超算、GPU集群等超高密度场景(单机柜50kW+)。需解决槽体密封、冷却液挥发及维护复杂性等问题。
2、冷板式液冷系统关键组件设计
(1)CDU(冷却液分配单元):系统的“心脏”。负责二次侧冷却液循环、压力控制及与一次侧(机房冷水)热交换。设计需确保供液温度高于机房露点(防结露),并配置N+1冗余泵。
(2)机柜内分液模块:采用Manifold(分液器)确保各服务器支路流量均衡,流量不平衡率应≤10%。推荐使用快速接头,支持服务器热插拔且具备防漏功能。
(3)冷却液与管路:二次侧通常采用去离子水+乙二醇(防冻防腐蚀),管路材质推荐不锈钢或耐压软管。必须集成漏液检测传感器(精度达0.1ml)及自动关断阀。
3、浸没式液冷系统设计要点
(1)槽体与密封:槽体需耐腐蚀(如不锈钢)、全密封设计,并配备液位监测与补液系统。服务器安装方式由水平插拔改为垂直吊装,需重新设计机柜结构。
(2)热交换循环:采用CDU+板式换热器或泵箱一体机,利用自然冷源(冷却塔)直接散热,大幅降低压缩机能耗。设计需控制冷却液流速(1.5-2.0m/s)以减少沿程阻力。
4、混合散热与控制系统
(1)风水混合设计:冷板式常采用“液冷核心+风冷内存/硬盘”的混合模式。需在机柜顶部或背部预留风扇墙,并设计独立风道,避免冷热气流混合。
(2)智能监控:集成温度、压力、流量、漏液四重传感器,通过BMS系统实时调节泵速与阀门,实现AI预测控温,确保芯片结温稳定。
二、机房整体布局规划:空间、管路与安全
1、机柜排列与通道优化
(1)集群化布局:将液冷机柜按“面对面、背靠背”排列,形成封闭冷通道或封闭热通道。机柜正面通道净宽建议≥1.5m(便于设备搬运),背面维护通道≥1.2m。
(2)CDU部署策略:
分布式:CDU置于机柜列头或列尾,缩短二次侧管路,减少冷量损耗,适合高密GPU集群。
集中式:CDU集中布置在机房侧边或独立设备间,便于集中监控,但需增加泵功率克服管路阻力。
2、管路系统与基础设施
(1)架空地板下布局:二次侧液冷管路优先布设于架空地板下,建议地板下净高≥600mm。必须严格隔离强电桥架与液冷管路(如强电走天花板,液冷走地板),防止漏液引发短路。
(2)管路设计与冗余:采用同程系统或环网设计(双供双回)确保水力平衡与故障冗余。主管路口径需按最大热负荷的1.1倍设计,并设置检修阀门。
3、安全防护与承重考量
(1)漏液防护系统:机房地面需设计漏液收集槽(坡度≥0.3%),并配备漏液探测器与应急排水系统。对于浸没式液冷,需设置防泄漏围堰。
(2)承重与空间:浸没式液冷槽体满载后重量极大(可达数吨),需校核楼板荷载(通常需≥12kN/m²)。机房层高需满足“机柜高度+吊装空间+管路空间”要求,建议净高≥4.5m。
4、模块化与扩容设计
(1)分区模块化:将机房划分为多个液冷模块(如每20个机柜为一个模块),每个模块配备独立CDU与管路系统,支持按需扩容且故障互不影响。
(2)运维空间预留:CDU设备侧需预留≥1m的检修空间,机柜上方预留≥1.2m的吊装空间(用于服务器更换)。