来源:2024年度全国农村金融机构科技创新优秀案例评选

获奖单位:山东农信

荣获奖项:十大网络影响力优秀案例

一、项目背景

山东农信数据中心于2013年进行规划设计,2016年完成竣工验收并投入使用。数据中心制冷系统采用水冷解决方案,配套建设了1套制冷自控系统,通过DDC控制器(品牌为西门子)对制冷系统的制冷机组、水泵、阀门等设施进行自动控制,同时借助Insight平台软件,实现了控制程序参数配置、远程操作及系统运行状态反馈展示。

截至2023年,原制冷自控系统已连续运行9年之久,硬件设施存在一定的老化,同时,运维过程中发现,该系统偶发不明原因关机等控制故障,并存在控制与反馈时延较长且部分报警无法报出等问题,另外,西门子厂家已于2022年底完成了自控系统产品转型,不再提供Insight软件的技术支持与维护,鉴于制冷自控系统在数据中心基础设施中所处的关键地位,经综合评估分析,确定对该系统进行优化改造,全面化解系统风险隐患;其次,山东农信数据中心于10年前规划设计,与新型数据中心相比,基础设施绿色节能与可视化运维管理方面存在一定差距,具体表现在,一是数据中心节能潜力挖掘达到瓶颈,通过制冷自控系统的智能化、精细化控制,成为突破节能的有效突破口。在碳达峰和碳中和“双碳”目标背景下,中央及地方政府陆续出台了关于数据中心绿色节能的指导政策、意见及行动方案,山东农信先后采用照明改造、优化精密空调精确送风控制、空气处理机变频控制、优化气流组织以及空调系统运行模式等手段,深入挖掘节能降耗潜力,截至2022年底,数据中心年平均PUE约为1.57,距离国家绿色数据中心PUE最低标准仍有一定的差距,经分析研究,基于现有系统架构下的节能改造已基本完成,同时考虑建筑结构、安全运行等因素,新的绿色节能产品应用具有较大局限,采用智能化、精细化控制提高制冷系统运行效率,成为突破数据中心节能天花板的有效途径。二是原制冷自控系统人机交互和数据分析能力偏低。原制冷自控系统所采用的Insight平台软件主要作为过程控制管理软件使用,不仅人机交互、图形展示等方面体验较差,而且平台软件没有数据存储功能,无法基于历史数据进行统计分析,缺少对水资源和电力资源消耗多维度分析能力,因此也无法进行各种维度的展示。

数据中心三分靠建设,七分靠运维管理。为全面化解数据中心制冷系统风险隐患,以制冷自控系统优化改造为契机,通过引进节能算法,盘活既有大量基础设施运行数据,进一步发掘数据中心节能潜力,在数据中心制冷系统高效、稳定运行的基础上,不断探索新的运行模式,进一步减低系统能源消耗,同时实现可视化运维管理,提升运维工作质量与工作效率,为数据中心绿色低碳与高质量运行提供有益的参考。

二、项目方案

制冷自控系统优化升级工作旨在解决原系统存在的安全隐患,并突出节能降耗、统计分析与可视化展示等功能,系统升级工作可总结为“一替换、二新建”,即:一是借鉴智慧物联网技术,组建基于PLC控制器的控制子系统,替换原DDC控制器终端及系统监控软件;二是新建针对水冷空调系统的数据分析子系统,配置数据集中存储与节能分析算法,实现能效评测及节能决策功能,提高制冷资源的使用效率;三是新建可视化子系统,实现建筑结构、IT机房、水冷空调系统3D建模,并实现机房温度云图、电力及水资源能效数据和故障统计视图等功能。优化升级后的制冷自控系统形成以控制子系统为主,以数据分析子系统与3D可视化子系统为辅的全新架构。系统总体架构的示意图如下:

(一)控制子系统

控制子系统采用PLC控制器,每个PLC控制器作为一个独立终端,组建分布式控制系统,首先,按照设备类型、用途进行分类,将同一类型的设备接入同一类型控制器形成各智慧终端,作为基本的控制单元;然后,将各终端按照特有的接口协议连接起来,实现信息交互,共同组成智慧物联网系统;最后,根据实际需要预制控制逻辑,实现自动化控制,同时预留通信接口,可通过远程智能化或手动参数配置,灵活调整控制逻辑。网络架构如下:

控制子系统以实现制冷机组、水泵、冷却塔等制冷设备的自动化运行为主,包括单元控制(主控、分控、群控)以及运行数据、趋势分析、报警信息展示等功能。结合设备用途,终端控制单元划分为冷源控制单元、冷塔控制单元、主水管网控制单元、空气处理机控制单元以及新风机组控制单元和附属设施共6个控制单元。

(二)数据分析子系统

数据分析子系统作为数据采集、治理、存储、监控、管理的主要平台,将控制子系统、动环监控系统、机房温度等数据中心环境产生的海量数据统一接入到系统后,通过数据治理、分析等方式进行数据处理,并进行集中存储,为系统历史数据查询以及历史曲线查询等系统应用提供,并为外部可视化子系统提供展示数据,同时,数据分析子系统提供节能策略推送功能,基于系统当前运行状况以及海量历史数据,利用AI模型进行节能策略的推送,并根据需要进行制冷系统参数的自动或手动调整。系统架构图如下所示。

1.数据采集功能。通过WebService接口、Modbus协议、PLC协议等,对接动环监控、机房温度、控制子系统,完成实时和离线数据接入。

2.数据治理功能。主要是提供数据接入后的数据治理,包括数据清洗(主要包括丢弃、补全、不处理和真值转换四种功能)、数据安全、血缘关系、数据赋权等。

3.存储功能。采集的实时数据推送到Redis缓存数据库中,一方面数据推送至关系型数据库mysql进行,为可视化子系统提供数据来源;另一方面数据推送至系统数据治理服务所需消息队列,通过对数据进行集中处理后,写入海量历史数据库Clickhouse,进行历史数据的集中存储。

4.数据监控功能。主要为运维人员提供开发脚本或生成调度任务,对数据服务和组件进行监控,生成日志文件,监控平台管理状况。

5.系统管理功能。主要是自定义系统标签、服务配置、定时任务管理、微服务注册管理等系统后台管理共。

6.算法模块。主要是通过检测数据中心整体散热量及制冷系统设备等状态参数,优化对制冷系统的控制策略,使制冷与数据中心整体发热量精确匹配,在保证安全的前提下使数据中心的能耗降低。节能控制算法分前端空调系统和后端冷源系统两大类调控对象,遵照“供需平衡”、“高效运行”两个原则,通过内置深度强化学习(EDRL)方法和遗传算法,自动推送系统运行策略。

(三)可视化子系统

可视化子系统主要通过3D建模,将水冷空调系统设施、管路及配件按1:1比例进行全方位展示,同时将机房温度以立体云图方式呈现,直观反映数据中心空调运行状态,清晰明了展示系统的运行状态;另外,针对能效资源使用情况,在不同的维度,从不同的视角对PUE、WUE等能源消耗情况进行统计分析,采用柱状图、曲线图等方式进行集中展现,从全景视图中准确掌握各类数据的价值,提高数据中心的管理水平,为决策提供准确、直观的信息支持。可视化子系统主要包括制冷系统整体可视化视图、效视图、温度云图、告警视图等。

1.制冷系统整体可视化。主要是参照数字孪生方式,展示制冷系统的实际布局情况和运行情况。一是系统运行视图,以3D系统图方式重点展示制冷系统的当前运行状态,二是平面布局视图,以3D模型同比例展示各楼层配套制冷设施的安装位置以及管道的实际排布等信息。

2.机房温度场可视化。通过机房部署实际情况,将机房的物理空间、机柜位置,数字转化后生成机房物理环境信息,展示每个机房模块的温度云图,以及机柜使用情况和热点情况,包括:一是各个机房模块温度最高的机柜编号与温度值;二是机房模块的机柜总数、加电总数、最大功率与平均功率。

3.能效数据可视化。通过数据分析子系统采集的各类用电、用水数据,对能效数据进行统计分析,展示近1年用电和用水的使用效率,以及总量、分布及趋势。一是用电效率管理视图,包括:近1年电能利用效率(PUE)及月度电能利用效率趋势,近1年总用电量及月度用电量趋势,近1年IT总用电量(含机房模块用电量)及月度用电量趋势,近1年非IT总用电量(含制冷、消防、监控、照明及损耗等用电)及月度用电量趋势;二是用水效率管理视图,包括近1年水能利用效率(WUE)及月度水能利用效率趋势,近1年总用水量及月度用水量趋势,近1年冷却水总用水量(含蒸发用水、冷塔溢流、水处理排水)及月度用水量趋势,近1年其他用水量(含冷塔清洗用水、加湿用水及其他用水)及月度用水量趋势。

4.告警视图。从设备类别、告警等级等不同维度,通过饼形图、柱状图、曲线图等不同样式,将数据分析子系统处理数据进行汇总展示,便于运维人员直观掌握告警数据,分析趋势信息等,从而提高运维工作效率。

三、创新点

数据中心的高效运行至关重要,山东农信数据中心制冷自控系统优化升级项目采用了一些新技术和方法,为数据中心的可持续发展和高效运营带来了全新的突破。

(一)传统工控技术与信息化技术相融合,实现分级调控。

传统的工控技术,其控制逻辑是写死在控制终端的,仅根据人为设定的运行状态参数,结合实时传感器数据,对运行过程中的设备进行实时调控。本项目创新性的建立数据分析子系统,通过对数据中心动力与环境数据进行全量收集与分析,将参数调整策略下发到控制终端,从而由系统代替人员对终端参数进行动态调整,最终执行内置的控制程序进行实时控制,从而实现数据分析子系统的“参数调控”和物联网子系统的“实时控制”两级控制策略,不仅提高了制冷系统的自动化程度,而且最大程度提高了设备的运行效率。

(二)融合进化算法与深度学习算法,建立节能算法模型,发掘节能潜力。

针对数据中心制冷系统具有复杂动态特性的应用场景,本项目创新性的采用了进度深化强化学习算法,充分结合了强化学习的探索与进化优化的全局搜索特点,通过策略迭代逐步优化决策,并探索不同策略组合,最终达到最佳的能耗与性能平衡,可以在确保系统安全的基础上,实现智能化和自适应调控,最大限度地提高系统能效,降低数据中心整体PUE;另外,算法库建立后,根据系统运行情况,不断建立补充算法,当出现数据异常时,通过调用算法进行分析判断故障原因,为运维人员提供判断数据,可以快速准确找到故障原因。

(三)将分布式与微服务技术应用在传统的基础设施监控系统中,提高系统安全稳定。

传统的数据中心基础设施监控系统(如动环监控系统)处于安全考虑,更多的只是“只监不控”,对于有控制要求的系统,往往采用传统的工控系统,而本项目要借助数据分析子系统对控制子系统进行参数调控,意味着其对制冷系统进行间接控制,因此,系统的安全性就应达到与工控系统的一致。本项目基于传统的数据中心基础设施监控系统,服务器采用集群化部署,采用微服务架构实现各组件的分布式部署,具备强大容错能力,能够确保在数据处理过程中达到系统更高的可用性。

四、技术实现特点及优势

(一)总体特点及优势

优化升级后的数据中心制冷自控系统由控制子系统、数据分析子系统以及可视化子系统组成。通过对数据中心能耗相关的数据采集和分析,利用AI节能算法推送出节能调控策略,然后将数据中心整体能耗情况通过可视化技术更直观的展示给运维人员做出科学的决策。总体架构特点及优势如下:

1.端到端的数据链路。本系统建立了安全的从设备末端到数据采集和传输、数据处理和分析、算法调用、可视化展示的数据链路。

2.系统高内聚低耦合。本系统架构从便于运维和安全运维角度,采用了模块化设计,将整个系统划分为物联网控制子系统(主要完成末端数据采集和反向控制)、数据分析子系统(主要负责数据接入、数据分析、算法调用等)、可视化子系统(主要用来展示数据中心整体能耗情况及节能控制效果);各子系统之间的通信只通过接口进行数据交互,节能算法调用采用事件驱动方式,实现了各子系统之间的高内聚低耦合。

(二)各子系统特点及优势

1.控制子系统。一是成熟的设计架构,控制子系统改变了传统的控制方式,借鉴当前先进、成熟的物联网的方式进行搭建采用智慧物联网的架构,由于数据中心对高可用性、数据保护和系统安全的要求极高,物联网技术通过多种安全机制,确保了数据中心的设备、通信、数据和物理设施的安全;二是安全高效的数据采集与处理,控制子系统借鉴物联网技术,将制冷系统划分为冷却系统、冷源系统、二次泵系统、末端空调系统、新风系统、AHU系统、辅助设施系统等控制单元,通过划分设备单元进行分模块采集,每个单元控制器负责采集本系统传感器的数据,同时嵌入控制程序负责控制本系统内的执行机构,提高数据处理效率,同时,各采集控制器适配系统设计的冗余原则,控制子系统中各采集控制器之间与系统中联锁单元一一对应,按照统一的接口协议连接实现信息交互,且相互之间无联锁关系,防止单独故障点的同时,也杜绝了由单个采集控制器故障引起其他采集控制器出现故障的情况;三是冗余的网络配置,控制子系统按网络冗余、设备冗余双重冗余方式进行配置,网络采用环形网络拓扑设计,将所有设备连接成一个闭合的环,当网络中的某个链路或设备出现故障时,系统可以通过反向路径继续保持通信。环网冗余采用Media Redundancy Protocol(MRP)冗余协议来自动检测网络故障,并快速切换到备用路径,从而避免通信中断,同时,制冷自控系统网络采用网络隔离架构,将关键设备与数据中心其他监控网络分离,通过虚拟局域网(VLAN)技术,确保控制系统与外部通信网络分离,减少外部攻击的风险;四是关键设备上采取主备冗余。在更高的可靠性需求下,通过两个控制器主站的冗余结构,使得当一个主控制器发生故障时,备用控制器可以自动接管控制任务,其内置的控制程序具备安全模式,即当完全失去通信时,使本智慧终端处于默认参数状态。

2.数据分析子系统。数据分析子系统由数据分析模块、管理模块以及算法模块构成。其中数据分析模块、管理模块采用微服务架构,采用spring cloud,由Nginx、Redis、Mysql、docker、vue、nacos等组件构成,该架构能够让数据中心制冷系统的不同功能模块(如数据采集、分析、控制)解耦合,实现模块化管理,可以轻松扩展制冷系统分析和节能控制的功能,从而降低系统维护难度;在系统运行过程中,可将不同的控制任务分发到多个服务实例中运行,并在不同节点间动态分配任务,同时基于系统强大的数据处理能力,通过在集群环境中进行分布式计算,可处理数据中心制冷系统产生的海量数据,包括设备运行数据、环境数据、能耗数据等,从而大幅提升数据分析及利用效率;另外,该技术架构具备强大容错能力,能够确保在数据处理过程中,即使某些节点出现故障,系统也能自动恢复并重新执行任务,进一步提升了系统运行的可用性和稳定性。

针对数据分析子系统算法模块,本项目基于人工智能算法,根据制冷系统制冷量与机房散热量的供需平衡原则,以设备之间联锁关系为依托,选用进化深度强化学习作为模型,实时优化设备运行工况,使整个制冷系统能耗达到最低。进化深度强化学习结合了进化算法与深度强化学习的优势,能够自主学习和优化复杂系统中的策略,在数据中心制冷系统中具有显著的应用优势。通过学习并优化冷却策略,进化深度强化学习可以最大限度地提高系统的能效,降低能耗,实现智能化和自适应调控。该模型优势如下:一是该模型综合了强化学习的深度探索与进化优化的全局搜索的优点,对于制冷系统这样具有复杂动态特性的应用场景,确保既可通过进化优化进行广泛的探索,又可通过强化学习不断优化局部策略,最终达到最佳的能耗与性能平衡;二是数据中心的制冷系统通常涉及多个变量和子系统(如冷却塔、空调、风扇等),系统之间相互影响且非线性复杂,该模型能够通过多维度数据学习,理解系统之间的复杂交互关系,优化整个制冷系统的运行策略,并可通过不断试错和优化策略,在复杂多变的环境中自适应调整,持续优化冷却效率;三是制冷系统中有多个参数需要同时调节,如温度设定点、风速、水流量,该模型可以实现多目标优化,在这些参数中找到最优组合,确保系统在不同工况下都能高效运行;四是数据中心的制冷系统每天产生大量运行数据(如温度、湿度、设备负载等),该模型可以高效处理大规模数据,能够从历史数据中学习冷却需求的变化模式,并结合实时数据进行动态决策,避免能效低下和冷却不足,同时可探索多个策略,通过评估不同冷却策略的优劣,能够快速找到最优解,提高运行效率。

3.可视化子系统。可视化子系统对数据中心的物理设备模型进行仿真建模,运用真实与虚拟融合的方式映射现实设备运行情况。一是数据中心的设备、服务器、制冷系统、网络等在虚拟环境中全方位展现,能够与现实同步更新,使得管理者能够直观地查看各个区域和设备的运行情况;二是对接数据分析子系统,可视化子系统不仅展示设备的物理状态,还能展示设备的运行参数、能耗情况、温度湿度等多维度信息,提供更为全面的监控视角;三是可视化子系统具有良好的交互性,运维人员通过鼠标点击、拖拽等方式,方便查看设备的详细参数环境信息。同时,系统可配置性高,支持灵活调整显示内容、格式等信息,极大提高了系统的管理便捷性和灵活性。

五、项目过程管理

根据项目总体工作方案,项目分为深化设计、环境搭建与测试、系统部署上线及试运行4个阶段,各阶段工作开展情况如下:

(一)深化设计阶段。2023年7月1日至8月31日,完成控制子系统控制逻辑、点位与线缆的梳理,出具PLC控制柜深化设计图纸,同时制定数据分析子系统的数据清单与对接标准。

(二)环境搭建与测试阶段。2023年9月1日至10月31日,完成控制子系统PLC控制柜定制、控制逻辑编制和仿真、模拟测试,可视化子系统的3D建模与温度传感器的安装,以及数据分析子系统数据集成和节能控制算法的定制开发,同时,完成图形工作站与虚拟机的环境搭建。

(三)系统部署上线阶段。2023年11月1日至12月30日,逐一开展PLC控制柜的安装、线缆割接与系统调试,最终完成控制子系统、可视化子系统和数据分析子系统的部署上线。

(四)试运行阶段。2024年1月1日投入试运行以来,持续开展控制子系统在真实环境中的优化调试,确保制冷系统的安全稳定运行,同时,重点开展当前冬季运行模式下节能控制算法的持续调优工作。

六、运营情况

山东农信数据中心制冷自控系统优化升级项目聚焦于实现数据中心制冷机组、水泵、冷却塔等关键基础设施的全面精准监测与自动化控制,通过引入先进节能算法,实现制冷系统各类设备运行状态的动态调整。系统自部署运行以来,整体运行平稳可靠,为数据中心的稳定运行提供了有力保障,并为持续推进数据中心的节能降耗发挥了关键作用。系统运行情况总结如下:

(一)系统的可靠性、稳定性高。制冷自控系统采用冗余架构设计,具备多重故障信号检测和自动切换功能,个别设备出现故障时,能够迅速切换到备用设备,确保制冷过程不中断。同时,系统能够实时发出故障报警信息,便于快速定位故障和开展维修工作。

(二)监测与控制精度高,系统根据监测到温度、流量、设备运行状态等数据,并根据预设的参数自动调节设备频率、阀门开度、风机转速等设备的运行状态。无论在高热负荷阶段还是低热负荷阶段,均能将温度波动控制在极小范围,为IT设备提供稳定的运行环境。

(三)节能效果显著。通过智能的算法和优化的运行控制策略,系统能够根据数据中心的实际负荷情况、室外环境情况以及设备状态等信息,动态调整制冷设备的输出功率、选择合适的运行模式和参数,提高设备运行效率,降低系统能源消耗,避免了不必要的能源浪费,与优化前系统相比较,节能效果显著。

(四)系统操作便捷,可视化程度较高。通过直观的人机界面,运维人员可以轻松地监控系统的运行状态、调整参数设置,并查看历史数据和报表。系统还具备自动化的运行模式,能够根据预设的控制逻辑自动运行,减少人工干预,提高管理效率。系统还具备能效统计、故障统计、机房温度等视图,能够实施监控数据中心源消耗、故障趋势等,为数据中心的节能优化、设备维护提供数据支持。

七、项目成效

优化升级后的制冷自控系统有效解决了原系统存在的安全隐患,并突出了历史数据分析、节能降耗与可视化展示功能。

(一)优化后的控制子系统可靠性更高,系统运维更加高效便捷。制冷系统是数据中心的关键基础设施,而制冷自控系统作为制冷系统的控制核心,自身的安全稳定运行以及高效运维是重中之重,控制子系统的优化改造着重上述两个方面,具体成效体现在:

1.设备选型与系统架构更加合理。全新改造的控制子系统采用业内应用成熟的标准化、通用型可编程逻辑控制器控制方式,有效解决了原系统存在的安全隐患,系统运行更加安全稳定;同时,系统从架构上进行重构,按照控制设备类型划分了冷源、冷却塔、持续制冷、空气处理机、新风机组及附属设施等6个控制单元,控制边界更加清晰明确,控制逻辑更加简洁高效,有效提高了系统运行的整体可靠性。

2.控制与反馈更加清晰明了。为便于运维人员开展系统的整体监控与操作,进行了人机交互界面的整体优化,一是优化制冷系统主控视图,清晰展现了设备操作后的运行状态与数据,并将控制参数与实时数据进行对比展示,进一步提高了工作效率;二是增加了分控视图,消除了附属设施自动化控制的盲点,并清晰展示了各类附属设施在制冷系统中所处的角色;三是按照控制单元分类,对各类设施的运行状态与数据进行全量展示,并对同类型设备运行情况进行清晰对比,从而有效提高了工作质量。

3.报警处理更加高效便捷。转山西路机房制冷系统监控点位多达数千个,报警配置不仅可以及时发现传感器故障,而且可以避免控制事故的发生。新建的控制子系统增加了报警分级分类,将报警等级分为提示、一般、严重、紧急,既可对设备运行数据偏离预设值进行提示,又可对问题的严重程度进行系统判定,有效保证了系统的安全稳定运行。

(二)弥补原系统历史数据不足的缺陷,强化历史数据的统计分析与应用,进一步提升运维管理成效。具体体现在以下方面:

1.历史数据保存完整全面。相比原制冷自控系统注重控制,忽视数据存储等缺陷,新建的数据分析子系统全面利用缓存数据库、关系型数据库以及大数据数据库,无论是温度、压力、湿度等参数,还是设备运行时间、能耗数据等,经数据治理后,均可准确记录并存储,,这为后续的数据分析、决策等各类应用提供了有效的数据保障。

2.历史数据应用更加丰富有效。优化后制冷自控系统基于历史数据,一是可通过查询运行历史数据,对不同时间段数据的对比分析,更好地了解系统的运行状态和变化趋势,从而为调整制冷系统运行策略提供有力依据,二是可实现了历史数据存储、查询、曲线展示等功能,提高了数据管理效率和历史数据利用率,三是系统出现故障或异常情况时,通过对比故障发生前后的数据变化,能够帮助运维人员快速判断故障原因,大幅缩短故障排查时间,同时根据历史维护记录和设备运行数据,为预防同类故障提供经验参考,大大提高了系统故障排查和维护效率。

3.进一步提升运维决策能力,全面而丰富的历史数据为运维人员提供了更全面的信息,可以根据历史数据评估系统的能耗情况,制定节能措施,也可以根据设备的运行时间,合理安排设备的维护和更新计划,还可以对设备的性能进行分析,为设备更新和升级提供决策依据。

(三)强化精细化与智能化控制,进一步突破了能效天花板,PUE进一步降低。

数据中心制冷自控系统升级后,一方面通过控制子系统,强化了末端数据采集的广度与精度,实时、全面、准确的反映系统的运行状况,并为数据分析子系统提供更加全面的数据来源;另一方面通过数据分析子系统,基于海量历史数据,利用AI模型,在确保系统整体安全稳定运行,同时考虑应急处置余地的情况下,对进回水温度、水量、风机转速等运行参数进行精细化的调节,进一步发掘制冷系统节能潜力。数据中心制冷自控系统升级后,数据中心能耗持续降低,经试运行8个月,与2023年的1至8月进行同期对比,除2月份和4月份PUE,受室外天气和开展系统功能测试影响,有所升高外,其余各个月份数据中心PUE整体均呈下降趋势,数据中心PUE对比如图所示。经测算,与系统升级前相比,试运行期间数据中心的节约电量约24.27万KWH,充分验证了项目技术可行性和创新性,为既有数据中心节能改造提供了可行性方案。

(四)3D展示数据中心制冷系统各类设施运行状况,直观展示各类能效数据,可视化运维管理能力进一步提升。

从全景视图中准确掌握各类数据的价值,提高数据中心的管理水平,为决策提供准确、直观的信息支持,一方面实现了监控可视化,通过优化制冷系统主控视图,更加清晰展现当前主要制冷设施的运行状态与运行数据,构建机房、水冷空调系统设施、管路等3D模型,同时将机房温度以立体云图方式呈现,实现数据中心实时运行状态动态展示;另一方面,实现资源管理可视化,从不同的维度,对能效资源使用情况、PUE、WUE、机柜上架率、用电趋势等能源消耗情况进行统计分析。同时,实现数据分析可视化,将运维数据、故障数据等转化为直观的图表和图形,通过分析一段时间运行曲线,发现某些有规律故障或偶发类型故障,从而有针对性进行预防和改进。

八、经验总结

数据中心制冷自控系统优化升级项目,进一步提升了数据中心安全可靠性,降低了数据中心能源消耗,为山东农信既有数据中心实现自动化、智能化控制以及绿色转型提供了有益探索与实践经验。项目建设过程中,经验总结如下:

(一)明确目标,顶层设计,突出运维。首先,项目规划阶段,要明确目标,设定优化控制、节能降耗、安全稳定运行的目标,并制定总体设计蓝图,综合考量传统技术与创新技术的应用,为整个项目指明了建设方向;其次,项目建设过程中,运维人员要全程参与,对硬件部署、线缆接驳、控制逻辑、程序代码等每个细节都要清晰掌握,系统投产运行时,才能做到心中有底,顺利开展运维工作。

(二)技术选型与创新并重,自动控制与人工干预互补。本项目采用的自动化控制与创新技术是一把“双刃剑”,为确保数据中心安全稳定运行,一是自动化控制系统选择成熟、开放、稳定产品,并且从末端传感器、控制器等关键自控设施要做到绝对可靠,确保关键基础设施稳定运行;二是关键控制节点采用人工干预,对于重要设备的开关机操作适时引入人工确认环节,避免完全自动化对于系统运行带来的未知影响,同时强化系统运行过程中的监控管理,通过良好的可视化界面设计,使得运维人员清晰明了的知悉系统整体运行状态,及时判断并处理“应控未控”等系统等问题;三是同时适度创新引入节能模型,在确保数据中心安全稳定运行的基础上,持续探索数据中心运营新模式。

(三)加强团队协作,持续开展优化改进,项目涉及暖通专业、电气、智能化专业等多个专业领域,尤其是系统在线改造,保障数据中心安全至关重要,因此施工与运维充分沟通、相互配合,才能确保项目顺利推进;同时,注重持续优化与改进,系统试运行只是一个开始,要持续关注系统的运行情况,结合实际数据反馈,不断优化节能模型和控制策略,做好大数据应用场景挖掘,以适应数据中心业务的发展和变化。

更多金融科技案例和金融数据智能优秀解决方案,请在数字金融创新知识服务平台-金科创新社案例库、选型库查看。