接触机房工作的朋友都知道,IDC数据机房里面一般都摆放着一排排放满服务器的网络机柜,这些网络机柜组合安装面板、插件、插箱、电子元件、器件和机械零件与部件构成了一个密集型柜子,网络机柜里面设备众多,并且价格不菲,对这些机柜和设备的保养维护就显得非常重要了,应该如何有效的保养机房设备,保证其高效运行呢?

维护保养IDC数据机房设备的目的

维护保养IDC数据机房设备的目的是保障机房设备正常运行,对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。

什么是IDC机房运维?

IDC机房运维可以简单的从五个方面来概括:主机监控、信息统计、硬件维护、系统维护、网络维护,处理这些问题就是IDC机房的运维,IDC机房运维涉及到方方面面的问题,它不同于其他运维,处理的问题都是比较低沉的问题。

在很多公司可能都是将服务器托管的到专门的IDC机房让专业的人士进行维护,还有些大公司建有自己的IDC机房,但管理层面上可能只是网络信息部门的一个子部门,但我们仍要面对很多机房管理的问题。

什么是分层运维?

计算机能有今天的成就很大一个成功是在于它的模块化设计,以及分层体系,现在我们用的PC的硬件是由CPU、内存、硬盘、主板、输入输出设备等组成。正是这些模块化的构造让人们对计算机的维护更加的方便,快捷。现在我们正在步入云计算时代,云计算的实施却是阻碍重重。但是云计算是必然的趋势,因为这是人们对信息自由的渴望、是对资源合理利用的迫切需要。

所以说云计算的发展也少不了用模块化,分层次的进行设计和优化,我们来看看云计算的分类:云计算可以认为包括以下几个层次的服务:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。

现在的系统分层多且繁杂,无法体现我们在IDC机房的运维,我认为IDC机房的运维应该根据服务提供的角度去对IDC机房进行维护,从终端角度来看,所有提供网络服务的资源都是一朵朵的网云。我们在IDC机房中的运维都是为了面向终端进行服务。所以说我们应该根据服务来对我们的IDC机房进行运维。

根据云计算服务的分类认为我们在运维分层的问题上应该和云服务的分类相呼应来进行维护,所以我认为,IDC机房的运维应该分成:基础设施维护,耦合层维护,应用服务维护三个层面。

1、基础设施维护

基础设施维护顾名思义,指的是对设施设备的维护,包括设备的环境维护,设备的统计等等。在这个层面我们需要保证每一台机器是可以正常连接的,是可以正常使用对外提供服务的,并且我们得保障机器的正常运行并且是可管理的。总的来说基础设施层的维护是为了对耦合层的交付使用而服务的。

2、耦合层维护

在这个层面我们对设备有了统一的管理,在这个层面有系统性的架构统一的管理系统,指令系统,和监控系统,在这个层面我们可以发现底层的问题,并交由底层处理,并在这个层面保证应用服务的正常运行。在这个层面将会涉及负载均衡和备份等技术。

3、应用服务维护

在这个层面主要是客户对自己应用的维护,在这个层面里客户对自己运行的运营软件进行维护。当然这个分层的维护只是个萌生概念,如果有一天这个理论可以被建立,相信会被更加的完善。并且为我们更好的理解运维体系服务。

具体维护方法:

1、机房除尘及环境要求:定期对设备进行除尘处理,清理,调整安保摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备内部。同时检查机房通风、散热、净尘、供电、架空防静电地板等设施。机房室内温度应控制在+5℃~+35℃,相对湿度应控制在10%~80%。

2、机房空调及新风维护:检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。

3、UPS及电池维护:根据实际情况进行电池核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。

4、消防设备维护:检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。

5、电路及照明电路维护:镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。

6、机房基础维护:静电地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、接头紧固;防雷器检查;接地线触点防氧化加固。

7、机房运维管理体系:完善机房运维规范,优化机房运维管理体系。维护人员24小时及时响应。

IDC机房服务器机柜维护保养

服务器机柜维护保养是机房运维人员工作重要的组成部分,在做服务器机柜维护保养的时候,避光、除尘和空间控制是最终要的三种方式,现在就让九河互联小编为大家讲解一下服务器机柜维护与保养。

1、压力控制

部服务器对于压力的承受都有一定限制的,别看那都是全金属机身,但是总有一个承压最高值。塔式服务器一般都是单独机体的立式,就算是采用卧式层叠,因为单机空间占据太多,堆起的服务器数量也不会太多,在此涉及的外部环境的压力问题不大。

以1U机架式机箱为例,一部1U实际能够承受的压力大致是同规格重量(即1U)在5-7个左右,一些强度比较好的机架托盘,对于服务器的承压基本也在6-8部1U服务器之间。

所以在设置机柜摆放的规格时一定要做好预算不要单个隔层放置太多部。

2、空间控制

服务器的空间控制主要是为了便于规划、管理,还有一个小的原因也是为了上文提到的温控制,以实现更好的散热。服务器的杂乱摆放或者网线的随处陈列,以及散乱的柜后和地板下线路通过精心的维护工作,可使机器线路位置重新规划都井井有条,线路的控制也很有顺序,这样对于问题的处理就更加容易了。

如果是小型机房靠墙的塔式服务器,从充分利用空间、努力保持温控、保持电源和KVM等线路的日常维护综合考虑,以机体距离墙面300px左右为宜。

3、避光

直射的阳光对于服务器温度的增长可是很有助力的,但是可惜,服务器温度越高,越容易出问题,对于服务器系统的稳定性来说是非常不利的。另外,直射的阳光对于机房内的显示器是很有攻击性的——由于阳光的直射,显示器的寿命很容易减半甚至更多。在IDC和ISP机房里操作时,想见到一丝代表希望的阳光都不可能,所以避光这一条是做得很不错的。

在一些小型机房,由于尽量利用空间的租金成本需求,房间内的设施都比较拥挤,很可能在不远处就有一扇大窗对着;机房里的环境对于向往自由但是又必须长期坐在里面的人员来说,是非常烦闷的,导致随时随意拉开窗帘,敞开窗户,在感受阳光和新鲜空气的同时,对设备造成了一定危害,隐患也随之形成。

所以,在阳光可以穿过窗户直射到服务器的机房,最好有一条规则加上去,那就是禁止打开窗帘与窗户。考虑到机房工作人员的感受,每天最好抽出几个时段让工作人员轮流到户外走走。

4、防尘

服务器是一个高性能的机器,同时也是一个很容易表现脆弱的机体。有些机房的服务器,由于长时间裸露在空气外,当混杂在空气中的尘土进入其中到一定量的时候,机器里的风扇等可就不堪重负,开始罢工了;另外,灰尘的进入,对于主机里大多数设备包括主板、CPU的寿命是有很大损耗的。

所以,在机房内,有条件的情况下,最好购置专业的服务器机柜;管理人员进入机房前,在脚上最好套上一次性的防尘罩或者个人专用的干净的拖鞋;机房内原则上不接受外人的拜访。