APP下载

浅谈机房驻场运维

2018-03-04

机电信息 2018年27期
关键词:驻场机房运维

艾 渊

(云南电网有限责任公司曲靖供电局,云南曲靖655000)

1 机房驻场运维的概念

驻场运维,即安排专业的技术人员在机房工作,对机房进行日常维护保养;对设备信息化完善进行登记,对出入机房人员进行登记,对各系统设备参数进行每日的例行登记,建立设备档案,应对突发故障,制定巡查规范及制度,定期联系设备供应商对运行的设备或软硬件进行维护保养。驻场运维是一种日常化的工作,需要投入一定数量的稳定的驻点人员,对机房各个系统存在的隐患进行提前预判,协调处置,同时及时上报问题原因及处置方式,为机房的整体安全运行提供可靠的数据或报告支撑。

2 机房驻场运维的意义及重要性

机房的设备分类众多,根据不同的侧重点又可分为很多部分,各设备彼此之间工作内容既相互独立又有内在的紧密联系,而且机房里的设备不仅自身的价值很高,其本身的数据也非常重要。当机房安全平稳度过试运行期后,即可投入正常使用,此时为了延长设备的使用寿命,便需要定期地维护保养。驻场运维的侧重点在于保障设备的正常运行,当出现问题时应急协调解决的处置能力及时间控制,取决于运维工程师对日常设备维护的认识和驻点运维工作的完善性和有效性,这决定了是否会出现额外的费用、人力、时间的支出;而从另一个角度来说,在问题发生的第一时间,如果现场运维人员能在日常维护中积累相应的处置能力,那么将能大大节约时间、人力、物力成本。

因此,机房驻场运维的意义在于通过每日对设备的维护、记录、保养延长设备生命周期,保障机房设备运行稳定,降低故障率。在机房突发事故导致设备发生故障,影响机房正常运作时,可以及时得到机房专业运维人员的技术支持和维修,快速解决故障,及时恢复正常工作。

3 机房驻场运维的目的

机房驻场运维通过每日的记录维护,按每周、每月的时间节点,比对设备运行参数及报警记录,生成各系统性能评估及运行生命周期状态表,总结出目前设备在运行中存在的问题及隐患,并通过会议或报告的方式将各系统性能评估及运行生命周期状态表反馈给设备管理方,给出合理化建议,同时协助设备管理方将各系统存在的问题统计出来,形成后续完善的机房运维及改造计划,从而提升机房整体运行质量,达到延长系统工作寿命,减少系统突发性故障,保障机房稳定运行的目的。

4 驻场运维设备的分类及运维内容

机房的驻场运维项目可分为七大部分:综合布线系统、空调系统、动力环境监控系统(含门禁、视频监控、入侵报警)、机房消防系统、防雷接地系统、配电系统、基础环境,现场运维工程师需要每日对这7块进行巡视记录,以保障各系统设备正常运行及预防突发故障。驻点人员采用以下方式对各系统进行维护:

4.1 综合布线系统

综合布线日常维护需注意:(1)机柜内是否存在临时作业的跳线、飞线,未做标示、未进行整理的需要进行整理,并按线缆对应的端头标注标签。(2)机柜是否存在未捆扎的线缆,需要使用扎带或魔术带进行捆扎,并整理进理线器、分线槽或桥架。(3)线缆是否存在松脱或接触异常问题,需要每日对各监测系统、网络系统进行检查,防止临时作业导致的未接入问题或线缆接错问题。(4)对出现临时作业的综合布线类工作,按范围、位置、端口、时间进行登记,防止违规操作导致的线缆端头故障耽误故障排除时间。(5)检查内容每日需进行相关记录,以保证设备单日进行过检查,确保设备在日常维护中的可靠性,为预防突发故障做出相应的数据支撑。

4.2 空调系统

机房精密空调主要由压缩机、冷凝器、膨胀阀、蒸发器、风机、空气过滤器、加湿器、加热器、排水器等组成,安装的目的是确保室内空气温度、相对湿度、噪声、压力、洁净度等参数保持在规定范围内。因此,保证空调设备的正常运行也是保障机房各系统安全、稳定运行的重要工作,其中主要工作内容如下:(1)检查液晶面板,查看温湿度是否正常,查看时间是否正常,看是否存在报警记录,查看参数显示是否异常。(2)检查精密空调内环境,是否存在漏油迹象,是否存在铜管结霜或压缩机结霜,是否存在接水盘堵塞等情况。(3)检查压缩机启动是否正常,通过电流表检查启动电流、电压是否正常。(4)使用压力表检查动态压力,观察视液镜颜色,判断制冷剂是否充足。(5)检查冷凝器,看是否有冰、污垢附着,检查风扇是否存在异响等。(6)检查蒸发器是否有冰、污垢附着,蒸发器翅片是否存在变形或损坏。(7)检查空调滤网是否洁净,是否需要清洗或更换。(8)检查内容每日需进行相关记录,以保证设备单日进行过检查,确保设备在日常维护中的可靠性,为预防突发故障做出相应的数据支撑。

4.3 动力环境监控系统

(1)传感器检查:传感器设备有无鸣叫(滴滴声)。(2)视频监控系统:查看视频监控系统的画面是否清晰、显示是否正常、录像是否正常、球机是否转动。(3)门禁机:日常保养、刷卡检测、通信检测、显示检测、按键检测,读卡器及电锁之间的电源电压是否正常。(4)精密空调系统:检查精密空调和监控软件通信是否正常,参数监测是否准确。(5)市电质量检测系统:监测实际市电输入数据与监控数据是否一致。(6)温湿度监测系统:查看实际温度和湿度与监控软件显示的温度、湿度是否准确,通信是否正常。(7)重要开关监测系统:检测重要的开关,查看实时开关的状态和监控软件的重要开关显示状态是否一致。(8)漏水检测系统:测试漏水检测系统及设备运行是否正常。(9)测试电话、短信报警是否正常工作。(10)监控软件:确定监控软件运行的稳定性、数据记录的准确性,及时对软件进行升级。(11)检查系统设备清洁程度,特别是设备内部的积尘及其他物质。(12)检查系统设备运行环境,通风及散热是否良好,环境温度以及设备有无进水可能。(13)检查内容每日需进行相关记录,以保证设备单日进行过检查,确保设备在日常维护中的可靠性,为预防突发故障做出相应的数据支撑。

4.4 机房消防系统

(1)检查电磁阀与控制阀的连接导线是否完好,端子有否松动或脱落。(2)从启动钢瓶上卸下电磁阀,检查其动作是否灵活。(3)卸下报警及控制系统与执行机构的连接装置,用模拟试验方法,检查自动控制、报警及延时功能的灵敏度和动作可靠性。(4)检查贮存容器开启机构灵活可靠性。(5)检查灭火剂贮存容器阀和启动容器阀的安全装置和管路安全阀放气口。(6)检查所有钢瓶外表有无腐蚀和镀层脱落现象。(7)对系统中所有软管进行外观检查,发现任何缺陷及时更换或对软管进行耐压试验。(8)检查内容每日需进行相关记录,以保证设备单日进行过检查,确保设备在日常维护中的可靠性,为预防突发故障做出相应的数据支撑。

4.5 防雷接地系统

防雷接地系统在日常维护中注意,定期使用接地电阻测试仪对机柜接地、设备接地、机房接地网、接地环进行测试,看是否存在异常接地数值,检查是否有违规接地;应制定防雷接地设备预防性驻场运维计划,对防雷接地的运行状况、安全性等进行定期检测。

运维工程师及时处理日常运行过程中出现的问题:(1)对电位端子箱、防浪涌抑制器等防雷设备进行外观检查,并清除杂物。(2)检查接线端子,对接头松动或出现氧化的部分及时进行处理。(3)检测接地网接地电阻,对不符合要求的及时进行处理。(4)检查接地线缆、铜排等,对有破损的部分进行修复或更换。

4.6 配电系统

配电系统大致可分为动力配电柜、ATS柜、UPS柜三大部分,日常维护主要内容如下:(1)检查液晶面板,查看温湿度是否正常,查看时间是否正常,看是否存在报警记录,查看参数显示是否异常,采集数据是否正常。(2)使用红外测温仪检查柜内温度,接头温度,及空开、断路器、浪涌保护器、漏电保护等是否正常。(3)记录当天柜上数据,检查内容每日需进行相关记录,以保证设备单日进行过检查,确保设备在日常维护中的可靠性,为预防突发故障做出相应的数据支撑。

4.7 基础环境保洁

机房驻场人员应对进行机房环境作业的人员提出以下要求:(1)进入机房需穿戴全套工作服,配带鞋套等保护机房环境。(2)进入机房需有许可并进行登记。(3)进入机房产生的垃圾或废料需及时清理。(4)向进入机房的工作人员说明机房管理制度。

机房驻点人员日常对机房环境的检查包括:(1)检查过程中着重查看静电地板是否存在凹凸不平及踩踏松动等情况,记录上报缺陷并协商更换。(2)对于防静电地板的保养维护,应使用吸尘器或墩布进行板面的清洁,不要将液体撒在地板表面上。(3)工作区域应穿软底专用鞋或脚套进入,严防粉尘进入工作场所。(4)搬运机器设备时严禁机器设备在地板上拖檫。(5)对防静电地板及地板下进行吸尘处理,保证机房颗粒状物质不超过设备正常运行要求。(6)对墙面平常不易打扫到的角落及彩钢板进行除尘。(7)对吊顶内定期除尘,杜绝顶面灰尘掉落。(8)对顶面管子、吊杆等进行巡查,防止松动、脱落。(9)对插座电压灯进行测试,及时发现有隐患的部分;对照明、插座的运行状况、安全性等进行定期检测。(10)对照明灯具、开关面板、插座进行外观检修,对出现松动现象的进行校正。(11)对各个区域灯具照度进行抽查,按照规范要求,若有照度不够的,根据现场情况同甲方提出相应的整改建议。(12)检查灯具、开关面板、插座等接线端子,对接头松动或出现氧化现象的及时进行处理。

5 驻场运维的发展方向

机房各系统及环境的维护从驻场运维方式发展,可使用稳定的运维资源,获得较为长期的保障;通过机房现场安排驻场工程师,进行每日的现场检查及例行记录,检查中有效应对突发故障,再将各系统设备的运行情况记录下来,按每周、每月的时间节点,比对设备运行参数及报警记录,生成各系统性能评估及运行生命周期状态表,总结出目前设备在运行中存在的问题及隐患,并通过会议或报告的方式将各系统性能评估及运行生命周期状态表反馈给设备管理方,给出合理化建议,同时协助设备管理方将各系统存在的问题统计出来,形成后续完善的机房运维及改造计划,从而提升机房整体运行质量,达到延长系统工作寿命,减少系统突发性故障,保障机房稳定运行的目的,进而推动机房驻点运维方式的长远发展。

6 结语

驻场运维方式适用于设备管理方在没有足够专业人员数量配置的情况下,和机房建设方签订合同,派遣专业的工程师,对机房进行驻点维护;也适用于大型信息机房、通信机房、数据中心等大型机房的稳定维护。驻点运维人员可在机房各系统还未建设完成时就加入驻场运维,在机房各系统投入运行前就对现场的系统设备有一个深入的认识,在后期的驻场维护中,更容易排查问题所在,检验系统运行状态、减少系统的突发性故障。在后期的驻场维护工作中,将日常巡视及检查结果生成设备运行记录、故障分析与排查、系统性能评估及运行生命周期状态表,有利于提出完善的机房运维建议及改造计划,逐步完善机房各系统的维护及管理。

猜你喜欢

驻场机房运维
EPC工程施工监理探讨
浅谈医院信息化驻场监理新模式
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
数据中心机房气流组织研究在某机房的应用
浅谈园林驻场设计师在施工过程中的作用
杂乱无章的光伏运维 百亿市场如何成长
基于ITIL的运维管理创新实践浅析
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置