APP下载

一种基于机器人的数据中心管理系统

2018-08-08李俊山

科技与创新 2018年15期
关键词:灾备机房客户端

李俊山

(浪潮电子信息产业股份有限公司 高效能服务器和存储技术国家重点实验室 数据中心研发部,山东 济南 250000)

1 行业应用特点

1.1 缺乏对基础设施的硬件状态监控

无论是国内还是国外,厂商的运维管理系统都是基于IP的所谓“智能”管理系统,要求被管设备不仅必须要有IP地址和完整的MIB库才可以管理,而且只能获取到设备一半的硬件状态信息,对于非智能设备完全无法管理,比如机房消防设施状态、老式UPS的供电情况和空调系统的温湿度等信息。总而言之,目前的运维产品仍然无法达到对机房硬件设备全面的监控管理目的,因此需要一套能够全面、实时监控各种智能及非智能设备的状态管理系统,以便出现故障后进行实时告警。

1.2 外包运维工作安全性

应用外包服务或各厂商驻厂服务方式来解决运维日常出现的问题,缺点是外包服务人员的素质参差不齐,技术水平不一,部门人员纪律性不强,所以通常客户为了业务的安全,在运维管理制度上都要求外部人员进机房需要客户方人员在场,也就是所谓的“随工”,机房的安全性无法完全得到保障,需要一套能够对外部人员在机房工作的自动化跟踪记录系统,起到远程监工的作用。

1.3 数据中心无人管理

数据中心的建设越来越多地采用“两地三中心”方案,即同城灾备中心结合异地灾备中心的“两地三中心”,国内以政府、央企牵头的客户大都在北京,同城主机房通常在总部办公楼,同城的备机房离主机房位置相对都较远,几十千米以外,异地的灾备机房建设在偏远的西北地区,比如中国人民银行灾备机房在拉萨,且只能由编制内人员进机房维护管理,最终造成严重的客户方IT运维人员不足、工程项目延误、工作效率低下等问题,急需一套高效的无人值守远程维护解决管理系统。

2 系统架构

浪潮基于机器人的数据中心管理系统技术可以很好地解决上述问题,其系统架构如图1所示。

图1 系统架构图

浪潮数据中心机器人系统基于JAVA语言开发,SOA三层架构,分别为数据服务(采集)层、数据处理层、界面展示层,架构之间采用松耦合方式,进行平台化设计的一套纯B/S机房智能巡检管理系统,系统基于ΧML的portlet配置文件可以自由地动态扩展,后台支持开源的MYSQL数据库,提升了数据处理的规范度和再加工能力。底层采集层使用硬件机器人来实现,机器人使用AGV底板SLAM技术进行机房的定位与地图构建,同时在机身安装多种传感器,有360°且高达300万像素的云台视频机、RF射频识别器、红外感应探头、温湿度探头、热成像等感应装置,系统软件层设计有巡检管理、网络管理、IT资产管理、知识库管理、告警管理、报表管理、系统管理、license管理,共同构成强大的IT机房智能巡检管理功能平台。具体资源的管理作为基于平台的管理功能,具备以接口为中心的设计模式。

该系统能够观测设备工作指示灯,识别各指示灯下标文字,变化时转化为文字告警,通过云台摄像机监控且借助各种专业传感器。管理对象如下:网络设备、服务器主机、UPS电源、空调系统、消防系统、门禁系统、漏水情况、烟雾情况、地下热成像、墙面裂缝和地面卫生。

系统提供强大的扩展能力,支持管理能力的自由扩展:采集平台以AI智能机器人为主,采集机房各类设备的指标,能够将新管理对象快速纳入到新的指标体系;支持分布式部署,单套系统即可支持每天两次对500个机柜的巡检;支持巡检指标的自定义,巡检项采用列指标自动学习、自动扩展的方式;支持用户个性化报表的快速扩展,实现各种具备企业特征的报表数据和展现方式。

3 互联互通

数据中心管理系统与机器人之间使用Socket协议,协议消息包含4个字节的固定头部(Head)和消息体(Body)。

3.1 固定头部

前4个字节为Head(固定头部)部分,表示后面消息体的字长(字节数);低位字节在前。例如,如果消息体长度为10,则这4个字节是0A、00、00、00,即Head为0A000000。

3.2 消息体

Head后紧跟消息体,使用JSON格式,UTF-8编码。

3.3 消息体格式说明

客户端与服务器之间发送的所有JSON数据中都包含参数“message_type”,表明消息的类型。

3.4 向服务器注册客户端

在客户端与服务器建立连接之后,客户端需要向服务器发送注册指令完成注册。

参数说明见下表。

表1 参数说明

无返回数据。

其中,视频巡检则用如下方式:

提供一个rtmp的直播流地址,Web页面支持播放rtmp视频流,rtmp://192.168.1.25//live/xxx.

图2为微模块动环监控系统。

图2 微模块动环监控系统

4 总结

通过拉通机器人与数据中心管理系统直接的互联互通,提高了数据中心综合管控效率,提升了监测段,有效地解决了人工巡逻存在的“三不一低”问题,极大地推动了机器人在数据中心巡检中的应用。

猜你喜欢

灾备机房客户端
你的手机安装了多少个客户端
高速公路收费站无人值守机房安全监管系统
“人民网+客户端”推出数据新闻
——稳就业、惠民生,“数”读十年成绩单
平疫结合的CT机房建设实践
论岸桥机房无焊接化改进的优势
浅谈广播电视播出机房技术操作与维护
媒体客户端的发展策略与推广模式
深蓝云海“云灾备”正式上线
新华社推出新版客户端 打造移动互联新闻旗舰
共享灾备走向智能化