APP下载

机房动环监控云化架构的设计与实现

2018-09-23

通信电源技术 2018年7期
关键词:动环联通机房

江 陵

(中国联通江苏省分公司,江苏 南京 210000)

1 绪论

1.1 云计算的国内外发展现状

云计算作为物联网的重要组成部分,受到了各国政府的青睐。它开启了IT产业界的技术革命,为行业今后的发展提供更多的机遇和可能。美国作为技术大国,也将云计算技术纳入其IT战略中。美国国防信息系统部门根据国家发展需要在数据中心加强云环境系统更新,利用先进的科学技术构建虚拟云环境。在西雅图华盛顿州会议中心举行的微软Build 2018开发者大会上,微软CEO萨提亚·纳德拉声明,到2020年,全球智能设备将超过200亿台,每个人每天会产生1.5 GB的数据,而每个智能家庭产生的数据会高达50 GB[1]。在“世界是一个超级计算机”前提下,AI与云计算是微软最为重点的话题。此外,日本也顺应时代发展潮流,计划建立名为“Kasumigasek iCloud”的大规模云计算基础设施。该设施能够帮助日本财政部、内务部和监管部等各个职能部门收集数据信息,完善工作机制[2]。在“十三五”信息规划中,中国对云技术作出全面剖析,提出要将云计算纳入发展纲要,并将其作为下一个五年计划中信息化领域的重要发展任务[3]。

在2016年年底,工业与信息化管理部出台关于信息软件产业发展的指导意见,划定出行业的十个重点发展领域,包括基础软件、信息安全软件、工业软件、嵌入式软件、行业应用解决方案、系统集成和支持服务、软件服务外包、各类创新型服务、数字内容加工处理与服务以及IC设计服务。为响应国家号召,积极发展信息产业,北京启动祥云工程,江苏无锡则希望通过产业振兴打造“中国云谷”。除政府部门外,经济、文化、科技等各行各业都掀起一股“云浪潮”。

现阶段,云计算技术正逐步走向开放包容和互联互通,服务器普遍选用X86机群,储存技术则向SAN+NAS一体化发展。随着互联网宽带提速的增效,小型机厂商更加重视PC服务器的发展,未来网络也会逐渐实现虚拟化、网格化和扁平化。当前,网络用户的参与门槛降低,获取信息的渠道增加,且成本不高,每个人都可以根据兴趣选择个性化内容。同时,公共计算网络逐步兴起,可以有效感知用户位置,扩大移动用户规模。在云计算逐步向公共计算网过渡的过程中,对集约化规模化计算技术的要求增高,促使行业明确开放的云标准,在虚拟计算的同时合理调配信息资源。

在业务方面,电信业务的发展更加集约化和专业化。随着信息技术的快速发展和社会资源的日益增多,网络用户正呈现爆发式增长,对信息服务的要求也在不断提高。当今,计算机技术的运用成为通信行业发展的重要凭借。企业应不断加强信息服务供给,实现计算和通信的融合发展,各大运营商也要把握发展机遇,提出明确的发展目标,即成为综合信息服务提供商。云计算技术的广泛运用不仅能够帮助运营商转变经济发展模式,优化产业升级,还可以促进通信技术的发展与创新,完善信息基础设施建设。

1.2 动力环境监控系统的发展概况

20世纪初,移动通信技术已在世界各国得到广泛应用。运营商可以将每一个电源设备和配套设施布局到合适位置,并采用专业的监控技术实施统一管理。由于设备生产厂家的规模和发展程度存在差异,动力系统的开关电源配置也会有所不同,因此在系统维护过程中必须接入统一电源开关。

现实发展的需求往往会引发信息革命和技术革新,不同企业应根据实际操作和信息保密需求采用不同功能和类型的监督管理系统。在选择过程中,不可盲目扩张动力监控系统,更不能脱离生产实际遑论发展,而是要把握不同系统的功能机制,适当整合系统,避免因信息干扰、技术混乱等管理问题导致各部分无法互联互通,整个系统走向瘫痪和崩溃。

当前,通信设备监控系统多采用综合性管理平台,并逐渐向无人操控的自动化方向发展。通信企业可以逐步撤销监管人员,通过遥控和遥调等“遥控制”手段掌握监督管理的主动权。这要求基站的内部系统必须具备动态化、智能化、安全系数高和稳定性强等特点,保证监控系统能够自动收集并实时更新数据信息。通过统一的管理平台,移动基站的信息设备和数据资源实现在网络环境下的集中整合,不仅减少人力、物力和成本,还可以将数据输送到监控中心,避免出现信息泄露、数据遗失和操作故障等问题。

2 研究背景与研究意义

2.1 江苏联通现网动环监控情况

江苏联通自三期工程开通后,便着手动力环境监控系统的构建。其实施方案先后由中兴和艾默生开关电源供应商提供,但两者在运行过程中都容易问题。比如,中兴系统不稳定,经常出现乱报和错报警的技术故障。而且中兴的监控系统无法覆盖艾默生电源,无法对其实际操作进行控制,导致监控设备存在不匹配问题。为更好地解决监控系统的管理问题,又先后采用了以下方式[4]。

2.1.1 干接点告警

该方式主要采用分组划分,通过接入重要开关告警数据,如基站停电、电池电压低告警、主要负载熔断器断和门碰等,实现开关量告警。当接收到报警数据,信息数据在汇总后会被输送到基站操作台,并选择一组接点进行信息对接,以便及时判断是哪组在报警[5]。

该方式存在一定的缺陷,例如,实施具有很强的依附性,一旦离开基站的网管系统,便立即丧失信息和数据来源,使动力监控系统无法发挥告警预知作用。此外,如采用此方式监控动力设备的运行情况,故障信号需要通过多层菜单方可被系统获得,存在输送损耗与告警延迟问题。当前,由于包括江苏联通在内的很多运营商仍采用无线和动力维护人员分开值班的制度,愈发给系统的优化完善带来困难。

2.1.2 公务信道组网

现阶段,大部分联通移动基站采用公务信道光传输组网方式构建动力环境监控系统,且监控信号传输方式为光传输。江苏联通的长期供应商是中兴公司,他们为联通移动基站的动环监控提供专门开发的F2口,传输速度可达64 kb/s。

该方式也存在较大弊端。首先,在监控系统组网后传输速率明显缓慢,造成严重的传输限制。其次,公务信道组网采用轮巡的数据采集方式,一个环上的基站只能在同一个通道进行最大速率为64 kb/s的数据传输,运行效率大大降低,而且当一个环节出现故障,整个通道就会陷入瘫痪。如果对基站传输数据稍作修改,又会导致大批的基站信息无法有效上传[6]。为解决以上难题,联通公司后期采用了变大环为小环的方式,能够避免速度变慢。但是这也带来种种缺点,如传输资源占用较大,对整个网络的传输构成很大压力,维护人员压力倍增。

2.1.3 时隙分插复用组网

在移动基站与控制器中存在一条输送数据和信息的2M通道。它被进一步划分为32条传输速度为64 kb/s的传输通道,其中,除时隙0用于传送同步信号和时隙16用于传送信令信号外,其余30个时隙全部用于承载其他业务。由于其承受能力大于目前联通的用户规模,业务承载仍有富余。在数据传输过程中,动环监控系统可以从中抽取一个时隙进行数据传输,并可以将不用的时隙还回交换机使用,实现监控数据通过时隙分插复用的传输。如果把同一模块下的基站监控系统进行整合,并将其分配到一个或多个控制中心,控制中心便可以通过前置机对各项数据进行梳理汇总。在信息处理完之后,会存储最终结果,并在显示设备上实时显示,有助于系统操作员和维护人员对各种设备进行信息的“遥控”,实现对每一个基站的监控与控制。

2.2 机房监控系统云服务器改造的必要性分析

随着信息行业的快速发展,网络覆盖范围日益扩大。对江苏联通而言,由于用户数量大,分布范围广,且业务需求复杂,设备的维护和监控要求变得更高,企业面临更多的困难和挑战。传统的管理模式和人员巡检方式存在时效性低和安全性问题,无法满足“互联网+”时代的发展要求。为保证各环节实施的优质高效,联通应该采取网络化和动态化的统一管理模式,构建智能动力监控系统。同时,在设备操作、动力供给、环境维护和人员配置等方面应进行综合监控,积极满足联通“不间断,高质量,经济效益强”的安全需求。

当前,电信行业的竞争日益激烈,安全性已成为企业脱颖而出的重要法宝。运营商应将增强网络安全作为企业业务开展的重要前提,确保平台运营的稳定性,保证网络用户的利益。为提升网络安全性,企事业单位应该根据自身发展要求设计出不同的方案。例如,单位可以精细化管理为切入点,在规划总体布局的同时做到精准定位,并投入大量的人力物力对保障网络安全,在设备管理、资产统计、发电效率和基站巡检等投入大量物资。此外,还可聘请专业技术人员进行网络维护,提升检测的准确性和可靠性,为网络用户营造安全信息环境。

伴随着现代动环设备的发展和日益普及,传统监控系统的不足逐渐显现。先前的监控中心(Supervision Center,SC)需要耗费大量的人力,几乎所有问题的处理都需要人工的参与。而且,各监控服务器缺少沟通和对接,数据的处理能力和远程操控能力不断下降,无法保障管理的有效性和精准性。在大数据时代,为响应共享互通的时代趋势,对各行各业都提出了相应的改造要求,其中通信系统尤为突出。随着机房数量的不断增加和分布区域的日益扩大,如何改善和维护机房内外部环境成为行业发展的新方向和新要求。当前,数据信息的处理呈现多元化和个性化的需求,较常采用的解决技术为云计算、云技术和智能统计等,它们皆可以帮助更多的服务站点实现分工合作,提升实际工作效率[7]。

相关人员应立足于当前研究背景,以现有研究成果为切入点,提出一种可应用于动环监控系统的云架构系统。整个系统采用二级架构,对每一部分具体的工作职能进行了重新设计,此外在系统设计阶段,积极结合联通公司的性质,使系统具有更好的扩展性,顺利应对联通用户不断增长的实际问题。笔者参考云技术的发展思路和操作方法,以江苏联通机房环境监控系统为研究对象,阐述实施的具体优化方案。

3 云计算架构下环境监控系统的搭建

当前,江苏联通发展较快,网络技术已经普及到各个城区和乡镇,各地对机房环境的要求和智能管理的需求也日益明确。基于此,江苏联通发挥自身的技术优势,结合平台体系打造出可监控和检测的标准化云计算管理系统。

3.1 云计算技术架构及其关键技术

通常,云计算统一整理各个资源,形成资源池,实现对各个资源的统一处理与管理。它是一种虚拟化技术,在架构上分为三个基本的层次:应用层、平台层和资源层。云计算主要用于提供基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS),且各类服务相互关联、相互影响。云计算平台可以分为3个逻辑层次和1个云管理平台,凭借完整的服务体系,不仅能实现各司其职,也可为用户提供有效专业的信息供给。其具体架构如图1所示。

最底层是基础资源层。资源层主要提供各级服务中最基本的服务,除供应实体资源和虚拟资源外,还可对感应器、报警器和控制器等物理资源进行抽象处理,实现对物理资源的计算和存储。在该层内能够完成对资源管理的自动化优化,使对各个信号设备的采集和访问变得更加便利。

中间层是平台层,处于资源层与应用层之间。它以环境监控系统软件为核心,在资源层之上运行,可用于提供各种应用服务,包括各子系统、WEB和应用服务器的开发、测试和运行等。

最上层为应用层,是考察云计算架构功能和成效的试验田。所有层次的信息数据都将在该层汇总,并提供包括联通内网登陆查询数据、报警汇总和数据智能分析在内的各种业务应用。在应用层同样可实现对WEB和客户端的访问。

保证云管理平台的有效性、高效性和整合性,能为各个系统提供便利的运营环境,促使各服务系统能够灵活部署、运行与管理,及时调整工作方案,优化管理环境。云管理平台的应用,不仅带来了系统性能方面的增益,在提升系统安全性方面效果同样立竿见影。运用云管理平台还可以增加系统的可扩展行,为整个监控系统提供全方位保障。此外,选用这种系统架构在开发过程中可以降低成本,后期的系统维护也更加方便快捷,极大地节约人力成本。云管理是云计算的“中枢神经”,具有管理、用户服务和调度监控功能。运行该平台可以采集到大量的技术信息和信号资源,及时发现并处理系统故障,在系统出现问题时,也可以通过智能化的手段与其他服务系统进行对接,保证管理的自动化。

3.2 云平台工作原理

系统的设计形式采用分层设计,主要包括三个层次:联通机房动环监控平台;各种传感器组成的信息采集层;包含交换机的浏览层。其具体结构如图2所示。

图2 联通环境监控系统结构

在监控系统中,集中监控系统平台主要负责监督和调配光电设备、FTTx网管和系统温湿度,并对联通机房的整体数据实施分析、管理和输出。当设备出现故障时,该平台会自动启动报警装置,处理紧急情况,记录突发信息,并借助语音等多媒体手段实现实时输出。管理人员在接到信号后能够立即启动紧急预案,及时整修和维护机房设备。

现场设备采集层主要负责对光电设备、FTTx网管和温湿度信息进行全方位采集,利用专业化操作系统进一步筛选和处理,并通过内部服务器将信息输送到监控云平台。

远程WEB浏览站的主要功能是进行远程WEB浏览,通过远程系统帮助管理人员实时了解机房运行情况,远程操控服务设备,实现管控一体化。工作人员选择IE浏览器,以LAN或VPN方式实时观看监控画面,也可以远程浏览机房的工作状态和设备使用状况。

3.3 环境监控系统的搭建

如图3所示,机房监控系统主要由环境监控、动力监控和安防管理模块组成。当前,江苏联通共有5 000多个机房,可以通过统一的多媒体平台为各个地点设置固定的TCP/IP地址,使其接收到所需要的信号和资源。各个站点的机房控制系统都配备有红外、灯光或烟雾等前段感知设备,可用于收集汇总相关数据信息,并对其进行智能分析、搜索和数据挖掘等复杂计算。以上功能的实现都离不开云计算和云管理的支撑。通过云技术,信息能够得到循环处理、输送和互动反馈。在中心机房下达指令后,各站点可以通过光电信号和智能设备接收指令,进而执行相应的指示。此外,中心平台能够突破时间和空间的限制,实现对数据信息的实时跟踪、监控以及处理。

图3 机房监控系统模块

4 云计算架构下环境监控的优势

4.1 跨平台、跨媒介、跨地域

云计算借助数字技术、智能技术和互联网技术,以手机和电脑等移动终端为载体,通过微博、微信和邮件等媒介进行虚拟化运作。无论在精细化分工、分布式监控和网格化管理还是智能化报警方面,都体现出云计算架构的灵活性和丰富性。这种新技术不仅能够带动信息产业健康有序的发展,也能凭借“三跨”优势扩大数据服务的范围,保证信息输送的稳定性和安全性[8]。

4.2 监控全面,部署方便

云计算架构的系统优势是能够监督和管理各个环节或各类设备提供的各种服务,如UPS电源和IT服务器。当信息层或平台层出现异常情况时,平台可以借助多个接口和内部关联信息网自动发布预警通知,整合AD与权限管理,提升系统运作的工作效率。具体优势如表1所示。

5 江苏联通机房动环监控系统改造情况

江苏联通运用基于云架构的动环监控系统,集成温度、湿度、红外线和烟感等各类传感器,实现对机房各个供电设备和光电设备的实时监控与管理,在发生危险状况时可以发出警报,并定位故障点。此外,凭借数字采集和视频监控技术,系统具备远程监控功能,可以采用异常短信报警和远程管理等各种控制手段,管理变得更加便利[9]。云计算构架以高收益、低成本的技术优势实现技术上的发展和对系统的有效管理,具体改造情况成果及后续持续发展方向如下。

表1 云计算架构下的环境监控的优势

(1)集成化。凭借统一的云平台,可以实现全省动环监控系统、视频安防系统乃至运维管理系统的高度集成。一般情况下,数据中心设备运行维护班组的例行工作是保养和维修,面对需要巡检的设备却没有明确的规则,无法及时管理紧急维护任务。而作业管理会提供统一直观的总览展板,便于操作管理,不会遗漏重要工作内容。作业管理也拥有主动运维能力,可以自动生成保养检修作业计划,并结合手机派单形成闭环电子流,管理整个工作流程。提供数据中心维护制度自动设置功能,由软件自动提醒相关人员进行设备维护及保养管理,并跟踪进行手机派单和流程闭环;通过统一展板可看到总体维护工作情况,了解设备故障具体信息以及维护任务安排和执行情况,并可手工查看各细节,快速完成维护工作。

(2)流程化。即可在高度集成平台的基础上以流程化的方案展现全省机房运行情况。通常,值班员需要手工记录各种事项,在进行交接班时需要双方逐条说明情况并签字。如果记录的信息不完整或字迹潦草,那么交接效率将非常低。此外,忘记交接账户、值班人被骚扰和当班人收不到紧急信息通知等情况也时有发生。如果系统本身能内置交接班的管理规范,在交接班过程中自动进行数据的统计和确认并给出建议,将大大提高交接班的效率。应用云平台的自动化交接班,在快下班时可以得到自动提醒,系统也可以帮助人员进行数据统计,形成翔实且易读的交接班报表,交接班流程顺畅不容易出现差错。

(3)智能化。重点在于逐步提供精细化运维水平与智能运维程度。云平台能够利用全省运维数据分析运营风险(灾害或主设备故障)并进行建模。其中,风险预案以AI方式纳入系统管理,在发生风险时,系统会为值班员指示具体的风险等级和应对措施,显示受风险影响的客户和位置,并积极帮助联系相关人。在应急方案执行过程中,系统能为工程人员及时显示故障信息、维修设备资料和携带工具信息,为主管提供故障预计恢复时长和客户影响信息,便于联系客户澄清问题。而在风险处理完后,自动实施闭环并进行经验管理,为以后的运营提供数据支撑。

6 结 论

当前,物联网与云计算是省级动环监控系统的技术演进方向。面对海量的监测局站、设备、监测点和告警信息,为提升动环设备的智能化程度,实现由动环设备自身完成监测数据生成、告警判断与标准化处理操作,构建基于物联网模式的网络架构是目前最合理的解决方案。鉴于省级动环监控系统的检测范围广,用户需求多,物联网与云计算的合理运用是其当前乃至未来很长一段时间的新方向和新目标[10]。

笔者结合通信信息产业发展的时代背景,对学界动力环境监控系统的相关研究分类汇总,并以江苏联通运营商为研究对象,对动力环境系统展开研究,深入分析系统架构、工作机制、设备维护等方面信息,指出工作中出现的问题与设备本身存在的故障,为动力环境监控系统今后的发展提出参考意见。与传统监控系统相比,动环监控系统充分运用云技术、云管理和云架构虚拟技术,实时监控仪器设备,大大降低了人力物力,实现了系统智能化运行。各大生产商应积极响应通信行业的发展要求,在集中监控、维护和管理等方面投入更多资源,促进新技术的全面推广和使用。动环监控系统能够将各单项检查项目通过监控中心平台整合在一起,实时检测设备运行参数,及时排查安全隐患,提高了系统的准确性和安全性。此外,系统的维修手段也从单一的设备检查转变为智能化手段,即利用数据库的信息反馈对存在的问题进行专业判断并制定针对性强的维修方案。语音、视频和声光报警方式的采用也有助于实现巡逻方式的线上化和虚拟化,减轻工作量,提高系统的工作效率。

猜你喜欢

动环联通机房
基于国产化龙芯的动环数据采集系统
平疫结合的CT机房建设实践
广中江高速全线通车联通10条高速公路
风起轩辕——联通五千年民族血脉
船舶尾轴环机械密封装置端面变形研究
常用机械密封失效分析及判断
基于VPN的机房局域网远程控制系统
一张图读懂联通两年混改
微信搭台“联通” 代表履职“移动”
浅谈一体化机房系统