APP下载

机场视频图像智能运维平台构建研究

2021-04-22王连斌

数字技术与应用 2021年2期
关键词:工单运维监控

王连斌

(上海国际机场股份有限公司,上海 200336)

0 引言

随着民航局的《四型机场》建设纲要的实施以及智慧机场的建设,机场视频监控系统建设规模日益庞大,智能监控设备的大量布设为智能化视频图像应用提供了坚实支撑,但同时也对视频监控系统和设备的稳定运行提出了更高、更严的要求。除了常规的安全防范,事后溯源、联网监督、区域协同等整合视频能力的深度业务应用均需构建在健康、高效运行的视频监控系统的基础上,视频监控系统存在故障或故障未及时处理,关联业务应用平台的功效就会大大减弱,甚至误导了决策。因此,智慧运维平台的构建和应用,显得尤为重要。

1 需求分析

机场的监控系统一般主要由前端高清智能摄像机、传输网络、存储系统、后端视频管理平台等组成,随着《四型机场》建设的深入开展,前端智能摄像机的应用会越来越多、越来越广,保障监控系统的稳定、高效运行也显得愈发困难。原有的视频图像运维手段已经无法匹配当下的视频图像应用体系,这对视频图像监控系统的运维工作提出了新的要求[1]。目前的机场视频图像运维工作存在如下难点,具体而言:

1.1 故障事后发现,监控形同虚设

相比较别的领域和行业,有一些视频管理平台是带有视频质量检测模块,能够半自动地进行图像质量的检测,进行预警、提示等,然后进行人工的二次复核,减少人员的查验强度和工作量。但是目前针对我们所在机场的视频管理平台,并没有视频质量检测模块,而且也没有专人对图像质量进行查验,基本上是依靠最终使用单位或其他管理平台调用视频的时候,才发现图像质量不符合要求,不具备使用价值,或者一直处于故障状态,视频监控系统形同虚设。

1.2 建设跨度漫长,运维涉及面广

机场的视频监控系统是分期、分批进行规划和建设的,从三到五年前开始的数字监控系统的建设到近二年的高清监控建设再到目前的高清智能监控系统的建设,不同阶段的监控建设使用了不用的前端产品、视频管理平台以及视频流转发的方式,为现在的一体化运维带来了困惑,运维人员必须要能够全面掌握这些跨时间、跨系统、跨平台的不同系统,对问题做出准确的判断,进而进行处置,保障系统的可靠运行。

1.3 报修机制不全,责任无法落实

目前机场的视频监控系统报修,采用微信工作群、电话等方式,微信群里面有用户、运维单位、监管单位、设备厂商、建设单位等,没有有效的报修机制和后期的跟踪管理,维修台账记录不清,责任难以落实,维修的时效性难以把控。报修用户无法了解维修的进度情况,时常出现反复报修、反复催促的情况,降低了运维的效率。

综上所述,面对高速发展的视频监控系统发展,现有运维体系的建设滞后程度比较严重,迫切需要一套高效统一的图像智能运维平台,监测图像系统的良好运行、智能预判系统运行态势、实现智能资源分配,形成一套高效的故障处置电子流,为机场的图像系统的大规模赋能使用保驾护航。系统为适应匹配智能监控时代的发展,预留相关大数据和算法平台的接口,为人工智能时代的智能运维提供后续开发空间。

图1 系统架构图Fig.1 System architecture diagram

2 运维平台结构

鉴于智能运维平台需要融合底层各个数据,通过多种服务接口对上层提供支持,因此,设计采用面向对象的SOA思想开发平台系统,使平台本身就能够混合搭配各种执行环境、令服务接口与服务实现、传输协议的明确分离。使运维平台中涉及的各个子系统能够松散的集成运作,达到共同完成业务的要求。

如图1所示,以面向对象的SOA思想开发的运维平台系统,从上到下可以划分为:汇聚资源层、协议接入层、采集数据层、算法服务层、交互应用层。其中:第一、第二层作为数据链路底层;第三、第四层作为中间数据采集及算法服务;第五层作为应用系统的交互功能。

(1)数据链路底层。主要是利用协议接入层的各类通用协议(如NETSDK、SNMP、HTTP等),将汇聚资源层中各类资源(如服务器等硬件设施、操作系统、数据库管理系统等)进行汇聚和互联,为中间层提供资源和链路支持。(2)中间数据采集及算法服务。主要是通过基础数据链路采集到的数据,按照功能应用的不同进行数据归类。并通过平台的各类服务算法(如智能预警服务、智能检测服务、智能流程服务和智能巡检服务)等,为上层提供支持框架和服务结果。(3)应用交互。以数据链路底层和采集、处理的数据为基础,通过面向各类部门、用户等,提供相关的定制化的应用功能,包括维修管理、智能报表统计、地图管理、日志管理等。

3 运维平台核心功能

3.1 智能预警

智能预警则是在故障发生前,预测故障发生的概率,从而提醒或有针对性的对故障提前规避[2]。(1)指标预警。指标是用以衡量应用系统各方面业务状态(业务指标)和运行状态(技术指标)的自描述的标准或数据,如存储数据量、设备在线时长、图像延迟、卡顿,服务响应延迟时间等。指标预警是针对某一可量化的系统或指标。根据其历史运行积累的数据信息,以时间为轴,构建其正常运行的数据基线,结合该系统或指标当前的运行状态、采集的数值,判断是否出现异常。更进一步,可依据采集的系统组成或指标的构成因数,获取影响指标的其他变量元素,通过人工智能的算法生成预测模型,预测未来一段时间该指标的可能趋势,提前获取应用或系统可能出现的状态。(2)寿命预警。电子设备都具备设备的使用寿命,在寿命期内,能够保持较好的稳定性和可靠性,但是当设备进入临界期后,其品质和稳定性就会有陡降,故障的可能性会增加数倍到十几倍,为预警带来了可能。当然,电子设备的使用寿命,除了和时间有关外,和使用的环境、使用的方式、状态等因素有关。根据同类设备、同样环境下历史运行状况的积累数据,按照设备类型构建使用时长和故障发生的标注参考期,结合设备的重要程度,备件时间供应等方式提出预警。为设备的动态更新、发挥可靠期内设备的最大使用效能提供技术依据。

3.2 智能检测

(1)视频图像质量判断。视频图像质量判断采用高清晰视频截图与高性能分析算法,对前端监控视频中出现的无视频信号、画面遮挡、画面卡顿、画面干扰、亮度异常、图像噪点、视频图像模糊、等前端设备常见的故障、信号干扰、视频图像质量下降进行细化分析、精确判断的一种服务。(2)视频质量异常统计。分类(视频丢失、条纹干扰、噪点干扰、亮度异常、图像偏色、视频冻结、视频模糊、画面抖动、画面遮挡、标签异常、云台控制故障等)统计每天的视频异常点位数量。(3)视频完好率。分类(常规监控、智能监控)统计每天的视频完好点位数量与视频点位总量的百分比。通过智能检测,用户能够有效感知因前端视频采集设备、中间视频传输等采集传输环节导致的视频画面质量问题及可能带来的损失,并能够主动侦测破坏前端监控系统的不法行为。在设备、传输发生问题后,可以迅速进行处理,保障监控系统有效运行。

3.3 智能流程

智能流程就是通过流程管理进行工作故障事件闭环处置。可根据自身运维管理实际情况进行流程调整与优化,实现工单管理、工单创建、工单接单、工单回退、工单改派、工单提交、工单跳转、工单关闭、工单删除、工单查询与统计等功能。建立报修工单处置流程,对于设备故障,能够派发到运维单位的工单系统,并在运维单位修复完备后,获取显示修复信息。在流程管理中,配套基础知识库建立,能够维护设备故障处置建议,在进行故障处置时进行推荐显示,辅助故障快速定位和处置。知识库是实现运维知识的有效共享、维护使用贯穿于系统的各个层次,能够维护设备故障处置建议,在进行故障处置时进行推荐显示,辅助故障快速定位和处置。知识维护是通过录入、采集、维护等方法获取资料,并对资料的各种属性进行编辑的各种功能的集合。

3.4 智能巡检

智能视频故障自动巡检是保证机场视频监控系统安全、稳定运行,提高可靠性的一项基础工作。使用基于人工智能和机器学习的智慧视频故障检测系统,通过优化算法和数据工具,使检测结果客观、可重复性强。另外,由于系统具有很好的自学习能力,只要具备足够的样本重新训练检测系统,智能算法的性能将进一步提高。智能视频故障检测系统若采用轮询方式,可以处理较大数量的视频源。在整体系统架构上,采用大数据和“云”处理架构很方便的可实现横向扩容,可适应不同数量视频源的需求,方便今后因视频数量增加而需要的系统能力扩容。支持对前端摄像机的分组检测;不同时间,可以制定不同的诊断计划,对不同的前端摄像机进行检测。支持检测项目设置,对不同的前端摄像机,可设置不同的检测项目。支持阈值参数设置,对不同的前端摄像机,可设置不同的阈值。使用人工智能算法巡检代替人工巡检,对设备状态和环境状态进行全天候全自主检测,可以有效地提高巡检质量、提升巡检效率、降低人工劳动强度,减少人为的疏漏,及时发现异常,大大提高机监控系统安全运行可靠性,为智能巡检的最终目标实现提供了技术手段。

4 实际价值体现

如何做到运行故障的第一时间发现、第一时间处置,如何提升系统运维的效率,如何对运维流程上各单位进行考核成为亟待解决的问题。视频图像智能运维通过可视化的拓扑图直观的为机场运维管理提供流程化、自动化、规范化的支持,通过监测前端设备及中心设备实时运行情况,为运维人员提供实时的系统运行信息,把控运行态势,当故障发生时,通过智能化的诊断方式准确定位和排查,达到快速响应、快速报警、快速解决的目的,将系统故障风险降至最低,避免重大损失。

猜你喜欢

工单运维监控
基于量化考核的基层班组管理系统的设计与应用
The Great Barrier Reef shows coral comeback
基于transformer的工单智能判责方法研究
运维技术研发决策中ITSS运维成熟度模型应用初探
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
基于HANA的工单备件采购联合报表的研究与实现
基于ITIL的运维管理创新实践浅析
电力95598热线全业务集中后的工单预警机制
PDCA循环法在多重耐药菌感染监控中的应用