APP下载

基于信创环境的运维管理系统设计与实践

2022-07-08阳岁红于英涛方镭

电子技术与软件工程 2022年8期
关键词:信创工单运维

阳岁红 于英涛 方镭

(1.江西省委信息保障中心 江西省南昌市 330036 2.华北计算技术研究所 北京市 100083)

1 引言

为了保障网络空间安全,提升我国信息化能力和数字经济水平,我国将信创(信息技术应用创新)纳入国家信息化发展战略。所谓信创建设就是从关键环节核心组件的自的设备品牌、类型众多、设备质量参差不齐、运维服务业务繁杂、压力大、不能有效地对问题进行系统化、自动化分析与统计等主创新入手,从政府信息化等关键行业试点,从而逐步建立自主知识产权的IT 底层架构和标准,实现全IT 全产业链实力和结构的优化升级。近年来,信创产业出现爆发式的增长,改造和新建了大量的基于信创环境的信息化系统,这些系统的运维管理也将迎来挑战和机遇。

运维管理是信息化部门的基本职能,如何提高运行维护效率,规范运维管理行为,使业务部门对信息部门提供的信息服务更为满意,是信息部门一直思考的问题。基于信创环境的运维管理系统,通过对原有运维系统进行适配改造并部署,实现对国产软硬件设备监控和管理,可以为运维工程师提供统一的工作平台和技术手段。通过掌握基础设施状况和实时运行情况,提供运维纵向、横向的协同手段,可以实现对基础资源的统一监控、资产台账信息的统一维护管理、运维流程的规范化管理、各类数据的统一门户展现,从而加强IT 系统维护能力、提高维护工作效率、改善维护工作的质量,进而保证各系统维护水平的可持续性提升。

因此,针对当前信创环境信息化项目在服务运维和保障中存在的设备品牌、类型众多、设备质量参差不齐,运维服务业务繁杂、工作压力大、难以有效对问题进行系统化、自动化分析与统计等难题,通过规范化、统一化和清晰化的处理和管理工单事务,建立基于信创环境的运维管理系统势在必行。它不仅能够满足信创环境信息系统运行保障及后续升级需要,而且可以为部门或行业的信息化工程提供有力的技术支撑与保障。

2 系统设计

2.1 设计思路与架构

根据基于信创环境的运维管理实际需求,系统设计按照为最终用户提供服务的角色层次分成用户接入服务层、服务核心业务层和平台数据服务层。系统总体架构如图1 所示。

图1: 基于信创环境的运维管理系统总体架构图

其中,用户接入服务层是运维服务平台面向设备使用者、现场工程师、原厂工程师等角色的交互层,它包括面向终端设备使用者的一键服务终端,面向现场和原厂工程师等角色的微信平台,面向统一电话接入的服务热线入口。核心业务层提供运维服务平台的核心业务能力,目前它包括:智能服务台,工单系统,服务供应商管理系统,设备管理系统,终端监控系统,服务器监控系统,应用监控系统,未来可以支撑业务能力的持续扩展。平台数据服务层是为上层的核心业务层的各个系统提供公共接口和数据交换服务。

2.2 系统功能设计

2.2.1 电话服务热线统一的对外服务热线,通过电话服务热线入口,为用户提供个性化的服务。为给用户提供优质的服务,这就需要客服人员必须,熟悉服务运作流程,达到用户满意的同时,提高工作效率,迅速找到解决方案,减少每个电话的占线时间,尽快应答队列中下一客户的电话。

2.2.2 一键服务客户端

一键帮助服务客户端是终端设备用户的嵌入式服务入口。当用户在终端设备按下键盘上的帮助热键,一键帮助服务客户端的服务窗口启动,用户可以在服务窗口中查询常见问题,进行自助服务;也可以由智能文本机器人引导受理服务请求,分流至在线运维工程师来处理解决。

2.2.3 微信平台

微信平台中的微信小程序和服务号是对外服务窗口。微信小程序为客服提供工单新建、工单查询、工单追踪等功能;为运维工程师提供工单查看、工单修改、工单维护等功能;为用户提供扫码报修、进度追踪、服务评价、查阅知识库信息等功能;为各单位信息化管理者提供每天、每月的报障情况,故障分析等功能。微信服务号主要是帮助用户了解行业动态、提醒用户和运维工程师工单信息,帮助提高故障解决效率。如图2 所示。

图2

2.2.4 智能服务台

智能服务台主要是通过集中化部署、集中化服务受理、多级工程师支持流程等方式,为用户在使用终端设备和应用服务过程中遇到的问题进行受理、通过整合各种资源信息进行处理、对处理结果进行满意度回访,保障运维工作的顺利开展。系统支持来电智能分配功能、根据在线客服的服务状态、当前服务队列、排队情况进行智能分配给空余客服,提高服务响应效率。

2.2.5 工单系统

工单管理模块主要为用户、客服和运维工程师提供在线工单服务,用户可通过微信端快速创建工单,客服、运维工程师可通过网页创建工单。主要包括工单新建、工单修改、工单分配、工单确认、工单全程追踪、评价、查询、历史回溯、导出等功能,通过标准化工单体系,来使工单系统所有的操作,处理,管理和维护全部满足和履行该标准化的内容,避免服务拖延,服务延迟,避免降低服务质量和资源浪费,通过SLA 服务目标能让工单系统的工单处理操作和相关服务进行是否达标评定。如图3 所示。

图3

2.2.6 知识库

知识库系统作为安全可靠知识和运维经验的收集和共享平台,将系统维护案例、安全可靠领域内相关产品知识、技术知识、技能知识、经验方法等知识进行体系化的梳理和积累并提供查询。通过这个知识共享平台,为技术人员、使用者提供发现问题和解决问题的能力,减少重复劳动。知识库系统涵盖知识的提交、审核、共享、应用、创新、消亡等整个生命周期,统一整理、统一录入,实现知识的整合、记录、查询及共享。如图4 所示。

图4

2.2.7 服务供应商管理

此系统功能包括两块,一是用于客服创建工单时填写设备、应用所属供应商信息,可根据供应商名称模糊查询,并返回查询结果,在后期进行数据分析时可按供应商维度分析设备运行情况、设备维修情况、服务水平、故障解决情况。二是从服务的视角组织管理设备和应用的原厂商,以便有效合规地把原厂商纳入服务体系,打通服务能力。系统提供对供应商的基础信息,服务合同,以及服务SLA 的管理。包括供应商内容管理、供应商合同内容管理、数据查询与修改、供应商状态管理。

2.2.8 设备管理系统

设备管理对终端设备、服务器设备等进行信息状态维护管理,建立以信息化为核心的管理方法,解决设备不清,设备闲置等问题,减轻设备管理人员数据处理负担,提高设备管理效率。包括设备添加、维护、查询、删除、搜索功能,以及对各类软硬件设备资产数据导入和导出功能。管理员可查看所有用户单位设备信息,各用户单位管理员可查看本单位和所辖单位设备信息。设备信息查询时可根据设备领用单位、设备厂商、设备SN 码、设备分类进行查询。查询时返回匹配结果包括设备的配置信息、当前领用单位、设备厂商、所在位置、领用时间、服务期限等。如图5 所示。

图5

2.2.9 备品备件管理

备品备件是设备检修、运行、提高问题解决效率的重要保证,备件管理对IT 设备的可靠运行起着至关重要的作用。备品备件管理系统包含对备件供应商的管理、备件类型的管理、备件出入库管理、备件报废管理、备件查询管理、备件申请管理等功能。

2.2.10 终端监控系统

设备监控系统用来采集设备运行数据,为设备管理模块提供数据和接口服务。能够灵活地对监控对象、数据收集间隔等进行配置,并提供管理界面,对终端设备的使用情况进行数字化跟踪和分析。

终端监控代理完成终端设备适配后,通过母盘预装在终端设备(即电脑PC 终端),需要具备开机自动,随系统内置操作系统服务中,并以root 身份运行,具有读取系统运行数据的权限。系统自动获取终端系统SN 码,与设备管理中SN 码进行匹配,匹配成功后,监控自行启动。通过监控时间段内设备鼠标的使用情况,进而判断该设备是否真正的被使用,并将此信息进行数据上报,作为后续终端设备推广实际效果的判断依据。

2.2.11 服务器监控系统

服务器监控系统可以实现对服务器、网络设备、安全设备、Web 服务器、数据库等进行统一的监控管理,对服务器设备的资源情况进行数字化跟踪和分析。可以根据相关监控指标进行故障报警,能够设置不同类型资源的策略规则,并关联指定的资源,策略匹配之后进行触发告警及消息提示,对预警信息、故障信息进行整合处理,为用户提供即时有效的风险提示。

服务器监控代理提供运行时多种指标监控,包括静态信息和系统运行的状态信息,如:CPU 使用率、内存使用情况、文件系统使用情况、文件系统IO 情况、网络接口使用情况等为管理人员呈现XC 服务器的健康状态,对异常情况进行告警提示。安全设备监控代理能够对安全设备运行状态监控,包括防火墙、IPS、IDS、网关等硬件设备等,主要监控指标包括CPU 使用率、内存使用率、设备在线状态、设备响应时间等。

2.2.12 应用监控系统

信息系统存在众多服务应用,针对应用服务的运行状态进行动态监控,并能够通过配置不同的阈值来进行预警,从而实现主动IT 支持服务,保障应用服务的持续可用性。应用监控系统会根据不同应用实现方式来安装不同的监控探针,设置不同的监控指标,从而实现精确监控、提前预警。其中还包含了对中间件Web 线程池利用率、当前线程数、忙碌线程数、响应时间等信息监控以及数据库共享内存使用、占用CPU 时长、数据库状态等指标监控,保障数据库安全,优化数据库性能。

2.2.13 身份认证系统

身份认证即用户管理、授权管理系统,用户管理系统主要提供用户注册和用户管理服务。可以为用户提供微信端快速注册、个人信息维护等功能;为管理人员提供服务机构维护、服务人员维护、客服小组管理、厂商管理等功能。授权管理系统是按照角色访问系统的权限提供管理服务,通过系统建立用户、客服、运维工程师、系统管理员等角色,并进行权限分配。如图6 所示。

图6

3 系统实践

目前,该运维管理系统已稳定运行并成功服务于政府部门信创工程项目,取得了较好的建设成效。通过信息化管理手段和方式,将运行维护中的多种资源和信息整合为面向管理者、使用者、技术人员的运维管理平台,实现了统一的基础设施管理、运维工作与绩效管理、技术支撑等,提升了整体运维服务水平。据统计,2021 年下半年该系统服务情况如表1 所示。

表1: 基于信创环境的运维管理系统服务情况2021 年下半年服务情况表

该项目建立了一套完整、统一的工单运维服务体系,支持项目的日常运维工作,提供用户帮助支持、售后支持、IT服务支持,形成了流程化、规范化、统一化的事件管理方式,高效、成功地解决了用户发起的各种事件请求,为项目各类产品的故障情况进行总结和分析,及时发现产品质量问题、使用问题、生态问题,为政府部门、运维服务单位、厂家等有针对性地解决问题、开展培训工作、提升技术人员专业技能、促进产业生态发展提供了有效的依据。具体包括:

(1)统一化、流程化管理事件、服务请求、建议等工单,客服、客户、技术沟通无障碍,同平台沟通交互,快速地解决了用户问题,提升了服务质量和用户满意度。客服、用户、技术均可以通过电话服务热线、一键服务客户端、微信小程序、智能服务台等方式报工单;工程师通过小程序接收工单,并及时录入工单处理情况,对处理完毕的工单,进行故障分析、总结;客服、用户可以通过小程序查看自己所创建工单的处理进度,对工单进行督办。

(2)服务单位将系统中的知识库按照一定的方法进行分类保存,并方便编辑、修改,用户通过微信小程序查询知识库内容,自助解决问题,加快了知识的流动,有利于知识共享与交流,提升了服务满意度。

(3)用户可以在微信服务号中查阅服务台对外发布的公告、通知等信息,总揽自己发起工单的全过程,了解政府政策、掌握行业动态。

(4)备件管理和工单管理数据在系统中实时呈现,备品备件调度得心应手,充分提升了整体软硬件平台事件的解决效率和管理水平,实现了政府部门通过可视化和量化指标对运维工作进行考核。

(5)通过对资产进行全生命周期的管控,实现资产透明化。通过权限管理,实现所有权、管理权、使用权分离,一方面确保资产安全可靠、另一方面方便政府部门了解各单位设备的使用情况、故障情况,了解厂家的故障率、解决率等信息。

4 结束语

针对当前信创环境信息化项目在服务运维管理中存在的难题,建立了一种基于信创环境的运维管理系统设计与实现方法。该运维平台实现了运维服务过程中的资产管理、服务台管理、工单管理、备件管理、知识库管理等管理功能,能够支持相关软硬件运行维护工作,为运维服务提供了有力的技术支撑与保障,是用户、客服、运维和厂商之间沟通、协调和服务保障的系统。平台根据不同组织、部门和客户的需求,通过统一门户展现,标准化的流程和操作,对设备使用情况、运维服务情况进行自动分析和统计等满足了操作层、管理层、决策层的业务需求,实现了管理的规范化、信息化,保证了各系统维护水平的可持续性提升,提高了政府部门的运维管理效率和和企业的运维服务水平。

猜你喜欢

信创工单运维
基于量化考核的基层班组管理系统的设计与应用
低代码开发平台加速信创落地
基于transformer的工单智能判责方法研究
EasyStack下注信创云
江苏省信创生态构建发展新格局
江苏省信创生态构建发展新格局
运维技术研发决策中ITSS运维成熟度模型应用初探
基于HANA的工单备件采购联合报表的研究与实现
基于ITIL的运维管理创新实践浅析
电力95598热线全业务集中后的工单预警机制