APP下载

通过DMHS转报系统进程日志判别系统状态

2017-11-14钱锋

电脑知识与技术 2017年29期
关键词:故障类型

钱锋

摘要:当前全民航大范围使用北京航管科技DMHS系列转报系统,DMHS转报系统的核心软件-DMHS进程拥有各自的LOG日志以记录转报系统的运行状态。在转报系统故障处理与日常运维时,及时查看分析相应DMHS进程的LOG日志对故障进行准确定位,判断系统当前的运行状态,有利于值班人员做出相应处理,及时采取应急措施,合理实施通报流程,周期性分析转报系统的运行状态并进行相应维护,对于转报系统故障及系统状态的判别具有实际意义,提高转报系统故障处理与日常运维的水平。

关键词:DMHS进程;LOG日志;故障类型;状态判别

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)29-0262-03

Abstract: Large-scale use of the whole civil aviation air traffic control technology DMHS Series Switching System, the DMHS forwarded to the core software-DMHS process has its own log to record the message switching system operating status. Failure to deal with day-to-day operation and maintenance of the DMHS System, view the timely analysis of the corresponding the DMHS process log to accurately locate the fault,determine the system's current run state, on duty to make the appropriate treatment promptly take emergency measures,a reasonable implementation notification process,periodic analysis of the operational status of DMHS System and maintenance of the actual significance for the message switching system failure. Improve the level of the DMHS System failure to deal with day-to-day operation and maintenance.

Key words: DMHS process;LOG logs;Fault types;state identification

DMHS转报系统由北京航管科技有限公司生产,在中国民航的多个机场应用,由两台DMHS转报服务器构成双机主备转报模式。DMHS转报系统的核心转报软件为各DMHS进程, DMHS进程各自拥有相应的LOG日志文件作为其运行的记录。而LOG记录往往作为转报系统技术支持研究系统故障时的参考依据:在发生转报系统重大故障与设备运维时,值班人员往往直接联系北京厂家的技术支持人员,技术支持人员采用远程登錄转报系统查看运行状态,其检查的主要手段就是查看各种DMHS进程的LOG日志,事后出具的故障报告中也包含DMHS进程LOG日志中的内容。

作为在民航设备运行保障第一线的人员,我们缺乏有效的转报系统日常运行情况分析的手段,系统运维工作往往停留在查看硬件指示灯,数据备份等项目上,对于系统的工作状况了解不够,手段不足。在故障发生时习惯使用DMHS管理工具(DMHS_MNG)判断故障及系统状态,对实际反映系统状态的LOG日志关心较少,可能导致无法及时判断系统的当前状态,因而缺乏进一步处理的依据,可能造成故障处理延误,通报不尽合理等情况。在故障处理与系统状态判别的过程中过多依赖厂家的技术支持。

本文以浦东机场转报备用系统(无智能集中器)为参考模型,通过对转报系统DMHS进程及其LOG日志内容的分析,结合实际案例与个人工作经验,提出查看DMHS进程LOG日志的方法与要点,综合分析判断转报系统的工作状态,以提高对转报系统运行情况的判断处理能力,减少一线员工对技术支持的依赖,缓解设备运行保障的压力。

1 转报系统DMHS进程LOG日志作用与系统状态判别

1.1 转报系统DMHS进程及其LOG日志的分类与作用

以上是浦东机场转报备用系统的DMHS进程及其LOG日志,各LOG日志分别记录了系统不同模块的工作情况及异常事件,时间精确到秒。

1.1.1 DMHS_AFS进程的LOG日志举例

2012-07-04 00:24:53 Main [浦东应急] V10.3P_t Debug_Flag=N

2012-07-04 00:24:58 AFS 资料 卡(net0) 本[] 对等[100.100.9.1]重用[N

2012-07-04 00:25:06 Ora_Start 开始

2012-07-04 00:25:06 Ora_Start 数据库已启动

2012-07-04 00:25:06 Lnr_Start 开始

2012-07-04 00:25:11 Lnr_Start 启动已完成!

2012-07-04 00:25:16 机器状态变化 [未定 —>主机 ] (-1—>1)

该LOG日志记录了系统双机的工作状态及系统双机切换时的具体状态变换。可以通过查看该LOG日志准确的判断系统双服务器的主备工作状态,系统的网络及数据库的工作状态,作为判别整个系统工作情况的主要依据。endprint

1.1.2 DMHS_MON进程的LOG日志举例

2012-07-08 00:52:11 Main [新浦东] V9.B9 [20091102]

2012-07-08 00:52:15 文件操作Par_ 文件[Dmhs_Par.num]恢复成功!!

2012-07-08 00:52:16 AIT8140 O_Mem_Ok

2012-07-08 00:52:25 Auto_Wr_Db 自动写数据库

2012-07-08 00:52:25 Afs_To_DB_Input 从文件[AFS_IN_TELE.120708][应提23 有效:23 内存重:0]到数据库,记录数:23!

2012-07-08 00:52:26 Afs_File_To_DB_Output 从文件[AFS_OUT_TELE.120708] [应提23 增加:23 修改:0 内存重:0 ]到数据库,记录数:23!

该LOG日志记录了系统数据库读写操作及数据库的工作状态。可以通过查看该LOG日志判断转报系统数据库的运行状态及电报数据的存储情况。

1.1.3 DMHS_COM进程的LOG日志举例:

2012-07-08 00:52:12 Main V9.8O_P0 2011.01.13 IP_MARK[24] UPD_MON[65530] Take_Sec=600

2012-07-08 00:52:17 Get_Vlk_Port_St [100.100.8.234][async1/0] 端口[25] Sh_Pos=-1 ucWork_St=0XE1 cDcd[0—>1]cFlow_Ctrl[0—>1]cRec_St[9—>0]State[0—>3]

该LOG日志记录了异步单元与主机的联接情况,异步单元网口及用户端口的状态。可以通过查看该LOG日志判别转报系统各异步单元的工作状况,系统网络的工作情况及转报用户端口是否存在异常情况。

1.1.4 DMHS_R25进程的LOG日志举例:

2012-02-25 10:52:39 Main [浦东应急] V9.8O [20120225 105239] [08.6F]

2012-02-25 10:52:40 RX25_Login [100.100.8.8](23) 聯接成功!

2012-02-25 10:52:44 RX25_Login [100.100.8.8] 网卡[1] 密码[ait_dmhs] 成功!

2012-02-25 10:52:51 ???8140 [HSX](460200505350) 现已联接!

该LOG日志记录了智能同步单元的 X.25分组干线链路联接状态。可以用于判别转报系统的X.25链路工作情况及分析X.25链路中断的原因。

1.1.5 DMHS_IP进程的LOG日志举例:

2012-07-25 08:23:14 备机状态变化 网络[-1—>1] 串口[-1—>1]

2012-07-25 19:55:00 EJK :25195500转报告警 [KGD]只支持输出,而接到电报

该LOG日志记录了网络内各设备网络端口的状态变化。可以用于判别转报系统IP终端的工作情况及整个网络的运行状态。

1.2 通过多个LOG日志综合判别转报故障情况与系统状态

发现任何故障与运行的不正常情况,需要通过查看相关的多个DMHS进程的LOG日志进行相互比对,根据参考文献[1]中对于进程的描述,综合判断系统当前的工作状态,作为下一步处理的依据。推荐在查看LOG日志的过程中使用UNIX操作系统提供的VI编辑器,查看时方便灵活。

DMHS_进程的LOG日志不是故障判定与系统状态辨别的唯一手段,可以通过结合DMHS_MNG监视与管理工具,UNIX操作系统的PS指令(查看进程),查看系统的告警情况等手段综合使用,目的是使得故障判定与系统状态辨别更准确、更及时、更可靠。

2 DMHS进程LOG日志对故障判别作用的案例

在日常工作中,维护人员最常用的是DMHS_MNG监视与维护工具,这个管理工具为维护人员提供了整个系统的菜单式管理维护项目,并能通过该管理工具显示系统的工作状态。

某日,转报系统发生主备服务器双机倒换事件,值班人员使用DMHS_MNG监视与维护工具观察系统双机工作状态:

国际时10:57转报备用系统服务器A机发生自动重启,此时应该由服务器B机自行接替工作,利用DMHS_MNG工具观察系统状态,一直到国际时11:17服务器B机才成为主机,接替A机工作成功,系统间切换时间为10:57-11:17之间,切换期间系统的2台服务器均没有成为主机。

依据前述的LOG日志综合判断方法分别查看了DMHS_AFS/DMHS_IP/DMHS_R25的LOG日志:

#vi DMHS_AFS.0225

主机(100.100.8.2)DMHS_AFS.0225:

2012-02-25 10:52:22 发串口测试 Com[6]/Test_Sec[5]/Deal_Sec[12]

2012-02-25 10:52:22 发UDP测试 Peer[5]/Test_Sec[5]/Deal_Sec[12]

2012-02-25 10:52:22 网络测试报告 网络 联测[10:52:14] (Net=8/Sec=5)

2012-02-25 10:52:24 状态报告 Work_St[0] Doc_St[89] 串口通信[10:52:16]可能故障[8/8]endprint

2012-02-25 10:52:32 超时状态报告 本机的网络正常, 对方无反应切换 超累计[2]

2012-02-25 10:52:34 双机库指针初始化 Input[R=0/W=4326] Output[R=0/W=522] Send_Ch[R=0/W=6260]Order[R=0/W=6108]

2012-02-25 10:52:34 Ora_Start 开始

2012-02-25 10:52:34 Ora_Start 数据库已启动

2012-02-25 10:52:34 Lnr_Start 开始

2012-02-25 10:52:39 Lnr_Start 启动已完成!

2012-02-25 10:52:39 主备切换 备—>主

2012-02-25 10:52:39 机器状态变化 [备机 —>主机 ] (0—>1)

#vi DMHS_IP_0225

主机(100.100.8.2)DMHS_IP:

2012-02-25 10:52:39 Main [浦东应急] V9.8O

#vi DMHS_R25_0225

主机(100.100.8.2)DMHS_R25:

2012-02-25 10:52:39 Main [浦东应急] V9.8O [20120225 105239] [08.6F]

2012-02-25 10:52:40 RX25_Login [100.100.8.8](23) 联接成功!

2012-02-25 10:52:44 RX25_Login [100.100.8.8] 网卡[1] 密码[ait_dmhs] 成功!

2012-02-25 10:52:46 ???_BASE x25 route 460200505350 int s1/0 from-tcp 15223 cud XSHAPVG packet

2012-02-25 10:52:51 ???8140 [HSX](460200505350) 现已联接!

通过查看系统DMHS进程的LOG日志可以看到,系统在国际时10:52:22-10:52:51之间主备服务器实现了自动倒换,服务器B已经自动成为主机并接管工作,数据库启动成功,X.25干线链路联接成功,转报系统已正常工作。

这样就出现了两种完全不同的故障判断结论,如果使用DMHS_MNG管理与监视工具观察系统情况,在长达20分钟左右的时间中系统处于无法工作的状态,按照故障类型判别显然是1类故障,需要进行应急处置并实施相应的通报流程,造成的影响较大。而查看LOG日志可以发现,系统在30秒左右的时间已经实现了自动倒换,备机接管工作成功,系统工作正常,按照故障类型判别是3类故障,无需进行应急与通报工作,仅需对故障的设备进行排故操作即可。

对于在一线值班的人员来说,能够及时判断系统状态及做出合适的处置是保障工作中最为重要的核心内容。因此,在故障发生时应该更注重于对系统LOG日志这樣底层的记录进行及时查看,作为判断系统工作状态的依据,这是最为可靠和有效的。当然,也可以通过DMHS_MNG管理工具,利用PS指令观察系统进程状态等手段相互配合。建议在查看LOG日志时使用VI编辑器进行查看,较为方便与灵活,同时注意观察不同LOG日志,注意LOG日志内容相互之间的关联。

3 结束语

DMHS进程的LOG日志记录了详细的转报进程及设备的运行情况,时间精确,状态说明准确,可作为判断故障原因及系统当前工作状态的主要依据。本文的分析了各LOG日志与转报系统运行状态之间的关系,通过案例分析了LOG日志在故障判定方面的作用。结合作者个人在工作中的体会,将转报系统的故障现象与相关的LOG日志进行了关联,提供了一种转报系统故障与工作状态辨别的思路,目的是准确的判断系统运行状态,使得设备保障能力得到进一步的提高。

参考文献:

[1] DMHS-H用户使用手册-V5.1-SCO[S],2008.endprint

猜你喜欢

故障类型
电缆故障测试方法探讨
高压输电线路故障类型与防范举措研究论述
关于电气控制与机床电路检修实训教学的初步探索
某110kV变电站1#110kV主变油色谱异常原因分析及故障处理