APP下载

GSM-R核心网SGSN设备时钟故障案例排查及应急

2020-07-30李秀芳

铁路通信信号工程技术 2020年7期
关键词:晶振线缆时钟

李秀芳

(中国铁路北京局集团有限公司北京通信段,北京 100860)

1 GSM-R系统网络组网描述

铁路移动通信系统(GSM-R)如图1 所示,包括智能网(IN)、网络交换子系统(NSS)、基站子系统(BSS)、操作支撑子系统(OSS)、通用分组无线子系统(GPRS)以及移动台(MS)等。本文主要针对服务GPRS 支持节点(SGSN)设备时钟系统功能出现异常时对相关无线网络的影响进行分析、处理、应急等,最终对诺基亚SGSN 系统(硬件版本为DX200,软件版本为SG7CD10)时钟软件配置、硬件设置等达到更深入的了解,以提高维护人员对诺基亚SGSN DX200 系统的维护水平,进而提高设备维护质量。

图1 GSM-R系统网络结构Fig.1 Network structure of GSM-R system

2 问题描述

2.1 京广高铁无线系统网管告警及详情

京广高铁无线系统网管告警信息,基站控制器(BSC)与SGSN 互联的两个2 M 接口,其中 PCMG:1 和PCMG:0 同时出现级别为重要告警的信息内容,显示:Loss of Frame/slip Alarm onLink B 和Loss of Fram e/slip Alarm onLink A,如图2 所示。

图2 京广高铁无线系统网管告警截图Fig.2 Alarm screenshot of wireless system network management of Beijing-Guangzhou high-speed railway

2.2 京沪高铁无线系统网管告警情况

在京广高铁BSC 系统上报告警信息的同时,京沪高铁BSC 系统也同样上报上述告警信息,即两条高铁线的BSC 系统与SGSN 互联的接口均出现滑码/帧丢失告警。

3 问题排查

3.1 对核心网SGSN设备的时钟同步系统(CLS)单元进行排查

鉴于同时两条高铁线的无线系统BSC 网管均上报同样的告警信息,引起维护人员的高度重视,立即对问题进行排查分析。由于两套BSC 均出现与SGSN 之间滑码/帧丢失告警,所以首先对SGSN 系统运行情况进行检查,发现SGSN 出现时钟晶振告警,而且处于主用状态的CLS-0 单元发生了自动切换,导致原来备用状态的CLS-1 单元变成主用状态。

上述SGSN 晶振告警与京广高铁、京沪高铁的BSC PCMG 出现滑码告警相吻合,需要进一步对SGSN 系统此时的时钟同步状态进行检查。在SGSN网管界面主菜单下使用DRI 命令查看时钟同步状态,结果如图3 所示。

此时时钟状态显示当前SGSN 提取为“2M1”线路时钟,同步单元CLS-0 为快速跟随模式,暂未跟踪到时钟信号。初步分析CLS-0 时钟模块故障导致主备冗余板件进行自动倒换,计划对SGSN 系统的CLS-0 时钟模块进行更换。

图3 SGSN系统晶振告警时的时钟同步状态Fig.3 Clock synchronization status when the crystal oscillator of SGSN system alarm is given

2019年12月11日00:00,更换CLS-0 时钟模块1 h 后,发生如下变化:1)SGSN 的时钟晶振告警消除;2)京沪高铁和京广高铁BSC 告警未消除;3)使用DRI 命令查询SGSN 系统时钟同步状态,除同步晶振控制字为15359 偏离正常标称值32768 较大外,其他均正常。当时判断更换时钟模块后,同步外部参考时钟需要一定的时间,于是进一步观察。

直至11日10:57,再次使用DRI 命令查看SGSN 系统时钟状态,发现时钟状态与CLS-0 故障时状态一致,而且0、1 两侧同步晶振控制字均为0。正常应该接近标称值32768,0 侧同步晶振控制模式为快速跟随模式(FAST),暂未跟踪到时钟信号。而1 侧同步晶振控制模式为NORMAL,而且京广、京沪BSC PCMG 滑码告警仍然未消除,如图4 所示。

图4 更换SGSN的CLS-0时钟模块9 h后的系统时钟同步状态System clock synchronization status after replacing the CLS-0 clock module of SGSN for 9 hours

3.2 对核心网SGSN设备时钟抽取情况进行排查

通过上述问题的排查,发现问题原因非SGSN系统本身CLS-0 时钟模块问题,于是对系统在用的2M1 时钟径路进行排查。由于SGSN 的外部时钟从2M1 抽取,即SGSN 通过固定的时钟线缆2M1接入特定的交换终端(ET)2 M 接口背板槽位,再通过成端至DDF 架ET 的2 M 线与上级网元实现2 M 对接,最终SGSN 系统达到提取上级网元的频率同步信号。根据上述时钟抽取方式,进一步确定SGSN 系统时钟线缆与ET-256 相连。

需要进一步检查线路时钟2M1 的时钟提取方式、相关的线缆接入以及涉及到ET-256 的硬件设备等。首先尝试更换线路时钟源2M1 的2 M 电路线缆,发现断开时钟2M1 的2 M 线缆后, SGSN 设备对应的ET-256 没有上报中断的传输告警,状态依旧为正常状态,并对ET-256 进行诊断,结果未通过,由此可以判断为2 M1 提供线路时钟的ET-256 硬件存在问题,而承载ET-256 的硬件为ET4C模块,其中一个ET4C 可以提供4 个2 M,只能从序号第一个2 M 抽取时钟,分析由于ET4C 模块故障导致无法提取线路时钟,需要进一步对ET4C 硬件模块进行更换。

后续对SGSN 的ET-256 对应的ET4C 模块进一步检查时,发现此模块除ET-256 其中此2 M 承载SGSN 与信令转接点(STP)互联,专门用来抽取时钟外(此2 M 无其他业务,只提供时钟信号跟踪),还有1 个2 M ET-258 承载SGSN 至STP 互联即Gr 接口业务,考虑到更换ET4C 模块会影响Gr 接口互联业务,计划通过应急措施调整ET 位置,改变线路时钟源位置,即调整机框背板外部参考时钟线缆的位置,来实现从其他固定的ET 位置来获取线路时钟,将ET-256 调整到ET-276。诺基亚SGSN 可以提供时钟信号的ET 位置如表1 所示。

表1 诺基亚SGSN系统可以提供时钟信号的ET编号Tab.1 ET number of clock signal which can be provided by Nokia SGSN syste

在调整机框背板外部参考时钟线缆时,发现2M3 外部参考时钟线缆插错位置, 2M3 对应的外部参考时钟线缆SGAC_152 插在了ET-258 的位置,由于ET-258 不对外提供线路时钟信号,只有每个ET4C 的第1 个2 M 位置才有时钟信号输出,当时错误的时钟线缆接线位置如图5 所示。

图5 SGSN 2M3时钟线缆错误接至ET258位置Fig.5 SGSN 2M3 clock cable is incorrectly connected to ET258

SGAC_150 电缆为2M1,对应的ET 位置为ET-256;SGAC_152 电缆为2M3,对应的ET 位置为ET-258;所以导致2M3 一直跟踪不到线路时钟,整个设备只通过一路2M1 来抽取线路时钟。正常情况下,当2M1 外时钟不正常时,系统会自动倒换至2M3 的外时钟,使SGSN 系统时钟跟踪不会出现问题。在处理2M1 抽取时钟异常的问题时,同时又发现了2M3 的错误接法,所以还要对2M3 进行处理,保证正常情况下SGSN 系统两路线路时钟跟踪均处于良好状态,系统再根据人为设置的时钟优先等级进行外时钟的抽取等。

3.3 对SGSN系统时钟2M1和2M3线缆进行调整

鉴于上述2M1 和2M3 的时钟线缆均需要调整位置,结合SGSN 设备本身ET 的出线成端至DDF架的情况,再根据表1 进行适当的调整,最终调整情况如下。

在SGSN 设备的后背板调整2M1 外部参考时钟线缆SGAC_150 至ET-276 位 置,同时将ET-276 成端至DDF 架的2 M 线跳至原与STP 2 M互联的DDF 位置,通过SGSN的时钟设置可以看到,将2M1设置优先级最高为7 级,通过STP 进行时钟同步。

在SGSN 设备的后背板调整2M3 外部参考时钟线缆SGAC_152 至ET-260 位 置,ET-260 是SGSN 与STP 互联业务电路,同样可以完成从STP 侧抽取时钟功能,只是优先级设置为5 级,低于2M1 的优先级。

调整后的时钟2M1 和2M3 的电缆与ET 背板接线如图6 所示。

经过上述调整后,2M1 线路时钟立刻同步成功,同步晶振控制状态也恢复为NORMAL,同时将2M1 外部参考时钟断开,系统也能自动切换到2M3外部参考时钟,而且无线网络系统京广高铁和京沪高铁BSC、PCMG 滑码等告警消失,观察数小时后,系统稳定运行,时钟跟踪异常的问题得到解决。

图6 SGSN系统 2M1和2M3时钟线缆正确调整至ET相关位置图Fig.6 Diagram of the 2M1 and 2M3 clock cables of SGSN system are correctly adjusted to ET related positions

问题解决后当时的系统时钟跟踪情况如图7 所示,2M1 和2M3 为链接状态“CONNECTED”,同步单元0 侧和1 侧均能跟踪到时钟信号,状态显示NORMAL。当2 M1 时钟跟踪有问题时,系统会自动选择状态为“CONNECTED”的2M3 进行时钟跟踪。当时只有同步晶振控制字40072 和41 108偏离正常值较大外(正常后会逐步接近频率标称值32768),其他均恢复正常,相关告警全部消失。

图7 问题解决后的SGSN系统时钟跟踪情况Fig.7 Clock tracking situation of SGSN system after the problem is resolved

4 问题原因

原SGSN 2M1 外部参考时钟源线缆SGAC_150接的ET-256 硬件故障,无法取到线路时钟信号。

原SGSN 2M3 外部参考时钟源线缆SGAC_152 接的ET-258 位置不提供线路时钟信号。

5 综合分析及应急措施

开局时SGSN 系统外部参考时钟设置存在问题,4 路外部参考时钟,其中只有第一路外部参考时钟为正常状态,由于第三路外部参考时钟线缆接入错误,整个SGSN 系统只有一路外部参考时钟,所以当仅有的一路时钟出现任何问题,导致整个SGSN 系统时钟出现异常。

掌握系统提供外时钟的方式及方法,才能做到在处理时钟问题时先应急恢复再排查问题,本案例由于采取了及时的应急处置方式,将时钟倒接至其他ET 位置,所以后续仍需对携带业务的ET4C 故障模块进行更换。

日常技术维护人员在对SGSN 系统执表维护时,在熟悉系统时钟设置的情况下,根据检修周期,定期检查时钟跟踪状态,发现异常及时排查处理,确保系统时钟运行正常。

6 结束语

高速铁路利用GSM-R 的GPRS 网络分组数据业务实现车载设备和地面设备间双向信息传输,包括行车调度命令、进路预告、无线车次号校核信息传送以及承载列车自动驾驶(ATO)应用系统等,所以GPRS 系统在高速铁路通信系统中发挥着重要的作用,而SGSN 做为 GPRS 系统的重要组成部分,日常维护人员需要深入研究设备的相关工作原理,提高对设备的维护水平,以提供高可靠性的设备质量,为高速铁路行车调度提供可靠的通信保障。

猜你喜欢

晶振线缆时钟
别样的“时钟”
两非门晶振振荡电路的设计
晶振引发的EMC辐射发射超标分析及整改方案设计概述
古代的时钟
上海福尔欣线缆有限公司
晶振失效故障分析
有趣的时钟
一种线缆盒
时钟会开“花”
华通线缆:“通”向未来的品牌梦