APP下载

核心网过年“罢工”吉林移动春节断网

2019-02-21蒋雅丽

通信世界 2019年4期
关键词:吉林运营商故障

本刊记者|蒋雅丽

作为基础网络建设支撑者,运营商的网络故障是事故。面对像春节这样的大面积并发流量,目前运营商以及设备商的支持能力需要提高。

2月7日,正值大年初三,在走亲访友的高峰时期,吉林省部分地市的移动用户却出现手机无服务现象。从当天上午9时起,吉林移动客服中心便陆续接到用户投诉,反映手机业务无法使用。吉林移动在第一时间启动应急预案,70余名值守人员与专家前往现场进行故障排查并处理,最后于10时30分起用户通信业务陆续恢复。

透过问题看本质,或是HSS故障

据了解,此次通信故障波及吉林省长春市、松原市、四平市、吉林市4个地市,而且吉林省移动卡在外地也没有信号,但外地移动卡在吉林省却可以正常使用。最初,吉林移动公司工作人员称,“移动部分号段网络升级,导致手机卡暂无信号,网络预计恢复时间为当天下午13点左右,无需到营业厅补卡”。随后,吉林移动10086官方微博回应故障原因为系统繁忙,预计影响时间延长至2月7日16时,公司维护人员正在紧急处理。当晚,吉林移动官方微信公众号发布消息称故障是由于城郊个别烟花燃放导致架空骨干光缆故障,影响部分用户通信,现已完全恢复。

虽然,吉林移动最终回复为通信光缆被鞭炮燃放所致,但很多业界专家认为该回复经不起推敲。吉林移动规模网络瘫痪的技术原因可能出现在哪里,值得思考。大部分业内人士的分析认为,基本可以判断此次事件是由于核心网HSS(Home Subscriber Server,归属签约用户服务器)故障所致,并赶上春节假期,厂商相应处理速度受影响,故而恢复较慢。

HSS功能与HLR类似,是IMS(IP Multimedia Subsystem,IP多媒体子系统)中控制层的重要组成部分,负责移动用户管理的数据库,能永久存储和记录所辖区域内用户的签约数据,并能够动态地更新用户的位置信息,以便在呼叫业务中提供被呼叫用户的网络路由。

具体来说,HSS支持用于处理调用/会话的IMS网络实体的主要用户数据库,包含用户配置文件、执行用户的身份验证和授权,并可提供有关用户物理位置的信息。HSS所提供的功能包括IP多媒体功能、PS域必需的HLR功能及CS域必需的HLR功能,可处理的信息包括用户识别、编号和地址信息;用户安全信息,即针对鉴权和授权的网络接入控制信息;用户定位信息,即HSS支持用户登记、存储位置信息;用户清单信息。

当用户选择某个电信运营商并购买了SIM卡之后,其相关信息就被录入了HSS系统当中,包括国际移动用户识别码IMSI、移动台识别码MSISDN、基本业务、补充业务签约信息等。与拜访位置寄存器VLR所不同,HSS中记录了用户所有的原始开户信息,不会因为用户从北京跑到了上海而将其号码和签约信息进行删除。而每当某用户做被叫时,主叫的MSCS会发送消息给HSS网元请求路由信息,HSS查找数据库记录,向被叫用户当前所在的MSCS/VLR请求一个漫游号码,并将此号码发送给主叫MSCS,主被叫MSCS之间通过该漫游号码找到对方,并最终建立起主被叫用户之间的通话。

可以看出,HSS在移动通信网络中的地位可谓举足轻重,一旦HSS系统异常或者用户签约信息丢失,整个网络必将陷入混乱不堪的状态。

“路”不可断,运营商需防患于未然

面对像春节这样的大面积并发流量,从设备厂商的技术支撑以及运营商技术角度看,目前运营商以及设备商的支持能力需要提高。SA高级分析师杨光表示,吉林移动系统故障的情况到现在都不具体。如果是软件故障,可能和春节期间的人员流动有关系,认证鉴权量比较大,但是这种软件的“bug”总让人防不胜防。除了运气因素之外,只能说应该加强软件工程能力,提高软件质量控制的水平。不过也有可能是像光纤断裂之类的硬件故障,但这类问题恢复时间较长,所以可能性较小,除非像在几年前韩国运营商出现过的整个机房失火状况,处理起来相对麻烦。

不过,可以肯定的是,春节假期对厂商的响应速度和故障处理有影响。运营商和设备厂商对于此类事件都备有相应的应急预案,断网事件发生后,运营商和设备厂商们应该对整个事件的处理过程做出检讨和分析,查看原来的预案是否有不合适和需要改进的地方。以国际经验来看,每一代新技术部署之后都有大规模网络故障的案例,这是前进中必然要付出的代价。在4G方面,中国启动较晚,产业链已经比较成熟。而在5G方面,中国走得快,出现问题的几率可能会更大一些。并且除了做好应急预案之外,运营商也应该坦诚地与消费者沟通,以求得用户的理解。

业内专家金峰则表示,未来运营商应该积极提高智能网络方面的建设能力。主要方式为:一是智能化信息传输路由的选择;二是智能化内容本地存储(智能CDN等);三是智能化的网络优先级保障,即依据数据类型等给予传输优先级差异,只要不让网络崩溃,还是能保障用户体验的。

当然,设备本身是一方面,另一方面就是后续的运维服务,这个比较考验员工的能力,包括是否能发现问题,以及能否减少出错率。无独有偶,在2017年9月,广西移动也出现了重大故障,当时情况为80万用户手机失联,客户服务中心共收到10086投诉2.0727万起。经过调查,故障原因竟为2017年9月7日后半夜,厂家人员进行扩容割接时,工程师不小心把HSS设备的用户数据给格式化删除了,这也可以看出当前火热的AI对于运营商智慧化基础网络管理的重要性。

同时,此类事件也给电信运营商的用户发展战略提供了思路。就单基站服务的用户数来说,中国移动差不多是中国电信和中国联通的2倍,另外还有物联网的用户需要服务。此后,电信运营商应该审视一下现在供应商管理的思路,怎么样在成本和质量之间找到更好的平衡点。

作为基础网络建设支撑者,运营商的网络故障是事故,引起了用户吐槽,但是也可以从另一个角度看出运营商的重要地位,一旦运营商的“路”断了,那这上面的微信、支付宝等“车”还怎么能跑起来?

猜你喜欢

吉林运营商故障
A Spring Coat for Sarah
吉林卷
故障一点通
吉林卷
奔驰R320车ABS、ESP故障灯异常点亮
取消“漫游费”只能等运营商“良心发现”?
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合
三大运营商换帅
故障一点通