APP下载

如何有效压降传输故障的研究

2022-11-15俸丽琴

中国科技纵横 2022年15期
关键词:纤芯网管光缆

俸丽琴

(中国移动通信集团云南有限公司西双版纳分公司,云南景洪 666100)

0.引言

众所周知,传输网络故障主要划分为设备侧和线路侧2大类故障。其中,设备侧故障主要是由于设备性能和结构等原因引起的。而引起线路侧故障的原因比较多,主要包括光缆纤芯质量、尾纤质量、接头情况、环境因素等。如何有效压降传输故障,降低网络运维成本,成为通信运营商一直以来的工作目标和努力的方向。

1.线路侧故障压降方法

1.1 打破常规,提高巡检安全性

传统的巡检方式是维护人员徒步逐杆进行巡检,效率低、耗时长[1],隐患发现不及时,线路故障得不到压降。随着近年来无人机的快速发展,技术也越来越成熟,操作简单,便于推广,是辅助杆路巡检最佳的选择对象。利用无人机巡检,具有以下优点:(1)针对特殊场景,可以利用无人机巡检,大大提高了维护人员户外作业的安全性[2],有效避免维护人员在户外作业时与野生动物、毒蛇等危险动物遭遇的风险。(2)在发生暴风雨或地质灾害如泥石流、塌方、地震等情况后需要对重要线路开展巡检时,利用无人机巡检既可以快速有效地完成工作[1],又能保证维护人员人身安全不受自然环境的威胁。但是无人机存在的缺陷不容忽视,即无人机的续航能力存在局限性,一般只有半小时至1小时左右,不能长时间进行作业。

1.2 开展光缆跨路挂高专项整治,减少因跨路高度不足而引起的故障

随着经济的快速发展,公路等基础设施建设的覆盖使得大型交通工具也能实现通车,而乡镇上传输网络建设初期,跨路电杆多为7m杆或5m杆,现在,7m的高度已然不能满足大货车的通行高度,时常因货车超高或司机在车辆行驶过程中因环境因素的影响,如烈日、雨天、夜晚等视线不佳的时候会出现对跨路光缆高度与车辆自身高度差判断失误而挂断光缆,引起传输线路故障。结合日常巡检工作,将跨路杆路换成12m杆或者在原有基础上增加槽钢,已基本达到增高跨路光缆高度的效果,同时悬挂通信光缆警示牌,可以有效避免光缆被大车挂断的风险。

1.3 开展拖地光缆专项整治,减少人为故障

光缆拖地主要是因为杆路挂件是铁制品,随着网络建设时间越来越久,经过长期的风吹日晒,吊线、挂件等就会生锈,随着光缆数量越来越多,经常出现吊线无法承载光缆重量而断裂以及电杆倒杆导致光缆脱落的情况。造成光缆拖地的主要原因有以下几个方面:(1)工程为了赶工期临时沿路布防光缆未上杆。(2)维护或故障抢修时临时冲放了光缆未及时上杆。(3)为市场发展能抢先竞对无线拉远覆盖没有路由而沿路临时布防的光缆等。而沿路光缆拖地还会给人们出行造成安全隐患,造成交通事故,严重的甚至会造成人员死亡,给运营商带来不必要的赔偿。光缆长时间拖地,也会因为摩擦、外力拉扯、人类生产活动造成光缆损耗,甚至被人为砍断造成故障等。

1.4 开展光缆接头盒整治,减少蚁类造成的故障

光缆接头盒封装不严,时间长了,很容易进水[3]、进蚂蚁。蚂蚁在里面筑巢后经常会啃咬纤芯,导致光缆纤芯中断,引起故障。为有效解决这一问题,经过多次实验观察,得到最有效且效果最好的办法就是在接头盒内装上樟脑球,外加使用密封条和热熔胶封装。因樟脑球具有挥发性,挥发时间较长,挥发后不会遗留粉尘之类的固体物体,不会对光缆纤芯造成衰耗及误码等影响,且挥发的气体在接头盒封闭的空间内,气味不容易散,药效持久。可以有效避免接头盒进蚂蚁,减少故障的发生。此外,要规范使用接头盒,避免使用矿泉水瓶等物品替代封装。

1.5 光缆备纤修复,提高光缆优质纤芯的储备,有效缩短故障时长

光缆衰耗过大会引起业务发生闪断[4],尤其是2G业务对光缆衰耗较为灵敏,光功率低于门限值时业务就会发生倒换或者闪断,而备纤修复可以降低光缆衰耗,提高光缆纤芯资源的质量。汇聚层以上环路承载的业务量较多,如发生故障将会导致大面积业务中断,造成很大的损失。所以汇聚层以上光缆优质纤芯资源储备尤为重要,故障发生时,在光缆不全阻的情况下,可以通过纤芯调整快速恢复业务,缩短故障时长。

1.6 整治同路由隐患,避免重大故障的发生

汇聚层以上的光缆因同路由发生故障将会导致大量业务中断,传统的同路由隐患排查方法是通过设备网管拓扑图结合日常维护经验总结出同路由情况,此做法凭借主观因素较多,缺乏参考,容易有遗漏。可以借助Google Earth地图展示功能把设备网管拓扑图与运营商资源外线数据统一融合呈现辅助排查。具体是将资源管理系统中汇聚层以上环路使用的光缆以及承载的杆路信息导出后,导入Google Earth(前提是资源管理系统中的数据要准确),并用不同颜色区分每一个光缆段落,同一个环网的光缆数据放在同一个文件夹下,方便排查时使用软件自带的文件夹隐藏功能,快速排查发现同路由隐患。如2条缆走向有重叠部分就代表同路由,重叠线缆长度即为同路由长度。维护人员可以利用系统自带的测距工具测量同路由长度,对判断隐患的重要等级提供参考依据。

1.7 从建设源头严格管控工程质量,验收合格才能入网投入使用

造成光缆故障的原因有很多,如:光缆纤芯受到外力挤压、拉抻、光缆打折导致光缆弯曲半径过大使得光缆内部的玻璃纤维中断引起故障;光缆敷设距离过长,中间使用太多的接头,接头工艺不达标导致的光缆衰耗过大、信号丢失;光缆连接器受损导致的故障[3];尾纤老化引起的衰耗大等。如何有效预防传输线路故障,不仅要对存量光缆隐患进行整治,也要严格管控新建工程的入网标准,不能为了赶工期而降低对工程质量的要求,要严把质量关,拒绝带病入网。

2.设备侧故障压降方法

2.1 网络结构优化整治,提升网络健壮性

结合ZXSEM巡检小工具可以导出设备网管中的长支链明细,提高设备成环率是提高支链退服的最佳手段。而随着我们设备入网越来越多,前期已开通的站点现在会出现一些结构不合理,距离过长,或者组网有隐患等的情况,需要在维护过程中不断地优化设备组网结构,提高传输网络的安全性,进而降低传输故障。

2.1.1 长支链成环改造,提高设备成环比

在传输网络结构长支链中,上游节点无论是停电或者是光缆中断,下游节点都没有办法通过其他隧道修改业务,只能等上游节点恢复后下游节点的业务才可能恢复,其间影响业务时长较长,一旦因上游问题发生故障将陷入被动抢修的模式,而通过把支链成环后就可以有效解决这一问题。

长支链改造思路:以最短的光缆路由实现最多的网元成环,双归环优于单归环,同时光缆路由的选取要避免出现同缆同路由的情况。资管管理系统的外线采用的是GIS地图,缺乏参照物,路由的选取可以借助Google Earth将所需的资源外线数据导出后整理成系统支持的文件格式,将数据导入Google Earth,可以利用Google Earth辅助光缆路由的选取。

2.1.2 建立汇聚环逃生路由,有效缩短故障时长

汇聚环双断,会造成大面积的网元托管和业务中断。紧急抢通业务需优先抢通传输监控,但由于汇聚环是数据骨干域(0域),接入环都属于非骨干域(非0域),需要通过和其他双跨汇聚环的接入环抢通托管的网元,待托管网元上线后才可以运用故障抢通工具对业务进行抢通。而修改网元数据耗时与接入环长短成正比,为了争取能够在最短的时间内恢复业务,可结合倒换测试模拟统计出所有汇聚层链路中断后能够通过最短接入环进行抢通的路由明细,减少故障发生时因查找可用路由所消耗的不必要的时间,同时,将路由明细作为一份重要的日常维护资料按月进行动态更新,这可以有效地缩短故障时长。

另一方面,因为通过修改接入环数据抢通监控路由需占用一部分时间,为了更快抢通业务,在光缆资源允许的情况下对不同汇聚环又另组一条专用抢通业务的链路,这样就省去修改接入环数据时间,可以更快地抢通业务。

主要难点:(1)资源管理系统中哑资源数据不准确,导致光缆路由选取困难,需要花大量的时间精力去找出各个汇聚环间存在现网中光缆路由或者相连距离较短具备低成本放缆条件的光缆路由。(2)逃生路由通道链路带宽至少满足10GE以上。带宽太低在抢通过程中会导致流量超限,影响客户感知,而现网中10G或者100G板卡基本是根据前期规划配置的,可能现网中没有多余的10G或100G端口提供逃生路由链路使用,这需要额外的板卡和光模块。

主要优势:网管能够根据现网设备拓扑自动计算出距离较短的抢通路由。

逃生路由的实现:(1)在2个不同的汇聚环间找到一条可用光缆,并确保光缆路由与环路上其他段落不存在同路由隐患,若现网无光缆资源可以利旧,原则上应选取一条路由距离相对短、布放光缆成本费用低的路由重新布放一条到目标网元的光缆。(2)规划好设备端口,准备好板卡、光模块及尾纤,现场根据规划的端口完成跳纤,并确保光功率正常。(3)后台做好DCN即可完善逃生路由。

当汇聚环路发生双断时,此时汇聚环上的网元是不会托管的,即可以通过网管的抢通工具快速恢复业务。主要操作:割接调整->隧道迁移->故障抢通->选择故障链路->选择抢通隧道->抢通路由计算->抢通数据下发,实现业务恢复。

2.2 倒换测试,消除安全隐患

倒换测试是核查传输设备隐患的重要手段,是自我纠错、验证的手段。通过关闭端口激光器模拟可能出现的故障场景,可以发现网络中业务数据配置是否准确,网络通道保护是否有效,是否存在其他异常情况等,可以有效排查现网运行存在的安全隐患,做到事前发现隐患,避免不必要的故障发生。

2.3 加强日常设备网管巡检,及时发现设备隐患

设备网管上的告警是上报故障最为直观的方式[5],做好日常网管巡检,对已上报的告警及时处理,可以有效避免故障的发生,尤其是单板脱位告警、性能越限告警、高温告警、防尘网堵塞告警等,这些告警如不重视将会直接引发故障,影响业务,同时告警太多会引起告警风暴带来严重后果。近年来室外一体化机柜也越来越多,且室外一体化机柜散热效果不好,特别是在热带地区,室外气温本身就很高,如果不及时处理设备高温问题,将会导致设备被烧坏,引起故障,所以定期清理防尘网必不可少,尤其是汇聚层以上的设备更是要定期进行防尘网清洗,并对巡检发现的高温隐患及时处理。风扇单元在清洁时需要注意规范操作,一次只能进行单个风扇单元的清洗,不能一次把子架中3个风扇单元全部拔出进行清洁,清洁完成后需要立即还原。且清洁需采用毛刷或者吸尘器的方式进行,不能用湿毛巾或者水洗的方式,因为风扇单元上有电路部分,水洗可能会将风扇烧坏。风扇正常工作才能保证系统通风对流,设备单板的工作温度才能在正常温度范围内,否则温度过高会导致单板运行异常出现误码等影响业务的不良情况。

另外,对未使用的尾纤头应使用防尘帽保护,未使用的光板的光口应使用光口塞盖住。维护中要保证尾纤头、砝兰盘避免受到灰尘的污染。尾纤头插入单板砝兰盘前,应进行清洁检查,对不清洁的尾纤头及时使用擦纤盒和压缩空气清洁器进行清洁处理,不然容易造成光功率损耗,导致弱光、误码等情况影响业务的正常开展。

3.提高机房环境安全性,减少人为破坏行为

近年来,人为破坏通信设备设施的情况依然屡禁不止,随着家宽业务的大量发展,特别是在全球“缺芯”的背景下,资源的短缺促使部分人铤而走险,开始走向违法犯罪的道路,频频出现机房内PON板、光模块、电源线被偷盗的情况。而一旦出现机房被盗,将会严重影响客户业务的正常使用,故障恢复的时长也会消耗大量的人力和时间。且报警后警方破案难度较大,很难追回被盗物资,减少损失。为有效解决这一问题,一是在机房内安装摄像头。摄像头的安装应选择合适的位置,对机房全方位监控,以便在需要时可以能够提供清晰有效的视频,为警方破案提供有力的帮助。也可针对特定设备进行监控,将摄像头对准所需重点监控的设备,进行重点保护,当人员靠近监控设备时摄像头能够自动发出警告,可以起到一定的震慑作用。二是更换机房门锁,将锁反向安装在机房内侧,留一小孔够手进入机房内部开锁,以此增加开锁的难度,致使无法从外围进行撬锁,提高门锁的安全性,能够有效起到防盗的效果。三是设备厂家应在如何有效避免被盗的板件、光模块无法上线使用或在线跟踪定位被盗板件方面多做升级更新考虑,能够协助通信运营商对遗失板件进行追回提供相应的技术支持,有效打击违法犯罪行为。

4.结语

想要传输网络故障得到有效的压降,只有在维护过程中不断地提升维护人员技能,避免因人员误操作导致大面积故障的发生[6]。合理地对网络结构优化,线路侧和设备侧同时抓,才能切实提升网络的安全性,保障通信网络的健康发展。

猜你喜欢

纤芯网管光缆
多芯激励下实际多芯光纤芯间串扰特性研究
低串扰低弯曲损耗环形芯少模多芯光纤的设计
一种基于综资报表的纤芯资源能力评估方法
铺条长长的海底光缆
气吹法光缆敷设
无卤阻燃光缆及防蚁光缆
无卤阻燃光缆及防蚁光缆
发射机房网管系统的设计原则及功能
网管支撑系统运行质量管控的研究与实现
从网管系统到网管云:论网管集约化的建设思路