APP下载

传输网络误码分析及处理

2021-03-28屈斌

电子元器件与信息技术 2021年12期
关键词:误码单板比特

屈斌

(河北移动公司,河北 石家庄 050021)

0 引言

运营商传输网目前以SDHPTNOTN承载为主,三种传输网络要完成的工作基本相同,但工作原理有很大差异。SDH属于硬管道,业务一经分配和配置,通道独享,通过帧开销中的固定字节和比特来计算和监测不同断层的信号传输质量并反馈,能够提前发起预警;PTN属于柔性通道,带宽共享,通过在信号封装解封装的固定位置解析监测传输的信号包的质量,以监控和发现误码;OTN网络类似硬管道,也是通过不同的开销比特来计算和监测不同的断层信号质量[1]。

在熟悉和了解了传输网络的误码监控机理后,再深入学习各维护手册上对于误码处理的措施和方法,应用到日常维护中,不断的进行适应和更新,形成一套切实可行并可落地执行的误码监控、分析、处理的方法,在网络运维中,由于传输网的组网复杂性,同时各厂家、各平面对于误码的监控监测、告警名称有些不同,维护工程师对于此类误码故障的处理比较困难,相信采用此种方法和措施后,将会对网络工程师处理误码类故障起到较好的技术指导和帮助作用。

1 研究背景

针对当前传输网误码类告警、性能事件较多,对承载的业务造成了一定影响,为分析误码类告警的产生原理,不同的误码类型对业务造成的不同影响,并进行有效地预防和整治优化,特提出本研究课题。

2 误码产生原理及告警名称和类型

2.1 SDH误码

(1)SDH误码产生原理。误码是指经光接收机的接收与判决再生之后,码流中的某些比特发生了差错。SDH系统帧结构中,开销字节B1、B2、B3、V5分别用于监视再生段、复用段、高阶通道和低阶通道的误码。误码监视采用比特间插奇偶校验方式(BIP)的偶校验。比特间插奇偶(BIP)校验是一种监视传输质量的方法。其原理是:发送端将附加的奇偶信息插入发送信号中,接收端对同一奇偶性进行核算,并与信号中插入的奇偶信息相比较,如二者不一致,则表明传输过程中发生了差错[2]。

(2)SDH误码产生的原因:

表1 SDH 误码产生的原因

(3)SDH误码告警和分类:

表2 误码相关的性能和告警事件

2.2 PTN误码

(1)PTN误码告警产生原理。通过计算以太链路错误包数占总包数的比率来产生误码越限(dEXC)/信号劣化(dDEG)事件,其比率门限值可以设置。

(2)PTN误码告警产生原因:

原因1:线路信号劣化;

原因2:输入光功率不正常;

原因3:光纤头表面不清洁;

原因4:对端或本端光模块出现故障。

(3)PTN误码告警和分类:

表3 PTN 各厂家的误码告警及性能事件

2.3 OTN误码

(1)OTN误码产生原理

OTN误码监视采用BIP-8编码方式,编码字节随业务一起传输,信号误码监视范围包括SM/PM/TCMn三个层次,发送端产生BIP-8编码置于各段的BIP-8开销字节内,接收端从信号取出BIP-8开销后进行误码统计。

(2)OTN误码产生原因

原因1:光缆或合波部分的尾纤损耗过大或熔接头反射指标不合格,或者尾纤接头不清洁;

原因2:设备或单板温度过高,使信号处理产生异常,产生误码;

原因3:DCM模块配置不合理,在放大信号的同时,使噪声成级数放大,信噪比降低;

原因4:合波信号光功率异常,光功率过高或过低都可能导致误码的产生;

原因5:光功率非线性;

原因6:设备到ODF架的法兰盘损坏[3];

原因7:PMD严重超标,偏振模色散,它的单位是ps/Km,典型值是0.3~0.5ps/Km,与传输光纤的质量和长度有关,主要受双折射和模式耦合两个因素影响。

(3)OTN误码告警和分类:

表4 OTN 网络与误码相关的性能和告警事件

3 不同业务场景下误码类告警的影响

(1)数据业务:数据通信中信息本身几乎没有冗余度,只要数据块错一个比特,可能会造成坏包,数据块中错一个比特或是错多个比特串效果相同,会造成数据重传及数据丢包。

(2)语音业务:语音通信中,连续的零星误码通常不会造成断话影响,可能造成电话有杂音,音质下降,一般可以容忍,但对于突发性大误码,则很有可能造成掉话或者闪断等问题。

(3)视频业务:视频通信的数据往往是压缩编码以后的数据,而压缩以后的数据对误码非常敏感,造成误码环境下恢复图像质量严重下降。

(4)政企专线:政企专线业务具体需要参照用户具体传输的业务情况,如数据,语音还是视频等,可能造成业务闪断、丢包等问题。

(5)IPTV:会造成IPTV接入用户网速不稳定,可能导致IPTV无法打开界面,视频卡顿等现象。

4 误码类告警的监控发现机制

4.1 告警监控法

检查现网误码类告警,无不说明原因的紧急级别告警;每条告警有合理存在的原因,确保现网误码告警清零,不能清零的告警,必须确认原因。

4.2 性能监控法

通过查询设备及单板当前误码性能,判断设备运行情况是否正常,及时排除故障:

(1)检查OTU单板、支线路板的性能,收发光功率应在正常范围之内;

(2)检查OTU单板、支线路板的性能,纠后误码率为0;同时,波分侧15m/24h当前和历史性能中,不可纠错帧为0;

(3)数据业务检查是否有异常RMON性能事件;

(4)定期查询光功率:信号在通过传输系统的时候,光功率会产生一些变化。这些变化会影响传输线路上光信号的强度和灵敏度。光功率过高或者过低会损坏光器件或者产生误码,对业务造成影响[4]。

(5)PTN网管上创建了性能实例进行监控。主要是监控网元/单板运行状况和网络流量状况。

单板性能:网元上的单板是否运行状况,主要包括单板温度,CPU和内存利用率。

端口性能:包括端口所在链路是否有误码、错包,以及端口上接收和发送的流量、带宽利用率

激光器性能:监控激光器工作是否正常,主要是关注激光器的功率、温度和偏置电流等

4.3 工单系统派单

通过性能平台,可以实时采集各网管系统上报的性能数据,其中包括光功率、温度、误码等,按照提前设定的派单规则,过滤其中的误码性能数据,并按照误码告警名称(SDH:B1-SD、再生段(RS)背景块误码(BBE)越限、RS_SD;PTN: MAC_FCS_SD、 MAC_FCS_EXC、以太网物理接口(ETPI) 信号劣化(SD)、CRC_ERR;OTN: BEFFEC_EXC、15分钟纠错后误码越限告警、FEC_D_SD)将误码告警推送至故障管理平台,故障管理平台将故障按照规则进行过滤后,将需要派单的误码告警信息推送至工单系统,工单系统结合综资数据,产生性能故障工单,分别对不同地市、不同网络相关的设备和端口进行误码派单,同时通过IVR语音通知相关处理人员,督促进行处理。

5 提前预防、网络优化建议

5.1 误码的提前预防

(1)例行查询误码性能:通过网管,定期查询网元的误码性能事件,及时发现问题,以达到在误码还没有严重到影响业务之间就处理完成的目的。

(2)例行查询单板接收光功率:对于支持查询光功率性能事件的单板,应例行查询并记录全网收光功率是否在合适的范围之内;并将本次查询的数据,与历史数据进行比较,如果数据有变化,应查明变化的原因[5]。

(3)关注机房环境和温度:高温会影响到设备的正常运行,尤其是高温对时钟晶振的影响大。如果机房温度不能保持在合适的范围内,则可能会影响时钟质量,导致出现指针调整甚至是误码的情况。

5.2 误码的处理

误码的处理,常用的方法也先分析、后环回、再替换等:

(1)告警性能分析法:由于环回法对正常业务有影响,因此处理误码问题时,一般主要通过对误码性能、告警事件仔细分析,定位出故障点。

(2)逐段环回法:若条件允许,可使用环回法快速定位出故障站点。注意: 环回有可能造成ECC不通,要认真分析ECC,确认不会影响网管管理后再进行环回操作

6 结语

传输网是运营商的基础网络,传输网上承载的各种业务量越来越大,传输误码对业务感知造成了一定的影响。通过必要的监控手段来及时发现网络中存在的性能隐患,并分类分级进行原因分析和处理,对改善业务性能,提升业务感知尤为重要。在实践中,通过以上的方法和手段,可以解决处理网络中大部分的误码性能事件和故障,对提升网络健康度具有重要的价值。当然,由于作者技术水平有限,同时网络技术的发展变化日新月异,文中所讲的内容可能会存在错误和纰漏,欢迎大家进行批评指正。

猜你喜欢

误码单板比特
单板U型场地滑雪关键技术动作及训练方法
ZPW-2000A电码化轨道电路误码问题分析及解决方案
一种基于CAN总线的误码测试方法
比特币还能投资吗
比特币分裂
比特币一年涨135%重回5530元
单板层积材带来的内部生产模式
多支路两跳PF协作系统的误码性能
封面人物 单板滑雪凌空飞燕蔡雪桐
神秘的比特币