APP下载

IPRAN网络质量监测方案研究

2018-06-17向九松张凤刘菁左兴宇

科学与技术 2018年24期

向九松 张凤 刘菁 左兴宇

摘要:分析了当前IPRAN网络的运营现状和运维需求,介绍了目前主流网络质量监测的技术和方法,在此基础上提出了基于多维度数据分析的网络质量监测方案,帮助运营商提升运维效率、提高业务感知、获得竞争优势。

关键词:业务感知;SQM;IP FPM;秒级监控;资源树

1 引言

近年来中国移动互联网基础设施建设成就斐然,4G基站规模激增,抖音、拼多多等现象级的应用层出不穷,VOLTE语音逐步开始规模商用,物联网进入了快速发展部署阶段,各家运营商也在积极进行5G试点。与此同时,移动互联网用户总量增长放缓,提速降费后数据流量成倍增长但利润率却逐步下滑,各运营商之间的竞争日益激烈,运营商被内容服务商管道化的趋势也日趋明显。所有这些变化均对运营商的IPRAN承载网络提出了越来越高的要求,在封闭网络体系架构下只需关注网络设备本身而不注重客户感知、不关注应用质量的传统运维模式正面临着巨大的挑战。

2 需求分析

IP RAN通过引入MPLS、二层伪线、端到端BFD、FRR等技术,实现IP网络由业务网络向综合承载网络的转变,但由于IP本身尽力而为的特点,传统网络的运维机制、指标体系、监测手段等与不断攀升的移动承载需求相比仍然存在较大的差距,亟需引入一套可视、可管、可分析、可溯源的网络质量监测方法,提供先于用户发现、解决和优化业务感知问题的手段,促进提升移动互联网用户的业务感知。当前的移动互联网业务态势要求网络质量监测系统应该具备如下功能:

2.1 针对不同业务场景构建不同的网络质量指标体系

IPRAN作为一个综合承载网络,承载了LTE上网、VOLTE语音、政企专线、5G等多种业务,不同业务对于移动承载网的要求各不相同,仅以5G uRLLC典型应用工业控制以及窄带物联网为例,工业控制业务对时延有着极为苛刻的要求,一般要求十毫秒级别,可靠性要求接近100%;窄带物联网对时延、丢包并不敏感,但是对终端低能耗有较高的要求。只有实施差异化的质量指标体系,方能满足差异化的业务保障需求。

2.2 解决KPI指标与用户真实业务感知不匹配的问题

运营商需要解决“网元好≠端到端质量好,均值好≠局部地区好,测试好≠单用户好,统计好≠感受好”的评估难题,建立用户感知指标体系,推动以网络KPI(Key Performance Indicator)为核心的运维模式向围绕用户感知KQI(Key Quality Indicator)的新型运维模式转变。

2.3 实现网络故障、用户投诉的快速分析定位

在集约化运维的大趋势下,运维人员面临设备多、工作量大、隐患难以排查等困难。移动网业务又面临网元类型杂、设备数量多的问题,如何快速掌握网络运行状态,提前、精准、定向的进行网络排障和优化也是运维工作中亟需解决的问题。

2.4 提前发现业务感知下降、挖掘网络潜在隐患

据统计98%拥有负面体验的客户会选择不投诉,且50%的沉默客户会直接转网,因此,运营商需要将由客户投诉为导向的服务模式变为由KQI为导向的服务模式,在大量用户觉察有负面体验之前发现业务感知下降,排查潜在的问题,并及时解决。

2.5 支撑差异化的运维

为减缓运营商被逐渐管道化的趋势,运营商需主动与内容服务商进行合作,共建共盈感知系统,网络质量监测系统可以针对合作方的应用和客户进行差异化的监测和保障。

3 网络质量监测技术概述

目前主流的网络性能监测方法主要有主动测量、被动测量、网络性能采集、关联数据分析等等。

3.1 主动测量

是指运用内置或者外置探针将探测数据包放入网络中,观察该数据包的行为和到达时间,统计网络层管道的SLA指标。该方法适合端到端的网络性能测量,主要被用作测试延迟、丢包率、带宽以及其他端到端的路径特征检测,但无法监测实际业务感知。常见技术包括PING/TRACE、Y.1564、Y.1731、RFC2544等等。

3.2 被动测量

一般用于业务级的测量,由承载网设备感知实际的业务流量,测量出每条业务流的SLA指标,无需插入独立的测量报文。常见技术包括IP FPM、DPI测量等等。

3.3 网络性能采集

运用传统的网管手段或专用工具进行关键运维指标的采集,例如端口CRC、收光功率、各类资源利用率等。

3.4 关联数据分析

运用大数据手段关联周边各类系统采集的数据,进行信息整合并挖掘潜在的问题。

4 方案介绍

4.1 总体系统架构

IPRAN网络质量监测系统按照功能可分为数据采集与适配模块、指标模型设计模块、感知分析模块、问题定位模块、前端展示模块、IT接口适配模块等,具体架构如图一所示:

4.2 部署实施

4.2.1 基于设备自身SQM(Service Quality Management)的端到端业务拨测

目前IPRAN设备均自带交付测量技术,如Y.1731、RFC2544等等,通过这些技术可以模拟基站或政企专线业务进行时延、抖动、吞吐量、丢包率等性能的在线测量。在省中心选择一个业务相对空闲的BB对,各地市可选取若干A/U设备,并配置A/U设备到省中心B设备的模拟基站或专线业务。通过网管系统定期发起SQM测试,并实时分析测试数据,验证网络的性能指标。

4.2.2 基站和IPRAN设备的轮询PING测

在核心網侧部署探测服务器,模拟核心网对全网基站、城域ER、汇聚ER、B设备、A设备进行轮询PING测,获得承载网各个层次设备的时延、丢包、抖动数据,并将实测结果与网络资源树进行关联,实时反映承载网络的运行质量。

4.2.3 秒级监控

目前常规流量监测是分钟级别,如cacti、传统网管等,通过采集两个时段的差值再除以时间差得到监测结果,所以会产生“消峰填谷”的误差。在秒级峰值监控功能下,端口实际的利用率远高于传统手段监控到的流量峰值,通过现网实测二者最高差值接近30%。在现网部署秒级监控策略,可为网络扩容和流量分析提供更为精准的基础数据,进一步优化指标。

4.2.4 IP FPM

IP FPM(Flow Performance Monitor)检测是一种对实际业务流进行直接测量,获取网络的丢包统计、业务路径时延等性能指标的测量方法。在基站源端进行数据的染色,并通过网管进行实时统计计数,在核心网侧根据染色特征进行数据识别和采集,从而得到端到端的网络性能指标。

参考文献

[1]马啸威 曹维华 李文云 贺晓. 移动互联网业务感知质量优化方法及系统[J]. 广东通信技术2017.2

(作者单位:江苏电信省操作维护中心)