APP下载

IPTV端到端网络优化策略研究

2019-10-29中国联通安徽分公司安徽合肥230061

邮电设计技术 2019年10期
关键词:路由链路服务器

王 斌(中国联通安徽分公司,安徽 合肥 230061)

0 前言

随着IPTV 用户规模增长、高清和4K 视频节目数量不断增多,网络承载压力剧增。同时,IPTV 业务流穿越用户终端(机顶盒和光猫)、接入网、传送网、数据网和CDN,业务流程长且复杂,为快速定界故障点、提升视频用户业务感知工作带来了困难。因此,识别网络瓶颈、疏通网络通道、保障用户体验成为IPTV 业务运营的首要工作。本文通过深入研究分析安徽联通IPTV 网络架构、设备能力、网络容量和家庭组网等现状,着重分析了宿州、阜阳和池州3个地(市)的网络配置、流量等采样数据,发现了影响视频体验的网络问题,提出了IPTV业务端到端网络优化建议。

1 问题分析

1.1 网络架构

1.1.1 省网链路带宽成为瓶颈

当前安徽联通IPTV 业务主要有2 张网承载:城域网(主要承载HSI、IPTV 等)和省网(主要承载认证、计费、IPTV 回源、省内IDC 流量等)。IPTV 业务流规划如图1所示。

a)合肥IPTV 流量通过合肥城域CR 到合肥CDN分中心。

b)其他地(市)IPTV 业务优先命中本市CDN 分中心;未命中本地CDN 时通过省网绕行到合肥IPTV 平台。

安徽联通CDN 命中率平均为90%左右,省网链路中视频流量占比平均超过50%。目前省网到各地(市)带宽为5~20G,后续随着视频用户的增加及码率的提升,省网链路带宽将成为瓶颈。

图1 IPTV业务流规划

1.1.2 OLT上行通过汇聚交换机承载,容易导致拥塞

现网OLT 上行通过交换机汇聚接入占比88%,通过裸纤直连BRAS/SR 占比仅为12%。然而,用户体验取决于网络通量,网络通量和套餐带宽、丢包、时延有着直接关系。

安徽联通光改完成后城域网时延基本<20 ms,满足4K 视频流畅播放对网络时延要求(4K 视频流畅播放要求时延<20 ms,丢包率<10-4;或时延<10 ms,丢包率<5×10-4)。但网络丢包仍比较严重,导致TCP 下载速率降低一半,引起视频卡顿或花屏。现网汇聚交换机无缓存或缓存只有1 ms,更容易引发丢包,导致突发拥塞,成为影响视频体验的主要原因之一。

1.2 设备能力和网络容量

1.2.1 CDN分中心设备处理能力是瓶颈

经测试(带宽按6 M/户),现网单台流媒体服务器支持的峰值并发用户数约3 300户。据统计,目前流媒体服务器网络带宽峰值利用率达到80%~90%,内存利用率达到59%~72%。部分CDN 分节点峰值并发用户数已接近性能极限,影响了客户视频业务使用感知。

1.2.2 OLT承载网及上行链路带宽均存在瓶颈

全省超过80%以上的OLT 上行承载网为IPRAN。2018 年春节,部分地(市)IPRAN 网络带宽峰值利用率出现预警(见表1),存在忙时不能容灾的隐患,直接影响了IPTV用户和4G用户业务感知。

同时,OLT 上联带宽主要以GE/2×GE 为主,部分LSW-OLT 端口利用率超过50%,网络突发时产生丢包现象,无法满足未来3年的带宽需求。

1.2.3 PON网络的弱光和超距问题

表1 2018年春节期间部分地(市)IPRAN带宽峰值利用率

宿州与池州两市接收光功率异常(小于-27 dB)的ONU比例均超过5%,分别达到6.42%和8.05%。

池州现网32%的ONU 光距大于5 km,3.4%的ONU 光距大于10 km。宿州现网27%的ONU 光距大于5 km,3.5%的ONU光距大于10 km。

1.2.4 单口桥接型ONT 视频和上网业务共用通道,无QoS保障

全省存量桥接ONT 约占总量的58%。该类ONT通常下挂一个家庭网关拨号上网,家庭网络组网复杂、故障点增多。视频和上网流量共通道,当视频或上网流量突发,瞬间流量超过用户整体带宽的时候,就会导致丢包。若无QoS 保障,一旦瞬间突发流量大于端口转发速率,报文同样会被随机丢弃。对丢包敏感的视频报文被丢弃时,会导致视频卡顿或花屏。

1.3 家庭组网

通过分析95 082个(有效样本94 971个)已经部署探针的机顶盒数据,安徽联通直播业务卡顿用户占比小于1.6%,卡顿时间大于10 s 的直播业务卡顿用户占比小于1.2%。标杆运营商质差率为0.2%,安徽联通视频体验需要继续优化。通过抽样入户调查,发现相当一部分卡顿用户的机顶盒是通过无线接入ONT,而家庭内Wi-Fi覆盖差,导致视频业务体验不佳,同时影响组播部署。

2 优化策略

2.1 网络架构

2.1.1 部署组播

2.1.1.1 组播复制点的选择

相比单播来说,使用组播方式传递信息,不需要此报文的用户不会收到组播数据,用户的增加不会显著增加网络的负载,减轻了CDN 服务器和省网链路的负荷。相比广播来说,组播数据仅被传输到有接收者的地方,减少了冗余流量,节约了网络带宽,降低了网络负载。因此可以说组播技术有效地解决了IPTV 单点发送多点接收的问题。

经比较分析(见表2),IPTV发展初期,每台OLT组播用户较少,OLT 组播复制不节省带宽。但是IPTV 用户规模发展后,再考虑将组播复制点下移至OLT,会带来更多复杂的存量用户改造工作,因此建议将组播点确定为OLT。

表2 组播复制点选择比较分析

2.1.1.2 单/组播并存的适配方案

由于现网大部分存量ONT(单口ONT、多口桥接型ONT、机顶盒不具备有线接入多口路由型ONT 条件)无法开通组播业务,因此较长的一段时间内现网组播和单播用户并存。

新开通多口路由型ONT、存量路由型ONT(机顶盒有线接入ONT)使用组播方案。IPTV 组播业务流程如图2所示。

图2 IPTV组播业务流程

a)ONT 创建桥接WAN,承载IPTV,STB 通过IPOE拨号连接网络。

b)ONT 创建路由WAN,承载HSI 业务,并开启DHCP,为接入路由WAN的设备(PC、家庭Wi-Fi终端)分配局域网IP。

c)IPTV和上网通道分离,通过VLAN隔离。

单口ONT、桥接多口ONT、路由型多口ONT 工作在桥接模式使用单播方案。IPTV 单播业务流程如图3所示。

a)ONT LAN口下挂路由器。

b)路由器PPPoE 拨号获取IP 地址,开启路由模式。

c)STB和PC 通过DHCP方式获取局域网内地址。

2.1.2 其他网元优化

2.1.2.1 省网链路扩容

全网启用组播后,省网链路回源流量主要取决于点播业务的CDN 命中率。当边缘CDN 服务器出现宕机、节假日IPTV 并发用户数激增、边缘CDN 节点交换机脱网等情况,回源流量将突增,会出现严重的卡顿问题,因此必须将省网链路带宽扩容。

设单台CDN 服务器支持峰值并发用户数3 500户,平均每户带宽8M,则需扩容的带宽量为(3 500户×8M/户)/70%=40G。即建议省网链路带宽扩容至40G及以上。

2.1.2.2 逐步取消汇聚交换机

OLT 上行流量大于4G 时取消汇聚交换机:优先整改二级汇聚交换机,暂时保留一级汇聚,后续根据OLT上行流量再逐步取消一级汇聚交换机。

a)光纤资源充足地区:通过光纤直连BRAS,或通过一层交换机汇聚后接入BRAS。

b)光纤不足地区:OTN 波分下沉到OLT,通过波分接入。节省光纤资源,且便于维护。

c)光纤和波分不足的地区:通过IPRAN 接入或通过一层交换机汇聚后接入IPRAN。

2.2 设备能力及网络容量

2.2.1 扩容并优化CDN服务器

图3 IPTV单播业务流程

衡量流媒体服务器性能最关键的指标是:流输出能力、能同时支持的并发请求数量。影响流媒体服务器关键性能指标的关键因素是:CPU 处理能力、内存、磁盘读取能力和网络吞吐能力。因此,在CDN 服务器性能配置确定的情况下,采取如下措施。

增加边缘CDN 服务器数量,提高边缘节点的并发用户数处理能力。据统计,IPTV 用户并发率为25%~35%;在节假日、特别是春节期间,并发率将大幅度提高,为40%~55%,应根据活跃用户情况配置CDN 服务器的数量:边缘节点CDN 服务器配置数量=(注册用户数×55%)÷(3 300×80%)。

出于投资效益考虑,边缘CDN 节点的服务器数不能无限制增大,中心CDN的存储往往大于边缘CDN节点。提高CDN 命中率的最佳方案就是优化CDN 缓存策略。

a)新片源上线后,不立即下发到边缘CDN 节点。当点播该片源的用户达到一定数量,才被允许下发至边缘CDN节点。

b)长时间未点播的边缘CDN 节点片源,予以删除。

c)手工调整存储策略。

2.2.2 UTN及OLT上联链路带宽扩容

当前IPRAN 承载移动回传业务和OLT 上行业务,部分为GE 环。随着OLT 上行流量增加,GE 环无法满足带宽需求,需要升级到10GE,在解决OLT 上行接入带宽问题的同时,也提升了移动回传带宽。

根据用户发展情况扩容OLT 上行端口带宽。需强调的是:OLT上行流量超过4GE后再投资GE口会造成浪费,一方面上行光纤资源会急速消耗,另一方面OLT 上行板所占槽位也会大量消耗,且随着视频流量的增加,GE口需求急速增加,导致上行带宽频繁扩容,增大维护工作量。建议替换为10GE 上行,存量的GE上行单板退网后可以利旧到业务量小的OLT。

2.2.3 PON弱光及超距问题整治

OLT 的发送光功率一般为2~7 dBm,接收光功率为-27~-6 dBm。ONU 的发送光功率一般为-1~4 dBm,接收光功率为-24 dBm左右。

安徽联通FTTH 基本采用二级分光的模式。光从OLT 发出后,经过光缆、接头及分光器后,会产生不同程度的损耗(见表3)。产生弱光的原因大致分为三类:一是冷接头损耗过大;二是光缆原因造成损耗过大;三是用户挪动ONU 后没有按照规范放置,尾纤弯曲过大、分光器或法兰头等原因产生弱光。

PON 弱光及超距问题应遵循“先问题定位、后优化调整”的原则。为保障IPTV 用户正常业务体验,建议二级分光器测试光功率不低于-25 dB。

如需进行光缆割接,则寻找一条新的物理路由,在测通新路由后对业务进行割接(路由长度不超过8 km)。

如无需进行光缆割接,则将一级分光器输入前端正在使用的纤芯断开后,使用OTDR 对纤芯进行扫描。若OTDR 扫描光衰耗曲线结果正常,可判定为分光器故障。若OTDR 扫描光衰耗曲线出现高衰耗位置,则对应参考系统光路由距离查找具体的问题点,查找相应的原因并处理。

表3 ODN各节点平均光衰耗参考值

a)若为光缆纤芯或接头问题则重新熔接。

b)若为尾纤老化问题则更换尾纤。

c)若法兰头污损,利用擦纤器、酒精擦拭,然后检查连接可靠性,确保安装卡口到位。

因传输距离超过8 km 或者跳纤点过多导致的弱光问题,若采用a)和b)的方法无法完成改造,可更换CLASS C++模块。

2.2.4 QoS部署

QoS 是一个系统工程,涉及到网络各个节点。从QoS 动作看,有Remark 优先级、CAR/Shaping、Schedule 3 种。在不同网络节点需要部署3 种动作的1 种到多种。表4列出了网络不同节点的部署建议。

表4 设备QoS部署策略建议

2.3 推广家庭组网服务

当前家庭网络对运营商来说是黑盒子,用户自组网场景非常普遍,客户自购路由器品质不一,导致家庭网络问题较多。所以家庭网络可视化、可管理显得尤为重要。根据户型、房屋面积、ONT 位置及承载的业务,灵活选择家庭组网。推广HGU 的光猫,并强制TV优先采用有线方式接入,其次采用电力猫方式接入,屏蔽机顶盒采取无线方式接入。

2.4 将质差率作为维护考核指标

视频清晰度、视频加载速度和视频流畅度是影响视频体验的关键因素。安徽联通初步使用vMOS 评价指标,通过综合这几项业务指标,建立了这几个指标与用户主观感受指标(MOS 1~5分)之间的映射关系。

根据视频质量可评为1~5 分,1 分质量最差,5 分质量最高,低于2.5分即定义为质差用户。质差用户占总用户数的比率就是质差率。质差率是衡量IPTV 业务运营很直观的指标。一般情况下,质差率大于1%,可定义为该区域的IPTV 运营质量比较差。建议将质差率作为IPTV 业务维护考核指标,并对质差率高的区域组织专项网络优化整治。

3 结束语

本文主要从网元层面深入分析视频类业务运营存在的问题,如由于数据不完善,未深入分析机顶盒体验问题,后续可重点关注;传输问题及需求未深入分析(包括移动前传、回传等)。后续工作还需将IPTV/CDN平台的优化纳入研究范畴,提高安徽联通视频业务服务能力和质量。

猜你喜欢

路由链路服务器
天空地一体化网络多中继链路自适应调度技术
基于星间链路的导航卫星时间自主恢复策略
铁路数据网路由汇聚引发的路由迭代问题研究
通信控制服务器(CCS)维护终端的设计与实现
多点双向路由重发布潜在问题研究
PowerTCP Server Tool
一种基于虚拟分扇的簇间多跳路由算法
路由重分发时需要考虑的问题
得形忘意的服务器标准
计算机网络安全服务器入侵与防御