APP下载

LTE干扰智能定位

2022-02-20白京春乔思洁刘衍晓中国联通威海分公司山东威海264200

邮电设计技术 2022年1期
关键词:训练样本干扰源排查

白京春,乔思洁,刘衍晓(中国联通威海分公司,山东威海 264200)

1 概述

移动网络的发展日新月异,但仍可能会遇到如下问题:接续困难、通话质量差、上网慢、下载龟速、流媒体卡顿、视频聊天不流畅、用户投诉信号满格但无法正常做业务。这一切都可能是由干扰造成的,干扰带来的各种各样问题,会降低用户对网络的满意度,而干扰排查一直以来都在困扰着网络优化人员。

目前排查干扰的传统手段是依靠工程师的经验,首先利用网管结合地图初步判断干扰源的大概位置,然后再利用频谱仪和定向天线现场逐一扫频。传统方法存在4个方面的缺点,首先是及时性差,部分干扰靠人工观察网管指标难以发现,通常在用户投诉后才会引起注意,缺乏主动发现全网问题的手段;其次是准确率低,由于干扰形成的原因往往很复杂,对工程师的要求很高,但工程师的水平参差不齐;再次是效率低下,干扰排查需要分区域、分小区进行逐一分析,耗费大量时间;最后是人工成本高,尤其是对外界干扰的排查,一个干扰源往往需要多人、多次现场逐一查找,人力物力耗费巨大。

本文提出的方案分为两大模块:外部干扰小区识别模块和外部干扰源定位模块。项目的总体思路是,首先通过机器学习建立一个多分类的模型,把需要分类的小区信息输入模型后,模型自动对小区干扰情况进行分类。通过模型可以输出多种结果,包括正常小区、内部干扰小区和外部干扰小区。最后提取出对网络质量影响最大的外部干扰小区,使用其MR 数据,对外部干扰源进行定位(见图1)。

2 LTE干扰智能定位方案

2.1 外部干扰源识别模块

2.1.1 获取训练样本

从网管上提取每个小区的24 h 粒度的每个PRB上的干扰值,整理相关数据,包括小区名称、eNodeB ID、CI、时间戳、PRB号和干扰电平。然后,把相同带宽的小区放置在一组,剔除因设备故障、夜间自动关停等造成小区信息不完整的数据,将其作为训练数据(见图2)。

图2 生成训练数据示意图

有了训练数据后,还需要人工介入,分类打标签,但为上万个小区打标签耗时巨大,为了提升效率,采用了干扰瀑布图加聚类算法进行预归类的方式来加速处理。

生成干扰瀑布图:以时间为横轴,以0~99 号PRB为纵轴,每小时每个PRB 对应的干扰均值根据干扰强度,分别用不同的颜色来表示,最终生成每个小区的干扰瀑布图,辅助人工打标签(见图3)。

图3 干扰瀑布图

聚类加速:为进一步提高人工打标签的效率,先利用机器学习中的聚类算法,对所有干扰瀑布图进行聚类,再对聚类的结果进行人工确认,得到最终训练样本的标签,从而获得完整的训练样本(见图4)。

图4 生成训练样本示意图

利用瀑布图加聚类的方法,可以大幅缩短人工打标签的时长,由每百个小区100 min 降低到10 min,效率提升10倍。

2.1.2 建立预测模型

有了完整的训练样本,就可以进行多分类的建模。在建模过程中遇到并解决了如下问题:

a)训练时间过长。因为采用的数据是24 h 乘以100 个PRB,共2 400 列,因此训练时间过长,使用PCA降维,由2 400列降到83列,训练时间由分钟级别降到秒级别。

b)异常小区占比少。总体上干扰小区占比较少,易造成模型不准确,因此采用过采样的方法解决,异常小区占比由3.49%提高到9.39%,最终指标也提高了1.4个百分点。

c)分类指标不理想。从一开始的六分类,f1 指标仅有0.62 左右,从网络实际需求出发,将模型分类降低到三分类,f1指标提升至0.8以上。

d)调参效率低。使用贝叶斯调参代替网格搜索,调参效率提高10倍以上。

在经过模型的多次优化后,各种模型指标均达到较为理想水平,尤其是极端森林、xgboost、lightgbm 表现最好,因此,使用这3 种模型进行堆叠,在15 000 多个训练样本情况下,准确率达到0.98,f1 达到0.869 4,模型结果可用。至此,完成了干扰精准识别与自动分类模型的建立(见图5和表1)。

图5 各模型效果图

表1 堆叠后模型效果

2.2 外部干扰源定位模块

模型建立完成后,即可识别出全网外部干扰小区,接下来需要通过MR 数据来定位干扰源位置。MR,即测量报告,是评估无线环境质量的主要依据之一。从北向接口中提取的MRO 文件包含了60 余项数据,可以有效解析的主要无线类数据有14 项,从中选取5项,包括小区标识、经度、纬度、接收电平和发射功率余量。

其中PHR 也就是发射功率余量,反映UE 的发射信号功率大小,是反映小区内UE 发射功率分布情况的主要指标(见表2)。PHR取值范围为0~63,值越大,表示手机的功率余量越多,手机的发射功率越低,反之越高。本课题需要定位干扰源位置,因此需要从原始MR 中筛选出PHR 值在0~22、手机实际发射功率不正常的采样点,同时剔除RSRP<-110 dBm 的点,避免因为弱覆盖造成PHR变差的情况,影响判断结果。

表2 PHR取值对应表

用这些包含经纬度的采样点,生成热力图,经过对经纬度纠偏之后,通过Python 的Pyecharts 模块,将PHR以热力图的形式呈现在地图上(见图6),图6中红色区域表示PHR 异常的区域,更接近于干扰源的位置。

图6 外部干扰源定位模块示意图

2.3 对外界干扰小区的干扰源进行自动定位

本节以某村周边突发强干扰为例进行说明。该强干扰影响3 个基站9 个小区,该区域为大型居民区,且北面是海,东边是山,地形较为复杂,如图7所示。

图7 干扰源影响区域

提取3 个基站的24 h 的MR 数据,提取PHR 信息,经过经纬度纠偏之后,呈现在百度地图上(见图8),可以看到,数据异常区域主要集中在4个区域,为重点排查区域。

图8 干扰智能定位工具定位出的干扰源大致区域

通过与无线电管理委员会的合作,对以上4 个区域按照顺序定点排查,迅速定位到干扰源位于区域2一栋居民楼内,用户为了解决深度覆盖问题自行安装的手机信号放大器。通过开发的工具可以有效缩小排查范围,协助现场工程师迅速定位干扰源。

3 结束语

本文通过对网管KPI 的大数据分析,利用机器学习建模,自动识别出所有存在干扰的小区并进行自动分类,准确率超过85%,弥补了目前优化工作中对干扰类型判断方式的匮乏,为进一步的深入干扰排查指定目标。对于影响最大的外部干扰小区,通过MR 进行干扰源的智能定位,创新使用Python 加百度地图的方式,将PHR 以热力图的形式清楚地呈现在地图上,帮助缩小干扰源排查范围,极大地缩短了定位时长,提高了工作效率。

目前已完成建模和全省4G 栅格速率的全流程自动预测,用于指导全省4G 网络低速率区域的整改,提高用户感知。

与排查干扰的传统手段相比,该工具主要有如下3个方面的优势。

a)发现问题全面,告别传统使用全网统一门限值的粗略判断方式,通过2 400 个维度的数据,自动甄别全网干扰小区,尤其是对隐性干扰小区,可以达到精准全面的识别。

b)提升工作效率,对发现的干扰问题自动进行干扰类型的分类,区分内部干扰与外部干扰,相对于传统人工判断方式,效率极大提升,全网运行一次仅需1 h。

c)增强自主优化能力,对于外界干扰可以自动输出重点排查范围,大大节省人力物力,增强自主优化能力。

猜你喜欢

训练样本干扰源排查
基于六旋翼无人机平台的GNSS 干扰源测向与定位系统设计与实现
超低功耗短距离无线通信干扰源精准定位方法
高层建筑消防安全排查情况及处理对策
基于接收机位置信息的GNSS干扰源定位技术
人工智能
美国煤矿安全风险管控和隐患排查治理
如何排查并改错
基于小波神经网络的网络流量预测研究
计算机控制系统的软件抗干扰技术
企业基层组织排查化解矛盾的方法及效果