APP下载

基于随机森林的建筑物场景微蜂窝模型的构建

2020-10-15陈明发严天峰

计算机应用与软件 2020年10期
关键词:自由空间蜂窝损耗

陈明发 严天峰,3

1(兰州交通大学电子与信息工程学院 甘肃 兰州 730070) 2(甘肃省无线电监测及定位行业技术中心 甘肃 兰州 730070) 3(甘肃省高精度北斗定位技术工程实验室 甘肃 兰州 730070)

0 引 言

微蜂窝预测模型是基于容量节俭进行微蜂窝系统设计的工具,对于移动通信的应用研究有着巨大的指导意义。微蜂窝预测半径在1.6 km以内,微蜂窝预测模型大体可以划分为两类:理论模型和经验模型。理论模型是应用电磁波理论计算得到的确定性模型;经验模型是统计性模型,是在大量测量数据基础上形成的。经验模型中比较经典的就是Lee微蜂窝预测模型,它根据信号的传播距离,在自由空间损耗模型上添加不同场景下的损耗参数,与其他模型相比,复杂度不高且适用各类场景,经验证,其准确度较高[1-3]。Lee微蜂窝建筑物损耗分析方法研究的是建筑物损耗与射频路径上穿过建筑物宽度之和的关系,然后应用最小二乘法构建成模型,但是在市区场景下,建筑物形状的多样性和布局的复杂性等对分析建筑物损耗造成较大影响,使用Lee建筑物简化算法来计算建筑物损耗存在较大误差,而精准地得到射频路径上的信号穿过每个建筑物的宽度又很困难。

本文基于实地测试数据对Lee模型进行了建模以及仿真,建立路径损耗参数,改进自由空间损耗模型;针对Lee对与建筑物损耗分析误差较大的问题,应用机器学习中随机森林和GBRT两种集成回归算法对建筑物损耗数据进行分析,建立建筑物损耗模型;综合自由空间损耗模型与建筑物损耗模型使得市区微蜂窝模型更为精准。

1 Lee微蜂窝原理

基于市区建筑物场景下衰减预测的基础模型为Lee微蜂窝模型。接收端接收的强信号是来自于多条经过建筑多次反射的反射波,而不是穿透建筑的无线电波,Lee微蜂窝传播模型的预测公式为:

Pr=Pt-LLOS(dA,h1)-LB+GA+Ga

(1)

式中:Pt为发射功率;LB为建筑损耗,B表示射频信号路径上信号穿过建筑物的总厚度;GA是射频路径上信号到达第一个建筑物的损耗,由发射端到建筑物的距离决定。本次实验中GA=0,LLOS(dA,h1)为视距dA处的路径损耗,即自由空间损耗。距离发射端的自由空间损耗的公式为:

(2)

式中:df为近场距离。微蜂窝的近场距离公式为:

(3)

式中:h1为发射天线高度;h2接收天线高度;λ为波长[4]。

Lee微蜂窝建筑损耗模型为:

(4)

式中:LB表示建筑物造成的信号传播损失;B(单位为m)为Lee建筑物损耗模型传输路径上所有建物宽度之和。

2 集成回归算法原理

集成算法是指由多个弱分类器模型组成的整体模型,主要有两大类:Boosting和Bagging[5-7]。本文中选取Boosting中最具代表性的算法GBRT和Bagging中最具代表性的算法Random Forest进行数据预测分析。

2.1 随机森林回归算法

随机森林[8]是复合决策树的集成机器学习算法。随机森林使用booststrap方法构建n个训练集,每个训练集对应生成一个决策树,总体就有n个决策树,因为每个决策树的数据集都不相同,所以每棵树又有少量区别。最后对所有的决策树的预测结果取平均减少预测的方差,提高在测试集上的性能表现。相比较单棵树训练过程,随机性主要体现在两个方面:每次迭代是在原始数据集中重新抽样获得不同的训练集;对于每一个树节点,考虑不同的随机特征子集来进行分裂。

随机森林的数学模型公式如下:

(5)

式中:N为回归树模型回归树的数量。

2.2 GBRT回归算法

GBRT[9]算法是一种迭代决策树的集成机器学习算法,该算法由多棵决策树组成,所有树的结论加起来就是最终答案,GBRT的数学模型fGBRT如下:

(6)

式中:T为建立模型的回归树的数量;h(x;at)为一个回归树模型;at为每个回归树模型的参数。算法的核心思想是第T树学习的是前T-1棵树结论和的残差,通过叠加所有决策树的结论不断逼近真实值。为了防止过拟合,GBRT算法加入了Boosting这一项。

2.3 最小二乘法

最小二乘法[10]是线性拟合中最常见的一种,是通过最小化误差的平方和寻找最为逼近原始数据的函数表达式,形如y=f(x,b),求出函数关系。

3 测试方案描述

3.1 测试地点

本次实验选取的测试地点为以兰州交通大学电信楼为中心,以半径为微蜂窝极限距离1 600 m的圆为测试范围进行测试计算。测试场景和测试点分布使用ArcGIS[11]绘制如图1所示。

图1 测试场景图

图中黑色圆点为发射基站位置,黑色三角形为移动接收点。本次实验中发射天线高度为45 m,接收天线高度为2.5 m,测试频率为400 MHz,频率为400 MHz时的近场距离为600 m,微蜂窝的极限距离为1 600 m。

3.2 测试设备信息

表1为本文测试的设备信息。

表1 测试设备信息

经过测试以及分析得出,功率放大器和天线增益为33 dB,设备损耗为8 dB,馈线损耗为5.3 dB。

为了验证市区微蜂窝场景中建筑对信号传播的影响,测试得到的数据要尽可能详细,包括接收点的功率值、经纬度值、海拔值。

3.3 射频路径上建筑物宽度计算

如图1所示,研究建筑物对信号传播的损耗就是研究射频路径上信号穿过建筑物的宽度与建筑物损耗之间的关系。Lee建筑物损耗模型提出了简便计算射频路径上信号穿过建筑物宽度之和的方法:将测试地区的建筑物按照建筑物布局和街道分布划分为如图1所示的5个建筑物区块,分别计算5个建筑物区块的建筑物占比,由穿过建筑物区块的距离和建筑物占比得到等价建筑物区块总宽度B,若射频信号穿过图1中的2和4区域,则:

B=a2·L2+a4·L4

(7)

式中:ai为各个区域的建筑物面积占比;Li为射频信号穿过各个区域的距离。

在同一个建筑物区块内的两个测试点,建筑物占比是相同的,测试点与发射点的距离是相近的,但是由Lee建筑物损耗模型得到的建筑物损耗与实际测得建筑物损耗差值却很大。针对这一缺点,本文提出如下椭圆区域计算方法。

由惠更斯-菲涅尔原理可以得到:对电波传播造成较大影响主要是位于第一菲涅尔区域的障碍物。因此,以收发两点间距离的一半为长半轴,以第一菲涅尔半径F为短半轴构建收发两点间信号的椭圆传播区域,计算该椭圆区域的建筑物面积占比a,如图2所示。

图2 基于菲涅尔区域的椭圆区域示意图

得到等价建筑物区块总宽度B:

B=L×a

(8)

式中:L为收发两点间的距离。

4 结果分析

4.1 改进自由空间损耗模型

由式(2)可以得到,自由空间损耗主要有两大参数决定,一是距离,二是路径损耗斜率γ。本文中使用发射点(ET,NT)、接收点(ER,NR)的经纬度计算两点之间的距离,公式如下:

S=2r·arcsin(sin2(NT-NR)+cos(NT)·

cos(NR)·sin2(ET-ER))1/2

(9)

式中:r=6 378.137 km为地球赤道半径。

测试地区的路径损耗斜率γ以前往往是参考类似地区的路径损耗斜率得到的,而每个地区的地形、建筑物分布、建筑物形状、街道走向又各不相同,因此引用其他地区的γ计算本地区的自由空间损耗往往会对近场距离以外的点造成自由空间损耗误差。本文将测试计算本地区的路径损耗斜率γ,从而提高自由空间损耗模型精度。将损耗数据进行线性分析,得到路径损耗斜率图如图3所示。

图3 路径损耗斜率图

取图3中的7组数据分别计算路径损耗斜率[12],再取平均值得:

γ=23.51 dB/dec

研究地区的微蜂窝路径损耗斜率为23.51 dB/dec。已知路径损耗斜率与距离,得到改进自由空间损耗模型与传统的自由空间损耗模型对比如图4所示。

图4 自由空间损耗模型

可以看出,自由空间损耗误差主要在近场距离以外,误差在1.5 dB 左右。

4.2 基于集成机器学习算法的建筑物损耗模型

将数据集按照3∶7的比例划分为测试集和训练集,使用随机森林、GBRT两种集成算法构建市区建筑物损耗的预测模型,模型的构建流程如图5所示。

图5 模型构建流程图

4.2.1参数设置

集成机器学习算法中回归树的数量是影响算法的预测性能的重要参数。本文依据模型在数据集上的评价参数(RMSE、R2)与回归树数量之间的关系曲线选择最佳的回归树数量进行模型训练,两种算法的关系曲线分别如图6和图7所示,其构建的市区建筑物场景的微蜂窝预测模型达到训练的最优。

(a)

(a)

由图6和图7得到构建集成损耗模型时的最佳回归树的数量如表2所示。

表2 回归模型回归树的选定

4.2.2建筑物损耗建模对比分析

本文选取了Lee建筑物损耗模型与随机森林、GBRT两种集成算法构建的模型进行对比,结果如图8-图10所示。

图8 GBRT建筑物损耗模型与实测模型对比

图9 随机森林建筑物损耗模型与实测模型对比

图10 Lee建筑物损耗模型与实测模型对比

图8、图9中横轴上的距离是由式(8)计算得到的信号传播区域中信号穿过的总宽度;图10中横轴上的距离是按照LEE建筑物模型简化算法得到信号穿过建筑物的总宽度。由图8-图10得到三种建筑损耗模型在测试集上的精度如表3所示。

表3 回归模型精度对比

由上述对比结果可得:(1)由集成回归算法构建的建筑物损耗模型普遍优于Lee建筑物损耗模型。(2)当RMSE和R2趋于稳定时,基于随机森林算法构建的模型的RMSE最小且R2最大,但是基于GBRT算法构建的模型恰恰相反,并且GBRT模型预测值与实测值误差明显大于随机森林模型。综上,基于随机森林算法构建的建筑物损耗模型是稳定而且最优越的。

5 微蜂窝模型评估

结合三种建筑物损耗模型和改进自由空间损耗模型得到微蜂窝模型预测曲线在测试集上的表现以及误差累计分布曲线如图11、图12所示。可以看出,基于随机森林构建的市区建筑物场景损耗模型最贴近测试集数据曲线,因此最终选择随机森林回归模型进行微蜂窝损耗分析。比较最终模型与实测损耗测试集数据发现,基于随机森林实现的市区建筑物场景微蜂窝模型的R2为0.918 5,RMSE为2.321 4,最大误差不超过4 dB。造成本次实验误差的原因分析如下:(1)由于接受天线架设的高度为2.5 m,测试时天线的抖动可能形成测试值与实际值存在偏差;(2)测试时来往行人和车辆的干扰也会造成实际值与测试值的偏差;(3)发射点与接收点的地势高度差产生的有效天线高度增益或损耗也会使实验数据产生误差。

图11 模型曲线对比

图12 误差累计分布曲线

6 结 语

在信号穿过市区建筑物的场景下,建筑物的阻挡使得电磁波在到达接收端时存在多路信号且多路信号之间存在相位差,多路信号的合成过程中形成了多径衰落,造成信号的衰减,同时也使得市区建筑物场景下微蜂窝的电波损耗预测难度增大[13-15]。随机森林、GBRT与最小二乘法相比较具有很大的优势,可以充分应用数据含有的特征而又不担心过拟合。使用基于随机森林算法构建的微蜂窝模型在预测损耗时,预测误差不超过4 dB,预测精度较高,可以有效精准地应用于城市环境下损耗的预测。由于市区建筑物的多样性以及测试环境周围的复杂性,造成信测试点信号衰减的因素也不尽相同,因此使用随机森林算法对市区建筑物的形状和测试环境进行分类判别,再结合实测数据分析。未来将对市区建筑物微蜂窝预测模型进行更进一步优化,并构建更贴近实际的微蜂窝模型。

猜你喜欢

自由空间蜂窝损耗
热塑性蜂窝板的平压性能分析
核电厂主泵专用变压器1级能效限值推算
多工况下永磁电机损耗研究分析
三电平ANPC变流器损耗平衡的SVPWM策略
蜂窝住宅
5G传播损耗及链路预算
“蜂窝”住进轮胎里
自由空间
自由空间
自由空间