APP下载

面向智能巡检场景下的人员感知模型

2021-04-22宋曦尚为良张磊王琼

数字技术与应用 2021年2期
关键词:决策树高斯信道

宋曦 尚为良 张磊 王琼

(1.国网甘肃省电力公司,甘肃兰州 730030;2.甘肃同兴智能科技发展有限责任公司,甘肃兰州 730050;3.国网甘肃省电力公司信息通信公司,甘肃兰州 730050)

0 引言

随着人工智能的发展,在电网环境中智能巡检系统逐渐取代了人工巡检。虽然利用智能巡检系统可以提高巡检效率,但是人员的减少导致设备无人看管,设备的安全性无法得到保证,因此如何对侵入设备范围的人员进行检测与定位成为了亟需解决的问题。

早期的研究中,主要是使用传感器与摄像头对室内人员进行定位。文献[1]利用智能手机内置的声波传感器结合行人航迹推算(Pedestrian Dead Reckoning,PDR)算法对室内人员进行定位,文献[2]中提出了Flash-Loc系统,利用摄像头捕捉用户手机闪光灯发出的亮光从而对人员进行定位。利用传感器进行室内定位虽然精度很高,但是单个传感器造价昂贵,在大规模部署时成本太高。而摄像头在存在视线盲区且黑暗环境中无法稳定工作。所以需要一种高精度,低成本的设备解决上述问题。

WiFi技术的发展与无线设备的普及使其在众多室内定位技术中脱颖而出。基于WiFi信号的室内定位系统也被广泛研究。传统的WiFi定位主要依靠分析接收信号强度(Received Signal Strength,RSS)的变化来判断人员位置。如文献[3]提出了RADAR系统,利用接收信号强度进行室内人员定位,文献[4]中利用高斯滤波处理RSS信号,再利用三角形质心算法得出人员位置。但是由于RSS是粗粒度信号,且受环境影响时波动太大,影响了定位的精确性与稳定性。

不同于RSS信号,CSI信号是一种粒度更细分辨率更高的无线信道属性,且具有较强的抗多径干扰能力。基于CSI信号的室内定位已有了一定的研究成果。文献[5]利用一种融合粒子滤波与隐马尔科夫的粒子群优化—隐马尔科夫(PSO-HMM)算法对CSI信信号进行识别从而判断人员位置。文献[6]提出了Spotfi系统,利用CSI信号计算多径分量的到达角(Angle of Arrival,AOA)从而得出人员的位置信息。文献[7]提出的LiFS系统通过将多个无线链路的CSI测量建模为一组基于功率衰减的方程式来确定目标人员的位置。

基于上述特点,本文提出了一种基于CSI的室内人员感知模型。离线阶段,在商用无线设备上获取人员的CSI信号,之利用高斯滤波对初始CSI数据进行降噪处理,再使用PCA算法提取贡献最高的数据包并计算6个相关特征,利用提取的特征训练随机森林作为CSI位置数据的分类器。在线阶段,实时采集CSI信号后经过相同处理,通过对处理后的信号进行快速傅里叶变换构建能量指示器可以判断是否有人员入侵,通过随机森林模型对位置数据进行训练,最后输出定位结果。

1 相关理论

1.1 信道状态信息

信道状态信息是从物理层提取的信道特征,具有更细粒度的信息可以捕获附近环境的无线特征[8]。所以为了表现信号的传播过程,可以对其进行建模:

其中,Y为接收信号,X为发射信号,Noise为环境噪声。H为信道矩阵模型,可以表示为CSI,H的结构可以表示为:

其中,H(k)为第n条子载波上的CSI。H(kn)中都包含了子载波的振幅与相位,其公式为:

式中,||H(kn)||为第n个子载波的振幅,ejsinθn为相位信息。当WiFi信号穿过不同位置的人体时,CSI的振幅就会发生不同的变化。利用这一原理,本文利用振幅测量每个人员的位置。

1.2 高斯滤波

高斯低通滤波器是一种平滑线性滤波器,对于服从正态分布的高频噪声具有良好的抑制效果[9]。高斯滤波器是基于高斯公式计算出来的,所以本文设计的高斯低通滤波器可以表示为:

式中,δ是标准差,在式中被称为高斯半径。δ2表示方差。η是均值。由于环境中的噪声为大部分都是高斯白噪声和高频多径噪声,所以利用高斯滤波器可以对其具有良好的过滤效果。

2 人员感知模型

2.1 数据获取及降噪

本文利用商用WiFi设备进行数据的传输与收发。实验设备配置了2条发射天线与3条接收天线,总共形成6条信道链路。采集到CSI一条信道的位置信息如图1所示。

图中可以看出,原始的CSI信息包含了大量的环境噪声,掩盖了人体了位置信息。所以本文利用高斯低通滤波器对原始的CSI位置信息进行过滤,过滤后的结果如图2所示。

图1 原始CSI人体信号Fig.1 Original CSI human body signal

从过滤后的结果可以看出,经过高斯滤波过滤后的位置信号有效去除了环境噪声,使人体的CSI位置信息更加明显,方便进行位置特征的提取。

2.2 特征提取

由于过滤后的数据包含很多数据包,数据量庞大,如果都用来当成样本的话计算复杂度太高,所以本文使用主成分分析(Principal Component Analysis,PCA)算法提取位置数据贡献度最高的一包数据作为该位置的代表信息。使用PCA算法提取的特征如图3所示。

从图中可以看出,利用PCA算法可以有效降低样本的复杂度,并将最具代表性的一包数据提取出来。之后计算该包数据的均值,中位数,方差,自相关系数,标准差,极差六个系数作为该位置的特征。这些特征都可以在一定程度上代表当前位置的信息,使最后的训练结果更加准确。

2.3 随机森林模型

Breiman提出的随机森林算法[10]通过对样本构建多棵决策树来对样本进行分类。其核心思想为每次构建的样本均为随机提取,最后每棵决策树均输出一个结果,通过投票的方式决定最终的分类结果,即票数最多的。随机森林的结构如图4所示。

图2 经过高斯滤波过滤后的CSI信号Fig.2 CSI signal after Gaussian filtering

图3 PCA算法提取的代表信息Fig.3 Representative information extracted by PCA algorithm

决策树的构建依赖于样本的基尼指数,基尼指数是指样本集的混乱程度,基尼指数越高,样本包含的类别就越复杂,构建的决策树就越准确。基尼指数的计算公式如下所示:

式中,N为样本的个数,ki为样本属于第i类的概率。本文使用CART决策树,对于给定的样本集M,其基尼指数计算如下:

图4 随机森林模型结构图Fig.4 Structure diagram of random forest model

其中Di为第i个样本值。若给定一个特征ω,可以将样本集M分M1与M2两部分,所以计算特征ω的基尼指数为:

通过上述公式计算所有特征的基尼指数,并从大到小排列,选取排名前四的特征构建决策树。根据计算结果,本文选取标准差,方差,均值以及自相关系数四个特征。由于不需要剪枝,所以每棵决策树完全生长,通过构建大量的位置决策树后集成为随机森林模型,用于对位置信息的训练和分类。

2.4 FFT入侵能量指标

人体存在会对无线通信链路的传播路径产生影响,具体的来说,无线通信链路产生的影响表现为信道频域上的能量变化,入侵检测的核心问题是感知人体是否在入侵区域存在内。基于此,本文利用人员入侵时会改变信道的能量变化状态,将入侵时产生的CSI数据输入通过FFT处理,依据入侵和未入侵的信道能量变化建立一个能量阈值指标判断被检测区域内是否有人员存在。利用FFT对入侵状态和无人状态的CSI数据进行处理,多次采样,获得不同状态下的FFT曲线函数。存在人员入侵时和无入侵时的FFT曲线如图5所示。

对比图5(a)和图5(b),我们可以看出存在人员入侵时比人员未入侵时的信道能量变化更加频繁,未入侵时信道由于环境中的多径影响产生的能量变化微弱。因此,可以使用FFT建立一个来检测人体入侵的能量指示指标:

其中U是计算出的信道能量,L是给定的时间窗口大小,mag是每200ms条件下的归一化FFT系数,通过持续监视两个连续窗口的运动能量变化判断被检测区域是否存在入侵情况。

图5 无人状态与人员入侵时FFT能量指示Fig.5 FFT energy indication when no one is in a state and when people invade

3 实验与评估

3.1 实验设置

本文设置了两种实验环境,分别为实验室与机房。机房是模拟电力设备存在环境所布置的场景。实验场景平面结构如图6所示。

除此之外,本文设置了4名实验人员,在两种环境中采集了1200组位置信息作为样本集。

3.2 不同环境

本文在两种环境中对本文提出的方法进行测试,以此来验证本方法对环境的鲁棒性。图7为实验室和机房两种环境下的定位误差累积分布情况。

图6 实验场景平面结构图Fig.6 Plane structure diagram of experimental scene

从图7中可以看出,在实验室环境中,有90%以上的概率定位误差在1.5m以内,在机房环境中也有75%以上的概率达到1.5m的误差。而在两种环境中,都有90%以上的概率达到2m以内的定位误差。实验结果证明本方法在不同环境中表现出较强的鲁棒性和较好定位性能。

3.3 不同样本数的影响

不同的样本数也会对定位结果产生影响,所以我们也对比了利用不同数量样本构成的训练集对最终定位结果的影响。对比结果如图8所示。

从对比结果可以看出,随着样本数量逐渐上升,定位的误差也在逐渐降低。当样本集的数量达到600的时候定位误差到达最低点,当高于600时,定位误差逐渐稳定。所以本文选取600个样本做为训练集,既能达到最佳定位精度,也有效降低了训练的时间与复杂度。

图7 两种环境下定位误差累积分布对比Fig.7 Comparison of the cumulative distribution of positioning errors in the two environments

图8 不同训练样本个数对定位误差的影响Fig.8 The influence of the number of different training samples on the positioning error

表1 不同分类方法的定位误差Tab.1 Positioning errors of different classification methods

3.4 分类器效能评估

为了评估本文中设计的随机森林模型的分类效能,本文与分别与K近邻(k-Nearest Neighbor,KNN)算法,朴素贝叶斯算法以及支持向量机(Support Vector Machines,SVM)算法进行了对比,对比结果如表1所示。

表1分别对比了利用四种分类训练算法进行定位时的最大误差距离,最小误差距离以及平均误差距离。从对比结果可以看出,kNN算法和朴素贝叶斯算法的定位误差远高于另外两种算法。虽然SVM算法的最大误差距离要小于随机森林算法,但是从整体情况来看,本文利用的随机森林算法具有更好的定位表现。

4 总结

本文针对电力设备的安全保护问题提出了一种基于信道状态信息的室内人员感知模型,用于判断人员入侵并对入侵人员进行定位。离线阶段在商用WiFi设备上采集人员的数据,经过高斯滤波后利用PCA算法提取主要成分计算六种特征。之后使用所有特征数据构成随机森林模型并对其进行训练。在线阶段,实时采集人员的CSI数据,经过相同处理后先对其进行快速傅里叶变换做为能量指示器以判断是否存在人员入侵,处理后的数据输出随机森林模型中进行识别,最后输出定位结果。经实验证明,本文提出的模型对环境具有较强的鲁棒性,并具有较高的定位精度。在未来的研究中,本文将以进一步降低定位误差,增强系统的泛化能力做为研究目标。

猜你喜欢

决策树高斯信道
一种针对不均衡数据集的SVM决策树算法
天才数学家——高斯
决策树和随机森林方法在管理决策中的应用
基于决策树的出租车乘客出行目的识别
基于导频的OFDM信道估计技术
一种改进的基于DFT-MMSE的信道估计方法
有限域上高斯正规基的一个注记
基于肺癌CT的决策树模型在肺癌诊断中的应用
基于MED信道选择和虚拟嵌入块的YASS改进算法
一种基于GPU的数字信道化处理方法