APP下载

免校准的跨异构设备的室内定位方法

2020-01-17杨锦朋李晓薇

计算机工程与应用 2020年2期
关键词:测试点信号强度指纹

杨锦朋,常 俊,余 江,李晓薇

云南大学 信息学院,昆明650500

1 引言

人们对位置定位服务的需求正从室外走向室内,然而室内环境对无线信号的衰落效应使得基于GPS 卫星的成熟定位方法难于满足需要。目前,室内定位技术百花齐放,有定位精度达毫米级的专用定位系统,如红外、超声波和UWB 等,也有依托无线通信基础设施来扩展实现定位的定位系统,如公用移动通信网、WiFi、RFID和WSN 等。由于WiFi 性能优异,硬件成本较低,广泛部署于家庭、商场、办公楼等室内环境,因此,利用WiFi网络来进行室内无线定位,投入少,容易实现,是主要的技术选择[1-2]。

基于WiFi指纹的室内定位方法可获得比传统几何模型定位更高的精度,成为了研究的热点。然而,设备的异构问题、不同生厂商、不同型号的设备在测量WiFi接收信号强度时存在差异,从而对于位置指纹定位系统的准确性和稳定性产生严重的影响[3]。解决指纹定位设备异构问题的方法主要有两类,校准的方法和免校准的方法。校准的方法是通过对测试设备的RSS 向量进行补偿。文献[4]中,利用核估计的方法对测试设备RSS进行校准。文献[5]中,采用最小二乘法来建立异构设备RSS 值的线性关系进行校准。这些方法的缺点是需要对设备RSS 测量特性的学习,自动化程度不高,不能满足设备大规模接入的实时应用。免校准的方法是对原始指纹进行统一的处理,得到新的指纹。文献[3]中,提出了一种将RSS 值进行排序计算Levenshtein 距离特征,获取其对应的AP序列指纹,该方法的新指纹受环境影响大。文献[6]中,提出信号强度差(Signal Strength Difference,SSD)的方法,即通过取相邻AP 的RSS 的差值来作为指纹,新指纹一定程度减弱了设备异构的影响,定位复杂度也降低,但指纹特征会减少。Zou Han等人提出了一种信号趋势指数(Signal Tendency Index,STI)的方法[7],把处理后参考点指纹和测试点指纹的欧式距离作为STI,采用加权平均从关键参考指纹构建出新的测试点指纹。该方法改变指纹维度,但计算量大。文献[7]中提到利用普氏分析处理指纹,但并没有把标准化指纹作为直接的特征来进行定位。

免校准的方法与校准的方法相比,时延低,满足定位的实际应用需求,本文提出了基于极限机器学习的最强AP 分类标准化WiFi 指纹的免校准方法,即CLASSTDRSS-ELM方法。该方法结合最强AP分类、普氏分析和极限学习机,分类标准化WiFi 指纹,训练回归模型,并估计待定位节点的位置,减小了异构手机定位的精度偏差。

2 CLAS-STDRSS-ELM框架

2.1 问题分析

设备异构性问题是室内WiFi指纹定位中一个不可忽视的问题。导致异构设备测量差异的原因包括以下几个方面[8],一是在IEEE802.11 标准中,信号强度测量用于无线信道的估计,由0~255 的整数标识,缺乏相关的度量单位。二是终端采用的天线、基带芯片、硬件驱动和封装材料的不同,导致了灵敏度和衰减不同[9]。三是各个厂商按照自己的方式来测量信号强度,对信号强度的度量方式不同,导致了信号强度度量的差异性[10]。本文采用了四种异构类型的手机进行实验分析,四种手机的信息如表1所示。

表1 手机信息

图1 是四种手机在同一个参考点上采集来自8 个APs的RSS数据均值的曲线。

图1 四种手机AP编号与RSS值曲线

从图1 中看出不同手机在同一个位置所接收到来自8个APs的RSS值是明显不同的,MI 4LTE手机与vivo X5ProD手机相对接近,LG-ls990手机与ONE E1001手机差距相对大,图中不同手机从相同AP获得的RSS,最大相差10 dBm,说明了不同手机RSS确实存在差异。

在本文实验环境中,从不同手机采集来的大量数据来看,同一位置接收信号强度值最大相差15 dBm,对基于指纹匹配的定位方法会带来大偏差的位置估计。从图中可以看出不同曲线之间虽然有间隔,但是曲线的形状有一定的相似性,信号变化的趋势大致是相同的。

2.2 CLAS-STDRSS-ELM流程

如图2 所示,本文采用的基于ELM 的最强AP 分类标准化WiFi 指纹的室内定位方法(CLAS-STDRSSELM),分为离线模型训练阶段和在线定位阶段。

图2 CLAS-STDRSS-ELM方法流程

离线训练阶段,参考设备(Reference Device,RD)在参考点(Reference Point,RP)采集数据建立指纹库。采用最强AP法对指纹库指纹分类,分类数由AP的个数决定,假设采用n 个APs,指纹库就分为n 类,得到n 个子指纹库。之后利用普氏分析的方法对每个子指纹库进行处理,即对每条指纹的RSS 进行平移和缩放的操作,得到标准化的子指纹库。把每个标准化子指纹库作为训练样本,输入到ELM进行回归训练,得到每一类子指纹库的回归模型。

在线定位阶段,测试设备(Test Device,TD)采集在该实验环境内某一个待定位点来自所有参考APs 的RSS值。同样对其进行分类和标准化处理,假设划分为第k 类,就把经过分类和标准化处理后的RSS向量输入到第k 类训练好的ELM回归模型中,得到位置估计。

本文提出的CLAS-STDRSS-ELM 定位方法,结合了最强AP 法、普氏分析法、ELM。采用最强AP 法相较于其他分类方法可以快速对指纹进行分类,保证不同手机的同一类指纹特征的相似性,缩小定位的范围,实现粗定位;使用分类的指纹结合ELM进行回归训练,可以减少每类模型的隐藏节点数,提高效率,实现快速精定位。普氏分析方法处理分类的指纹,可以把RSS分布变为一个标准正态分布,使得不同手机采集的RSS有着同一分布,减少不同数据域之间分布的差异,接近一个统一标准指纹,为ELM 提供稳定的特征输入。ELM 是机器学习的方法,采用神经网络训练回归模型,实现定位,相较于传统的基于指纹匹配的定位方法,能够快速训练出泛化的模型,获得更加精确的位置估计。

3 CLAS-STDRSS-ELM定位模型

定义假设实验环境中设置m 个参考点,n 个APs,WiFi指纹库表示为FDB(L,RPS),其中L 为位置集合,RPS 为参考设备在参考点采集自所有AP 的RSS 向量集合。第i 个位置的指纹表示为Mi=(li,rpsi),Mi∈FDB,i=1,2,…,m ,其中第i 个位置的坐标li=(xi,yi),li∈L ,第i 个位置在第j 次采集的RSS 向量rpsi,j=表示在第i 个位置第j 次采集来自第n 个AP 的RSS。经过分类的指纹库表示为FDB={fdb1,fdb2,…,fdbn},标准化指纹库表示为:

STDFDB={stdfdb1,stdfdb2,…,stdfdbn}

测试设备(Test Device,TD)在本文实验环境内某一个待定位点采集来自所有参考APs的RSS值,表示为tdsi=[rss1i,rss2i,…,rssni],第k 类tdsi向量表示为标准化处理后的tdski表示为stdtdski=[stdrss1i,stdrss2i,…,stdrssni],k ∈1,2,…,n。

3.1 最强AP指纹分类

通过处理大量的采集数据,可以看出在与AP 接近的参考点,采集到的RSS 相对较大,符合信号空间传播模型中距离与接收信号强度成反比的关系和终端选择AP 接入WiFi 的过程。所以根据最强接收信号强度对应的AP 编号对指纹进行分类,能够把物理地址接近的指纹划分为一类。即使手机型号不同,但在同一位置最强RSS 对应的AP 编号也是相同,这样分类也能保证不同手机的同一类指纹特征的相似性。假设指纹最大RSS对应第k 个AP,就把这条指纹归为第k 类,所有的指纹都进行相同的分类处理,把指纹库的所有指纹划分为n 类,即FDB={fdb1,fdb2,…,fdbn},k ∈1,2,…,n,其中m, j=1,2,…,30。 fdbk中所有的最大RSS,都来自第k 个AP,这类指纹的位置与第k 个AP 比较接近,同一类指纹,物理坐标更为接近。

3.2 指纹标准化

在文献[10]中,采用了普氏分析的方法[11],一种在形状统计分析领域,用来进行图形比较的方法。采用普氏分析的方法比较两个或多个对象,即对这些对象进行最优的平移,统一的缩放和旋转。在本文的应用中,一条指纹就作为一个对象来处理,一条指纹是一个一维的对象,只对其进行平移和缩放处理,使其接近标准的参考对象。

假设测试设备在第i 个测试点采集一次的RSS 表示为tdsi=[。

先按照3.1节的方法对其进行分类,得到:

其中:

均匀缩放处理:

其中:

图3 是图1 数据经过标准化后的结果,从图3 可以看出不同手机在同一位置的RSS向量,经过标准化处理后,更加接近。

图3 四种手机AP编号与标准化RSS值曲线

3.3 极限学习机

极限学习机(ELM),发展自单隐含层前馈神经网络算法,其理论简单,隐含节点随机产生,输出权值解析得出,运行快速,应用广泛[12-14]。极限学习机可以用来压缩、特征学习、稀疏编码、聚类、回归拟合、分类等[15]。

利用ELM回归估计位置,在离线阶段训练模型,把STDFDB 中第k 类stdfdbk中的每条作为训练输入,对应物理坐标li为训练目标;在线阶段,把测试设备的输入模型中预测出测试点估计位置来。

假设一个有L 个隐层节点的单隐含层前馈神经网络,能够无错地估计出样本,可以得到ELM输出如下,

其中,au是输入权值,bu是偏置,βu是输出权值。

假设第k 类stdfdbk有N 个训练样本,可以获得:

其中:

Hk是第k 类训练样本隐藏层输出矩阵,βk是第k 类输出权值矩阵,Lk是训练目标矩阵。

通过求解代价函数的优化问题可以求出输出权值来。代价函数如下:即最小化每个训练样本的累积定位误差和最小化输出权值的L2范数。

ξi是的训练误差,与Lk的差,最小化ξi是为了获得更好的定位精度是正则项,最小化βk是为了防止模型过拟合,提高模型泛化能力,C 是用来平衡模型定位精度和泛化能力的超参数[16]。利用Moore Penrose广义逆H^ ,解析地确定输出权值向量βk的解,推导过程见文献[17]。

βk表示隐藏节点与输出节点之间的权值关系,表达了隐藏节点对输出节点贡献的权重。

4 实验环境和数据集

4.1 室内环境布局

本文实验环境如图4所示,包括了三条长度分别为60 m,63.6 m,40.5 m的走廊。在整个区域内布置了22个APs 在天花板上,距离地面约2.5 m,分布如图中所示。在环境中设置了158个采集点,即158个网格,每个网格1.2 m×1.2 m,其中选取143 个点作为参考点,15 个点作为测试点。

图4 实验场景平面图

4.2 数据集

为了讨论设备异构性问题,在实验中使用了四种异构类型的手机,包括了MI 4LTE,LG-ls990,ONE E1001,vivo X5ProD手机。其中MI 4LTE作为参考设备,采集158 个点的RSS,LG-ls990,ONE E1001,vivo X5ProD手机只采集15 个测试点的RSS。采集时所有手机保持在相同的高度1.2 m,同一朝向。在每个点隔3 s采集一次来自所有APs的RSS,一共采集30次。通过处理采集来的数据,发现最小的接收信号强度值为-93 dBm,把测不到的点赋值为-100 dBm。

4.3 CLAS-STDRSS-ELM定位算法

在本文的实验场景下,采集数据,利用CLASSTDRSS-ELM 的方法对测试点进行定位,分析本文方法的性能,具体步骤如下。

算法1 CLAS-STDRSS-ELM

训练阶段:

输入:标准化子指纹库STDFDB;激活函数G ,隐藏节点数L,超参数C

输出:第k 类模型的输出参数βk

for k=1,2,…,n

(1)随机产生输入权值au,偏置bu;

(3)根据式(13)计算输出权值矩阵βk;

(4)保存第k 类模型参数:βk,au,bu,G,L;

end for

测试阶段:

输入:测试点的RSS 向量tdsi,测试点标准化RSS 向量,第i 个测试点的实际坐标li

for i=1,2,…,d(d 是tdsi的数量)

(1)对tdsi进行分类,得到分类号k;

(2)加载第k 类模型参数:βk,au,bu,G,L, 计算li=

end for

5 结果分析

使用定位误差和平均定位误差来评价定位的性能。定义定位误差Errori和平均定位误差AverErrori:

其中,(xi,yi)是第i 个测试点的实际坐标,()是第i个测试点的估计坐标,d 是测试点的总数。

实验比较四种方法的定位性能,分别是不对指纹进行处理,结合ELM的定位方法(RSS-ELM);对指纹进行标准化处理,结合ELM的定位方法(STDRSS-ELM);对指纹进行分类处理,结合ELM的定位方法(CLAS-RSSELM);对指纹进行分类,做标准化处理,结合ELM的定位方法(CLAS-STDRSS-ELM)。经过实验验证,RSSELM 和CLAS-RSS-ELM 中激活函数选取Hardlimit,隐藏节点数设置为370,超参数C 设置为2-7;STDRSSELM和CLAS-STDRSS-ELM的激活函数选Sigmiod,隐藏节点数设置为200,超参数C 设置为2-6。

5.1 超参数C 实验分析

图5是两种定位方法超参数C 和平均误差的关系,参数C 是一个平衡定位误差和泛化能力的参数,一般设置为2的指数幂。从图中可以看出超参数C 大,参考设备MI 4LTE 的平均误差小,但是与测试设备平均误差差别大,说明训练模型偏重获得小的定位误差,弱化泛化能力。超参数C 小,参考设备与测试设备的平均误差差距相较小,说明训练模型,偏重模型的泛化能力。

5.2 四种手机不同定位方法实验分析

表2 采用不同定位算法四种设备最大误差,最小误差,平均误差的比较,本文采用的CLAS-STDRSS-ELM定位方法,缩小了定位误差,降低了不同设备定位精度的差异。对比RSS-ELM 方法MI 4LTE 手机定位精度有7.5%提升,LG-ls990 手机有33.7%提升,ONE E1001手机有35%提升,vivo X5ProD 手机有53%提升;对比STDRSS-ELM方法,参考设备MI 4LTE 手机定位效果差异不大,其他手机分别有13.9%、30%、51.7%的提高;对比CLAS-RSS-ELM方法,定位性能分别有8.7%、8.6%、3.7%、11.6%的提升,实验结果说明CLAS-STDRSSELM定位方法对于异构的手机定位效果更好。

MI 4LTE 手机与ONE E1001 手机的WiFi 模块和操作系统相同,但是定位的精度也有所差异,主要是由于两款手机的天线、封装材质、内核版本均不同,综合这些因素造成了WiFi信号强度的差异。

图6 是四种手机采用不同方法的平均定位误差的累积概率分布。当定位误差小于等于2.9 m 时,CLASSTDRSS-ELM 方法的置信度为53%,RSS-ELM 方法的置信度为14.5%,STDRSS-ELM 方法的置信度为16%,CLAS-RSS-ELM 方法的置信度为46%。四种定位方法的平均定位误差分别是2.89 m,4.53 m,4.06 m,3.14 m,实验结果说明,先对指纹进行分类,对于定位的性能有很大提高,采用标准化指纹对于不同设备的定位误差都有所提高。

表2 各种定位方法的误差比较 m

图6 不同定位方法的平均定位误差累积概率分布

5.3 不同免校准定位方法实验分析

图7 是四种手机采用不同指纹处理方法的平均定位误差的累积概率分布,分别是信号强度差(SSD),双曲线指纹(Hyperbolic Location Fingerprinting,HLF),绝对RSS 指纹,标准化指纹(STD)。CLAS-SSDRSSELM、CLAS-RSS-ELM、CLAS-HLFRSS-ELM、CLASSTDRSS-ELM 方法四种手机的平均定位误差分别是3.47 m,3.14 m,3.01 m,2.89 m。SSD的方法理论上可以减少不同手机之间的差异,但是存在环境的影响,SSD减少了指纹的维度,所以定位精度比不上绝对RSS 指纹。本文中HLF 的方法,只采用了所有HLF 的一个独立的子集,即用相邻AP间的归一化对数信号强度比,比起一般HLF减少了计算量,比起绝对信号强度减少了一个维度,但是这个新的指纹更加稳定,能够反映相邻AP间RSS 的相对强弱,进而反映采集点与AP 之间的远近关系。STD的方法通过平移和缩放变化,可以把RSS分布变为一个标准正态分布,使得不同手机采集的RSS有着同一分布,减少不同数据域之间分布的差异,得到稳定的特征,能够训练出更加泛化的模型。

图7 不同定位方法的平均定位误差累积概率分布

6 结束语

针对基于WiFi指纹的室内定位中存在设备异构的问题,在本文的实验环境下,根据指纹最大RSS 的对应AP 编号对指纹进行分类,对分类指纹进行平移和缩放处理,得到标准化形式,结合ELM 的回归方法,训练不同类的模型,标准化的测试设备RSS向量输入同类模型中,获得位置估计。实验结果表明,采用最强AP法对指纹分类,定位精度有提高,采用CLAS-STDRSS-ELM的方法,相比其他方法,对于异构的设备,定位精度有提高,稳定性好,鲁棒性提高。从采集来的数据可以看出少量的指纹并不是对应最接近的AP接收到的RSS值比较大,这可能是在测数据时环境扰动造成的,后面考虑加入滤波对指纹进行处理,消除异常影响,学习深层的指纹特征,建立长期稳定的指纹库。

猜你喜欢

测试点信号强度指纹
矿山长距离胶带机动力特性测试及运行分析
光学相干断层成像不同扫描信号强度对视盘RNFL厚度分析的影响
基于信息熵可信度的测试点选择方法研究
电子自旋共振波谱法检测60Co-γ射线辐照中药材
像侦探一样提取指纹
为什么每个人的指纹都不一样
逻辑内建自测试双重过滤测试点选取策略
室内定位信号强度—距离关系模型构建与分析
WiFi信号强度空间分辨率的研究分析
基于自适应稀疏变换的指纹图像压缩