APP下载

基于可信度估计的迭代滤波的WSNs数据融合算法*

2016-09-16宋喜忠黄淮学院信息工程学院河南驻马店463000

电子器件 2016年4期
关键词:测数据传感方差

刘 栓,宋喜忠(黄淮学院信息工程学院,河南驻马店463000)

基于可信度估计的迭代滤波的WSNs数据融合算法*

刘栓*,宋喜忠
(黄淮学院信息工程学院,河南驻马店463000)

传统的迭代滤波IF(Iterative filtering)算法假定传感节点的初始可信度相同,这有背于客观事实。为此,提出基于可信度估计的迭代滤波的WSNs数据融合ATIFDA(Ascertaining Trustworthinessof Sensor Node-based Iterative Filtering Data Aggregation)算法。ATIFDA算法利用最大似然估计MLE(Maximum Likelihood Estimation)计算每个传感节点的初始可信度。首先进行簇划分,每个簇选择一个簇头CH(Clusterhead),簇头收集传感节点的感测数据,然后,再利用MLE估计每个传感节点的初始可信度,再进行IF算法,最后,进行数据融合。仿真结果表明,与dKVD算法相比,提出的ATIFDA算法在噪声环境下,均方根误差RMSE(RootMean Squared error)降低了近43%。

无线传感网;数据融合;簇;可信度;最大似然估计;迭代滤波

为了提高数据传输效率,无线传感网WSNs (Wireless Sensor Networks)的融合节点AN(Aggregator Node)将来自多个传感节点提供的数据进行融合[1-3],然后再转发到基站(Base Station)。然而,由于计算能力和传感节点能量的受限特性,以往数据融合方案仅使用简单的融合算法,如平均算法。但是,简单融合算法很容量受到遭受到恶意攻击的侵害。因此,融合节点AN在数据融合之前需对各自传感节点数据进行可信度(Trustworthiness)估计。估计的方差应该接近于CRLB(Cramer Rao Lower bound)[4]。换而言之,方差应逼近于最大似然估计MLE(Maximum Likelihood Estimator)。尽管传感网络应用领域日益广泛,但是对分布式传感节点提供的感测数据进行估计仍是一项挑战性工作。不过,随着处理器的功耗减少、计算能力的增加以及成本的下降,传感节点能够承载较复杂的融合算法。例如,近期出现的多内核、多处理器的传感节点[5],具有高效、快速的计算数据处理能力。由于迭代滤波IF(Iterative Filtering)算法能够解决数据融合和数据可信度评估两项任务,其被广泛应用于WSNs。在IF算法中,可信度的估计是基于传感节点的感测数据与真实数据的估计值的差异。真实数据的估计值是通过上一轮迭代过程中所有传感节点感测数据的融合而获取的。近期,提出大量IF算法[6-13]。然而,这些算法在迭代初始时给所有传感节点赋予相同的可信度值,并没有进行差异化处理,这很容易遭受攻击者的攻击。为此,本文提出基于可信度估计的迭代滤波的WSNs数据融合 ATIFDA(Ascertaining Trustworthiness of sensor node-based Iterative Filtering Data Aggregation)算法。ATIFDA算法对每个传感节点提供的数据进行不同的可信度处理。利用传感节点的误差估计,计算每个传感节点的初始可信度,而不是像同类的IF算法那样,假定每个传感节点的初始可信度均相同。假定传感节点的误差是随机性的,并引用误差估计的偏差(Bias)和方差(Variance)概念。簇头CH(Cluster Head)先收集簇成员的感测数据,然后利用IF算法对数据进行处理,最后进行融合。

1 背景知识

1.1系统模型

考虑如图1所示的系统模型,将网络内传感节点形成不连通的簇(Cluster),每个Cluster有一个簇头CH,其担任数据融合的任务。每个Cluster的CH周期地向簇内成员收集数据,并进行融合,再向基站传输。此外,本文假定CH是可信的,未受到攻击。同时,假定CH具有足够的计算能力,能够快速运行IF算法。

图1 系统模型

1.2IF算法

首先,以WSN的数据融合为背景,简单地描述IF算法。考虑n个传感节点Si的WSN,且i=1,…,n。假定CH以特定时刻读取的一组数据为分析对象,每组数据由m个连续时隙的数据构成。因此,用矩阵表 示 一 组 数 据 ,其 中xi=表示传感节点Si的第i-m维数据。

当l=1,r(1)=X 1。那么第l+1轮的w(l+1)可利用函数 g(d)计算,如式(2)所示。其中,表示传感器感测数据的的与真实值的差异。

图2 常用IF算法步骤

算法1描述了常用IF算法的步骤。从上述可知,传统的IF算法在初始迭代时,给每个传感节点赋予相同的可信值,这是不合理。每个传感节点存在个体的差异性。为此,提出的ATIFDA算法利用传感节点的数据,估计传感节点的可信度,然后再进行融合。

2 ATIFDA算法

2.1算法框架

为了提高ATIFDA算法的性能,提出了一个估计传感节点的信任值的初始估计算法,将该初始估计值用于IF算法的初始迭代。大量传统算法是以样本均值(SampleMean)作为方差的估计值。据此,提出一个强健的方差估计算法。假定感测数据误差的组成部分是相互独立的随机变量,且服从高斯分布。

图3描述了ATIFDA算法的框架以及框架内部模块间的相互作用。如图3所示,首先估计传感节点的两个噪声参数,偏差(Bias)和方差(Variance)。然后,利用最大似然估计MLE算法估计可信向量的初始值,最后,利用可信向量的初始值估计每个传感节点的可信度,再进入初始IF算法。

图3 算法框架

2.2偏差Bias的估计

假定WSN中所有传感节点数据均有一些误差,传感节点S的误差为,且服从高斯随机分布,偏差Bias为bs、方差为σs,即~N(bs,σ)。设定rt表示在时间t的传感数据的真实值,因此,每个传感节点感测的数据,如式(3)所示。

由于不知道真实的传感数据rt,不能直接获取误差的值。但是,能够计算传感节点间误差差异值,为此。先定义δ(i,j):

据于式(6),引入拉格朗日多乘算子λ,可得:

通过设定F()b的梯度为零,便可得到Bias值的线性等式。若定义:

因此,可得:注意到获取的bi值实际上是传感节点i的误差的样本均值的近似值。

2.3方差估计

假定感测误差是由于相互独立的随机变量产生,那么Bias值bi为样本均值的近似值,因此可得:

类似地:

依据上式可知,通过计算矩阵 β可得Sensors Noise方差的估计值。依据使用以下引理,能够计算所有传感节点的方差和。

引理(总体方差) 设定x¯t为时隙t的感测数据的均值,利用式(10),并结合,可得:

同样,引入拉格朗日乘子λ,得到如式(18)的线性等式:

2.4最大似然估计M LE

2.2和2.3两节描述误差估计的偏差(Bias)和方差的计算过程。

再利用式(18)计算所得的υi替换σi。再对式(19)进行关于rt的微分,并令导数等式为零,便可得:

利用测量值期望值rt描述传感节点的初始可信值。即。

2.5ATIFDA算法

传统的IF算法假设所有传感节点的可信度相同,较脆弱,易受到攻击者的攻击。为此,提出的改进IF算法克服此缺点,依据传感节点的数据,计算每个传感节点的可信度,再进行迭代IF,流程图如图4所示。

图4 ATIFDA算法流程图

3 数据仿真

本节进行系统仿真,评估提出的算法在噪声差的环境下估计传感节点真实数据的能力。引用均方根误差RMSE(RootMean Squared Error)作为评估的性能指标。

3.1仿真参数

所有实验是基于HP电脑、采用3.30 GHz、Intel Core i5-2500处理器并使用Matlab R2012b软件。每次实验独立重复200次,取平均值作为最终仿真数据。传感节点数n=20,每个传感节点读取的连续数据时隙次数m=400。

表2 判别函数

在所有实验中,将提出的ATIFDA算法与3个其他的IF算法进行比较。第1个IF算法为文献[6]采用的dKVD算法。为了分析dKVD算法的性能,在仿真过程中引用判别函数,分别为g=d-1。选用的第2个IF算法为文献[7]提出的基于 rank的相关 IF算法 CR-IF(Correlation based ranking-IF)。最后一个IF算法为文献[8]提出基于权值平均的IF算法WA-IF(Weighted Averaging-based IF)。仿真过程中,采用的判别函数为=d-0.5。

利用 dKVD、CR-IF、WA-IF和本文提出的ATIFDA算法进行数据融合,并对比分析它们的性能。表2总结选用的3个IF算法的判别函数。

3.2误差环境下算法的准确性和有效性

在感测数据中接入高斯噪声(Gaussian Noise)。为了更充分发评估算法性能,引用以下4类不同的仿真场景数据。

(1)无偏误差(Unbiased Error)

图5显示了4类算法在无偏误差的环境下的RMSE情况。从图5可知,提出的ATIFDA算法的最低,并且随着σ的增加,优势越明显。

图5 无偏误差环境下的RM SE

(2)偏离误差(Biased Error)

本次实验,考虑偏离误差。在感测数据中插入偏离误差。因此,在时间t,传感节点s的误差ets服从偏离误差的正态分布,即从1变化至5。无偏差为零均值高斯分布的随机变量。仿真结果如图6所示。

图6 有偏误差环境下的RMSE

从图6可知,4类算法的RMSE的性能与无偏误差环境下的RMSE相近,这表明四类算法对偏差具胡强健性。此外,从图5可知,提出的ATIFDA算法的RMSE最低,进一步表明,提出的ATIFDA算法优于其他同类算法。

(3)相关噪声(Correlated Noise)

之前假定传感节点的误差是不相关的(Correlated),为此,进行实验,考查在相关的误差环境下算法的性能。选取幂指函数 ρ(Power Exponential)[15]作为协方差(Covariance)函数。此外,方差=s×σ2,相应地方差矩阵仿真结果如图 7所示。提出来的ATIFDA算法的RMSE优于其他算法,随着σs的增加,优势越明显。此外,与图5、图6相比,相关噪声环境下的,RMSE明显增加。

图7 相关噪声环境下的RMSE

4 总结

在无线传感网WSNs中,由于传感节点的计算能力和能量受限,数据聚集节点常采用简单的算法聚集来自其他传感节点的数据。简单的聚集算法强健性差,容易受到遭受噪声的影响。为此,本文提出基于簇化的最大似然估计的ATIFDA数据聚集算法。首先将传感节点进行簇划分,每个簇选择一个簇头,簇头承担数据收集聚集的任务。然后,再利用最大似然估计MLE估计每个传感节点的初始可信度,最后,进行数据聚集。仿真结果表明,提出的ATIFDA算法在噪声环境下,具有较低的RMSE。

[1] Misra S,Venkata Krishna P,Saritha V.LACAV:An Energy-Efficient Channel Assignment Mechanism for Vehicular Ad hoc Networks[J].JSupercomput,2012,62(3):1241-1262.

[2] 赵庆平.基于LEACH协议的WSNs楼宇环境监控系统的设计[J].电子器件,2014,37(3):493-497.

[3] 归奕红.无线传感器网络HEDSA数据聚合研究[J].计算机工程,2011,37(7):160-164.

[4] 付永生,李善平,周波.无线传感网络中能量均衡的连通支配集算法[J].传感技术学报,2010,23(8):114-1145.

[5] Shi H L,Hou K M.Energy Efficient and Fault Tolerant MulticoreW ireless Sensor Network:E2MWSN[C]//Proc 7th Int ConfWireless Commun,Netw Mobile Comput,2011:1-4.

[6] De C,Van P.Dooren.Iterative Filtering in reputation systems[J]. SIAM JMatrix AnalAppl,2010,31(4):1812-1834.

[7] Zhou Y,LeiT,Zhou T.A RobustRanking Algorithm to Spamming [J].Europhys Lett,2011,94(8):48-52.

[8] Laureti P,Moret L,Zhang Y C.Information Filtering Via Iterative Refinement[J].Europhys Lett,2006,75(8):1006-1012.

[9] Yu Y K,Zhang Y C.Decoding Information From Noisy,Redundant,and Intentionally Distorted Sources[J].Physica A:Statist Mech Appl,2006,7(8):732-744.

[10]Li R H,Yu JX,Huang X.Robust Reputationbased Ranking on Bipartite Rating Network[J].Proc SIAM Int Conf Data Mining,2012,56(8):612-623.

[11]Ayday E,Lee H,Fekri F.An Iterative Algorithm For Trust and Reputation Management[C]//Proc IEEE Int Conf Symp Inf Theory,2009,3(6):2051-2055.

[12]Liao H,Cimini G,Medo M.Measuring Quality,Reputation and Trust in Online Communities[C]//Proc 20 th Int Conf Found Intell Syst,Aug.2012,4(5):405-414.

[13]Chen B C,Guo J,Tseng B.User Reputation in a Comment Rating Environment[C]//Proc 17 th ACM SIGKDD Int Conf Know l Discovery DataMining,2011,56(8):159-167.

[14]RezvaniM,Ignjatovic A,Bertino E.Secure Data Aggregation Technique for Wireless Sensor Networks in the Presence of Collusion Attacks[J].School Comput Sciand Eng,Univ New South Wales,Kensington,NSW,Australia,Tech Rep,2013,34(6):23-31.

[15]Vuran M C,Akyildiz IF.Spatial Correlation-Based Collaborative Medium Access Control in Wireless Sensor Networks[J].IEEE/ ACM Trans Netw,2006,14(2):316-329.

刘栓(1978-),男,汉,河南新蔡县人,硕士,讲师,研究方向为图形图像、网络、智能信息处理,liu_liliu@126.com。

An Ascertaining Trustworthinessof Sensor Node-Based Iterative Filtering Data Aggregation A lgorithm in WSNs*

LIU Shuan*,SONGXizhong
(College of Information Engineering,HuanghuaiUniυersity,Zhumadian He'nan 463000,China)

As certaining trustworthiness of data is crucial for WSNs.Iterative filtering(IF)algorithms hold great promise for such a purpose.However,it is not reasonable to assume that the initial trustworthiness of sensor node is the same for traditional IF algorithm.Therefore,the ascertaining trustworthiness of sensor node-based iterative filtering data aggregation(ATIFDA)algorithm is proposed.In ATIFDA,initial trustworthiness of sensor node is estimated by MLE(Maximum Likelihood Estimation).Firstly,The sensor nodes are divided into disjoint clusters and each clusterhasa clusterhead(CH).Itcollects the reading ofsensors,and isused to estimate the initial trustworthiness by MLE.Secondly,CH would copewith these data by iterative filtering.Finally,the data aggregation is done. The simulation results show that the proposed routing algorithm outperforms the dKVD algorithm especially in the RootMean Squared error(RRSE),which is reduced about43%.

wireless sensor networks;data aggregation;cluster;trustworthiness;iterative filtering;maximum likelihood estimation

TP393

A

1005-9490(2016)04-0810-06

项目来源:河南省科技发展计划项目(132102210463);河南省教育厅科学技术研究重点项目(13A520786)

2015-08-25修改日期:2015-10-27

EEACC:6140;723010.3969/j.issn.1005-9490.2016.04.012

猜你喜欢

测数据传感方差
《传感技术学报》期刊征订
新型无酶便携式传感平台 两秒内测出果蔬农药残留
概率与统计(2)——离散型随机变量的期望与方差
方差越小越好?
计算方差用哪个公式
IPv6与ZigBee无线传感网互联网关的研究
小学学业质量监测数据的分析应用
方差生活秀
初中生体质健康测试分析——以2015年湖州市第四中学教育集团西山漾校区体测数据为例
基于PMU/SCADA混合量测数据兼容性的船舶系统状态估计研究