APP下载

基于直方图的mass函数构造方法*

2014-03-23李文艺

关键词:构造方法直方图神经网络

李文艺,刘 春,李 彪

(1.宿州学院机械与电子工程学院,安徽 宿州 234000;2.河南大学计算机与信息工程学院,河南 开封 475000)

证据理论是一种不确定推理方法[1-2],获取有效的mass函数是该理论应用于实际的关键所在。一旦获取了该函数,接下的工作就是利用Dempster公式对多个mass函数进行合成运算,再根据合成的结果进行判决。从目前来看,已有的获取mass函数的方法可以分为两类:一类是利用专家的经验来构造mass函数;另一类是根据已知的信息根据一定的条件自动生成函数。前一类方法容易获取mass函数,但是由于每个专家的偏好不同、经验不同,给出的mass函数有很大的主观性。不同的专家可能会给出相反的证据,此时利用Dempster公式进行合成时可能出现错误的结果。而后一类方法,比如模糊方法,熵函数方法,粗糙集方法等[3-12],采用自动生成的方法可以不受个人主观因素的影响,比较客观的获取mass函数, 在一定程度上解决了mass函数的获取。

针对mass函数的获取方法,本文给出了一种基于直方图的mass函数的构造方法。该方法首先获取样本特征的直方图,再用特征的直方图构造出mass函数。其基本思想是不同的样本特征的直方图可能会有重叠部分,则在直方图重叠部分样本提供的信息具有一定的不确定性,重叠的程度大说明不确定性就大,重叠程度小说明确定性就较大,在直方图不重叠部分,样本提供的信息具有较大的确定性,所以可以利用直方图重叠程度来确定mass函数的确定程度。该方法的优点是在样本较少,或者较大时都可以得到有效的mass函数。通过对鸢尾属植物进行分类实验,显示本文所提出的方法正确分类率达到96.64%,这说明了本文方法的有效性。

1 证据理论

设非空集合Θ是一个完备集合,应包含问题的所有可能,称为Θ识别框架。2Θ为Θ的幂集,函数m为2Θ到[0,1]的映射,即m:2Θ→[0,1],则映射m称为基本概率分配函数,又称mass函数。若A∈2Θ,m应满足以下条件

其中Ø为空集,若m(A)>0,则称A为证据的焦元。

假设m1,m2为识别框架Θ下的两个证据的mass函数,可以利用Dempster合成公式对证据进行合成,Dempster公式如下

2 基于直方图的mass函数构造方法

本节将详细介绍基于直方图的mass函数构造方法的基本思想和基本过程。

2.1 基本思想

假如有A,B,C三类样本,每一类样本都有k个特征可供利用,分别记为x1,…,xk。假设A,B,C三类样本的特征x1分布区间分别是[c,d],[a,e],[b,f](如图1所示)。在区间[a,b]与[e,f]中样本不存在重叠,现有一待识别对象为s,根据s的k特征确定s的归属。若x1∈[a,b],由x1构造的mass函数应该对s∈B有很大的支持度;若x1∈[e,f],由x1构造的mass函数应该对s∈C有很大的支持度。区间[b,c]与区间[d,e]中B,C样本的特征存在重叠,若x1∈[b,c]或x1∈[d,e],由x1构成的mass函数应同时支持s∈C,s∈B;此时mass函数值对B,C的支持程度与x1附近B,C两种样本的数量紧密相关。若x1附近C类样本数比B类样本数多,x1形成的mass函数对s∈C的支持程度大于s∈B支持程度,反之亦然。如果x1∈[c,d],mass函数应该A、B、C三类都有所支持,具体对A、B、C的支持程度同样取决于x1附近样本数目的三类样本数目。x1附近那类样本数量多,特征x1生成的mass函数应该对此类有较大的支持程度。为了避免某些特征构成的mass函数,“一票否决”现象,设定mass函数对框架Θ函数值不为0。

图1 样本分布区间

2.2 基本过程

假设有N个可能的识别结果,辨识框架记为Θ={A1,A2,A3,…,AN}。设框架中每个元素的M个特征分别记为Θ={A1,A2,A3,…,AN} ;下面仅以特征x1为例说明由样本特征构造mass函数的具体步骤。

步骤5 特征x1构成的mass函数记为m1,m1(Ai)表示x1支持Ai的程度。现有一个未知对象a,若a的特征x1∈Δj此时特征x1构成的mass为

对余下的M-1个特征按照以上步骤可以分别生成m2,m3,…,mM。容易验证对于由x1产生的mass函数之和为1,这完全满足mass函数的条件。α应是一个较小的数值,通常α∈(0,0.3]。利用Dempster合成公式对多个特征进行融合,可以完成多特征融合的分类器设计。

3 仿真实验

鸢尾属植物样本的数据集中共有三类植物分别是Iris-Setsoa, Iris-Versicolor, Iris-Virgninca;每类样本50个,共有150个样本。每个样本包含四个特征,分别是含萼片长度,萼片宽度,花瓣长度,花瓣宽度[13]。本文利用该样本数据进行仿真实验来验证所提方法的可行性。

具体的仿真实验过程如下:对样本数据进行预处理,去除“野点”后余下149个样本。样本的特征范围(单位cm)以及每个特征直方图的区间个数如表1所示。首先利用本文方法构造出每个特征对应的mass函数;然后采用Dempster公式融合不同鸢尾属植物的四个特征;再根据融合结果完成对三种鸢尾属植物的分类工作,判决规则采用最大化mass函数值的原则。

对样本数据采用“留一法”进行测试,采用不同的方法进行实验,结果如表2所示。对待识别对象的萼片长度、萼片宽度、花瓣长度、花瓣宽度分别加上不同方差的干扰信号(干扰信号的平均值等于该类样本特征的平均值),使用本文方法进行分类的结果如表3所示。

表1 样本数据

表2 不同方法的实验结果

表3 不同干扰情况下的实验结果

分别采用BP神经网络、支持向量机、聚类分析以及本文方法进行了分类实验,结果如表2所示。由表2可见采用本文方法的正确识别率为96.64%,明显高于支持向量机、神经网络与聚类分析方法。在被识别对象的特征受到干扰时,实验结果如表3所示。由表3可看出在干扰较小时,本文方法保持了原有的识别率;在干扰增大时,本文方法仍能获得较为理想的实验效果;在干扰信号较大时识别率为85.23%,此时识别率仍然优于表2中的神经网络与聚类分析方法。

在样本较少时可以把直方图的组距设计的大些,并利用mass函数构造过程中的步骤4与步骤5,这样在小样本的情况下同样可以生成可用的mass函数。此时不会出现神经网络中的欠学习的问题;其次使用本文方法时不用纠结于神经网络中神经元个数的选择,同时也避免了神经网络结构的选择。在样本数量很大时直方图的组距可以设计的小一些,此时每一个子区间内样本的频率更接近特征分布密度函数在该区间内的平均值,这会使结果更准确而不会出现神经网络中的过学习问题。利用本文方法进行多特征融合时,由于单个特征的mass函数精度对于最终融合结果影响不明显,所以在待识别对象的特征存在干扰时仍能取得较好的识别率。

4 结 论

针对证据理论的使用中mass函数的构造问题,提出了一种利用直方图思想构造mass函数的方法,该方法可以利用样本的特征构造出需要的mass函数,利用Dempster规则合成多个特征的mass函数值,即可实现多特征融合的模式识别方法。把该方法用于鸢尾属植物的分类实验中,在没有干扰的情况下,分类正确率达到96.64%。在被识别样本特征受到干扰时,使用本文方法仍然可以获得较为理想的识别效果。文中的实验说明了该方法可以很好的构造出所需要的mass函数。由于在实际的模式识别中通常都需要利用对象的多个特征进行识别,只要有少量的样本就可以使用本文方法构造出样本中每类特征对应的mass函数。在进行多传感器融合时,若有多个传感器的输出数据作为样本,利用本文方法可以构造出每个传感器的mass函数,可实现多传感器的信息融合。

参考文献:

[1]DEMPSTER A P. Upper and lower probabilities induced by a multi-valued mapping [J]. Annuals of Mathematics Statistics, 1967, 38(4): 325-339.

[2]SHAFER G. A mathematical theory of evidence [M]. Princeton: Princeton University Press,1976.

[3]康兵义,李娅,邓勇,等. 基于区间数的基本概率指派生成方法及应用[J].电子学报, 2012, 40(6):1092-1096.

[4]王俊林,张剑云. 基于统计证据的Mass函数和D-S证据理论的多传感器目标识别[J].传感技术学报, 2006, 19(3): 862-864.

[5]江四厚,王汉功,阳能军. 基于熵的Mass函数算法及在液压泵故障诊断中的应用[J]. 机床与液压, 2007, 35(12):185-187.

[6]DENG Y, SHI W K, ZHU Z F, et al. Combining belief functions based on distance of evidence [J]. Decision Support Systems, 2004, 38(3): 489-493.

[7]DENG Y, JIANG W, XU X, et al. Determining BPA under uncertainty environments and its application in data fusion [J]. Journal of Electronics(China), 2009, 26(1): 13-17.

[8]肖建于,童敏明,朱昌杰,等.基于广义三角模糊数的基本概率赋值构造方法[J]. 仪器仪表学报,2012, 33(2): 429-434.

[9]孔金生,李文艺. 基于模糊集合的mass函数构造方法[J]. 计算机工程与应用, 2008, 44(20): 152-154.

[10]韩峰,杨万海,袁晓光. 基于模糊集合的证据理论信息融合方法[J]. 控制与决策, 2010, 25(3):449-452.

[11]蒋雯,张安,杨奇. 一种基本概率指派的模糊生成及其在数据融合中的应用[J]. 传感技术学报, 2008, 21(10): 1717-1720.

[12]刘雷健,扬静宇. 基于融合信息的物体识别[J]. 模式识别与人工智能, 1993, 6(1): 27-33.

[13]IrisData Set. Famous database for pattern recognition from Fisher [OL]. [2011-3-20]http://archive.ics.uci.edu/ml/datasets/Iris

猜你喜欢

构造方法直方图神经网络
符合差分隐私的流数据统计直方图发布
面向可靠性预计的软件运行时行为模型构造方法
基于递归模糊神经网络的风电平滑控制策略
基于FPGA的直方图均衡图像增强算法设计及实现
神经网络抑制无线通信干扰探究
基于Python构造方法与析构方法的研究
基于神经网络的中小学生情感分析
用直方图控制画面影调
中考频数分布直方图题型展示
基于支持向量机回归和RBF神经网络的PID整定