APP下载

基于PGBN模型的SAR图像目标识别方法

2016-10-13郭丹丹丛玉来

电子与信息学报 2016年12期
关键词:识别率字典贝叶斯

郭丹丹 陈 渤 丛玉来 文 伟



基于PGBN模型的SAR图像目标识别方法

郭丹丹 陈 渤*丛玉来 文 伟

(西安电子科技大学雷达信号处理国家重点实验室 西安 710071)

特征提取是合成孔径雷达图像目标识别的关键步骤,也是难点之一。该文提出一种基于PGBN(Poisson Gamma Belief Network)模型的SAR图像目标识别方法。PGBN模型作为一种深层贝叶斯生成网络,利用伽马分布具有的高度非线性,从复杂的SAR图像数据中获得了更具结构化的多层特征表示,这种多层特征表示有效提高了SAR图像目标识别性能。为了获得更高的训练效率和识别率,该文进一步采用朴素贝叶斯准则提出了一种对PGBN模型进行分类的方法。实验采用MSTAR的3类目标数据进行了验证,结果表明通过该方法提取的特征有更好的结构信息,对SAR图像目标识别具有较好的性能。

SAR图像;特征提取;PGBN(Poisson Gamma Belief Network)模型

1 引言

SAR图像目标识别具有重要的商业价值和军事价值,一直是国内外研究的热点[1,2]。虽然近几年目标识别领域已经得到了极大的发展,但是准确快速地完成SAR图像目标识别仍然是一项充满挑战的任务。对于SAR图像目标识别来说,特征提取是其中十分关键的一步,特征提取的好坏直接影响SAR图像目标的识别性能,因此有必要对SAR图像进行有意义的特征提取,提高SAR图像目标识别性能。现在已经有了许多针对SAR图像的特征提取方法。例如:文献[3]采用PCA(Principal Component Analysis)对图像作特征提取,该方法属于线性特征提取方法,并不能得到数据的非线性特征;文献[4]采用KPCA(Kernel Principal Component Analysis)方法得到数据的非线性特征,对数据有更好的表征能力;文献[5]采用ICA(Independent Component Analysis)算法在假设各信号分量独立的基础上对信号进行分解,得到了生成信号的独立分量。上述提取SAR图像特征的方法很大程度上改善了SAR图像目标识别性能,但这些方法存在一个共同特点:当输入的数据具有非负性时,得到的字典与隐变量仍然存在负值,但是SAR图像数据中不可能有负的像素点,因此在物理意义上并不能得到很好的解释。

为了获得物理可解释的分解方法,文献[6]提出了非负矩阵分解(Non-negative Matrix Factorization, NMF)方法,文献[7]对该方法求解方式做了改进,提高了算法效率。NMF的主要思想是将输入矩阵近似分解为字典与隐变量的非负加权组合形式,获得了数据的基本结构信息,龙泓琳等人在文献[8]中采用NMF算法对SAR图像做了特征提取,相比于其他特征提取方法,该方法提取到了SAR图像内部结构信息,增加了目标识别性能。NMF采用优化方式进行求解,为了平衡各惩罚项需要通过交叉验证的方法对参数进行选择,具有较高运算复杂度。Zhou等人在文献[9]中提出了基于贝叶斯框架的非负矩阵分解模型(Poisson Factor Analysis, PFA)模型,有效避免了模型参数的选择问题。该模型将数据通过泊松分布表示为字典与隐变量加权组合的形式,并对隐变量采用伽马分布进行建模,应用PFA模型对数据建模获得数据结构信息,且先验的存在可以减少过拟合,对于数据及参数设置更具鲁棒性。

事实上,从SAR图像相干斑生成的角度看,每一个像素点可以看成由若干个散射点回波共同叠加的结果,在统计学上可以将散射点数量描述为一个服从泊松分布的随机过程[10],而PFA模型采用泊松分布对数据进行建模,是一个计数过程,这里可以将散射点数目看作服从泊松分布的变量,因此采用PFA模型对SAR图像数据进行建模在理论上是可行的。

虽然PFA模型可以对SAR图像进行特征提取,但是其作为单层模型,挖掘的信息属于较为简单的结构,为了提取更为丰富的数据结构特征,在深度学习的启发下,Zhou等人在文献[11]中提出了PGBN(Poisson Gamma Belief Network)模型。PGBN模型在PFA模型的基础上,构建了一个深层贝叶斯生成网络,在第1层通过泊松分布将数据表示为字典与隐变量非负加权组合的形式,然后将底层隐变量经伽马分布分解为高层隐变量与高层字典的乘积,使得其高层字典具有更为丰富的结构信息。与传统深层网络如深度置信网络(Deep Belief Network, DBN)[12]相比:在建模方式上,DBN模型对隐变量采用二值数据建模,而PGBN模型对隐变量采用伽马分布建模,伽马分布的存在增强了网络的非线性;在参数的训练方法上,DBN模型采用贪婪逐层堆叠策略训练网络参数,而PGBN模型利用吉布斯采样的方式对各层参数联合训练。

PGBN模型属于无监督模型,为了利用SAR图像的监督信息获得更好的目标识别结果,本文进一步提出了一种基于朴素贝叶斯分类准则对PGBN模型进行分类的方法(Naive Bayes Poisson Gamma Belief Network, NBPGBN)。NBPGBN模型除了在训练过程中引进类别信息,仍然采用原来的建模方式和求解方法。简单来说,NBPGBN模型采用PGBN模型分别训练各类数据,得到各类样本的字典,测试时采用朴素贝叶斯准则得到识别结果。

本文贡献主要有:(1)提出了一种基于PGBN模型提取SAR图像特征的方法,通过PGBN模型对SAR图像进行多层特征提取,获得了具有多层结构信息的SAR图像字典表示。(2)提出了一种基于朴素贝叶斯分类准则对PGBN模型进行分类的方法(NBPGBN),获得了具有区分能力的数据的多层特征表示。

2 基于PGBN模型的特征提取方法

2.1 PFA模型

PFA模型属于单层PGBN模型,为了便于理解,这里首先对PFA模型做简单介绍。PFA模型是贝叶斯生成模型,即在贝叶斯的框架下对数据进行非负分解,且由于SAR图像的相干斑特性,用泊松分布对数据进行分解是有意义的。

(2)

2.2 PGBN模型

PGBN模型是基于PFA模型的深层网络模型。该模型首先把数据通过泊松分布分解成字典和隐变量的乘积,然后将隐变量通过伽马分布的形状参数分解得到下一层的字典和隐变量的乘积,顶层隐变量共享伽马形状参数,层PGBN生成模型表示为

(4)

根据式(3)~式(5)可以写出PGBN模型参数的联合分布(为了保持公式的简洁,这里只列出字典和隐变量):

(6)

2.3 PGBN模型推理

该模型采用马尔科夫链蒙特卡洛(MCMC)方法对参数进行估计,基于Gibbs采样的算法具有可行性,这里采用Gibbs采样技术进行参数估计[13]。在Gibbs采样的每次迭代中,参数是从其条件后验分布的采样中获取的。根据PGBN模型参数的联合分布和贝叶斯公式推导出PGBN模型各个参数的条件后验分布。为了保证文章连贯性只给出几个主要变量的采样,采样过程中需要增广两个变量,在第层通过多项式分布采样增广变量,在第层通过CRT(Chinese Restaurant Table)分布采样增广变量,具体如下:

(9)

这里需要说明的是,该模型在给定网络层数时,采用联合学习方式训练模型,即上下吉布斯采样的方式。每次迭代时,先从向上采样得到,,,然后采样得到,,,计算得到,最后从向下采样得到。

3 基于PGBN模型的分类

上述PGBN模型属于无监督生成模型,训练过程中并没有用到类别信息,然而充分利用类别信息有利于识别性能的提高。鉴于此,本文提出了一种基于朴素贝叶斯准则[14]对PGBN模型进行分类的方法(NBPGBN)。NBPGBN模型首先对训练样本分类训练,得到各类样本字典,然后提取测试样本对应于各类字典的特征。每类字典分别对应每类样本的结构信息,即各类字典对所属类别的样本有最好的描述能力,因此当测试样本选择属于该类的字典时会得到最大后验概率。朴素贝叶斯准则将最高后验概率对应的类别作为测试样本的类别:

(12)

根据式(11)算出第个样本对应各类字典的似然值,然后将最大似然值所对应的类别选为样本类别。

4 实验结果与分析

4.1 实验数据

为了验证该方法的有效性,本文采用MSTAR公共数据集进行验证,该数据是由X波段聚束式SAR得到。图像大小为128128,分辨率为0.3 m0.3 m。该数据集包含了俯仰角为和的3类目标共7种型号。其中训练样本采用俯仰角为的目标图像,测试样本采用俯仰角为的目标图像,用于训练和测试的具体样本如表1所示,测试数据中存在与训练数据类型相同但型号不同的数据,该测试场景主要验证识别算法对于不同型号的同一目标的识别能力。将所有的训练数据经过上述预处理得到输入矩阵,然后分别在PGBN模型和监督PGBN模型上进行训练。

4.2 实验设置

该实验主要分为两大部分:第1部分是基于单层PGBN模型对SAR图像进行特征提取及分析,第2部分是基于多层PGBN模型和多层NBPGBN模型分别对SAR图像进行特征提取和分析。第1部分,首先将不同维度的单层PGBN模型分别与NMF, PCA和ICA进行比较,隐层维度分别设置为500, 400, 300, 200, 100;第2部分,由于MSTAR的3类目标数据训练样本较少,所以该网络深度只需要设置为3,各层隐变量维度分别为1000, 500, 200;实验结果将与多层RBM, DBN, SDBN, JSRC作比较。为了比较的公正性,NBPGBN模型采用朴素贝叶斯准则进行分类,DBN模型用Softmax分类器进行分类,其它模型的分类结果均采用SVM分类器得到,其中SVM 分类实验采用LIBSVM 算法包进行求解[15]。所有实验均在3.2 GHz加4 G内存的普通计算机上完成。训练NBPGBN 的时间大约为1 h,而每幅图像的测试时间大约在1 s。

4.3 实验结果

本文实验将从多方面验证该算法的可行性。首先给出采用上述实验数据得到的字典,通过分析字典来更深入地了解目标的局部信息,以及其对目标识别的意义;然后将基于本文方法得到的识别率分别与其他方法等进行比较。

4.3.1 数据字典的结果及分析 图2表示PGBN模型的3层字典。在给定3层网络的前提下,本文获得了每一层字典表示,为了保证字典的清晰性,图中只选了每层字典使用频率最高的前30列进行展示。第1层字典呈现出数据的基础结构信息,属于像素级别简单通用;从第2层字典中可以看出,该模型已经学到了部分目标结构信息,以及背景杂波和阴影信息;而模型第3层字典得到了数据的高层结构信息,完全可以将目标,背景杂波,阴影的结构分别表示出来。上述实验结果表明基于PGBN模型进行特征提取可以学到有物理意义的SAR图像多层结构信息。

图1 基于PGBN模型进行分类的流程图

表1 MSTAR 3类目标数据训练数据和测试数据

图2 PGBN模型关于MSTAR图像字典展示

图3所示为MSTAR图像字典使用情况对比,从结果可以看出,随着层数的增高字典变得更为稀疏,产生这种现象的主要原因有两个:字典随着层数增加变得更加结构化,通常一个样本只需由几个不同的高层字典构成,所以相较于底层字典,高层字典系数往往很稀疏;该模型有能力学到稀疏的字典系数,而稀疏性正是字典学习方法的理想特性。

图4所示为样本与各层字典之间的关系树图,根节点为训练样本图像。在给定样本图像的基础上,选取构成该样本的主要字典,即从中选取其中3维,这3个字典已经分别包含了样本图像的大部分结构,而且3个字典之间存在着明显区别;其次从中找出构成的主要字典,选出的字典同样具备上层字典的结构信息,但是6个字典之间的差异性已经降低;最后从中找出构成的主要字典,第1层字典存在着很少的结构信息,大部分属于像素级别信息,这些字典之间差异性再次降低,说明底层信息简单通用。从上到下观看图像字典树图时,字典信息变得越来越简单,阐述了各层字典之间的关系;从下到上的字典树图直观地表示了给定字典时样本的生成过程。

图5表示NBPGBN模型的字典,由于第1层字典代表比较基础的信息(如图2(a)所示),因此这里只画出了各类样本在第2层,第3层的字典。同样选取每一类字典使用频率最高的前30列进行对比。从图中可以看出每一类样本的高层字典变得更加结构化,且随着层数的增加各类样本字典之间区别逐渐明显,反映了各类样本字典具有不同的结构信息。采用NBPGBN模型提取SAR图像特征,可以得到各类样本的字典,通过比较各类字典之间的异同,有利于后期对于SAR图像的目标识别及分析。

4.3.2 识别率比较 表2所示为单层PGBN模型与其他方法识别率的比较。NMF方法是将输入矩阵分解为字典与隐变量的非负加权组合形式,模型求解采用迭代的方式依次对字典和隐变量进行更新,其缺点是需要通过交叉验证对参数进行选择,当隐变量维度逐渐增加时,由于样本数量过少和参数选择的问题,NMF方法的识别率先增加后减少,发生了过拟合。PCA方法直接求得数据协方差矩阵的特征向量,然后向选取的特征向量方向进行投影,但是对于SAR图像目标识别来说,该方法提取得到的特征向量含有负值,而负值在物理上是不可解释的。ICA方法在假设各信号分量是独立的基础上对数据进行分解,得到独立的基向量,当隐变量维度为100维和200维时,ICA方法获得了与单层PGBN模型很近似的识别率,但是随着维度的增加,该算法发生过拟合,导致其识别率逐渐降低。总结来讲,单层PGBN模型属于非负矩阵分解范畴,能够对非负数据提取物理意义的特征;单层PGBN模型基于贝叶斯框架,先验的存在可以有效减少过拟合现象,即模型随着隐变量维度增加变得更加复杂时识别率不会受到很大影响。因此相比于其他特征提取方法,单层PGBN模型可以获得更好的特征识别效果。

图3 MSTAR图像各层字典使用频率

图4 MSTAR图像字典树图

图5 NBPGBN模型关于MSTAR图像的字典

表3所示为多层PGBN和多层NBPGBN分别与其它方法识别率的比较。多层PGBN模型训练时并未用到监督信息,因此首先将多层RBM (Restricted Boltzmann Machine)模型[16]和多层PGBN模型做比较,在第1层时PGBN模型所得识别率已经超过多层RBM模型将近一个百分点,第2层多层RBM模型的识别率降低,而PGBN模型识别率却稳定增加,第3层时PGBN模型识别率持续增加到89.16%,优于多层RBM识别率。相比于PGBN模型,NBPGBN模型有两大优势:NBPGBN模型在训练时引进了监督信息,其识别率得到了提高;NBPGBN模型对样本分类训练,训练过程中采用并行方式,训练效率得到提升。SVM方法直接求得样本之间间隔最大的分离超平面,属于线性分类方法,KSVM方法利用核函数将SVM推广到非线性空间,属于非线性分类方法,这两种方法都属于MSTAR目标识别的常用方法。因此将SVM和KSVM对MSTAR 3类目标的识别率作为基准。为了比较公正性,这里将单层NBPGBN模型得到的结果分别与SVM和KSVM方法进行比较。直接用SVM进行分类,可以得到识别率为86.73%,采用KSVM方法可以得到90.2%的识别率,然而单层NBPGBN模型可以得到92.67%的识别率,因此采用NBPGBN模型提取特征有利于提高目标识别性能。DBN模型是由多层RBM堆叠而成,首先训练各层RBM,然后采用神经网络对参数进行微调,相比于多层RBM模型虽然其引进了监督信息来微调参数但其识别性能并未获得很大提高,相似性约束的深度置信网络(Similarity Deep Belief Network, SDBN)[17]在DBN模型增加了相似性约束,属于有监督的特征提取方法,但是其仍然采用贪婪逐层堆叠策略训练参数。如表3所示,SDBN模型相对于DBN模型识别率得到了提高,但其在第3层的识别率降低,表明网络性能不够稳定,两者与NBPGBN的整体对比结果表明:NBPGBN得到的目标识别结果更好,各层识别性能更加稳定。基于独立字典联合稀疏表示的分类方法(Joint Sparse Representation with independent dictionary based Classification, JSRC)[18]需要分割目标与阴影(该模型对分割阈值较为敏感),并对目标与阴影进行随机降维,再分别学习目标与阴影的字典,而NBPGBN模型无需上述复杂的预处理,具有较好的推广性和易实现性。结果对比表明,当采用简单的朴素贝叶斯准则对PGBN模型进行分类时,NBPGBN获得的识别效果优于上述其他方法,且NBPGBN模型是从非负矩阵分解的角度出发,相比于其他方法,可以获得有物理意义的SAR图像特征,如炮管等结构。由此可以反映出PGBN模型建模方式,联合训练策略和伽马分布的高度非线性使其得到的特征有较好的表征能力,而这种多层化的表示有利于提高目标识别性能。

表2 单层PGBN模型与其他方法识别率的比较(%)

表3多层PGBN模型识别率比较

5 总结

文中提出了一种基于PGBN模型的SAR图像目标识别方法,为了提高识别率和分类效率,进一步提出了一种基于朴素贝叶斯准则对PGBN模型进行分类的方法NBPGBN。采用上述方法对MSTAR 数据库中的3类目标图像数据进行验证和分析。对目标图像字典的多角度分析表明本文的NBPGBN方法能够提取出目标的多层结构信息;实验结果与其他特征提取方法识别率的比较,表明该模型有更好的稳定性和更高的识别率。

参考文献

[1] 张红, 王超, 张波. 高分辨率SAR图像目标识别[M]. 北京: 科学出版社, 2009: 5.2 节.

ZHANG Hong, WANG Chao, and ZHANG Bo. High Resolution SAR Images Target Recognition[M]. Beijing: Science Press, 2009: 5.2 Section.

[2] 保铮, 邢孟道, 王彤. 雷达成像技术[M]. 北京: 电子工业出版社, 2004: 1.1 节.

BAO Zheng, XING Mengdao, and WANG Tong. Radar Imaging Technology[M]. Beijing: Publishing House of Electronics Industry, 2004: 1.1 Section.

[3] HE Zhiguo, LU Jun, and YAO Kuanggang. A fast SAR target recognition approach using PCA features[C]. International Conference on Image and Graphics, Chengdu, China, 2007: 580-585.

[4] LIN C, PENG F, WANG B H,. Research on PCA and KPCA self-fusion based MSTAR SAR automatic target recognition algorithm[J], 2012, 10(4): 352-357.

[5] 宦若虹, 杨汝良. 基于ICA和SVM的SAR图像特征提取与目标识别[J]. 计算机工程, 2008, 34(13): 24-25.

HUAN Ruohong and YANG Ruliang. SAR images feature extraction and target recognition based on ICA and SVM[J]., 2008, 34(13): 24-25.

[6] LEE D D and SEUNG H S. Learning the parts of objects by non-negative matrix factorization[J]., 1999, 401(6755): 788-791.

[7] LEE D D and SEUNG H S. Algorithms for non-negative matrix factorization[C]. Neural Information Processing Systems, Denver, CO, USA, 2000: 556-562.

[8] 龙泓琳, 皮亦鸣, 曹宗杰. 基于非负矩阵分解的SAR图像目标识别[J]. 电子学报, 2010, 38(6): 1425-1429.

LONH Honglin, PI Yiming, and CAO Zongjie . Non-negative matrix factorization for target recognition[J]., 2010, 38(6): 1425-1429.

[9] ZHOU Mingyuan and CARIN Lawrence. Beta-negative binomial process and Poisson factor analysis[C]. Artificial Intelligence and Statistics. La Palma, Canary Islads, Spain, 2012: 1462-1471.

[10] 孙洪. 高分辨率SAR图像目标识别[M]. 北京: 电子工业出版社, 2013: 5.1 节.

SUN Hong. Processing of Synthetic Aperture Radar Images [M]. Beijing: Publishing House of Electronics Industry, 2013: 5.1 Section.

[11] ZHOU Mingyuan, CONG Yulai, and CHEN Bo. The Poisson Gamma belief network[C]. Neural Information Processing Systems, Montreal, Canda, 2015: 562-570.

[12] CHEN Y, ZHAO X, and JIA X. Spectral-Spatial classification of hyperspectral data based on deep belief network[J]., 2015, 8(6): 1-12. doi: 10.1109/JSTAR.2015.2388577.

[13] 张学峰. 雷达高分辨距离像目标识别与拒判方法研究[D]. [博士论文], 西安电子科技大学, 2016: 71-73.

ZHANG Xuefeng. Study of radar target recognition and outlier rejection based on high range resolution profiles[D]. [Ph.D. dissertation], Xi dian University, 2016: 71-73.

[14] LIU X, LIU R, MA J,. Privacy-preserving patent-centric clinical decision support system on Naïve Bayes classification [J].&, 2016, 20(2): 655-668. doi: 10.1109/JBHI.2015.2407157.

[15] CHAN Chihchung and LIN Chinjen. LIBSVM: A library for support vector machines[J]., 2011, 2(3): 1-27. doi: 10.1145/ 1961189.1961199.

[16] GE Hinton. A practical guide training restricted boltzmann machines[J]., 2010, 9(1): 599-619. doi: 10.007/ 978-3-642-35289-8_32.

[17] 丁军, 刘宏伟, 陈渤. 相似性约束的深度置信网络在SAR图像目标识别中的应用[J]. 电子与信息学报, 2016, 38(1): 91-103. doi: 10.11999/JEIT150366.

DING Jun, LIU Hongwei, and CHEN Bo. Application of similar constraints deep belief networks in SAR image target recognition[J].&, 2016, 38(1): 91-103. doi: 10.11999/JEIT150366.

[18] 丁军, 刘宏伟, 王英华, 等. 一种联合阴影和目标区域图像的SAR目标识别方法[J]. 电子与信息学报, 2015, 37(3): 594-600. doi: 10.11999/JEIT140713.

DING Jun, LIU Hongwei, WANG Yinghua,. The method of SAR target recognition with joint shadow region and target region image[J].&, 2015, 37(3): 594-600. doi: 10.11999/ JEIT140713.

郭丹丹: 女,1993年生,博士生,研究方向为统计机器学习、雷达自动目标识别.

陈 渤: 男,1979年生,教授,研究方向为雷达目标识别、统计机器学习,深度学习网络等.

丛玉来: 男,1988年生,博士生,研究方向为统计机器学习、雷达自动目标识别.

文 伟: 男,1987年生,博士生,研究方向为统计机器学习、SAR图像检测与识别.

SAR Image Recognition Method with Poisson Gamma Belief Network Model

GUO Dandan CHEN Bo CONG Yulai WEN Wei

(,,’710071,)

Feature extraction is a key step and difficult point in SAR image target recognition. This paper presents a novel method based on Poisson Gamma Belief Network (PGBN) for SAR image target recognition.As a deep Bayesian generative network, the PGBN model obtains a more structured multi-layer feature representation from the complex SAR image data using the high nonlinearity of the Gamma distribution, and the multi-layer feature representation effectively improves SAR image target recognition performance. In order to obtain a higher recognition rate and efficiency of training, this paper further proposes a method for classifying PGBN model based on the Naive Bayes rule. The experimental results about MSTAR dataset show that the feature extracted by this new method has better structure information, and it has better performance for SAR image target recognition.

SAR image; Feature extraction; Poisson Gamma Belief Network (PGBN) model

TN957.51

A

1009-5896(2016)12-2996-08

10.11999/JEIT161068

2016-10-12;改回日期:2016-12-02;

2016-12-14

陈渤 bchen@mail.xidian.edu.cn

国家自然科学基金(61372132, 61271291),新世纪优秀人才支持计划(NCET13-0945),杰出青年科学基金(61525105),青年千人计划

The National Natural Science Foundation of China (61372132, 61271291), The Program for New Century Excellent Talents (NCET13-0945), The National Science Fund for Distinguished Young Scholars (61525105), The Program for Young Thousand Talent by Chinese Central Government

猜你喜欢

识别率字典贝叶斯
基于贝叶斯解释回应被告人讲述的故事
基于类图像处理与向量化的大数据脚本攻击智能检测
字典的由来
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
大头熊的字典
正版字典
高速公路机电日常维护中车牌识别率分析系统的应用
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习