APP下载

基于贝叶斯信息准则的极化干涉SAR图像非监督分类

2012-07-25涂尚坦廖明生

电子与信息学报 2012年11期
关键词:标号极化类别

杨 文 颜 卫 涂尚坦 廖明生

①(武汉大学电子信息学院 武汉 430072)

②(武汉大学测绘遥感信息工程国家重点实验室 武汉 430079)

1 引言

极化干涉合成孔径雷达(Polarimetric Interferometry SAR, PolInSAR)是利用极化合成孔径雷达进行干涉测量的新型成像雷达。极化干涉合成孔径雷达通过极化信息和干涉信息的融合,有效地扩展了观测空间。极化干涉SAR不仅具有对目标散射体的精细物理形状敏感的特性,而且包含目标散射体空间分布的信息,大大提高了对地物的识别能力[1]。

非监督分类是极化干涉 SAR图像自动解译中最为基本和重要的应用之一,也是研究的热点领域。目前已有多种极化干涉 SAR非监督分类方法被提出来。2001年,文献[2]给出了利用L波段的E-SAR极化干涉SAR数据进行地物分类的精细分析,通过利用极化干涉熵和极化干涉各向异性度特征,有效地改善了初始分类的效果。2004年,文献[3]也利用极化干涉熵和极化干涉各向异性度进行极化干涉SAR非监督分类研究。2005年,文献[4]基于极化干涉 SAR数据相干系数在单位复数椭圆中的分布形状,并利用得到的椭圆率等参数对极化干涉SAR图像进行分类。文献[5]利用Shannon熵特征的强度,极化度和干涉3个分量,进行地物分类,获得了好的效果。文献[6,7]利用Shannon熵分解的强度,极化度和干涉度 3个贡献度来均等地利用极化干涉SAR数据强度,极化和干涉信息。实验结果表明了利用Shannon熵特征进行地物分类的有效性。

图像的非监督分类问题,本质上是判定哪些像素和哪些像素应该被分在一类中,也就是应该把哪些像素聚成一类,其中涉及到了每个像素类别标号的确定和聚类类数的确定[8]。在前文所提到的极化干涉SAR图像非监督分类算法中,主要侧重于研究如何更加准确地进行每个像素的标号确定,而对如何确定聚类类别数的研究较少。2007年,文献[9]利用自启动的方式来进行极化干涉 SAR数据非监督分类,同时利用极化干涉SAR中干涉相位差来自动确定类别数,获得了比较好的实验效果。但文献中只利用了部分极化干涉SAR数据信息来确定类别数,存在一定的偏差。同年,文献[10]利用对数似然函数作为判定准则,采用交叉验证的方式,在极化SAR图像非监督分类中确定最佳类别数。文献中利用对数似然函数的拐点来判断类别数,需要进行人工判定,存在一定的人为误差。

本文针对极化干涉 SAR图像非监督分类最佳类别数确定的问题,提出了在Wishart统计模型下,基于贝叶斯信息准则来自动确定最佳类别数的方法。为了提高极化干涉SAR非监督分类标号确定的准确性,本文利用Shannon熵分解特征中的强度,极化度和干涉3个分量对地物进行初始分类,然后利用期望最大化(Expectation-Maximization, EM)和标号代价(LabelCost)优化[11]算法对分类结果进行迭代优化,以获得稳定的分类结果。最后利用德国航空航天中心(German Aerospace Center, DLR)E-SAR机载SAR德国Oberpfaffenhofen 地区的极化干涉SAR数据和中国电子科技集团第38研究所(CETC 38)的机载 SAR海南陵水地区极化干涉SAR数据验证了算法的有效性。

2 Shannon熵特征

在极化干涉SAR数据的基础数学模型中,回波信号被定义成一个6维向量的形式,以表现两根天线不同极化通道的反射强度。

其中h,v表示不同方向的发射波。

极化干涉SAR协方差矩阵满足Wishart分布,其定义如下:

其中Γi为天线的极化协方差矩阵,包含了对应天线的极化信息。Ω12表示天线间的相干性,包含了两天线的干涉信息。

在标准的极化干涉SAR数据模型中,Shannon熵表示式如式(3)所示[12]。

极化干涉SAR数据的Shannon熵分解如下:

3 贝叶斯信息准则

图像的非监督分类问题,涉及到像素标号的确定和图像类别数确定的问题。传统的聚类算法,如Kmeans, EM等,聚类数目K需要预先根据经验给定。而聚类数目的不同,直接影响到分类结果的好坏。贝叶斯信息准则(Bayesian Information Criterion, BIC)是确定类别数目的常用方法,其定义如下:

其中Lk(X)是模型f(·|)在样本集X上的对数似然函数,是对模型复杂性(模型参数数目)的惩罚项。似然函数可以理解为条件概率的逆反,为了便于分析取对数变换,对数似然函数定义如下:

其中Θk为每一类的模型参数,xl为测试样本数据。对于极化干涉SAR图像非监督分类问题,一般利用极化干涉 SAR数据协方差矩阵进行分类。基于复Wishart分布可以得到

因此,基于复Wishart分布的BIC准则定义如下:

根据BIC准则,在同时考虑似然项和惩罚项的同时,通过寻找似然函数与类别数的变化曲线的最小值得到最佳类别数。

4 LabelCost能量优化

传统的迭代聚类算法都假定像素点之间是相互独立的,尤其是在SAR数据中,SAR图像中相干斑噪声干扰比较严重。为了抑制相干斑噪声对分类结果的影响,一般通过建立马尔科夫随机场(Markov Random Field, MRF),利用平滑先验信息,来提高分类精度和分类结果的可视性。

LabelCost算法,是Delong等人[13]最近提出的能量优化算法,其同时考虑了数据项,平滑代价项和标号代价项,从而将能量函数描述为3项之和,提高了算法的准确度与适用性,其能量函数表示如式(9):

其中,第1项为传统的数据代价项,表示观测数据信息对分类标号推理的势能,第2项为平滑代价项,主要考虑平滑先验信息的势能。第3项为标号代价项,主要考虑标号代价的势能。本文,基于EM迭代框架,利用LabelCost能量优化算法,通过引入平滑代价项和标号代价项,抑制相干斑噪声对分类结果的影响,从而有效的提高了非监督分类的精度。

5 算法具体流程

在本文中,分类算法首先利用Shannon熵特征进行初始分类,并利用EM算法和LabelCost算法进行迭代优化,获得稳定的聚类结果。同时利用BIC准则确定最佳类别数,从而获得在最佳类别数下的稳定的分类结果。算法具体的流程如图1所示,具体步骤如下:

图1 自动确定类别数的极化干涉SAR非监督分类流程

(1)从极化干涉 SAR协方差矩阵数据提取对应的Shannon熵特征,然后基于Shannon熵特征分解,得到强度,极化度和干涉度3个分量。

(2)根据强度,极化度和干涉度能量大小进行初始化分类。按照每种能量大小分别把图像分割成 3类,以有效利用极化干涉SAR数据中强度,极化和干涉3种不同的信息。

(3)融合3种不同贡献的分类结果,按照每种贡献的强度均分为3类,融合后图像被分割成了27类。将此结果作为初始分类结果启动算法中的外层迭代。只要类别数不是最佳类别数,每次外层迭代通过类类的聚合将类别数减少1类。

(4)在某一特定类别数情况下,在内层循环中,利用EM迭代和LabelCost能量优化算法来改善分类结果,以获得稳定的分类结果。

(5)在获得稳定的分类结果后,利用BIC准则判断是否为最佳类别数。如果不是最佳类别数,进行类的合并,重新开始进行内层循环。如果为最佳类别数,则跳出循环,并输出最佳类别数下的分类结果。

6 实验结果与分析

为了验证算法的有效性,本文利用E-SAR德国Oberpfaffenhofen 地区的极化干涉 SAR数据和CETC38的机载SAR海南陵水地区极化干涉SAR数据进行实验。Oberpfaffenhofen 地区的数据,其波段为L波段,分辨率为3.0 m×2.2 m,图像大小为1300像素×1200像素,平台高度为3 km,视角从25°变化到 60°。通过分析该地区的光学遥感图像,并结合地理坐标信息,标记对应的地面实况(ground truth)。海南陵水地区数据,其波段为X波段,分辨率为0.5 m×0.5 m,图像大小为1200像素×400像素,平台高度大约是7 km,视角为45°。通过实地考察标记了对应的地面真实图。

图2为Oberpfaffenhofen 地区数据分类结果,图2(b)-图2(i)分别为4-11类别数下的分类结果。从结果对比中可以看出,类别数在7类左右时,分类结果会比较好。图2(j)为不同类别下BIC准则函数的曲线图,曲线在8类时达到最小值,说明通过BIC准则判定最佳类别数为8类,这符合前面对类别数目的分析,在8类的情况下也获得了好的分类结果,说明了BIC准则判定的有效性。

如图3所示,图3(b)-图3(h)分别为海南陵水地区数据5-11类别数下的分类结果。从图3(i)中可以看到,BIC准则函数与类别数的变化曲线在第6类时取得最小值。因此确定最佳类别数为6类,对应的分类结果也好于其他类别数下的分类结果。同时,从分类结果图中也可以看到,在加入了标号代价项后,分类结果的噪声干扰现象得到了很好的抑制,分类目标区域也保持了很好的完整性。

图2 Oberpfaffenhofen 地区数据不同类别数下的分类结果

图3 海南陵水地区数据不同类别数下的分类结果

为了定量分析分类结果的好坏,引入纯度(Purity)和条件熵(Conditional Entropy, CE)参量来对分类结果进行评估。纯度和条件熵的定义如下:

其中q为真实的类别(class)数目(人为设定),k为实际分类所得类别(cluster)数目。表示原本属于第i种类别而最后被分为第r种类别的数据量大小。纯净度越高,熵就越低,说明非监督分类结果越好。表1和表2分别为Oberpfaffenhofen地区和海南陵水地区数据分类纯度和条件熵比较结果。方法1和方法2分别是用FastPD能量优化(没有考虑标号代价项)和LabelCost能量优化的非监督分类算法。

从表中可以看出,随着类别数的增加纯度会增大,然后趋于稳定。Oberpfaffenhofen地区数据的纯度在7类附近开始趋于稳定,说明最佳类别数为7类左右。海南陵水地区数据的纯度在 6类附近开始趋于稳定,说明最佳类别数为 6类左右。方法2使用了LabelCost能量优化算法,该优化算法不仅考虑了数据代价项和平滑代价项的影响,还考虑了标号代价项的影响,其分类结果更好,表现为纯度更高,条件熵更低。在海南陵水地区的数据实验结果中,其效果更好。

表1 Oberpfaffenhofen地区数据纯度和条件熵比较结果

表2 海南陵水地区地区数据纯度和条件熵比较结果

7 结论

本文提出了一种改进的极化干涉 SAR非监督分类算法,通过利用LabelCost能量优化,有效地抑制了噪声对分类结果的影响,目标区域完整性也得到了很好的保持。同时,利用BIC准则确定了非监督分类的最佳类别数,并在最佳类别数下获得了良好的分类结果。

[1]Cloude S R and Papathanassiou K P. Polarimetric SAR interferometry[J].IEEE Transactions on Geoscience and Remote Sensing, 1998, 35(5): 1551-1565.

[2]Ferro-Famil L, Pottier E, and Lee J S. Unsupervised classification and analysis of natural scenes from polarimetric interferometric SAR data [C]. Proceedings of International Geoscience and Remote Sensing Symposium(IGARSS),Sydney Australia, July 7-13, 2001: 2715-2717.

[3]杨震, 杨汝良, 刘秀清, 等. SAR 图像的极化干涉非监督Wishart分类方法和实验研究[J]. 电子与信息学报, 2004,26(5): 752-759.

Yang Zhen, Yang Ru-liang, Liu Xiu-qing,et al.. Study of polarimetric interferometric Wishart classification of SAR images[J].Journal of Electronics&Information Technology,2004, 26(5): 752-759.

[4]Neumann M, Reigber A, and Ferro-Famil L. Data classification based on PolInSAR coherence shapes[C].Proceedings of International Geoscience and Remote Sensing Symposium(IGARSS), Seoul, Korea, July 25-29, 2005:517-519.

[5]谈璐璐, 杨汝良, 商建, 等. 利用Shannon熵参数的极化干涉SAR图像非监督分类[J]. 电子学报, 2010, 38(10): 2264-2267.

Tan Lu-lu, Yang Ru-liang, Shang Jian,et al.. Unsupervised PolInSAR image classification with shannon entropy parameters[J].Acta Electronica Sinica, 2010, 38(10):2264-2267.

[6]Yan W, Yang W, Liu Y,et al.. Unsupervised classification of PolInSAR image based on shannon entropy characterization[C]. Proceedings of International Conference on Signal Processing Proceedings(ICSP), Oct. 24-28, 2010: 2192-2195.

[7]Yan W, Yang W, Sun H,et al.. Unsupervised Classification of PolInSAR data Based on shannon entropy characterization using iterative optimization[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing(JSTARS), 2011, 4(4): 949-959.

[8]代登信. 高分辨率SAR图像分类研究[D]. [硕士论文], 武汉大学, 2010.

Dai Deng-xin. Study on high-resolution SAR image classification[D]. [Master dissertation], Wuhan University,2010.

[9]Jäger M, Neumann M,et al.. A self initializing PolInSAR classifier using interferometric phase differences[J].IEEE Transactions on Geoscience and Remote Sensing, 2007,45(11): 3503-3518.

[10]Cao F, Hong W, Wu Y R,et al.. An unsupervised segmentation with an adaptive number of clusters using the SPAN H-α-A space and the complex Wishart clustering for fully polarimetric SAR data analysis[J].IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(11): 3454-3467.

[11]Delong A, Osokin A, Isack H.N,et al.. Fast approximate energy minimization with label costs [C]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco USA, Jan. 13-18, 2010:2173-2180.

[12]Morio J, Réfrégier P,et al.. A characterization of shannon entropy and bhattacharyya measure of contrast in polarimetric and interferometric SAR image[J].Proceedings of IEEE, 2009, 97(6): 1097-1108.

[13]Delong A, Osokin A, Isack H N,et al.. Fast approximate energy minimization with label costs[J].InternationalJournal of Computer Vision, 2012, 96(1): 1-27.

猜你喜欢

标号极化类别
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
壮字喃字同形字的三种类别及简要分析
非连通图2D3,4∪G的优美标号
服务类别
基于PWM控制的新型极化电源设计与实现
多类别复合资源的空间匹配
非连通图D3,4∪G的优美标号
非连通图(P1∨Pm)∪C4n∪P2的优美性
中医类别全科医师培养模式的探讨