APP下载

基于多级特征稀疏表示的遥感图像分类

2021-08-06任会峰朱洪前董庆超

关键词:增益分类器滤波器

任会峰,朱洪前,唐 玥,董庆超

(1.无锡学院,江苏 无锡 214105;2.中南林业科技大学 材料科学与工程学院,长沙 410004;3.海军航空大学 岸防兵学院,山东 烟台 264001)

遥感图像分类是高光谱遥感图像处理的重要分支,在城市规划、智能农业、环境保护、地质勘探、抢险救灾以及军事侦察等领域应用广泛[1-2]。目前主要依据地物图像的空间信息分类识别遥感图像场景[3]。在计算机运算能力相对较低的早期,学者们主要依据遥感图像的局部特征进行分类[4-5],这些研究为遥感图像分类进行了积极探索,但由于探测波段和空间分辨率较低等因素的影响,遥感图像分类面临特征维数高、训练样本缺乏等问题,而且局部特征与遥感图像本身的语义之间存在“鸿沟”[6]。为了提高对遥感图像语义的理解和表示,相关学者在局部特征的基础上引入特征编码方法,如词袋模型BOW[7]以及结合稀疏表示[8-9]的改进算法,提高了对图像的描述能力[10-11]。机器学习方法中,传统字典学习通过最小化信号重构误差实现分类[12],不适用于图像分类,且图像细节的方向性影响局部特征的描述[13],不同尺度图像的细节也不同[14]。

将遥感图像在8个方向5个尺度进行高斯核分解后提取Gabor特征,并用改进的粒子群算法确定中心最大频率和带宽的最优取值,稀疏表示构建Gabor特征视觉词典,形成遥感图像稀疏系数矩阵输入分类器,在分类器中计算特征增益以区分不同特征的重要度,从而构建遥感图像多方向多尺度稀疏表示(multiple levels sparse representation,MLSR)特征增益SVM分类器,并在标准数据集上测试方法的优越性。

1 多级特征提取

Gabor滤波的多角度选择性较好地模拟了人类视觉感受,能在频域和空域获得最佳分辨率,对提取信息量高的特征非常有效[15]。因此,可通过二维Gabor滤波器组与遥感图像卷积运算获得频域范围内各角度和各尺度的局部特征和鉴别特征。

二维Gabor滤波器组由高斯包络调制的正弦波定义,其高斯核表达式为

二维Gabor滤波器组与遥感图像卷积运算按照式(5)从时域或空域转换到频域:

滤波器包含实部滤波和虚部滤波2个部分,选择实部操作,计算公式见式(6):

图1是二维Gabor滤波器组在5个尺度8个方向的实部图像。

图1 二维Gabor滤波器组在5个尺度8个方向的实部图像

二维Gabor滤波器组对遥感图像在各角度和各尺度的局部特征和鉴别特征的提取效果取决于其参数选择。组合参数最佳取值可以采用粒子群算法对中心最大频率kmax和带宽σ进行寻优。针对标准粒子群算法容易早熟且惯性权重线性递减导致进化后期算法收敛速度下降的问题,将惯性权重ω和加速因子c1和c2设置为最优点适应度的函数,如式(7)和式(8)所示:

式中:f(gk)是算法第k次迭代全局最优点适应度,α=1/f(g1),n∈(1,2),通常n取值为1.5。按照式(9)和(10)更新粒子的速度和位置。

式中:k=1,2,…,m是迭代次数,根据迭代次数线性递减惯性权重ω,加速因子c1和c2取值为2,r1和r2取值为均匀分布在闭区间[0,1]的随机数;pi和pg分别表示当前粒子历史最优点和全局最优点,搜索空间范围为kmax∈[0,2π]/2,带宽σ∈[0,2π]。适应度函数采用式(11)的加权欧氏距离计算,其中L为类别数,fi为待分类遥感图像经过第i个Gabor滤波器高斯核后的平均值,为第l类遥感图像经过第i个Gabor滤波器高斯核后的平均值和方差。

参数寻优算法如下:

步骤1初始化种群规模M,终止条件为迭代100次,随机生成每个粒子的位置xi和速度vi,i=1,2,…,M。

步骤2按照式(11)计算粒子的适应度f(xi)。

步骤3按照如下规则更新粒子的极值和全局极值:

步骤4若满足终止条件,则pg对应位置坐标即为最优组合参数取值,否则步骤5。

步骤5按式(7)和式(8)更新惯性权重和加速因子。

步骤6按照式(9)和(10)更新粒子的位置,返回步骤2。

采用改进的粒子群算法获得二维Gabor滤波器组的最优参数组合后,连接Gabor滤波器5个尺度和8个方向的实部共计5×8个输出,形成遥感图像的Gabor特征向量集F={f1,…,fV}。

2 图像特征稀疏表示

稀疏表示可用于遥感图像的特征聚类和生成可视化字典,在稀疏表示过程中,利用稀疏表示模型从遥感图像中提取空间特征[16],从而提高视觉词典的语义准确性,生成更健壮有效的遥感图像表示。给定Y=[y1,y2,…,yN]∈Rd×N为N个d维遥感图像Gabor特征向量的集合,其中yi为一个d维的Gabor特征描述子。B=[b1,b2,…,bM]∈Rd×M是一个具有M个聚类中心的字典,对每一个列向量yi稀疏表示的系数向量记为xi∈RM,X=[x1,x2,…,xN]∈RM×N是字典B上的系数矩阵,其中M<<N。

遥感图像稀疏表示就是求解字典B的过程,使得Y=BX,其中系数矩阵X中非零元素的数量远小于数据样本yi的数量,则求解系数矩阵X就是解决如下优化问题:

式中:‖·‖是l0范数,亦即X中非零元素的个数,尽管l0范数的求解是NP问题,但当系数足够稀疏时,可用l1范数代替l0范数从而获得稀疏表示系数矩阵。因此,可将上式转换为如下优化问题

式中,最小化代价函数由X中每一列的数据拟合和正则化项组成,参数λ是一个平衡数据保真度和解稀疏性的惩罚参数[17]。

3 特征增益分类器

不同类别的遥感图像地物特征位于不同的子空间,能够被该类训练样本组成的字典线性表示,而很难被其他类别的训练样本线性表示。

首先对遥感图像I提取多层次的Gabor特征,构建特征集F={f1,…,fV},根据式(13)和(14)采用开源工具SPAMS获得稀疏系数矩阵X和构造字典B,最后将稀疏系数矩阵作为SVM分类器的输入。SVM分类器用欧氏距离度量样本之间的相似度,每一维的特征对分类器的贡献存在差异,而传统SVM分类模型中假设所有特征对分类器的贡献相等,忽视了特征的重要度差异。信息论中“熵”表明任意样本集对分类器的贡献都具有一定不确定性,因此,图像特征对分类器的贡献可以用特征的信息增益表示。同上可以计算所有稀疏系数向量的特征增益λM,得到遥感图像特征增益对角矩阵Q=diag(λM)。

考虑稀疏系数向量的特征增益以后,SVM的核函数形式变为

SVM核函数选择高斯核函数,则稀疏系数向量特征增益的高斯核函数为

图2为基于多层次特征稀疏表示的遥感图像分类流程框图。

图2 特征增益SVM分类流程框图

特征增益稀疏系数矩阵作为SVM分类器的输入,采用开源工具箱LIBSVM判决得到测试像素的类别标签。

4 测试与分析

采用Pavia University数据集进行测试,该数据集是由德国的机载反射光学光谱成像仪(reflective optics spectrographic imaging system,ROSIS-03)在2003年对意大利的帕维亚城所成的像[18],空间分辨率为1.3 m,尺寸为610像素×340像素,因此共计2 207 400个像素,其中包含大量的背景像素,包含地物的像素总共只有42 776个,这些像素共包括9个地物类别,表1为各类的名称和每类的样本总数,图3为Pavia University数据集中典型图像和对应的真实地物类别标识图像。

表1 Pavia University数据集属性表

图3 Pavia University图像与对应真实地物类别标识图像

由于Pavia University数据集C1~C9这9类样本间数量相差较大,若按比例抽取会造成类间不平衡问题,影响分类结果。因此,仿真时从每一类抽取250个样本作为分类模型的训练集,且限制抽取的样本总数不超过Pavia University数据集样本总数的10%。

经过30次迭代,共耗时262.736秒获得粒子的最优位置,对应中心最大频率kmax为2.406 7,带宽σ为1.148 6,分类器采用LIBSVM工具包[19]中径向基函数核的SVM,对于惩罚参数和RBF核宽度通过网格搜索的方法分别从{2-5,…,215}和{2-15,…,23}中选取。二维Gabor滤波器组中采用不同高斯核将遥感图像分解成不同尺度对算法性能的影响体现在中心最大频率和带宽的不同取值,表2为不同Gabor组合参数下分类器性能。

表2 不同Gabor参数下分类性能

从表2可知,选择合适的二维Gabor组合参数中心最大频率和带宽对分类器的性能具有较大影响,主要因为不同的中心最大频率和不同的带宽对图像的滤波能力和局部特征提取能力存在差异,低频有利于提取图像的整体特征,而窄带有利于提取图像的局部特征,从而全局上提升了图像的描述能力。而不同的中心最大频率和不同带宽对模型的训练时间影响不大,实验测试分析发现,只需要牺牲很小的时间代价即可换取较大的分类性能的提升。

再将提出的多层次特征稀疏表示联合特征增益SVM的遥感图像分类方法(MLSR)与不考虑特征增益的SVM分类器(MLSVM)以及BoVW、PLSA算法进行比较。其中,SVM统一采用径向基函数核,评价指标选择总体精度和Kappa系数[20],表3为Pavia University数据集上不同方法的测试结果。

表3 不同方法的识别结果

图4为MLSR、BoVW和PLSA 3种不同算法在Pavia University数据集上采用SVM分类器模型的分类结果示意图。图4(a)为真实的地物类别图;图4(b)为BoVW算法基础上的SVM分类结果;图4(c)为PLSA算法基础上的SVM分类结果。

图4 不同算法分类结果示意图

由表3和图4可知:提出的多层次特征稀疏表示联合特征增益的遥感图像分类方法(MLSR)相比不考虑特征增益的SVM分类器(MLSVM)、BoVW和PLSA算法具有更高的总体精度和Kappa系数,这是因为不同特征对分类器的贡献存在差异,通过计算信息熵和条件熵,将特征对分类器的贡献加以区分,提升了分类器的性能,同时多角度多尺度的多级特征稀疏表示能够更完备地描述遥感图像语义特征,其原因在于通过多角度多尺度分解后,低频有利于提取图像的整体特征,而窄带有利于提取图像的局部特征,从而在全局提升图像的描述能力,更加充分地利用遥感图像的空间信息,缩小图像特征与图像语义之间的鸿沟。尽管增加了图像的预处理过程,但是稀疏表示减少了运算量,模型训练时间并无明显增加。

为进一步直观展现不同方法的性能差异,采用PowerBI的Chord视觉对象对分类结果可视化,如图5所示。9个类别用不同的颜色的色带表示,色带之间的连接关系表示对应类别之间的混淆情况,各类之间连线交叉越复杂表明类间分类混淆程度越大,连接线与色带颜色越接近表示被误分为此类的样本越多。从中可见,MLSR的类间混淆最少,总体分类精度最高。

图5 和弦图

5 结论

遥感图像因其训练样本少、特征维数高,其分类是一项比较复杂的任务,二维Gabor滤波器组的关键参数中心最大频率和带宽对分类器的性能影响较大,低频窄带提高了图像的描述能力和可解释性,通过区分特征增益进一步提升了分类器的性能,下一步将深入开展遥感图像地物面积和形状测量工作。

猜你喜欢

增益分类器滤波器
“增益”还是“损耗”?挑战性工作要求对工作−家庭增益的“双刃剑”影响*
浅谈有源滤波器分析及仿真
基于多模谐振器的超宽带滤波器设计
学贯中西(6):阐述ML分类器的工作流程
有源环路低通中运放带宽对相噪的影响
基于增益调度与光滑切换的倾转旋翼机最优控制
基于朴素Bayes组合的简易集成分类器①
一款用于无线通信系统的小型滤波器天线
一种自适应子融合集成多分类器方法
宽频带增益放大器的设计与测试