APP下载

基于空谱融合与协同表示的高光谱图像分类算法

2022-04-01刘德山丁一民闫德勤

关键词:字典光谱协同

刘德山, 丁一民, 闫德勤, 党 琦

(辽宁师范大学 计算机与信息技术学院,辽宁 大连 116029)

高光谱图像(Hyperspectral Image,HSI)是一种由一维光谱特征和二维空间信息组成的三维数据立方体.相较于传统二维图像,高光谱图像分类可以获得更加详细的光谱信息,可以有效提升地物识别能力,提高分类精度.学者们将极限学习机(Extreme Learning Machine,ELM)[1-4],支持向量机(Support Vector Machine,SVM)[5-9],多项式回归(Multinomial Logistic Regression,MLR)[10-12]等机器学习方法应用于高光谱图像分类,并获得良好性能体现.

基于表示的分类方法根据优化方式的不同,可分为稀疏表示[13]和协同表示[14],其共同思想是根据“表示误差”最小原则,判定原子所属类别.相较于传统机器学习方法,稀疏表示基于光谱特性较为相似的像素点属于同一类别这一假设,通过少量训练样本线性表示测试样本,该算法忽略了空间信息对于稀疏重建字典的重要性.为充分挖掘空间信息,Chen等[15]提出联合稀疏表示算法(Joint Sparse Representation Classification, JSRC),将局部窗口中的像素进行联合表示,获取像素的空间属性.Tu等[16]提出引入皮尔森相关系数来计算光谱和空间相似性,以此来解决传统JSRC算法中局部区域的像素可能不属于同一类的问题.Zhang等[14]认为在基于表示的分类过程中真正起作用的是协同表示,并非稀疏表示.受此启发,Li和Du[17]提出了联合协同表示(Joint Collaborative Representation,JCR)方法,充分利用相邻像素点空间和光谱相似性,对原始数据平滑处理,进行联合协同表示分类.由于像素点之间空间信息重合度较高,利用联合协同表示方法很难对其进行区分.Jiang等[18]利用像素间的空间位置信息来构建权重矩阵,并以此对协同系数进行约束,提出空间感知协同表示(Spatial-aware Collaborative Representation,SaCR)和联合空间感知的协同表示(Joint Spatial-aware Collaborative Representation,JSaCR).

高光谱图像光谱带之间具有相似度高且样本维度较高的特点,使用原始数据进行基于表示的分类会造成光谱信息难以挖掘甚至维数灾难的问题.在高光谱图像中并不是所有的光谱带都适合应用于基于表示的分类,所以选取具有代表性的光谱带并提取光谱信息显得尤为重要.Yu等[19]认为在分类之前应降维处理,充分提取光谱信息并降低高维样本影响.学者们还提出了局部线性嵌入(Local Linear Embedding, LLE)、等距特征映射(Isometric Feature Mapping, LFM)、局部保持投影(Locality Preserving Projections, LPP)等降维算法来解决上述问题.降维方法可以使样本数据选取更加充分、完善,但是降维方法只针对单层特征进行处理,存在以下两个问题:一是同一光谱波段下的两个样本光谱距离较小,空间距离可能较大,存在“同谱异类”的问题,通过欧式距离来计算样本光谱间相似性无法做出有效区分.二是图像复杂,单层特征无法准确刻画像素间关系,特征学习不充分,影响分类精度.深度层次模型可以提取数据的抽象和不变的特征,与传统浅层分类器相比,具有更高的分类精度[20-24].Zhou等[25]根据高光谱图像空间和光谱特征提出分层光谱-空间特征网络(Hierarchical Spatial Spectral Feature Network),其目的是使用分层深度体系结构学习判别特征,通过迭代抽象相邻区域并重新计算新区域的表示来提取光谱空间特征.

研究表明,基于表示的分类方法在高光谱图像分类应用中,可以获得良好的结果.高光谱图像分类过程中,构建分类模型固然重要,但是选取合适的方法构建字典仍然必不可少.本文为充分利用空间和光谱信息,提出空谱融合与协同表示的高光谱图像分类算法(Hyperspectral Image Based on Spatial Spectrum Fusion and Collaborative Representation,SS-CR).构建特征字典通过交替进行空间特征学习和光谱特征学习实现,从而降低原始数据波段间高相似度、维数过高对分类造成的影响.在使用联合空间感知协同表示方法分类过程中,通过引入相关系数融合误差进行决策.在Indian Pines和Pavia University两个高光谱遥感数据集的实验表明本文所提算法是有效的.

1 空谱融合特征字典的构建

高光谱图像存在带间相关性强且维度高的问题,深度特征学习方法可有效提取图像中抽象、不变的特征,使特征字典更具代表性.本文采用空谱特征提取模型(Spectral-spatial Feature Learning ,SSFL),交替进行空间和光谱特征学习获得空谱特征,并将其堆叠成多个空谱特征学习单元,形成空谱特征网络(Spatial Spectral Feature Network,SSN)[25].

SSFL单元由光谱特征学习部分和空谱特征学习部分构成.光谱特征学习部分通过线性判别分析(Linear Discriminant Analysis,LDA)[26]实现,该方法将字典中同类样本内的散度最大化,将不同样本间的散度最小化,以此来从训练样本中提取更具代表性的原子作为训练样本.空间特征学习部分通过使用自适应加权滤波器(Adaptive Weighting Filter,AWF)[25]对LDA处理过的数据进行滤波操作.空谱网络的每一层输出结果都是下一层的输入结果,经过多个SSFL单元迭代,获得空谱特征构造字典.通过空谱特征网络构造空谱特征字典如图1所示.

图1 SSN结构

SSN网络通过对原始高光谱数据进行特征提取,首先通过LDA对原始光谱提取光谱特征,降低原始样本光谱相似度高的像素点所造成的影响.其次通过AWF对降维后的数据进行滤波操作,去除局部空间中边界点的噪声影响,提取空间特征.最后通过迭代的方式堆叠所提取的特征,得到空谱特征字典.具体的空谱特征字典构造方法如表1所示.

表1 空谱特征字典的构建

2 SS-CR算法

基于联合表示的方法解决了空间信息未充分利用及像素点间相似度较高难以区分的问题,但特征学习不充分以及局部空间内像素点异类并没有得到有效解决.通过SSN[25]网络构建空谱特征字典可以使特征学习更加充分,使特征字典更具“代表性”.相关系数[13]是衡量像素点是否属于同一类的重要衡量标准.引入相关系数在最终分类决策中,可有效排除异常像素点的影响.因此,本文提出空谱融合与协同表示的高光谱图像分类算法(SS-CR).

联合空间感知协同表示算法[16]通过欧式距离构建空间和光谱正则化项,充分融合空间和光谱信息.空间感知协同表示目标函数为

(1)

其中,ytest是测试样本,D是空谱特征字典,λ为光谱特征感知系数,γ为空间特征感知系数,Γ为光谱特征正则项,s为空间相似对角矩阵.最终解得协同系数:

(2)

(3)

(4)

(5)

最后融合相关系数和联合协同表示,确定测试样本最终类别.其中,β为正则化参数.

class(ytest)=argmin(r(ytest)+β(1-cor(ytest))).

(6)

综上所述,本文所提出的算法步骤如下:

步骤1:输入原始HSI图像,并使用空谱特征网络构建特征字典;

步骤2:使用式(1)进行联合协同表示,并用式(2)求解协同系数α;

步骤3:使用式(4)计算字典原子与测试样本之间的相关系数;

步骤4:使用式(6)确定测试样本类别并分类.

本文所提算法流程如图2所示.

图2 SS-CR算法流程图

3 实验及结果分析

本文算法选取Indian Pines、Pavia University两个高光谱遥感数据集进行测试,验证所提出算法的有效性.选取SVMCK[27]、SVM[28]、SRC[13]、CRC[14]、JSRC[15]、JCR[17]、JSaCR[18]作为对照实验,选取4种分类指标作为高光谱图像分类的评价指标,分别为类别准确率(Category Accuracy,CA),总体准确率(Overall Accuracy,OA),平均准确率(Average Accuracy,AA)和kappa系数.

3.1 实验数据集

Indian Pines数据集通过Aviris传感器于1992年的印第安纳州西北部获得.图像的像素大小为145×145,空间分辨率为20 m.光谱范围0.4~2.5 μm,去除20个吸水带之后,其共有200个光谱反射带,并提供16个地物类别.

Pavia University数据集通过Rosis传感器在Pavia大学进行拍摄.该数据集有由波长范围为0.43~0.86 μm的103个光谱带组成,每个光谱带像素大小为610×340,具有1.3 m的空间分辨率,共有9个地物类别.

3.2 实验参数设置及选取训练样本的影响

本文所提算法涉及3个参数,在Indian Pines和Pavia University数据集下,衡量光谱信息贡献度λ设置成1×10-3,正则化参数β设置成1×10-10,衡量空间信息贡献度γ分别设置成1×10-3和1.不同的算法在选取不同比例原子作为字典时,分类性能会受到影响.本文算法选取1%~5%训练样本并将每类剩余样本作为测试样本,不同算法的总体准确率作为衡量指标.表2和表3分别代表在以上两组数据集下不同算法的总体准确率.

表2 Indian数据集上不同算法的总体准确率

表3 Pavia University数据集上不同算法的总体准确率

由表2可以看出,随着选取各类原子的比例增大,各类算法总体准确率逐渐上升.本文所提算法在Indian Pines数据集下,训练样本选取比例未影响算法的分类性能,分类效果在不同选取比例下均优于对照算法.其中,选取原子比例为1%时提高1.83%~22.49%,选取原子比例为5%时提高2.79%~21.30%.

由表3可以看出,各类算法的总体准确率因选取原子的比例增大而提高.本文所提算法在Pavia University数据集下,选取训练样本的比例并未影响分类性能,在不同选取比例下的分类效果均优于对照算法.其中,选取原子比例为1%时提高0.72%~11.84%,选取原子比例为5%时提高0.3%~6.85%.

3.3 实验结果比对分析

3.3.1 Indian Pines 结果比对分析

在Indian Pines数据集下,随机选取10%的样本作为训练样本,剩余样本为测试样本.从表4中可以看出,SS-CR算法在9种类别里分类效果最好,在Alfalfa、Grass-pasture等6种类别中达到100%.OA、AA、kappa三种分类指标分别为98.42%、99.12%、98.20%均优于对照算法.图3给出Indian Pines数据集下不同算法的分类图,可以看出SS-CR算法分类效果最优.

表4 Indian Pines不同分类算法的准确率

图3 Indian Pines不同算法的分类结果比较

3.3.2 Pavia University结果比对分析

在Pavia University数据集下,选取数量为30的样本进行训练,剩余样本为测试样本.从表5中可以看出,SS-CR算法在8种类别里分类效果最好,在Sheets、Bare Soil等4种类别中达到100%.OA、AA、kappa三种分类指标分别为99.22%、99.29%、98.94%,均优于对照算法.图4给出Pavia University数据集下不同算法的分类图,可以看出SS-CR算法分类效果最优.

表5 Pavia University不同分类算法的准确率

图4 Pavia University不同算法的分类结果比较

4 总 结

本文所提算法相较于SVM、SVMCK、CRC、SRC的区别在于,上述算法均忽略了空间信息对于分类的重要性.空间信息可以对像素点之间的内在属性进行充分利用,从而降低同一波段下不同原子之间的影响,提高区分度.相较于JCR、JSaCR的区别在于本文首先使用空谱特征网络构建特征字典,提高字典判别性,在最终的分类过程中引入相关系数用于平衡误差所带来的影响,最终提升分类性能.空谱融合与协同表示的高光谱图像分类算法(SS-CR)应用于高光谱遥感图像分类共分为两个阶段:第一阶段通过SSN深度神经网络,交替进行空间和光谱特征学习,构造分层融合字典,并用于联合协同表示.第二阶段在分类过程中引入皮尔森相关系数,最大程度地避免“同物异谱”和“同谱异物”带来的影响,并使用联合协同表示分类器进行分类,二者共同决策出最终结果.在Indian Pines和Pavia University数据集上总体准确率可以达到98.44%、99.22%.本文所提算法不足之处在于构造字典和联合协同表示分类过程中,由于两个阶段是分开进行的,未能把两个阶段的模型进行最优化的处理,即并未发挥深度神经网络的最大优势,将在接下来的工作中继续完善.

猜你喜欢

字典光谱协同
基于三维Saab变换的高光谱图像压缩方法
家校社协同育人 共赢美好未来
高光谱遥感成像技术的发展与展望
蜀道难:车与路的协同进化
字典的由来
“四化”协同才有出路
大头熊的字典
三医联动 协同创新
正版字典
星载近红外高光谱CO2遥感进展