APP下载

联合光谱角与组合特征参数的高光谱影像分类

2021-03-03占燕婷吴柯徐宏根刘慧泽

遥感信息 2021年6期
关键词:特征参数光谱精度

占燕婷,吴柯,徐宏根,刘慧泽

(1.中国地质大学(武汉) 地球物理与空间信息学院,武汉 430074;2.中国地质调查局武汉地质调查中心,武汉 430205)

0 引言

高光谱遥感是在成像光谱学的基础上发展起来的,具有光谱分辨率高、图谱合一的独特优势,在军事侦察、大气探测、环境监测、地质勘察、海洋、林业和农业遥感等领域有着广泛和重要的应用[1-2]。与传统遥感相比,高光谱遥感的每个成像像元都有几十上百个成像波段,每个波段宽度一般小于10 nm,并且在传感器的成像光谱区间内是连续分布的,因此,高光谱遥感影像中的每一个像元光谱都是一条连续、平滑、完整的曲线,为基于光谱对影像地物类型的识别提供了更多的信息和方法。

光谱匹配技术是高光谱影像分类的关键技术之一,它是由已知地物类型的反射波谱,通过波形或特征匹配来达到识别地物类型的目的[3]。分类的主要依据是“同物同谱”理论,即:同种地物具有相似的光谱特征,在影像上呈现出高度的相似性。基于光谱相似性测度对影像进行分类的原理是对每一参考类别确定其参考光谱,然后对每一待定像元进行光谱测试,计算其与参考光谱的相似性,待定像元类别则属于相似性最高的一类[4]。常见的光谱相似性测度有欧氏距离、光谱信息散度、光谱交叉相关系数测度和光谱角度测度等[5]。其中,光谱角匹配法(spectral angle mapping,SAM)是一种比较波谱整体形状相似度的分类方法,由于具有明确的物理意义以及较好的分类效果,因此,它在高光谱匹配分类中一直拥有广泛的应用。近年来,众多研究者以SAM为基础,提出了一系列改进的光谱匹配分类算法,取得了良好的效果。比如:何中海等[6]通过在相似波谱曲线差异较大的特征区间设置权重,提出权重光谱角的方法,增大相似性矿物波谱与参考波谱的差异;Liu等[7]通过在SAM分类方法中加入基于像素间的“光谱向量长度差异”因子,提高了高光谱遥感影像的分类精度。

此外,突出光谱信息的局部特征(主要是波谱吸收谷特征)生成不同的特征参数,也能够进行地物类型有效的区分。尤其是对“同谱异物”的现象而言,光谱特征参数的引入能够显著提高相似地物类型的识别精度。例如:车永飞等[8]通过对光谱特征较稳定的主、次吸收谷特征参数赋以不同的权重系数,提取矿物的蚀变信息;韦晶等[9]综合利用多种光谱特征参数,进行统计分析,得到Cuprite矿区的矿物识别模型,最终实现了矿物信息的高精度识别。但是,仅仅基于光谱特征参数的绝对大小对典型地物类型进行识别,具有一定的局限性。由于只考虑了局部光谱特征的相似性,无法对整体光谱特征进行有效的表达,在常规的光谱匹配分类中,往往会造成分类精度低下。因此,研究者一般会在光谱特征参数的基础上,结合其他分类方法,构建完整的分类模型。例如:刘焕军等[10]提取土壤的反射光谱特征参数后,利用K均值聚类和决策树分别进行聚类分析和分类模型构建,实现的土壤的快速分类;王翔[11]以光谱特征参数为输入量构建决策树模型,对土壤进行分类,得到了比其他方法更高的分类精度。

基于以上分析,本文在SAM匹配分类模型的基础上,提出一种联合光谱角与组合特征参数(spectral angle mapping-combination characteristic parameter,SAM-CCP)的新型高光谱遥感影像分类方法。该方法能够有效区分不同地物类型的整体波谱曲线,同时兼顾对光谱局部特征信息的约束和识别,使得相似地物类型的光谱曲线也能够得到有效的区分。本文通过两组实验证明:SAM-CCP匹配法能够动态地调整特征参数,选择最优的组合方式,有效地降低了匹配分类的误差。

1 算法原理

1.1 光谱角匹配法

光谱角匹配法是指将两条光谱曲线各个波段的反射率值组成二维空间向量,通过计算其广义夹角来表征两条光谱的相似程度:夹角越小,光谱越相似。计算得到两条光谱曲线的夹角余弦值为cos,余弦值越接近于1,两条光谱曲线越相似[12]。光谱角匹配法虽然能从光谱曲线的形状上比较光谱的相似程度,但是对于光谱局部特征上的差异性较难区分[13]。

1.2 光谱特征参数匹配法

光谱特征参数匹配法(spectral characteristic parameter,SCP)是指将从光谱曲线提取出的吸收谷光谱特征参数组合成二维特征向量,然后计算像元光谱与参考光谱的特征向量之间的距离来表征两条光谱的相似程度,距离值越小,则证明光谱特征参数越接近,吸收谷越相似。计算其欧氏距离值如式(1)所示。

(1)

式中:xi和yi分别表示参考光谱和像元光谱的第i个特征参数;n为参数总个数;Euclidean为欧式距离值。

根据光谱的吸收谷特征,本文主要提取了吸收谷的八个特征参数进行分类,分别如下所示。

(1)吸收波谷位置P是光谱吸收谷反射率最低处对应的波长。

(2)吸收反射率Ep是吸收波谷位置处的反射率值。

(3)吸收宽度W是吸收谷两侧肩部的波谱带宽。

(4)吸收对称度S是过波谷位置垂线的左右两部分的对称程度,等于左右肩部距离谷底的波长宽度与吸收宽度之比。

(5)吸收深度H是吸收反射率Ep与吸收谷两侧肩部对应的较小反射率值的差值。

(6)吸收面积A是吸收带曲线与两侧肩部连线所围成的面积。

(7)吸收斜率K是原始光谱曲线中,吸收波谷两肩部连线的斜率。

(8)光谱吸收指数SAI是非吸收基线和吸收谷底垂线交点的反射率值与吸收谷底反射率值的比值。

1.3 联合光谱角与组合特征参数匹配法

1) SAM-CCP。SAM-CCP匹配法是指将光谱角匹配法得到的夹角余弦值cos与组合特征参数匹配得到的欧式距离值Euclidean相结合,匹配距离值如式(2)所示。

Distance=(1-cos)·Euclideanμ

(2)

式中:μ为欧式距离开方系数,通过在0~1之间调节μ的大小,可以不同步地改变像元光谱与不同参考光谱之间的Euclidean值,使距离大的值更大、距离小的值更小,增大光谱之间的差异性;Distance值为联合后的匹配距离,值越小,两条光谱越相似。光谱角表征的是光谱曲线的整体形状特征,而光谱特征参数表征的是光谱曲线的局部吸收谷特征,所以将二者相结合充分利用了地物的反射率光谱信息,有利于提高地物类型的识别精度。

2) 最优光谱特征参数组合选取。在实际应用中,选择更多的光谱特征参数对地物进行分类未必取得最好的结果,所以,从众多的光谱特征参数中,选择最佳的组合,从而更准确地识别地物类型,是该方法的重点。最优光谱特征参数组合选取步骤如下。

步骤1:利用包络线去除的方法对光谱曲线进行归一化处理,放大吸收谷的特征,然后根据地物光谱曲线的吸收谷特性,确定吸收谷的个数,从短波到长波方向,依次为v1、v2…vn。

步骤2:提取每个谷的光谱特征参数,共8n个。比如:v1的光谱特征参数分别为P1、Ep1、W1、S1、H1、A1、K1、SAI1,其他谷同理。

步骤3:选择一个光谱特征参数进行光谱匹配,共8n种分类结果,对其进行精度评价,得到最大分类精度的匹配参数f1。

步骤4:选择f1与其他8n-1个参数组合,对影像进行分类,对比所有结果的总体分类精度,得到最大分类精度的参数组合为[f1,f2]。

步骤5:重复步骤4,直到最大分类精度不再提高,此时的参数组合即为最优光谱特征参数组合。

2 实验与结果分析

为验证本文提出的联合光谱角与组合特征参数的光谱匹配算法的有效性,分别选用Indian Pines地区和Cuprite矿区的两组高光谱影像数据进行实验,并将分类结果与传统的最小距离法(minimum distance discriminant method,MD)、光谱信息散度匹配法(spectral information divergence,SID)和光谱角匹配法SAM的分类结果进行比较,精度评价选择总体分类精度(overall accuracy,OA)、Kappa系数、生产者精度(producer’s accuracy,PA)和使用者精度(user’s accuracy,UA)。

2.1 Indian Pines数据分类实验

Indian Pines数据获取于1992年,由AVIRIS传感器收集,覆盖区域为美国加利福利亚的一处农业实验区,如图1所示。数据由224个反射率光谱波段组成,波长范围为0.4~2.5 μm,大小为145像素×145像素,空间分辨率为20 m。去除覆盖在吸水区域的条带后,波段数量减少到200个。研究区地物类型以农作物为主,已知地物像元个数为10 249,共16类,分别是苜蓿、玉米Ⅰ、玉米Ⅱ、玉米Ⅲ、草Ⅰ、草Ⅱ、草Ⅲ、干草料堆、燕麦、大豆Ⅰ、大豆Ⅱ、大豆Ⅲ、小麦、森林、建筑和石头钢塔。该影像的反射率光谱曲线一般有五个明显的吸收谷特征,图2为经包络线去除后的大豆Ⅱ的参考光谱曲线,参考光谱是通过对比参考分类图,在原始影像中画感兴趣区域,获取其平均光谱,影像中其他地物类型的参考光谱总体形状与图2相似。从图中可以看出,光谱在前40个波段和波段90和120附近,噪声明显,据此采用窗口大小为5的均值滤波对其进行平滑处理,减小光谱特征参数提取的误差。经包络线去除后的光谱,可提取出五个吸收谷特征,从左往右依次为v1、v2、v3、v4、v5,吸收波谷位置P分别为band 32、58、78、104、145。

图1 Indian Pines原始影像

图2 经包络线去除的大豆Ⅱ参考光谱

实验首先调节μ值大小,调节范围为0~1,间隔为0.1,对比各个结果分类精度,再缩小范围到0.2~0.3,以0.01为间隔调节μ值大小,最终表明,当μ为0.25时,分类精度最高。然后对该数据提取出五个吸收谷的光谱特征参数,共40个;利用单个光谱特征参数对影像进行分类,分类精度最高的参数即为最优光谱特征参数组合中的第一个量,即A5;最后将A5与其他特征参数进行组合,依次获取最优组合中的其他参数,当分类精度不再提高时,该组合即为最优光谱特征参数组合。图3为选择不同个数的光谱特征参数进行组合时,对应的最高总体分类精度。由图可知,前期总体分类精度随着组合中参数个数的增加而增加,直到参数个数为6时达到峰值,随后总体分类精度不再增加,到第10个参数有降低的趋势。所以,由六个光谱特征参数组成的组合[A5,SAI2,Ep2,H3,S4,H4]即为该影像分类的最优光谱特征参数组合,此时,总体分类精度为77.66%。

图3 Indian Pines数据参数个数对分类精度的影响

基于四种方法的Indian Pines数据集分类结果如图4所示。从图中可以看出,所有算法对于苜蓿、干草料堆、小麦和石头钢塔等地物类型,表现出较好的分类结果,其原因可能与占地面积少且光谱曲线特征明显有关;而对于草Ⅰ、大豆Ⅲ和建筑,由于许多相似地物类型的存在,不同的地物类型具有极其相似的光谱形状和吸收谷特征,又加上影像中存在着大量的混合像元,对分类结果造成了较大的影响,精度仍然低下。SAM-CCP分类法对于区域中占地面积较大且位于中部位置的大豆Ⅰ和大豆Ⅱ,分类结果较其他三种方法更好,区域中错分的像素点更少。Indian Pines数据集的分类精度定量结果如表1所示。SAM-CCP分类法的总体分类精度最高,为77.66%,分别比MD、SID和SAM提高了7.07%、1.36%和2.65%。

图4 Indian Pines数据集分类结果

表1 Indian Pines数据集分类精度 %

2.2 Cuprite数据分类实验

Cuprite矿区位于美国西南部的内华达州,该地区基岩裸露程度高,矿物类型丰富,是遥感地质研究的典型实验区。Cuprite矿区的AVIRIS高光谱数据,获取时间为2006年9月20日,光谱范围为0.4~2.5 μm,光谱分辨率为10 nm,空间分辨率为20 m,数据大小为477像素×533像素,共224个波段,删除数据异常的108波段后,共223个波段用于实验,如图5所示。参照Clark等[14]1995年的Cuprite矿区填图结果,选取矿区中九种典型的矿物类型进行分类实验,分别为明矾石、高岭石、蒙脱石、白云母、方解石、玉髓、多水高岭土、高岭石和白云母的混合物,以及明矾石、高岭石和白云母的混合物。图6为九种矿物的参考光谱曲线,通过对比参考分类影像,获取原始影像中每一类型对应区域的平均光谱,即为该矿物的参考光谱。从图中可以看出,九种矿物类型的光谱曲线在整体上较为相似,但局部特征具有一定的差异性。在波段110和160附近曲线噪声较大,所以选取窗口大小为3的均值滤波对曲线进行平滑后再提取吸收谷的光谱特征参数,将减小因噪声引起的分类误差。经包络线去除后,该影像的光谱曲线可提取出七个明显的吸收谷特征,吸收谷位置分别在band 13、35、59、114、147、163、189附近。

图5 Cuprite原始影像

与Indian实验相同,首先调节μ值大小,找到最佳指数μ为0.08。然后组合光谱特征参数,对Cuprite矿区高光谱数据进行分类。图7为该实验中参数个数对分类精度的影响,当参数个数为4时,总体分类精度达到最高值87.89%,随后不再增加,此时光谱特征参数组合为[K7,W7,W2,P7],即为最优光谱特征参数组合,由此可见,谷7对分类精度的提高贡献率最大。

图6 Cuprite影像参考光谱曲线

图8为分类参考图和MD、SID、SAM以及本文方法分类结果的对比,总体来说SAM-CCP分类法的效果更好,各个类别的划分与地表真实类别更接近;其中,白云母的分类效果相比于其他三种方法更好,区域中错分的像素点更少,误差最大的是最小距离分类结果,将左边区域的部分白云母错分为方解石;四种方法都将研究区右边部分的明矾石、高岭石和白云母的混合物错分为明矾石,从图6中可以看出,这两种地物类型的光谱比较接近,因此造成了误分。Cuprite矿区数据集的分类精度如表2所示。基于SAM-CCP方法的分类结果总体分类精度和Kappa系数最高,分别为87.89%和0.779 1,其总体分类精度分别比MD、SID、SAM分类结果高9.24%、8.21%和3.59%。

图7 Cuprite数据参数个数对分类精度的影响

图8 Cpurite数据集分类结果

表2 Cuprite数据集分类精度 %

2.3 实验结果分析

从两组数据的分类结果可知,本文提出的SAM-CCP匹配法对于农作物和岩矿类型的识别都较SAM等传统的分类方法精度有所提升,尤其是对于光谱曲线整体相似性大而局部差异性大的地物类型,其识别精度得到了明显的改善,证明了该方法的优势。

由Indian Pines数据集分类结果可知,改善效果最明显的前三类分别为大豆Ⅲ、大豆Ⅰ以及玉米Ⅰ(表1中标粗显示)。其中,大豆Ⅲ的生产者精度和使用者精度比其他方法中精度最高的SID匹配法分别高出22.26%和13.68%;大豆Ⅰ的生产者精度比其他方法中精度最高的SAM高8.02%,使用者精度比其他方法中精度最高的SID高8.98%;玉米Ⅰ的生产者精度和使用者精度分别较SAM提高了9.24%和10.63%。而对于Cuprite矿区分类结果,白云母因具有独特的光谱特征区别于其他矿物类型,分类精度最高,其生产者精度达85.37%,使用者精度达93.98%,分别高出其他方法最高精度11.19%和4.41%。分类精度提高最为明显的三种类型分别是:高岭石和白云母的混合物、高岭石以及玉髓(表2中标粗显示)。高岭石和白云母的混合物生产者精度比精度最高的SAM高出12.54%,使用者精度比精度最高的SID高出10.58%;高岭石的生产者精度比MD高8.85%,使用者精度比SAM高7.08%;玉髓的生产者精度虽然只比其他方法中精度最高的SAM高2.01%,但其使用者精度提高了28.97%。

由于Indian Pines数据为精细农作物的分类,其每一类别的参考光谱都很相似,而Cuprite数据为岩矿类型的识别,各岩矿参考光谱之间的吸收谷差异较大,特征显著,所以添加了光谱特征参数后的光谱角匹配法,对于岩矿类型的识别较农作物,其精度提高更为明显。

3 结束语

本文提出了一种联合光谱角和组合特征参数的SAM-CCP匹配法,该方法基于遥感影像的光谱特征对地物进行识别分类,有效地解决了图像匹配中突出光谱曲线整体特征,而忽略光谱的局部特征信息的问题。将该方法应用于Indian Pines地区和Cuprite矿区高光谱影像数据,并与MD、SID和SAM分类结果进行对比分析。结果表明:

1)综合考虑了光谱曲线的整体和局部特征的SAM-CCP匹配法,能够改善多数光谱相似地物的识别精度,提高高光谱遥感影像分类的总体精度。

2)该方法对于农作物和岩矿地物类型的区分都具有一定的适用性,相比于农作物分类,该方法对于具有独特吸收谷特征的矿物类型的区分,精度提高更明显。

在以后的研究工作中,将考虑结合卷积神经网络等深度学习技术,进一步改善分类方法,提高地物识别精度。

猜你喜欢

特征参数光谱精度
基于三维Saab变换的高光谱图像压缩方法
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
基于DSPIC33F微处理器的采集精度的提高
基于PSO-VMD的齿轮特征参数提取方法研究
GPS/GLONASS/BDS组合PPP精度分析
星载近红外高光谱CO2遥感进展
统计特征参数及多分类SVM的局部放电类型识别
改进的Goldschmidt双精度浮点除法器
苦味酸与牛血清蛋白相互作用的光谱研究