APP下载

结合nDSM的高分辨率遥感影像深度学习分类方法

2019-09-05许慧敏

测绘通报 2019年8期
关键词:卷积精度分类

许慧敏,齐 华,南 轲,陈 敏

(西南交通大学地球科学与环境工程学院,四川 成都 611756)

高空间分辨率遥感影像(以下简称高分辨率影像)具有丰富的空间特征及纹理信息[1],其高精度分类在精准农业、城市规划、环境监测等领域发挥着重要作用。在传统高分辨率遥感影像分类方法中,最常用的是面向对象分类方法,该方法需要人工参与分割参数选择和对象特征选取,过程耗时耗力且难以得到更好的分类效果[2]。卷积神经网络(convolutional neural network,CNN)是图像分类中最常用的深度学习网络之一[3]。该网络在实现高效、准确的遥感影像分类中取得了一定的成果[4- 6]。文献[7]在CNN基础上提出了全卷积神经网络(fully convolutional network,FCN),通过上采样方式还原图像尺寸,在识别像元类别的同时还原像元在原图中的位置,真正实现了影像的像素级分类。为了解决FCN分类方法中定位和识别精度的权衡问题,众多学者不断对FCN进行改进,提出了一种U- Net网络[8]。虽然研究人员对U- Net模型进行了许多改进[9- 11],但目前基于U- Net模型的遥感影像分类方法仍然存在以下问题:①高分辨率影像数据波段有限,光谱信息不丰富,在一定程度上限制了模型特征学习的丰富度,造成影像分类精度低;②存在地物内部错分现象和地物边界残缺等问题。

针对以上问题,本文研究一种结合归一化数字表面模型(normalized digital surface model,nDSM)数据和U- Net模型的深度学习影像分类方法。nDSM数据记录了所有高于地面的地物相对于地面的高度信息,能够反映地物的真实高度。该信息在影像分类中对于区分不同类型地物(如建筑与地面、树木与低矮植被等)具有重要作用。本文方法通过引入nDSM提供的高度信息提高U- net模型的特征丰富度,优化分类结果,消除细小错分现象,以实现影像高精度分类。

1 本文方法

1.1 U- Net网络

U- Net网络因结构清晰呈U状而得名[8],是一种改进的FCN网络。FCN网络中包含跳跃结构[7],通过融合不同层次的特征图,将低层网络的细节信息和高层网络的语义信息进行结合,再进行反卷积操作,优化输出结果。反卷积操作不仅可以对每个像素都产生一个预测,即识别像素类别,而且能还原像素在原图中的位置,保留原始输入图像的空间信息即像素定位。

在实际应用中,基于FCN的方法通常难以同时达到较高的定位精度和识别精度,而基于U- Net网络的方法可以较好地克服该问题。U- Net网络由压缩通道和扩展通道组成,具体模型参数见文献[8]。压缩通道是典型的卷积神经网络结构,由卷积层和最大池化层组成。在扩展通道,先进行1次反卷积操作,再拼接对应压缩通道特征图,重新组成一个2倍大小的特征图,然后采用卷积层进行特征提取,重复这一过程,在最后的输出层用卷积层将特征图映射成2维的输出结果。

本文将U- Net网络每一级的核函数维数减少一半以降低模型的运算量并使用边界填充。因此,本文U- Net网络是一个9级网络,压缩通道用于逐层提取影像特征,扩展通道用于逐渐还原影像的细节信息和位置信息,最后得到反映影像特征的输出特征图。通过特征拼接处理实现不同层次特征信息的结合,克服因反卷积而造成的分割精度损失问题,以优化分类结果。本文使用的U- Net网络结构如图1所示。

1.2 结合nDSM与U- Net模型的影像分类流程

本文方法主要分为两个部分:模型训练和影像分类,如图2所示。在模型训练阶段,首先,nDSM数据作为最后一个波段叠加在遥感影像上,将叠加后的多源影像数据和真实地物分类组成的训练样本输入至U- Net模型中进行特征学习,得到预测概率分布图;然后采用交叉熵函数[12]衡量分类结果与真实地物分类之间的损失值,采用Adam优化算法[13]以缩小损失值为目标,当损失值缩小至给定的阈值范围内,则训练结束,得到最优的U- Net模型。在影像分类阶段,利用已训练好的U- Net模型对待分类影像进行分类,最终得到高精度的地物分类结果。

2 试验与分析

本文试验硬件平台CPU为Inter(R) Xeon(R)E5- 2640 v4 2.40 GHz,GPU为NVIDIA Tesla P40 24 GB,内存为128 GB,采用Mxnet深度学习框架实现U- Net模型的搭建与试验。

2.1 试验数据

试验使用ISPRS提供的Vaihingen数据集,该数据集包含数字正射影像、数字表面模型(DSM)、LiDAR数据和地面真实分类数据等。图3为试验数据集中的一幅数字正射影像及其对应的真实地物分类数据和DSM。

利用LiDAR数据,使用TerraScan和ArcGIS软件生成与数字正射影像分辨率相同的DEM数据,再计算生成nDSM数据,其计算公式如下

nDSM(i,j)=DSM(i,j)-DEM(i,j)

(1)

式中,nDSM(i,j)为nDSM在第i行第j列的高程值;DSM(i,j)为DSM在第i行第j列的高程值;DEM(i,j)为DEM在第i行第j列的高程值。

在构建输入影像时,本文将nDSM作为第4波段叠加在数字正射影像波段后参与模型的训练。

2.2 网络训练

在训练影像中随机裁剪出像素尺寸为256×256像素的图像块作为训练样本。验证影像采用规则格网的方式得到验证样本。本试验初始学习率为0.001,每次随机选取11组训练样本输入至网络中训练,一次训练看作一次迭代,每迭代100次输出一次验证集精度,当20次迭代的验证集精度不变时,学习率降为原来的1/2。当损失值小于0.05时,训练停止。

为定量评估影像分类精度,采用总体精度OA(overall accuracy)和F1- score作为评价指标。总体精度是常用的精度评价指标,表示每一个像素正确分类的概率。F1- score是精度与召回率的综合评价指标,能够综合反映算法对正负样本的识别与区分能力。

(2)

式中,Nkk为图像中像元被正确分类的个数;Ntotal为图像中像元的总个数。

F1-score=(1+β2)precision×recall/β2(precision+recall)

(3)

式中,β为权重因子,其取值反映精确度与召回率对F1- score的重要程度,本文设β为1,表示精确度和召回率同等重要;precision和recall分别表示精确度和召回率。

precision=TP/(TP+FP)

(4)

recall=TP/(TP+FN)

(5)

式中,TP为分类器正确分类的正元组;FP为分类器错误标记为正元组的负元组;FN为分类器错误标记为负元组的正元组。

2.3 试验结果与分析

试验将本文方法与现有影像分类方法SVM[14]、GBDT[15]和FCN- 8s[7]进行对比试验以验证本文方法的有效性。图4为两组示例影像分类结果对比图。传统分类方法SVM和GBDT方法错分和漏分现象明显,建筑物边缘细节粗糙杂乱,无法有效识别阴影区域真实地物类别,对车辆等小目标无法准确分类。这是由于传统分类方法受到影像分割尺度和分类器性能等多方面因素的制约。深度学习方法FCN- 8s错分和漏分现象较少,但在低矮植被和树木的区分及建筑物边缘、车辆等细节处理方面效果不佳。这是由于高分辨率遥感影像类内差异大,同物异谱或同谱异物现象造成的。此外,从两组试验的分类结果可以看出,现有深度学习方法的分类效果不稳定。本文方法分类效果最佳,nDSM提供的约束信息可以较好地区分低矮植被和树木、车辆等易混淆地物,建筑物边缘光滑准确,对地物细节反映更加全面真实。

表1为不同方法的地物分类精度对比。从表1中可以看出,传统分类方法SVM和GBDT方法分类精度较差;深度学习方法FCN- 8s优于传统分类方法。对不透水地面、建筑物和树木可以获得较高的分类精度,但在对于低矮植被和车辆的分类上表现不佳;本文方法在各种地物的分类精度上表现最佳,平均F1值达83.40%,总体精度达86.12%。

表1 本文方法与其他方法的精度比较 (%)

为了进一步验证加入nDSM数据可有效改善影像分类结果,在同一算法框架下将本文方法与未加入nDSM数据的方法进行对比分析,试验结果如图5所示。未加入nDSM数据的方法结果中存在建筑物与地面错分、树木与低矮植被错分、建筑物边缘粗糙等现象,加入了nDSM数据后的分类结果中错分现象明显减少,地物边缘更加细致。如图5中A、B区域所示,建筑物在数字正射影像上与其他地物的光谱特性混淆,因此在未加入nDSM数据的方法结果中被分别错分为低矮植被和不透水地面。由于nDSM对不同高度地物有很强的区分度,因此,加入nDSM数据的模型成功地修正了地物的错分现象,A、B区域的建筑物均被正确分类,同时还刻画出建筑物的光滑边缘,建筑物边界更加完整,更加符合真实地物结果。

表2为本文方法与未加入nDSM数据方法的精度对比。从表2可以看出,nDSM数据对U- Net模型的分类效果的影响显著,其中不透水地面、建筑物、低矮植被的分类精度相比于未加入nDSM数据的方法结果各提高了3.18%、2.35%、2.56%。这说明本文方法通过引入nDSM数据用于模型训练和分类,可有效利用nDSM数据提供的高度信息辅助分类,从而提高影像分类精度。

表2 本文方法与未加入nDSM数据方法的精度比较 (%)

3 结 语

本文提出了一种nDSM约束的高分辨率遥感影像深度学习分类方法。nDSM数据提供的高度信息能够优化影像分类过程中的粗糙和不确定性的分类标记,通过引入nDSM数据增加模型特征学习丰富度,以提高模型分类精度,优化分类结果,消除细小错分现象。试验结果表明,nDSM数据的加入提高了U- Net模型的分类结果精度,在不透水地面、建筑物和低矮植被的分类精度上提高显著。如何改进U- Net模型的结构从而使其得到更佳的分类结果是下一步的工作重点。

猜你喜欢

卷积精度分类
基于不同快速星历的GAMIT解算精度分析
热连轧机组粗轧机精度控制
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
按需分类
教你一招:数的分类
说说分类那些事
以工匠精神凸显“中国精度”