APP下载

基于改进U-Net的城市新增建设用地高分遥感变化检测

2021-12-17潘建平李明明孙博文李鑫胡勇

遥感信息 2021年5期
关键词:变化检测残差用地

潘建平,李明明,孙博文,李鑫,胡勇

(1.重庆交通大学 土木工程学院,重庆 400074;2.重庆市规划和自然资源调查监测院,重庆 401123)

0 引言

城市新增建设用地是城市建设的重要组成部分,其准确提取对制定科学合理的城市规划与土地利用规划、合理利用城市土地资源,促进城市土地集约节约利用,提高城市土地利用具有重要意义[1]。随着遥感技术的快速发展,使得高分辨遥感影像实现对地表覆盖变化检测成为一种高效、准确的技术手段[2]。近些年,国内外学者在遥感影像变化检测中做了大量的研究,常用的方法有分类后比较法[3]、影像代数法[4]、变化向量分析法[5]及基于形状特征的变化检测方法[6]等,但是普遍存在影像预处理环节要求严格、部分环节需要人工干预,自动化程度低、难以处理多源数据等缺点[7]。

与常用的变化检测方法相比,深度学习算法具有极强的学习能力,能够拟合复杂的映射关系,解决复杂的任务场景[8],因此可以将深度学习算法引入遥感领域,利用深度神经网络强大的特征学习能力来解决复杂的遥感影像变化检测问题[9]。2010年Mnih等[10]首次将深度学习方法引入遥感领域,提出用DBN(deep belief networks)模型来检测机载遥感图像中的道路。2015年戴丹[11]使用BP神经网络对长沙市城市建设用地扩张规模进行预测研究。2016年Zhang等[12]采用去噪编码器进行多源遥感影像的变化检测,变化检测的精度高于传统的变化检测方法。2017年冯丽英[13]采用深度学习对城市建设用地信息进行提取,证明了深度卷积神经网络在分类精度上优于传统的分类器。2017年Xie等[14]提出了新的残差ResNeXt模型,并将这种模型与ResNet进行比较,证明了ResNeXt训练错误率更低、提取精度更高。2019年高峰等[15]采用deeplab语义分割网络实现了耕地资源的自动化提取与变化检测。2019年吴海平等[16]利用卷积神经网络(convolutional neural network,CNN)自动提取新增建筑用地信息,实现了深度学习技术在土地利用遥感监测方面的初步探索。

目前,采用深度学习进行城市新增建设用地的变化检测研究尚少,同时国内外没有开放的数据集,给新增建设用地变化检测工作带来诸多困难。为此文章通过人工标注遥感影像,解决了缺少数据集的问题,并研发了一种改进U-Net的城市新增建设用地高分遥感变化检测技术,改进后的U-Net既保留了U-Net跳跃连接和编码、解码结构的特点,又引入残差网络ResNeXt解决了网络深度加深带来的模型退化问题。

1 技术设计

以全国土地变更调查遥感监测的DOM成果为数据源,其中前时相影像数据为2010年WorldView2数据,后时相遥感影像数据为2011年QuickBird+WorldView1的镶嵌数据,分辨率均为0.5 m。改进U-Net的城市新增建设用地高分遥感变化检测流程如图1所示。

图1 城市新增建设用地变化检测流程

1.1 新增建设用地类型界定

城市建设用地是城市土地的重要组成部分,从广义上讲是城市管辖范围内所有用于建设的土地,从狭义上讲是城市规划区范围内根据城市规划确定进行开发的土地。由于遥感地物种类复杂多样,不同种类之间相互组合,可以判定为新增的变化众多,给数据集的制作带来了困难。通过借鉴《2020年度全国国土利用遥感监测图斑类型划分标准》[17],结合重庆市的新增建设用地实际情况,本文对新增建设用地的界定根据下面四个标准:(1)前时相影像有植被覆盖或明显非建设痕迹,后时相影像有明显建设特征;(2)前时相影像有植被覆盖或明显非建设痕迹,后时相影像有明显建设推填土特征;(3)前时相影像有明显建设推填土特征,后时相影像有明显建设特征;(4)前时相影像有植被覆盖或没有明显建设,后时相影像有明显道路或大型沟渠特征。

1.2 数据集制作

首先,对前后期影像进行地理配准,保证两期影像中同名地物的特征点相互匹配。再将两幅影像分别矢量化,按照城市新增建设用地类型界定的四个标准,提取出新增建设用地的矢量图斑区域,并通过标注工具转化为二值标签图,即只含有新增建设用地与未变化用地两个标签。然后将前期影像、后期影像、标签图按照128的步长裁减为256×256的数据。数据集按照9∶1的比例划分为训练集、验证集,并通过随机旋转、上下翻转、左右翻转三种增广方法将训练集扩大为原来的四倍。最后将裁减后的3波段前期影像、后期影像批量叠加为6波段的影像与标签一起输入网络中进行训练。

1.3 网络训练

首先,将样本集输入改进前的U-Net中,在保证所有参数不变的情况下,仅改变三种损失函数的设置进行分别训练,通过对比分析损失曲线图、验证集预测结果图来寻找其中最优的损失函数,并将该损失函数设置为改进后网络的损失函数。其次,将样本集输入改进后的网络中进行训练和预测,并将预测结果与人工真实标注结果进行精度评定。

1.4 精度评定

采用二分类问题中常见的评价指标:精确率(precision)、召回率(recall)、F1分数(是精确率和召回率的调和均值)。

2 U-Net的优化

2.1 损失函数

损失函数是用来估量模型预测值与真实值不一致程度,损失值越小,模型的鲁棒性就越好,选取一个好的损失函数对于模型至关重要。但是在新增建设用地变化检测中存在类别不平衡的现象,即未变化的类别数量往往大于发生变化的类别数量,这将导致训练时损失函数会偏向样本数量多的一方,造成训练时损失函数很小,反而对发生变化类别的识别精度不高。针对这种现象,选择了三种针对类别非均衡的损失函数进行对比,分别是dice loss、focal loss和WCE loss(weight crossentropy loss),找寻其中最优的损失函数来提高精度。

dice loss是比较两个样本的相似程度,是一个区域相关的loss。当前像素的loss不仅和当前像素的预测值相关,和其他点的值也相关,训练更倾向于挖掘前景区域,正负样本不平衡的情况就是前景占比较小。

focal loss的提出是在目标检测领域,为了解决正负样本比例严重失调的问题。首先在原有的基础上加了一个因子gamma,减少易分类样本的损失,使得更关注于困难的、错分的样本。加入平衡因子alpha,用来平衡正负样本本身的比例不均。

WCE loss是给正样本加上一定的权重,来解决类别不平衡的现象。

2.2 U型卷积神经网络

U-Net采用了一种编码器解码器的结构,浅层的网络用来解决像素定位的问题,而深层次的网络用来解决像素分类的问题。添加的上采样阶段可以扩大特征通道,允许网络保留更多的原图信息在高分辨率的网络层次传播。没有使用全连接,全程使用valid来卷积保证了分割结果是基于没有缺失的全部特征。采用一种对称结构连接到所有浅层特征,将所有提取到的特征加以利用,保证了输入与输出尺寸相同的同时,也进一步提升了分割效果。这些结构使得U-Net可以使用比较少的训练集就可以得到非常好的分割效果。

2.3 残差网络ResNeXt

残差网络ResNeXt是在inception与ResNet上做出的改进,在结构上有两个特点。首先,借鉴了inception的“分割-转换-合并”模式,先将输入通道进行分组,然后对每一组进行卷积运算,最后再把所有分组的结果融合。其次,继承了ResNet的重复层策略,但不同的是,增加了路径的数量,每个路径上使用相同的拓扑结构组建ResNeXt模块分组卷积。这种独特的结构使得残差网络ResNeXt可以在不增加参数复杂度的前提下提高准确率,同时相同的拓扑结构减少了超参数的数量,便于模型移植。其结构如图2所示。

2.4 基于ResNeXt50的改进U-Net

为了增加网络分割结果的精细程度,增加特征的表达能力,同时避免层数加深带来的模型退化问题,文章采用了ResNeXt 50来对U-Net的编码层进行改进,以瓶颈残差模块对卷积层进行替换,分别以3、4、6、3个bottleneck_block堆叠块对U-Net的第2、3、4、5层中的卷积进行替代,其中ResNeXt50网络结构示意图如图3所示。改进后的网络结构如图4所示。

图3 ResneXt50网络结构示意图

图4 基于ResNeXt50的改进U-Net示意图

3 实验结果与分析

3.1 U-Net优化后的性能实验

本文使用Tensorflow框架并在NVIDIA GeForce RTX 2080 Ti上完成训练与测试。其中训练集增广后为7 776组,验证集未增广为216组,训练集的作用是对神经网络参数进行更新调优,验证集的作用是验证神经网络的预测精度,并不参与参数更新。训练集中每8组样本为一批次输入神经网络,迭代次数设置为500,优化器为带动量的随机梯度下降法,其中学习率设置为0.001,权重衰减为1E-6,动量为0.9。

在同一个U-Net中仅改变三种损失函数的设置,分别进行训练,生成训练模型,并对验证集进行预测与精度评定,训练时的精度如图5所示,预测结果为图6中的第2、3、4列所示。通过对比发现,加权交叉熵函数在基于U-Net的新增建设用地检测中结果最好。因此将交叉熵设置为残差U-Net的损失函数,保证上述训练参数不变的情况下,生成训练模型,并对验证集进行预测与精度评定,训练结果为图6中的第5列。

注:橘色曲线为加权交叉熵损失函数;红色曲线为dice损失函数;蓝色为focal损失函数;横坐标为迭代次数;竖坐标为训练精度。

注:第1列图片为人工勾画的真实变化图,红色区域为新增建设用地区域,黑色区域为未变化区域。第2、3、4、5列是预测的结果图,白色区域是预测为新增建设用地的区域,黑色是预测为没有发生变化的区域。其中第2、3、4列是采用相同的U-Net,基于不同损失函数的预测结果图,损失函数分别为 focal函数、dice函数、交叉熵函数。第5列是采用残差网络对U-Net改进后的网络预测结果图,损失函数设置的是交叉熵函数。

从图5可以看出,加权交叉熵函数在三种损失函数中精度的最高。从图6也可以看出,加权交叉熵函数较前两种损失函数在验证集上提取的边界轮廓更加完整,提取准确率也更高。所以可以认为,加权交叉熵函数在采用U-Net进行城市新增建设用地的变化检测中效果最好。从图6中第4、5列可以看出,改进后的网络相比于未改进前提取效果更显著,减少了分割图形中噪声点的出现,提取边缘轮廓更趋近真实标签图。

3.2 变化检测实验

由于本文的研究目标是为了提取出城市建设用地的新增区域,而不是对四种类型的变化进行分类研究,可以直接使用训练好的模型对实验区进行预测,而无需考虑不同新增建设用地的形态差异。

选取茶园区变化明显且包含所有新增用地种类的典型地区作为实验区,前后期影像大小为3 253像素×2 665像素,面积为2.167 km2,分辨率均为0.5 m,该实验区与训练集、样本集无重复区域,其中前后原始影像如图7所示,人工标注真实变化区域及改进模型预测结果如图8所示。提取精度对比如表1所示。

图7 茶园区部分地区

图8 结果对比

表1 精度对比 %

从表1可以看出,加权交叉熵在三种损失函数中的综合值F1分数值最高,为85.056%,优化改进的网络F1分数高于未改进的U-Net,提高了2.546%。实验结果证明了优化和改进网络的有效性和必要性。

4 结束语

本文考虑U-Net结构在变化检测方面强大的提取能力,通过在U-Net基础上加入残差进行改进,制定重庆市特有的城市新增建设用地数据集,设计了一套完整的基于深度学习方法的城市新增建设变化检测流程。实验结论主要有以下几点。

通过三种损失函数在训练精度曲线和提取结果的对比,找寻最优的损失函数,来尽可能减少类别不平衡对提取精度的影响。实验结果表明,加权交叉熵函数在三种函数中的精度最高,同时验证集上提取的边界轮廓更加完整,提取准确率也更高,实现了U-Net在损失函数上的优化。

残差网络ResNeXt已经被证明比ResNet具有更好的效果。为了避免一味地网络加深而带来的模型退化现象,本文借鉴了ResNeXt 50结构的残差模块对U-Net的编码结构中卷积层进行替换,在加深了网络的深度来获取更高提取精度的同时,这种独特的结构也可以避免模型退化的问题。实验结果表明,改进后的网络相比未改进前在使用同一种损失函数和参数时提取精度更高,证明了加入残差网络的有效性。

文章在U-Net上进行了优化和改进,为城市新增建设用地的变化检测提供了一种好的方法与思路,可以解决传统检测方法的工作量大、提取精度低、特征选择困难、阈值设置难等问题。但由于数据源仅选择了重庆茶园区的数据,所以数据集所包含的地物类别不够全面复杂,对其他地区的城市新增建设用地的提取效果还有待考证,下一步将在扩大样本集的数据量和复杂度方面继续研究。

猜你喜欢

变化检测残差用地
用于遥感图像变化检测的全尺度特征聚合网络
基于双向GRU与残差拟合的车辆跟驰建模
基于多尺度纹理特征的SAR影像变化检测
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
基于稀疏表示的视网膜图像对变化检测
城乡建设用地增减挂钩研究进展综述
基于Landsat影像的黄丰桥林场森林变化检测研究
城乡建设用地增减挂钩政策的演变
城乡建设用地增减挂钩的实践与认识