APP下载

基于U型神经网络两违疑似图斑识别模型研究

2021-11-25钟洪德

福建建筑 2021年10期
关键词:图斑人工标签

钟洪德

(福州市勘测院 福建福州 350108)

0 引言

在我国城镇化进程中,违法用地、违法建筑现象(简称两违)时有发生,传统实地巡查监管手段工作量大,耗时长,无法满足现阶段土地执法工作的需要。近年来,人们尝试遥感影像[1]制作正射影像图,或是采用倾斜摄影测量技术[2]建立实景真三维模型,代替人工实地巡查,极大减轻工作强度。但两违现象的发现仍然依靠人工比对识别。

U-Net神经网络在医学治疗分析方面表现突出[3-4],后来被运用到语义分割的各个方向,例如道路识别[5]、建筑物检测[6]、水位监测[7]等。近两年U-Net 开始应用于遥感影像分类领域,一些研究人员尝试多种数据源与原始影像结合,提高U-Net模型的分类精度,在建筑物分类上取得了较好效果[8]。

本文以福州市无人机两违监测影像为例,利用U-Net对样本数据进行训练,建立了两违疑似图斑自动识别模型,在GIS技术支持下可对大面积正射影像进行自动搜索,准确标定两违疑似图斑的位置和范围,极大提高了两违监测的自动化水平和工作效率。

1 U-Net神经网络原理

1.1 U-Net模型

U-Net模型由压缩通道(contracting path)和扩展通道(expansive path)组成,该模型外观呈“U”型,非常形象[9]。U-Net具有如下特点:

①使用全卷积神经网络,比较适应多种尺寸的输入图像。

②有别于一般卷积神经网络只能回答是什么,U-Net可完成图像分割,特别适合需要准确知道疑似图斑位置和范围的应用场景。

③能对有限的数据进行有效的处理和利用。

④处理速度较快。

1.2 Pytorch框架

为了帮助基于神经网络架构的开发,Google、Facebook、Microsoft等公司开源了Tensorflow、Pytorch、CNTK等神经网络框架。其中Pytorch是一种Python接口的深度学习框架,不仅可以实现GPU加速,还可以支持动态神经网络。相比于其他的深度学习框架,Pytorch允许进行动态定义图的操作,提供最大的灵活性和运行速度,因此受到了神经网络研究者们的青睐。

2 训练数据处理

2.1 数据来源

实验数据来自福州市勘测院“玉屏龙江街道两违监测项目”。该项目于近期采用无人机进行低空高分辨率(0.1)摄影,实验数据为经过纠正、镶嵌、匀色制作的工作底图,以及人工识别的疑似图斑矢量数据,以此为依据生成训练数据。

(1)玉屏龙江街道片区正射影像图数据,如图1所示。

图1 原始影像 图2 人工识别疑似图斑

(2)人工判别的疑似图斑shp格式多边形数据,如图2所示。

2.2 训练数据加工

U型神经网络需要准备两种数据,分别是样本数据和标签数据。

2.2.1 生成Rgb训练数据

Rgb训练样本数据以人工识别图斑shp数据为依据,使用ArcToolbox中的Export Training Data For Deep Learning(为深度学习输出培训数据)工具,在影像数据上直接提取。具体步骤如下:

(1)ArcMap加载疑似图斑与影像图,操作开始前,先对玉屏龙江街道片区疑似图斑shp的属性进行添加字段Classname与Classvalue,以保证后续的步骤顺利进行。

(2)启动Export Training Data For Deep Learning工具。

(3)样本规格为128×128,步长为64×64,步长为样本宽度的一半,这样刚好有一个样本中心处于相邻样本的边界,使取样有较好覆盖度。

(4)经过处理,得到样本文件夹,包含images、lables、stats。其中images中含有大量tif格式的图片,如图3所示,它们保留完整的地理坐标信息,为后续栅格叠加计算提供了条件。

图3 训练样本数据

2.2.2 生成标签数据

先将疑似图斑矢量多边形数据转换为同分辨率的栅格数据,经过重分类后得到0-1二值化数据栅格,其中0像元代表正常像元,1像元代表疑似像元。

然后将二值化栅格分别与3.2.1得到的训练样本图片做“乘法”或“加法”,得到与训练样本图片对应的标签图片。如果采用“乘法”,那么结果需要做二值化处理(所有非0值重分类为1);如果采用“加法”,则在做加法前,应将训练样本图片重分类成纯0值栅格数据。

由于每个样本数据对应一个标签数据,数量较大,本文采用Arcgis的model builder构建的批处理模型完成。这个模型用到重分类工具(Reclassify)与加法工具(plus),在重分类之前再加上一个栅格迭代器进行批处理循环。输出的标签数据如图4所示。

图4 标签数据

3 模型训练和评价

3.1 U-Net模型的构建

(1)定义卷积类class double_conv(),包括2个“二维卷积”+“二维正则化”+“ReLU激活层”,逻辑结构如下:多个小个模块用nn.Sequential()函数按顺序执行,减少了很多步骤。

=>nn.Conv2d=>nn.BatchNorm2d=>nn.ReLU

=>nn.Conv2d=>nn.BatchNorm2d=>nn.ReLU

(2)定义下采样类class down(),包括double_conv卷积层和nn.Maxpool2d池化层。

=>double_conv=>nn.Maxpool2d

(3)定义上采样类class up(),根据情况,使用nn.Upsample()函数进行上采样,或用到nn.ConvTranspose2d()函数进行逆卷积层操作。

(4)定义输入输出卷积层,class incov()、分别包含double_conv。class outconv(),包含标准二位卷积层nn.covn2d。

(5)定义class UNet,包括一个输入层,4个下采样,4个上采样,一个输出层。

3.2 模型训练

将前期准备好的训练数据随机选取90%作为训练集,其他10%作为验证集。

模型训练使用Pytorch 1.1框架软件,损失函数采用由torch.nn.functional模块提供的nn.MSELoss()函数,而优化函数是由torch.optim模块提供。采用CDUA模式在NVIDIA Quadro M2200 gpu 上完成,训练时间大约3 h。

训练完成后,用模型算出验证集的预测结果数据。

本文分别用32×32、64×64、128×128、256×256、512×512规格RGB训练样本完成5种模型的训练,之后用模型对验证集输出预测数据,如图5所示。

图5 128×128预测数据

3.3 模型评价

为评价模型的准确度,将验证集的预测结果与人工标定结果进行对比分析:

(1)无坐标系预测图片加入坐标系信息,使预测数据的位置与验证集标签数据对齐;

(2)对验证集标签数据做归一化处理,使得标签数据与预测数据单位统一;

(3)预测图片与标签图片进行减法计算,其中value为0的是识别正确的像素,value大于0或小于0的是识别错误的像素,最后计算正确像素个数占每张图片的总像数的百分比,即为所求准确度。

对每种规格的验证集进行以上操作,得出每一标签图片“两违图斑像素”精确率和召回率。如表1所示。32×32规格平均精确率72%最高,128×28规格平均召回率90%最高;256×256和512×512规格样本精确率十分接近(约为66%),但512×512规格召回率急剧下降,说明U-Net模型对样本规格选取较敏感。

表1 5种规格的平均准确度 %

因为“两违图斑像素”召回率表征了遗漏疑似图斑的概率。实际应用时出现遗漏人工难以弥补,但精确率偏低代表发现的疑似两违图斑中包含较多正常图斑被误判,这个可以通过人工甄别剔除。因此:样本尺寸以选取128×128为最优。

4 实例验证

4.1 模型应用步骤

模型应用时只能接受规格化的图片,因此不能把卫星遥感影像直接放入U-Net模型直接识别,因此,我们将遥感影像进行格网化处理。步骤如下:

(1)利用渔网工具生成网格得到渔网多边形,使用工具:ArcToolbox→Data Management Tools→Feature Class→Create Fishnet。

(2)用渔网多边形切割影像生成一系列小图片,用到分割影像工具(Split Raster)进行此项操作。

(3)用已经训练好的U型神经网络模型,分别对切分出来的小块图片进行识别,生成对应的预测图片集。

(4)依据输入图片坐标信息还原预测图片的坐标信息。

(5)将所有预测图拼接在一起得到总预测图,用工具Mosaic to New Raster进行此项操作。

(6)在总预测图上提取疑似图斑的边界。

(7)最后输出成果图。

4.2 实例验证分析

为验证模型的有效性,按上述步骤对福州市高新区2021年4月无人机正射影像图进行自动识别,预测效果如图6所示。

图6 预测效果图

对拼接好的总预测图与人工判读的两违疑似图斑栅格数据进行比对分析,结果表明:位置准确率达到95%(即在人工判定有问题的地方均有预测图斑),精确率达到51%,有一些正常图片出现误判现象。

5 结语

本论文U型神经网络建立了两违疑似图斑识别模型,包括:利用人工标识的疑似图斑矢量数据制作训练样本数据、设计识别模型、进行模型训练及评价,进而利用该模型对其他影像进行自动识别等。主要结论如下:

(1)模型对样本规格敏感,128×128规格训练得到模型为最优。

(2)试验表明,该模型可代替人工发现两违疑似图斑,从而减轻人工作业的强度,提高土地执法部门的工作效率。

(3)由于疑似图斑精确度难以同时提高,应用中发现有正常图片被抓取。这类问题可通过人工甄别把关,或由需国土执法人员实地核实后剔除。

本论文是运用深度学习人工智能技术发现两违疑似图斑的有益尝试,对于提高判读工作效率和自动化水平,以及减轻人工作业劳动强度具有重要实际意义。

猜你喜欢

图斑人工标签
人工3D脊髓能帮助瘫痪者重新行走?
地理国情监测中异形图斑的处理方法
新安县有序开展卫星遥感监测图斑核查工作
基于C#编程的按位置及属性值自动合并图斑方法探究
人工“美颜”
土地利用图斑自动检测算法研究
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
人工制冷
让衣柜摆脱“杂乱无章”的标签