APP下载

基于ENVI深度学习模型的卫星影像识别方法研究

2020-04-10崔珂玮张亚豪刘彤黄猛

现代信息科技 2020年1期

崔珂玮 张亚豪 刘彤 黄猛

摘  要:随着互联网的高速发展,大数据时代已经到来,时效性强的数据不断涌现,数据在各行业中的重要性愈发凸显。传统的人工数字化方法存在耗时长、效率低、需要大量人力的问题。采用ENVI卫星影像深度学习处理技术对西部地区房屋建筑进行数字化,该算法将遥感影像中ROI感兴趣区作为目标检测对象,通过参数优化、类激活栅格输出、密度分割等过程,得到此卫星影像的SHP图。此方法提高了数字化的效率,提供了有力的数据支持。

关键词:ENVI;数据数字化;卫星影像处理

中图分类号:TP183;TP751     文献标识码:A 文章编号:2096-4706(2020)01-0057-03

Abstract:With the rapid development of the internet,the era of big data has come,and data with strong timeliness is emerging,and the crucial importance of data in various industries is becoming increasingly prominent. The traditional manual digital method has the problems of time-consuming,low efficiency and large amount of manpower. ENVI satellite image deep learning processing technology is used to digitize the buildings in the western region. This algorithm takes ROI region of interest in the remote sensing image as the object of detection,through parameter optimization,class activation grid output,density segmentation and other processes,and then the SHP image of the satellite image can be obtained. This method improves the efficiency of digitization and provides powerful data support.

Keywords:ENVI;data digitization;satellite image processing

0  引  言

采用人工的方法需要6个月完成一个省份的数字化,按照此效率一年仅能完成2个省份,照此速度,完成全国数字化至少需要10年。现在我国处在快速发展阶段,许多城市每年都会发生巨大变化,虽然10年后可以完成数字化,但是数据已失去意义。因此,需要利用当前的最新的技术去实现全国的数字化。IT行业当前最火的技术为AI-深度学习,本文采用ESRI公司提供的ENVI深度学习模型进行了探索和实践。

ENVI是由ESRI公司研发的一个完整的遥感图像处理平台,它提供了专业可靠的波谱分析工具和高光谱分析工具,应用中汇集的软件处理技术覆盖了图像分类、图像数据的输入/输出、图像定标、图像增强、纠正、正射校正、数据融合以及各种变换、信息提取、基于知识的决策树分类、DEM及地形信息提取、与GIS的整合、雷达数据处理、三维立体显示分析,还可以利用IDL为ENVI编写扩展功能。本文主要涉及该应用的图像分类技术。

1  方法研究

1.1  生成标签图像

标签图像是模型训练中的样本数据,创建标签图像前,需要输入ROI(感兴趣区)以及所对应的栅格图像。ROI在图像处理领域是将图像中所关注的区域圈出,并且作为目标检测的对象。使用ENVI中Vector to ROI工具项便可以将已准确数字化的矢量文件转化为ROI,如图1所示。再使用Deep Learning模块中的Build Lable Raster from ROI工具项,便可以生成标签图像。这个过程中,转换成ROI的矢量数据的准确度以及合适的数量尤为重要,准确度低会导致训练出的模型无法识别出建筑房屋区域,数量过多过少都无法训练出识别建筑房屋的模型。

1.2  训练模型

得到标签图像后,训练模型便有了数据基础。模型可以简单地理解成函数,训练模型就是用已有的数据,通过某种方法确定函数的参数,参数确定后的函数就是训练的结果。ENVI中使用Deep Learning模块下的Train TensorFlow Mask Model工具項,对得到的标签图像进行训练,如图2所示。在此过程中,需要调整Patch Size(切片大小)、Number of Epochs(迭代数)、Number of Patches per Epoch(每次迭代训练的切片数)、Patch Sampling Rate(切片采样比率)参数来创建合适的模型。

在开始训练之前,必须设置或初始化TensorFlow模型,此过程定义了模型的结构,包括架构、patch尺寸和将用于训练的波段数,在ENVI深度学习中使用的框架为ENVINet5,它是一种基于掩码的编码器-解码器架构,可对图像中的每个像素进行分类。而patch是用于训练模型的图像块。可以在Initialize ENVINet5 TensorFlow Model对话框中指定模型的patch尺寸和波段数。

初始化新模型后,需要对标签图像进行训练,训练涉及反复将标签图像传递给模型。一段时间后,模型将学习标签栅格中的光谱和空间信息转换为类激活栅格,突出训练期间明显的特征。在第一次训练过程中,模型尝试初始预测并生成随机类激活栅格,将该栅格与标签栅格的掩膜波段进行比较。通过拟合优度函数(也称为损失函数),模型可以了解随机预测误差的位置。调整模型的内部参数或权重以优化准确率,并将标签图像再次传递给模型。

训练模型的过程中,ENVI使用专有技术训练深度学习模型,该模型基于有偏置的patch选择。引入有偏置的选择以便模型能够更频繁地看到具有更高密度的特征像素的patch。该方法基于逆变换抽样的统计技术,其中向模型显示的实例与它们的概率密度函数的贡献成正比。这种偏差是使用Train TensorFlow Mask模型工具中的类权重参数来控制的,可以为类权重设置最小值和最大值。当训练开始时,最大值用于偏置patch选择,此值在训练结束时降至最小值。在大多数情况下,最小值应为0,以便模型完成上一个Epoch,同时查看特征与背景像素的实际比率。除此之外,还可以设置Patch Sampling Rate参数以指示应发生的采样密度,这是每个像素在训练和验证标签图像中所属的平均patch数。当特征不明显时,增加此值可能会有所帮助,因为选择包含特征足够的patch的可能性更大。

1.3  图像识别

训练出模型后,使用Deep Learning模块下的TensorFLow Mask Classification工具项对其他栅格影像进行识别。输入即将识别的栅格图像和训练完成的模型,选择输出路径即可完成识别。此过程生成一个类激活栅格,它是一个灰度图像,其像素大致表示属于给定特征的概率,明亮像素表示与要素的高匹配。最后通过密度分割,选定0.8~1.0的范围创建高像素值的分类图像。导出SHP图层即完成此栅格的数字化工作。

2  问题分析

训练模型过程中,参数的选择对创建的模型有着重要的影响,因此寻找合适的参数是非常重要的。起初训练模型时,同时改变多个参数进行训练,即使最后产生较好的效果也无法确定是通过改变哪个参数产生的影像。因此,采用控制变量的方法,在四个参数中改变一个参数,其他参数使用默认值,改变的参数从最大值开始调整。每个参数都采用相同的方式进行测试,经过一段时间的测试总结发现,每一个参数使用控制变量的方法从大到小进行调整生成模型时,识别的效果都会呈先上升后下降的效果。因此最后确定出每个参数的数值是Patch Size:380;Number of Epochs:16;Number of Patches per Epoch:300;Patch Sampling Rate:6。此参数下的模型可以将卫星影像栅格图中的建筑区圈出,代替人力完成数字化工作。

但经过比对后,人工数字化的效果最好,目前使用ENVI的方法能完成75%左右自动工作,由于识别是按照像素块为单位进行识别,许多相似的非建筑区域同样被圈出,因此经过ENVI数字化过后,还需要人工审核。

同时,在使用ENVI识别各省的过程中发现,不同的居民地分布使用的模型各不相同。在识别的过程中需要区分城市与农村两种类型,需要使用特定的模型识别特定的居民地,否则会产生图3的效果。

3  结  论

通过使用ENVI对中国部分省份数字化后可以得出,使用ENVI深度学习模型的方法可以节省75%左右的工作量,仅需要人工对ENVI数字化结果进行审查。而人工作业的数字化质量和工作时间成负相关,和工作人员的疲劳度成正相关,工作时间越长,疲劳度也高,导致数字化质量降低,使用ENVI可以节省80%以上的人力。此方法在很大程度上节约了时间和人力,提高了数据的精确性,满足软件研发人员在软件开发中对数据完整性的要求,说明了该方法在数字化房屋建筑应用中的有效性,同时也为以后的矢量地理数据采集提供了参考和借鉴。

参考文献:

[1] 程许龙,党光普,李致博.地籍信息化管理中老旧铁路用地图数字化方法研究 [J].北京测绘,2018,32(8):923-927.

[2] 李贤江,陈佑启,邹金秋,等.卷积神经网络在高分辨率影像分类中的应用 [J].农业大数据学报,2019,1(1):67-77.

[3] 王增林,朱大明.基于遥感影像的最大似然分類算法的探讨 [J].河南科学,2010,28(11):458-461.

[4] 赵元元.数字化城市数字地图及空间数据库建设 [J].居业,2019(5):14-15+18.

[5] 金杰,朱海岩,李子潇,等.ENVI遥感图像处理中几种监督分类方法的比较 [J].水利科技与经济,2014,20(1):146-148+160.

[6] 李颖玥,刘朝晖.中国数字化城市管理发展综述 [J].智能建筑与智慧城市,2017(2):28-32.

[7] 邓书斌,陈秋锦,杜会建,等.ENVI遥感图像处理方法:第2版 [M].北京:高等教育出版社,2014.

[8] 李颖玥,刘朝晖.中国数字化城市管理发展综述 [J].智能建筑与智慧城市,2017(2):28-32.

作者简介:崔珂玮(2000.03-),男,汉族,山东临沂人,本科,计算机科学与技术专业,学士学位,研究方向:人工智能和软件开发应用。