APP下载

长时间序列的凤阳县景观格局分析

2022-03-13于弘李飞王安影陈小芳

安徽农学通报 2022年4期
关键词:景观格局随机森林机器学习

于弘 李飞 王安影 陈小芳

摘 要:利用Landsat卫星影像组成1989—2018年时间序列影像数据集,以凤阳县行政矢量边界等为辅助数据,采用基于机器学习的随机森林算法进行地物分类,并与RS、GIS、目视解译等方法结合,对凤阳县1989、1995、2000、2005、2009、2013和2018年7期遥感影像进行土地利用分类和景观格局分析。结果表明:经随机森林分类方法分析得出,总体精度达92.14%,Kappa系数为0.8956。研究结果有助于了解经济快速发展背景下凤阳县土地利用空间格局变化及规律,对于指导凤阳县城乡规划、土地资源管理以及生态环境保护等方面有着重要的参考作用。

关键词:景观格局;土地利用分类;机器学习;随机森林

中图分类号 Q149 文献标识码 A 文章编号 1007-7731(2022)04-0091-03

Abstract: The Landsat satellite images were used to form the image data set of the time series from 1989 to 2018. Taking the administrative vector boundary of Fengyang County as the auxiliary data, The random forest algorithm based on machine learning was used for feature classification, and combined with RS, GIS, visual interpretation and other methods to classify land use and analyze the landscape pattern of 7 remote sensing images of 1989, 1995, 2000, 2005, 2009, 2013 and 2018 in Fengyang County. The results show that the overall accuracy of 92.14% and the Kappa coefficient of 0.8956 were obtained by the random forest classification method, which can help to understand the spatial pattern changes and patterns of land use in Fengyang County under the background of rapid economic development, and has important reference significance for guiding urban and rural planning, land resource management and ecological environmental protection in Fengyang County.

Key words: Landscape pattern; Machine learning; Random forest; Land use classification

政府决策和人口增长对当地景观的影响主要表现在空间的配置组合形式上,社会的发展阶段与其联系复杂,由多个相互作用的地球表面生态系统组成的景观是异质的[1]。土地利用昭示着景观类型的转化,当地景观形态的演变发展现状,能够直接反映整体格局的拓展进程,由长时间序列引起的变化能够揭示城市中出现的生态问题,长期细致地总结其中问题有助于解决当下高频和高发的环境问题,满足现代人民的生活需要[2]。从以往的研究来看,在进行土地利用分类时,传统的景观分类有2种方法:最大似然法(Maximum Likelihood,ML)、支持向量机分类法(Supportvector Machine,SVM)。但對传统的方法而言,存在主观选择分类系统和训练样本的前提,导致训练样本的代表性不佳,同时同一类别的光谱在表现时有细微差异,然而概念的分类只能识别训练样本中的类别。在监督分类过程中,当样本数量较少或者未被操作者定义时,则无法识别[3]。本研究采用以决策树为基本单元的随机森林算法,本质上是机器学习算法的一种综合学习算法。它将多棵决策树集束集在一起,具有极好的精度,还可以在大数据上有效地运行,对于分类结果,可以得到1个内部的无偏估计[4],且当分类数据相对较小时,可以自动选择和排序主要的分类变量,这是一种优秀的特征空间优化技术[5]。研究结果为城市发展建设和规划提供数据支持,也对未来城市的资源协调利用和生态平衡提供支持和帮助。

1 材料与方法

1.1 遥感数据的获取 选择Landsat系列卫星影像数据作为凤阳县土地利用和规划的研究数据,时间范围为1989—2018年,具体时间在3—4月份,时间间隔为4~5年,使用数据的云量均低于5%。表1为Landsat系列卫星影像表列。

1.2 随机森林法 特征的有效增加能提高分类精度,筛选各特征变量对模型的影响非常重要。基尼系数(Gini Coefficient,GN)通常可作为衡量输入特征对模型贡献大小的评价标准,数值越高,特征的重要性越高[6]。本文使用的多时相多类型共58个特征,归一化重要性评分作为指标,客观评价各个特征的重要程度,且在实验中逐步减少输入特征维度,在保证模型分类性能和效率的基础上,为达到降维的目的,对最优特征子集进行了研究。

1.3 训练样本和验证样本 结合研究区Landsat系列数据景观类别解译的经验,据文献[7-8]的景观格局分类结果,凤阳县的主要耕地利用景观类有六大类:耕地、林地、裸地、水体、公路和建筑用地[9];根据文献[10]的研究经验和Google Earth高分辨率资料,在ENVI软件的支持下利用点、线、面混合的方式选择一定数量的类别数据作为样本数据。利用J-M距离可分离性评价样本数据的质量,对样本数据进行调整,使得最低分离度均大于1.85。经过评价后的样本数据,按照3∶1的比例分为训练样本与验证样本2类。

1.4 景观指标分析方法 景观面积比例(PLAND)是指某一类型景观斑块在总景观面积中所占的比例,表示该类斑块在景观中的影响程度,如式(1)所示。斑块密度(Patch Density,PD)是指某一类型景观斑块数量与面积之比,用来形容不同类型景观斑块的破碎程度和整个景观的破碎程度,如式(2)所示。最大斑块指数(Landscape Shape Index,LPI)是指景观中最大斑块面积除以景观总面积的,以反映景观的物种丰富度和物种多样性[11],如式(3)所示。

式(1)中,aij为第[ i ]类景观中第j块斑块的面积;式(2)中,N为第[ i ]类景观斑块数量;单位为个/hm2;式(3)中;max(ai)为第[ i ]类景观中的最大斑块面积。A为景观总面积。

2 结果与分析

2.1 特征重要性评估与最优特征子集的选取 将提取出波段反射率、K-T变换特征、主成分特征、纹理特征以及指数特征建立模型,利用归一化重要性评价各个特征对模型的贡献度大小,在所获取的58个特征变量重要性评分的基础上,选择经过EnMap-Box处理得到的最优特征子集,再建立随机的森立模型,以减少模型分类精度的降低。综合考虑各个特征重要性、平均和累积特征重要性与删减特征与总体精度、Kappa系数之间的关系,选取前43个特征作为优选特征子集。

2.2 机器学习分类结果的精度比较 在ENVI中的2种传统监督分类的方法:ML和SVM法进行分类,与机器学习的随机森林方法进行对比,结果如图1所示。由图1可知,随机森林的分类精度明显优于其他2种分类算法,其分类精度为0.9214,Kappa系数为0.8958。

2.3 基于随机森林方法的长时序景观格局分类结果 凤阳县1995—2018年水体变化、建筑分布、耕地监测变化结果如图2所示。

3 结论与讨论

本研究利用Landsat系列影像,通过随机森林分类方法对安徽省凤阳县近13年间的Landsat遥感影像进行了长时间序列上的景观格局分析,总体精度达92.14%,Kappa系数为0.8956。根据上述所得到的凤阳县景观格局分析的指数数据,结合凤阳县近13年间的遥感影像,得出以下结论:

(1)凤阳县1995、2000、2005、2009、2013、2018年这6期景观格局分类结果表明:凤阳县道路、居民区等建设用地面积不断增长;耕地总面积也在不断增加,但增加速度渐渐达到变慢;林地和水体改变并不明显;裸地面积先增后减。

(2)整体上,凤阳县1995—2018年各景观优势度发展趋势为:“居民区+道路”持续递增,耕地总面积持续上涨至趋于平缓。裸地年级在曲折中呈降低前景,但林地和水体的改变规则不明显,各景观类型的总体趋势呈现平衡发展态势。

(3)凤阳县1995—2018年间景观格局逐渐变好,各类景观斑块类型都在朝着均匀分布的方向发展,并且根据凤阳县近13年遥感影像可以看出凤阳县的景观类型逐渐丰富,景观要素也都呈现健康、均衡、稳定的发展。

(4)根据凤阳县1995—2018年土地利用现状的景观格局分析数据结果可以看出:凤阳县近13年的景观斑块碎化程度逐渐增加。凤阳县的裸地斑块的总面积、斑块密度、最大斑块指数等景观指数前期都在不断减少,但此时的道路和居民区的总面积、斑块密度等指数在迅速增加,说明凤阳县近几年经济一直在健康发展,城乡规划力度也逐年加大,并开始显现出成效。

在分类过程中,由于居民区和道路在建筑密集地区是难以区分的,可能会对凤阳县的景观格局分析结果造成了一定的影响;由最终的景观指数分类结果看出,鳳阳县近13年林地和水体变化的规律性并不明显,这可能是因为这2种地类其受阶段性影像较大,也与所获取影像的日期有很大关系,难以确定其变化趋势和规律。

参考文献

[1]李吟,周新邵.基于RS与GIS的区域景观格局动态演变研究[J].湖南城市学院学报(自然科学版),2017,26(03):35-38.

[2]靖传宝.基于Landsat时间序列数据的城市景观格局分析[D].济南:山东师范大学,2019.

[3]谢小杰.基于资源三号影像的植被信息提取方法及应用[D].南京:南京林业大学,2014.

[4]李庆,史敏伟.基于随机森林的多时相Landsat8土地利用分类研究[J].信息技术与信息化,2019(7):181-183.

[5]于新洋,赵庚星,常春艳,等.随机森林遥感信息提取研究进展及应用展望[J].遥感信息,2019,34(02):8-14.

[6]马玥,姜琦刚,孟治国,等.基于随机森林算法的农耕区土地利用分类研究[J].农业机械学报,2016,47(1) :297-303.

[7]赵琪.基于决策树的景观制图探讨与实践[J].测绘与空间地理信息,2019(3):131-134.

[8]叶红,张廷斌,易桂花,等.近15年郑州市土地利用景观格局分析[J].测绘与空间地理信,2018,41(8):85-88.

[9]闫琰,董秀兰,李燕.基于ENVI的遥感图像监督分类方法比较研究[J].北京测绘,2011(3):14-16.

[10]张伟,吴艳民,刘吉凯.Landsat系列影像支持下的凤阳县石英砂矿区土地利用动态监测[J].测绘通报,2018(6):91-97.

[11]张旭.兰州市土地利用与景观格局时空演变动态分析[J].甘肃科技,2018(19):41-44.

(责编:张宏民)

3857500338271

猜你喜欢

景观格局随机森林机器学习
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
资源型城市转型中景规格局的优化
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于随机森林算法的飞机发动机故障诊断方法的研究
基于支持向量机的金融数据分析研究
大都市边缘区土地利用规划对景观格局的影响
近十年我国城市景观生态学研究新进展