APP下载

基于高分二号的旺业甸林场蓄积量估测模型研究

2020-03-11刘兆华龙江平李新宇

中南林业科技大学学报 2020年3期
关键词:蓄积量方根样地

刘兆华,林 辉,龙江平,李新宇

(中南林业科技大学 a.林业遥感的数据与生态安全湖南省重点实验室;b.林学院,湖南 长沙 410004)

森林蓄积量调查是林业的一项重要工作[1]。随着遥感技术的发展,将遥感数据与地面数据相结合进行建模,估测出森林蓄积量并绘制出其分布图,是未来森林蓄积量的主要获取方法。

森林蓄积量遥感估测目前国内外已有大量的研究[2],遥感数据源主要有两个方面:一是光学遥感数据,主要有Landsat 系列,SPOT 系列、MODIS 以及国产的高分卫星和资源三号卫星等;二是微波遥感数据,包括激光雷达数据和合成孔径雷达数据等。模型方法从偏最小二乘、逐步回归等传统参数模型,到近几年逐渐兴起的机器学习算法,包括随机森林、神经网络、支持向量机等[3]。但普遍估测的精度较低,泛化能力较差,难以满足生产要求。因此,如何构建泛化能力强、精度高的森林蓄积量反演模型,是林业遥感领域中急需解决的问题[4]。

近年来,许多学者开始利用机器学习的方法对蓄积量进行估测,大多以TM、ETM、SPOT5等国外遥感卫星数据为数据源,而国产遥感卫星数据源的研究相对较少。本研究采用国产GF-2 卫星数据作为数据源,使用BP-神经网络(BP-ANN)、随机森林(RF)、K 邻近算法(KNN)、支持向量机(SVM)和多元线性回归(MLR)5 种方法,构建森林蓄积量的反演模型,并进行精度评价。

1 研究材料

1.1 研究区概况

旺业甸林场位于内蒙古赤峰市喀喇沁旗西南部(118°09′~118°30′E,41°21′~41°39′N),如图1 所示。林场主要地貌为中山山地和低山山地,地势西南高东北低,平均海拔800~1 890 m。旺业甸林场的人工林树种以落叶松Larix gmelinii、油 松Pinus tabuliformis、樟子松Pinus sylvestrisvar.mongolica、云杉Picea asperata和红松Pinus koraiensis为主,天然次生林树种以白桦、山杨、蒙古栎为主,林场森林蓄积的年平均年生长量为4.5 万m3[5-6]。

图1 研究区位置Fig.1 Location of the study area

1.2 据的获取及处理

1.2.1 外业数据的获取

在旺业甸林场内设置90个25 m×25 m 样地,2017年9月完成外业调查。其中,落叶松样地42 块,油松样地39 块,非林样地9 块,样地分布如图2所示。由于部分样地在遥感影像中被云覆盖,无法准确的提取该样地对应的遥感因子,因此将其作为异常样本剔除,最后得到合格样地75 块,其中32块落叶松样地、36 块油松样地及7个非林样地。

1.2.2 高分二号影像处理

研究所使用的GF-2 卫星遥感数据获取时间为2017年9月,包括4 景多光谱影像和4 景全色影像,在ENVI5.3 软件中实现GF-2 影像的预处理,包括:辐射定标、大气校正、正射校正、几何校正以及地形校正[7-8]。由于高分二号影像分辨率为1 m,而样地大小为25 m×25 m,为了使样地的DN 值与样地的蓄积量一一对应起来,利用ARCGIS 软件生成样地边界的矢量文件,并统计每个样地内的所有像元DN 值的平均值作为样地的遥感因子,这样就建立了像元的DN 值与样地蓄积量一一对应的关系[9]。

2 研究方法

2.1 遥感因子的提取与筛选

研究所提取的遥感因子包括GF-2 的4个单波段因子、通过4个波段计算得到的植被指数以及每个波段的8 种纹理特征[10-11]在内共43个遥感因子,分别计算各因子与蓄积量之间的Pearson 相关系数[12],最后选择出与蓄积量显著相关的因子作为建模时的自变量,如表1 所示,其中B2 为GF-2影像绿色波段,DVI 为差值植被指数(Difference vegetation index),EVI 为增强型植被指数,NDVI为归一化植被指数,B2_mean 和B3_mean 分别为绿色和红色波段灰度共生矩阵的均值[13-14]。

图2 样地分布Fig.2 Sample plot distribution

表1 自变量与蓄积量的相关系数Table 1 Correlation coefficient between independent variable and accumulation

2.2 蓄积量估测模型的构建

实验中使用与蓄积量显著相关的遥感因子,构建了BP-ANN、SVM、RF、KNN4 种机器学习模型以及1 种多元线性回归模型。BP 神经网络模型的基本原理是通过调整输入节点与隐层节点的联接强度取值W 和隐层节点与输出节点之间的联接强度T 以及阈值,使误差沿梯度方向下降,经过反复学习训练,找到预测结果误差最小时的权值和阈值[15-16];SVM 的主要思想是将低维空间中的x 用非线性函数拯射到一个高维特征空间cp(x),在高维空间中寻求线性回归超平面从而解决低维空间中的非线性问题,在构建SVM 模型时,要考虑其内核函数以及惩罚参数[17-18];RF 是一种基于决策树的集成算法,Breiman 在2001年对RF进行了一个详细的描述,在构建RF 时,要考虑到决策树的数量以及节点[19-20];KNN 是一种根据K个邻居的加权平均值来预测样本的方法,其关键点在于如何选择最佳的K 值[21]。

本次实验设置BP-ANN 模型的迭代次数为1 000 次,学习率为0.1,收敛目标为0.000 1;SVM 模型的核函数为高斯核函数,其表达式为其中σ 为可调参数,惩罚参数C 为1 000,gamma 为0.000 2;RF 模型的ntree 为500;KNN 模型的K 值从2 开始循环到50,得到当K 值为6 时,模型的精度最好,所以本次实验的K 值为6,距离为欧式距离。

2.3 模型精度评价

模型检验使用留一交叉方法进行精度验证,分别计算决定系数(R²)、均方根误差(RMSE)、相对均方根误差(RRMSE%)、3个指标对模型进行评价[22],3个评价指标公式如下:

其中yi为样地蓄积量的估测值,y为样地蓄积量的实测值,为样地蓄积量实测值的平均值,N为样地总数。

3 结果与分析

通过实测值和估测值散点图以及残差图来检验模型的拟合效果,结果如图3 所示。根据5 种模型的估测结果来看,其中机器学习模型都取得了较好的拟合结果(R²均达到0.6 左右),并对于非林样地的估测值都比较准确,但传统的线性回归模型拟合结果并不理想(R²仅为0.47),且对于非林样地的估测偏差较大。为了进一步评价5种模型对蓄积量的估测结果,分别计算并统计各模型的R²、RMSE 和RRMSE%(表2)。

图3 5 种模型的反演结果Fig.3 Inversion results of five models

表2 模型汇总Table 2 Model summary

由表2 可知,4 种机器学习模型相比于MLR模型,得到了更好的拟合关系,其中RF 模型的拟合度最高,其R²达到0.66;4 种机器学习模型的估测精度明显高于MLR 模型,它们的相对均方根误差要比MLR 模型低5%~10%,其中,RF 模型得到了最好的结果,其均方根误差为55.2 m³/hm², 相对均方根误差为28.1%。

利用构建的RF 模型对整个研究区的林分蓄积量进行反演,得到旺业甸林场蓄积量分布图,如图4 所示。从图中可以看出,研究区中蓄积量最大值为359.6 m³/hm²,最小值为0,没有出现负值,并且蓄积量主要分布在林场的东南部与西部地区,东北部与西北部地区蓄积量较少,符合实际调查结果。

图4 旺业甸林场蓄积量分布Fig.4 Distribution of the accumulation volume of Wangyedian forest farm

4 结论与讨论

本次研究以内蒙古省旺业甸林场作为研究区,使用GF-2 遥感数据并结合地面调查的75个样本,构建了RF,KNN,SVM,ANN 和MLR5 种森林蓄积量估测模型,并采用留一交叉方法进行了精度检验,得到了以下结论:

1)本次实验提取了GF-2 影像的6 种植被指数以及4个波段的8 种纹理特征用于构建林分蓄积量模型,并得到了较好的拟合结果,说明使用GF-2 遥感数据进行林分蓄积量的估测是可行的。

2)由本文结果可知,在构建林分蓄积量模型的过程中,机器学习的方法明显优于传统的线性回归方法,并且RF 模型取得了最好的估测结果,其均方根误差为55.2 m³/hm²,相对均方根误差为28.1%。

在本研究中,GF-2 数据在估测蓄积量中表现出了巨大的应用潜力,实验中选择了RF、KNN、SVM 和ANN4 种机器学习算法进行了旺业甸林场的蓄积量反演并于传统的线性回归模型进行比较,为以后的蓄积量估测研究提供了一定的参考价值。可能由于样本量较少的原因,SVM 和ANN 模型还并未完全发挥出其预测能力,并且研究中仅仅使用单一模型进行蓄积量的估测,在后续的研究中可以将集成学习的思想加入进来,将几种机器学习模型结合为一个集成学习器,使得每一种算法在估测蓄积量中均有所贡献。与同类研究相比,本次实验所选择的回归模型较多,并且模型验证方法使用留一交叉验证,因此本实验的结果更具有说服力。但研究样本仅为研究区的优势树种油松和落叶松,所以本次实验对于针叶林的蓄积量估测具有一定的参考价值,对于阔叶林和针阔混交林是否适用还有待进一步研究。

猜你喜欢

蓄积量方根样地
野生欧洲李光合特性日变化及其与环境因子的相关性分析
仁怀市二茬红缨子高粱的生物量及载畜量调查
随机振动均方根加速度计算方法研究及应用
额尔古纳市兴安落叶松中龄林植被碳储量研究
基于角尺度模型的林业样地空间结构分析
我们爱把马鲛鱼叫鰆鯃
当阳市森林植被碳储量及其价值评价
祁连山青海云杉林生物量与碳储量及其影响因素分析
数学魔术——神奇的速算
数学魔术