APP下载

基于随机森林算法的凉水自然保护区蓄积量反演研究

2016-10-26汪康宁

西南林业大学学报 2016年5期
关键词:蓄积量纹理反演

汪康宁 马 婷 吕 杰

(西安科技大学测绘科学与技术学院,陕西 西安 710054)



基于随机森林算法的凉水自然保护区蓄积量反演研究

汪康宁马婷吕杰

(西安科技大学测绘科学与技术学院,陕西 西安 710054)

以黑龙江凉水自然保护区为研究对象,采用GF-1卫星遥感影像为数据源,提取遥感影像在不同窗口大小下的纹理特征信息,与遥感影像自身的光谱信息相结合;利用随机森林算法,结合地面蓄积量采样点数据,建立凉水自然保护区蓄积量反演模型。结果表明:只基于卫星光谱的反演模型的相关系数为0.59,基于卫星光谱与纹理特征的蓄积量反演模型的相关系数为0.65;当窗口大小为3 × 3时,森林蓄积量反演效果最好。研究表明,基于卫星光谱信息和纹理特征信息,利用随机森林算法进行森林蓄积量反演在森林资源调查方面具有良好的应用前景。

蓄积量;反演;随机森林;保护区;高分一号卫星;遥感影像;纹理特征

森林蓄积量是评价森林的重要指标之一,是森林固碳能力的重要标志[1]。传统的森林蓄积量调查以局部人工地面实测方法为主,该方法存在调查周期长、数据更新慢、人力物力耗费大等缺点[2]。遥感技术作为一种对地观测方法,可以实现对森林的大面积实时观测,使森林蓄积量的快速实时估测成为可能。目前,基于遥感影像的森林蓄积量估测研究主要有2个方面:一是挖掘遥感影像中与森林结构相关性较强的信息进行反演估测,如利用多元数据的光谱信息、纹理特征、植被指数及衍生植被指数等信息构建反演模型[3-5];二是使用新的回归算法构建反演模型,从最初的多元线性回归模型到目前的多元非线性模型[6]、BP神经网络[7]、K近邻分类 (KNN)[8]等。随机森林作为一种机器学习算法,已经在点云数据分类、土地利用分类、生态评价等测绘学与地理学研究中得到应用[9-11]。目前基于遥感影像的森林蓄积量估测主要使用构建线性模型的方法,针对黑龙江凉水地区基于随机森林算法构建非线性蓄积量估测模型的研究还没有。本研究以黑龙江凉水自然保护区为研究对象,使用高分一号卫星遥感影像的光谱信息与纹理特征,结合实地实测数据,利用随机森林算法构建蓄积量反演模型,为森林蓄积量估测提供了一种新的方法。

1 研究区自然概况

本研究选择研究区域为黑龙江省伊春市带岭区的凉水国家级自然保护区。该保护区位于小兴安岭东坡,地处北纬47°6′49″~47°46′10″,东经128°47′8″~128°57′19″,总面积约为121.33 km2。保护区内以红松 (Pinuskoraiensis) 为主的天然林占绝对优势,同时还有云杉 (Piceaasperata) 林、山杨 (Populusdavidiana) 林、白桦 (Betulaplatyphylla) 林分布,森林覆盖率为98%。

2 研究方法

2.1随机森林算法

随机森林 (random forests) 是Leo Breiman等[12]人提出的一种基于决策树的机器学习算法,它实质上是一种使用分类回归树作为元分类器构建而成的集成分类器,如图1所示。该算法在执行回归和分类任务时可以获得比单个分类器更好的表现。

图1随机森林示意图

Fig.1Diagram of random forests

本研究中,随机森林算法使用德国地学研究中心 (GFZ) 提供的EnMAP (environmental mapping and analysis program) 工具实现。

2.2数据来源

2.2.1遥感数据

本研究使用的遥感数据为 “高分一号” 遥感影像。 “高分一号” 卫星是一种由我国自行研制并发射的高分辨率对地观测卫星,其上搭载的PMS相机成像幅宽60 km,可以获取2 m分辨率的全色黑白图像和8 m分辨率的多光谱彩色图像。其中8 m分辨率的多光谱彩色图像包括4个波段,分别为蓝色波段 (450~520 nm)、绿色波段 (520~590 nm)、红色波段 (630~690 nm) 和近红外波段 (770~890 nm)。

本研究采用的数据是2013年10月16日由 “高分一号” 卫星拍摄的凉水自然保护区8 m分辨率多光谱彩色图像。

2.2.2野外调查数据

地面调查数据来源于凉水国家级自然保护区,在保护区内以大约1 km的采样间隔划分矩形样地,每个样地大小为24 m × 24 m。精确统计了每块样地的蓄积量、林分组成以及海拔、坡度等地形因子。同时针对林区内的少量非植被覆盖区,如水体、道路建筑物等区域,也设立了部分样地,其蓄积量为0。最终共得到试验样地192块,随机选取135块作为训练样地,57块作为验证样地。

2.3数据处理

2.3.1遥感影像预处理

遥感影像在成像过程中,由于传感器平台、地球自转、地球曲率等原因,造成原始图像存在几何变形;而大气的吸收和散射作用、地形因素、传感器误差等因素,也会对传感器接收辐射值产生干扰。因此,对 “高分一号” 遥感影像进行辐射定标与FLAASH大气校正。之后进行正射校正,保证校正误差在1个像元以内,利用凉水地区小班矢量边界对进行正射校正的遥感影像进行裁剪,得到研究区影像数据。最后对遥感影像进行重采样,得到分辨率为24 m的遥感影像,作为试验使用的遥感影像。

2.3.2纹理特征分析

纹理特征是细小物体在影像上大量重复出现所形成的规律与特征。传统的纹理特征提取方法有灰度共生矩阵 (GLCM)[13]、空间自相关[14]、小波多频道、多方向特征[15]等。基于灰度共生矩阵提取的纹理特征,其在遥感影像分类与回归中的良好表现,已经得到国内外学者的证明[16]。故本研究选取了八个基于二阶矩阵的纹理滤波进行图像纹理提取,纹理的计算都是基于遥感影像的第一主成分 (PCA) 进行的,分别是均值 (mean)、方差 (variance)、协同性 (homogeneity)、对比度 (contrast)、相异性 (dissimilarity)、信息熵 (entropy)、二阶矩 (second moment) 和相关性 (correlation)。纹理特征计算公式见表1。

表1 基于灰度共生矩阵的纹理特征

在提取遥感图像纹理特征时,需要确定灰度共生矩阵的窗口大小。目前灰度共生矩阵窗口大小与蓄积量反演的精度尚未有明确的关系。故本研究选取3 × 3、5 × 5、7 × 7、9 × 9、11 × 11 5种窗口大小进行试验,分别提取5种窗口大小的纹理特征,与遥感图像光谱信息相结合,力求确定一个最佳蓄积量反演模型。

3 结果与分析

3.1纹理特征对蓄积量反演模型的影响

将灰度共生矩阵窗口大小设置为3 × 3,随机森林模型中决策树数量设置为100,联合光谱信息与纹理特征进行森林蓄积量估测,与单独使用光谱信息进行估测的结果对比,反演精度见表2,对比结果见图2。

表2 模型精度表

图2基于光谱信息与3 × 3窗口下纹理特征的凉水自然保护区蓄积量估测与反演

Fig.2(a) Forest volume estimation based on spectral; (b) Forest volume estimation based on spectral and textural feature in 3 × 3 window

表2表明:加入遥感影像的纹理特征提高了森林蓄积量估测模型的精度,纹理特征与森林蓄积量之间存在良好的相关性。预测结果与实测结果的相关性见图3。图3表明,联合反演模型的相关性明显优于单一反演模型,在低蓄积量区域尤为明显。

3.2窗口大小对蓄积量反演模型的影响

基于5种不同窗口大小灰度共生矩阵提取的纹理特征分别与遥感影像光谱信息联合,利用随机森林算法构建蓄积量估测模型,模型精度见表3。

表3 不同灰度共生矩阵窗口大小下的蓄积量反演模型精度

图3基于光谱信息与纹理特征模型的实测值与估测值的相关性

Fig.3(a) Correlation between measured value and estimated value based on spectral; (b) Correlation between measured value and estimated value based on spectral information and textural feature

由表3可知,随着灰度共生矩阵窗口大小的增大,蓄积量反演模型相关系数逐渐变小,其原因为3 × 3窗口所代表的实际面积 (5 184 m2) 与实际样地面积 (576 m2) 大小最为接近,故其相关系数最大。随着窗口大小的增加,窗口所代表的实际面积远大于实际样地面积,从而对纹理特征起到了平滑的作用,反而使森林蓄积量反演模型精度下降。

3.3决策树数目对蓄积量反演模型的影响

随机森林算法中,需要设置决策树数量,本研究选取在3 × 3窗口下生成的纹理特征,与遥感图像光谱信息结合,探究不同数量决策树对随机森林反演森林蓄积量模型精度的影响,结果见图4。

图4决策树数量与均方根误差的关系

Fig.4Relationship of number of decision tree and RMSE

由图4可知,当决策树数量达到1 500之后,均方根误差RMSE逐渐保持稳定。较少的决策树可以保证运算时间减少,故决策树数量选为1 500较为适宜。

4 结论与讨论

本研究利用随机森林算法构建反演模型进行森林蓄积量估测,结果表明遥感影像中的光谱信息和纹理特征与森林蓄积量之间存在较强的相关性,利用遥感影像对森林蓄积量进行估测是可行的。

联合光谱信息与纹理特征的反演模型反演精度明显高于单独利用光谱信息的反演模型,表明纹理特征可以提高森林蓄积量预测精度。

在本研究中,蓄积量反演模型在低蓄积量区域反演精度较好,在高蓄积量区域预测值明显小于实际值,出现这种情况的原因在于利用多光谱遥感影像估测森林蓄积量存在饱和度问题,饱和度阈值应在15左右,导致估测蓄积量在15以上的区域时估测值明显偏小。

[1]孟宪宇. 测树学[M]. 北京: 中国林业出版社, 1996.

[2]刘志华, 常禹, 陈宏伟. 基于遥感、地理信息系统和人工神经网络的呼中林区森林蓄积量估测[J]. 应用生态学报, 2008, 19(9): 1891-1896.

[3]刘俊, 毕华兴, 朱沛林, 等. 基于ALOS遥感数据纹理及纹理指数的柞树蓄积量估测[J]. 农业机械学报, 2014, 45(7): 245-254.

[4]王月婷, 张晓丽, 杨慧乔, 等. 基于Landsat 8卫星光谱与纹理信息的森林蓄积量估算[J]. 浙江农林大学学报, 2015, 32(3): 384-391.

[5]王佳, 宋珊芸, 刘霞, 等. 结合影像光谱与地形因子的森林蓄积量估测模型[J]. 农业机械学报, 2014, 45(5): 216-220.[6]张凝, 冯仲科, 冯跃文, 等. 旺业甸试验林场针叶林蓄积量估测模型的研究[J]. 中南林业科技大学学报, 2013, 33(11): 83-87.

[7]许云栋, 舒清态, 李圣娇, 等. 基于优化BP神经网络的香格里拉高山松蓄积量模型研究[J]. 西北林学院学报, 2015, 30(6): 190-195.

[8]王靖, 吴见. 干旱半干旱区森林蓄积量高光谱遥感估测技术[J]. 东北林业大学学报, 2014, 42(1): 69-70.

[9]Gislason P, Benediktsson J. Random Forests for land cover classification[J]. Pattern Recognition Letters, 2006, 27(4): 294-300.

[10]张雷, 王琳琳. 随机森林算法基本思想及其在生态学中的应用: 以云南松分布模拟为例[J]. 生态学报, 2014, 34(3): 650-659.

[11]孙雪莲, 舒清态. 基于随机森林回归模型的思茅松人工林生物量遥感估测[J]. 林业资源管理, 2015(1): 71-76.

[12]Breiman L. Random Forests[J]. Machine learning, 2001, 45(1): 5-32.

[13]Haralick R, Shanmugan K, Dinstein I. Textural Features for Image Classification[C]. IEEE Transactions on Systems,Man,and Cybernetics,1973, 3(6): 610-621.

[14]Soe W. Myint, Nina S. N. Lam, J. M. Tyler. Wavelets for urban spatial feature discrimination: comparisons with fractal, spatial autocorrelation,and spatial Co-occurrence approaches[J]. Photogrammetric Engineering & Remote Sensing, 2004, 70(7): 803-812.

[15]Mallat S G. A theory for multiresolution signal decomposition: the wavelet representation[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1989, 11(7): 674-693.

[16]Kuplich T M, Curran P J, Atkinson P M. Relating SAR image texture to the biomass of regenerating tropical forest[J]. International Journal of Remote Sensing, 2005, 26(21): 4829-4854.

(责任编辑曹龙)

Stock Volume Estimation Research Based on Random Forest Algorithm in Liangshui Nature Reserve

Wang Kangning, Ma Ting, Lv Jie

(College of Geomatics, Xi′an University of Science and Technology, Xi′an Shaanxi 710054, China)

This research taking Liangshui Nature Reserve in Heilongjiang as study area, using GF-1 satellite image as data source, textural features under different window sizes and spectral feature were extracted from GF-1 image. Forest stock volume inversion model were constructed using random forest algorithm and Liangshui forest volume data obtained by field investigation. Experimental results showed the coefficient of determinationR2was 0.59 for the spectrally based volume estimation model, and the coefficient of determinationR2was 0.65 for the spectral and textural feature combining model. When window size is set to 3 × 3, the forest stock volume inversion model achieves the best result. The result indicate that forest stock volume estimation based on spectral and textural feature from satellite image using random forests has potential application in forest inventory.

stock volume, inversion, random forest, nature reserve, GF-1 satellite, remote sensing image, textural feature

10. 11929/j. issn. 2095-1914. 2016. 05. 021

2016-04-13

高分辨率对地观测系统重大专项 (民用部分) 应用示范系统项目 (21-Y30B05-9001-13/15-7) 资助;国家自然科学基金项目 (51409204、41401496) 资助;陕西省自然科学基础研究计划 (2015JQ4105) 资助;江西省数字国土重点实验开放基金项目 (DLLJ2015604) 资助;2016年陕西省大学生创新创业训练计划项目 (1402) 资助;陕西省教育厅科研计划项目 (16JK1496) 资助。

吕杰 (1982—),男,博士,讲师。研究方向:林业遥感研究。Email: rsxust@163.com。

S771.8

A

2095-1914(2016)05-0125-05

第1作者:汪康宁 (1993—),男,硕士生。研究方向:林业遥感研究。Email: xustwkn@sina.com。

猜你喜欢

蓄积量纹理反演
反演对称变换在解决平面几何问题中的应用
基于ADS-B的风场反演与异常值影响研究
利用锥模型反演CME三维参数
一类麦比乌斯反演问题及其应用
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
当阳市森林植被碳储量及其价值评价
TEXTURE ON TEXTURE质地上的纹理
祁连山青海云杉林生物量与碳储量及其影响因素分析
消除凹凸纹理有妙招!