APP下载

基于BP神经网络的杉木标准树高曲线1)

2014-07-27董云飞孙玉军王轶夫郭孝玉

东北林业大学学报 2014年7期
关键词:树高输入量隐层

董云飞 孙玉军 王轶夫 郭孝玉

(北京林业大学,北京,100083) (中国科学院地理科学与资源研究所) (江西农业大学)

基于BP神经网络的杉木标准树高曲线1)

董云飞 孙玉军 王轶夫 郭孝玉

(北京林业大学,北京,100083) (中国科学院地理科学与资源研究所) (江西农业大学)

以福建省将乐县国有林场29块杉木人工林实测数据为例,运用BP神经网络建模技术建立树高预测模型。分别确定输入量和隐层节点数,再经训练和优选,得到的最优模型结构为2∶5∶1,决定系数为0.902 3,均方误差为1.784 2。结合传统的两个标准树高曲线方程,利用检验数据分别对模型进行验证。结果表明:BP神经网络模型不管是拟合效果还是预测效果都明显优于传统方程,可以作为有效的树高预测技术。

杉木;标准树高曲线;BP神经网络模型

Journal of Northeast Forestry University.-2014,42(7).-154~156,165

We used the data of 29 plots of Chinese fir located in national forest farm of Jiangle in Fujian Province to build height prediction model by BP neural network. First, the input variable and the hidden nodes were determined, then, by training and optimization, an optimum model was developed, with a model structure of 2∶5∶1, a determinate coefficient of 0.902 3 and error of mean square of 1.784 2. And then, it was compared with two traditional generalized height-diameter equations, the validation datasets were used to test the models, respectively. The fitting effect and prediction effect of BP neural network model are better than those of traditional equations, and BP neural network model can be used as effective tree height prediction technology.

Keywords Chinese fir; Generalized height-diameter model; BP neural network model

树高是森林经营管理以及林木生长收获研究中必需的因子。森林调查中,通常是先测量部分样木的胸径与树高来建立树高曲线,然后对缺失的树高进行预测。普通的树高曲线(仅以胸径为自变量)需要为每个林分建立不同的模型,因此,普通的树高曲线的应用范围非常局限。而标准树高曲线(以胸径和林分因子为自变量)可用于更广的区域[1-2]。传统的树高曲线建模方法,多运用与树高生长相关的各因子,采用线性或非线性进行拟合,建立相应的曲线方程。然而由林分的生长理论可知,非线性、复杂性是林分生长的本质。人工神经网络具有无限逼近任意非线性的能力,而且不依赖于现存模型,特别适合进行非线性建模[3-5],BP(Back Propagation)神经网络是人工神经网络中的应用最广的一种网络。

近年来,BP神经网络逐步被应用到林业中来,尤其预估林分生长[6-9],陈晨等[10]和马天晓等[11]分别基于BP神经网络建立了马尾松和毛白杨的树高曲线模型,虽然预测效果较好,但是并没有添加林分因子,应用范围较窄。本文以杉木为例,建立基于BP神经网络的标准树高曲线模型,并与传统的标准树高曲线方程进行比较,探讨其在树高估测上的可行性,为树高曲线建模与估测工作提供参考依据。

1 研究区概况

研究区位于福建省将乐县国有林场。将乐县位于福建省西北部,地处武夷山脉东南部,地理坐标为26°26′~27°04′N,117°05′~117°40′E,以中、低山为主,海拔180~500 m。属亚热带季风气候,具有海洋性和大陆性气候特点,年平均气温18.7 ℃,年均降水量1 672.3 mm,平均相对湿度81%。境内气温较高,夏季时间长,冬天较暖,霜冻较少,树木生长期长[12]。

2 研究方法

2.1 BP神经网络

2.2 模型构建

图2 单隐层BP神经网络结构图

BP神经网络需要对参与建模的数据进行前期处理。数据的归一化处理会提高网络的训练效率[15-16],结果输出时再进行反归一化处理。所以,本文对输入变量和训练输出量按比例压缩法进行了归一化处理,公式为:

式中:X代表原始数据;Xmax、Xmin分别代表原始数据的最大值和最小值;Y代表变换后的数据;Ymax和Ymin分别代表目标数据的最大值和最小值。

建模过程中,学习速率设置为0.01,最大迭代次数为1 000,目标精度为0.001,隐层神经元传递函数选用logsig函数(Y=1/(1+e-x),X、Y分别为自变量和因变量),输出层传递函数用purelin函数(Y=aX+b,X、Y分别为自变量和因变量)。训练算法选用Levenberg—Marquardt法,模型精度评价采用决定系数(R2)和均方误差(MSE)。R2越大、MSE越小,模型拟合精度越高。

3 结果与分析

3.1 输入量的确定

选取将乐县国有林场的29块杉木纯林样地(2 577株),样地面积为(20×20 m或20×30 m)0.04或0.06 hm2,实测样地树木的胸径和树高,起测胸径为2.0 cm,树高精度为0.1 m。根据国内外标准树高曲线和常用方程[13],选择树高(H)、胸径(D)、优势树高(Ht)、优势胸径(Dt)、样地平均胸径(Dg)、断面积(BA)、大树断面(BAL)、林分密度(SPH)等因子作为备选输入量(见表1)。其中:优势树高和优势胸径,分别选取样地中树高和胸径最大的5棵树,求其平均值;大树断面(SPH)为大于对象木胸径的所有竞争木的断面积之和。通过对树高与各影响因子的相关性分析,各因子与树高(H)的相关性由大到小顺序为:D(0.857 0)、Ht(0.832 2)、Dg(0.791 1)、Dt(0.788 4)、BA(0.596 1)、SPH(-0.419 9)、BAL(0.122 3),且相关性都极显著。

表1 模拟和验证数据概况

为了分析不同输入量对模型精度的影响,按照各因子与树高的相关性大小顺序,逐步加入到神经网络的构建中,且此时隐层节点数为4。每种网络训练20次,求R2和MSE的平均值,结果见表2。由表2可知,随输入量的增加,决定系数增加,均方误差减小;当加入优势树高Ht时,R2平均值、MSE平均值变化最大。加入其它因子对精度影响较小,一方面输入量过多,可能造成网络的冗余,另一方面为了增强模型的实用性和简单性。因此,选用胸径(D)和优势树高(Ht)作为网络的输入变量。

表2 不同输入量的拟合效果

3.2 隐层节点数的确定

表3 不同隐层节点数的拟合效果

为了进一步分析不同节点数的拟合效果,用surf分别节点数做仿真图,发现当节点数达到6时,树高随胸径和优势树高的变化开始出现失真(如图3),因此,最适宜的隐层节点数为5。

图3 标准树高曲线神经网络仿真曲面

3.3 最优模型

输入量及节点数确定后,经过不断重复的训练,选择最优的模型作为最终模型,相应的神经网络模型的传递函数表达式为:

H=purelin(4.212 9+0.324 3h1+0.09h2+9.500 4h3+0.126h4-3.794 4h5)。

h1=logsig(-2.720 7+9.070 2D-1.442 2Ht);

h2=logsig(21.181 5-2.342 5D-36.591 4Ht);

h3=logsig(-1.012 2-0.192 7D+0.332Ht);

h4=logsig(4.174+3.303 5D-5.004 8Ht);

h5=logsig(-1.109 5-0.686 1D+0.476 8Ht)。

式中:H为树高值(归一化后的值);hi表示隐层神经元的传递输出;i=1,2,3,4,5;purelin为线性函数;logsig为对数S型函数;D和Ht分别为胸径和优势树高。

3.4 模型的验证及比较

根据所选用的胸径和优势树高,在传统标准树高曲线研究中选择了两个方程[2,14](M1、M2),运用同一建模数据预估各参数值,将检验数据分别带入到三个模型中,并对它们的预测结果进行分析(见表4)。由表4可知,不管是建模数据的拟合效果还是检验数据的预测效果,BP神经网络的相关精度都比传统的方程要高。图4为BP神经网络模型对检验数据树高预估情况。在优势树高一定的情况下,树高随胸径的增加而增加;在胸径一定的条件下,优势高越大,树高越大。这些都符合林木实际生长的客观规律。

; (M1)

图4 BP神经网络预估效果

3 结论

以胸径、优势树高作为输入变量,以树高作为输出变量,构建了两输入一输出的杉木标准树高曲线神经网络预测模型。胸径和树高一直就存在密切的关系;树高的生长受立地条件影响较大,而优势树高能够反应立地质量的好坏,因此,把胸径、优势树高选作为输入量,不仅仅具有相关性,而且具有生物学意义。

基于20块样地树高实测数据作为训练数据,比较了隐层不同节点数对模型拟合效果的影响,发现尽管节点数的增加会提高模型的拟合精度,但是根据其仿真曲面可知,当节点数增加到6时,模型开始失稳,不符合其生物学意义。因此,在选择合适的隐层节点数时,用定性与定量分析相结合的方法进行模型性能分析,以克服神经网络在训练中容易出现过度拟合数据而降低模型泛化能力的缺陷,使分析结果可靠、可信。

经过大量的训练,选择最优的网络模型,并结合相同自变量的两个标准树高曲线方程,对三者的预测效果进行对比分析,BP神经网络的预测精度明显高于传统方程。BP神经网络在实际运用中,只需测量胸径和优势树高,就可以预测林木的树高,具有较强的实用性。

[1] 丁贵杰.贵州杉木人工林标准树高曲线模型[J].山地农业生物学报,1996,15(4):16-21.

[2] 王明亮,唐守正.标准树高曲线的研制[J].林业科学研究,1997,10(03):36-41.

[3] 浦瑞良,宫鹏,YangR.应用神经网络和多元回归技术预测森林产量[J].应用生态学报,1999,10(2):129-134.

[4] 林辉,彭长辉.人工神经网络在森林资源管理中的应用[J].世界林业研究,2002,15(3):22-31.

[5]Matlab.神经网络应用设计[M].北京:机械工业出版社,2010:94-95.

[6] 李际平,姚东和.BP模型在单木树高与胸径生长模拟中的应用[J].中南林学院学报,1996,16(3):34-36.

[7] 黄家荣,高光芹,孟宪宇,等.基于人工神经网络的林分直径分布预测[J].北京林业大学学报,2010,32(3):21-26.

[8] 徐步强,张秋良,弥宏卓,等.基于BP神经网络的油松人工林生长模型[J].东北林业大学学报,2011,39(12):33-35.

[9] 龙滔,覃连欢,叶绍明.基于BP神经网络连栽桉树人工林生长量预测[J].东北林业大学学报,2012,40(5):122-125.

[10] 陈晨,刘光武.马尾松人工林树高BP模型研究与应用[J].安徽农业科学,2012,40(14):8175-8177.

[11] 马天晓,赵晓峰,黄家荣,等.基于人工神经网络的树高曲线模型研究[J].河南林业科技,2006,26(1):4-5.

[12] 王轶夫,孙玉军,郭孝玉.基于BP神经网络的马尾松立木生物量模型研究[J].北京林业大学学报,2013,35(002):17-21.

[13] 魏晓慧,孙玉军,马炜.基于Richards方程的杉木树高生长模型[J].浙江农林大学学报,2012,29(5):661-666.

[14] 赵俊卉,亢新刚,张慧东,等.长白山3个主要针叶树种的标准树高曲线[J].林业科学,2010,46(10):191-194.

[15] 金星姬,贾炜玮,李凤日.基于BP人工神经网络的兴安落叶松天然林全林分生长模型的研究[J].植物研究,2008,28(3):370-374.

[16] 胥辉,全宏波,王斌.思茅松标准树高曲线的研究[J].西南林学院学报,2000,20(2):74-77.

Generalized Height-diameter Model for Chinese Fir Based on BP Neural Network/

Dong Yunfei, Sun Yujun(Beijing Forestry University, Beijing 100083, P. R. China); Wang Yifu(Institute of Geographic Sciences and Natural Resources Research, CAS); Guo Xiaoyu(Jiangxi Agricultural University)//

1) 林业公益性行业科研专项(200904003-1);国家林业局重点项目(2012-07);林业科技成果国家级推广项目([2014]26)。

董云飞,男,1990年9月生,北京林业大学林学院,硕士研究生。E-mail:dongyfei@163.com。

孙玉军,北京林业大学林学院,教授。E-mail:sunyj@bjfu.edu.cn。

2013年12月9日。

S791.27

责任编辑:王广建。

猜你喜欢

树高输入量隐层
基于RTD可编程逻辑门的n变量函数实现算法
电流互感器测量结果不确定度评定
基于BP神经网络学习算法的图像压缩技术研究
基于集成检定法的重力式自动装料衡器测量结果的不确定度评定
输入量与尿量比在深Ⅱ度烧伤患者休克预防性补液中的应用分析
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
华北落叶松人工林生长规律研究
人工福建柏胸径与树高关系的研究
不同种源马尾松树高与胸径生长相关模型研建