APP下载

基于核函数与可见光光谱的大豆植株群体净光合速率预测模型

2016-07-12武海巍于海业田彦涛王庆钰

光谱学与光谱分析 2016年6期
关键词:净光合大豆光谱

武海巍,于海业,田彦涛, 王庆钰

1. 北华大学电气信息工程学院,吉林省 吉林市 132013 2. 吉林大学工程仿生教育部重点实验室,吉林 长春 130022 3. 吉林大学植物科学学院,吉林 长春 130062

基于核函数与可见光光谱的大豆植株群体净光合速率预测模型

武海巍1,于海业2,田彦涛2, 王庆钰3*

1. 北华大学电气信息工程学院,吉林省 吉林市 132013 2. 吉林大学工程仿生教育部重点实验室,吉林 长春 130022 3. 吉林大学植物科学学院,吉林 长春 130062

采用美国MSR-16便携式多光谱辐射仪,通过推导的辐射仪有效观测面积公式,计算出测试单元数量,有效解决了测量区域可见光各波段光谱辐射配比关系M_D所需测量次数不确定的难题。采用美国CID公司生产型号为CI-310便携式光合作用测定系统,测量大豆植株群体净光合速率C_D。通过[0, 1]归一化方法对M_D和C_D进行归一化处理,分别得到归一化数据M_D1和C_D1。按不同测试时间划分,将M_D1分成两部分数据M_D11和M_D12,将C_D1分成两部分数据C_D11和C_D12。使用polynomial核函数、gauss核函数、sigmoid核函数和自主研发的bio-selfadaption核函数,利用grid-search,Genetic Algorithm,Particle Swarm Optimization对支持向量机惩罚参数c和参数g寻优,在支持向量机epsilon-SVR公式、nu-SVR公式条件下,通过四种核函数、三种优化方法、两种公式的交叉组合、M_D11、C_D11,建立大豆植株群体净光合速率预测模型。试验结果表明,在大豆植株试验区域面积S=17 m2和MSR-16便携式多光谱辐射仪放置于大豆植株冠层上方高度H=2 m条件下,epsilon-SVR-bio-selfadaption-grid-search模型对预测集1C_D12的预测精度达到85%以上,对预测集2C_D12的预测精度达到82%以上。在S和H其他组合条件下,epsilon-SVR-bio-selfadaption-grid-search模型对预测集2C_D12的预测精度达到81%以上。epsilon-SVR-bio-selfadaption-grid-search模型表明了bio-selfadaption核函数有效性、测量区域可见光光谱数据方法合理性、利用可见光光谱预测大豆植株群体净光合速率可行性。

可见光各波段光谱辐射; 支持向量机; 核函数; 大豆植株; 预测模型

引 言

光是大豆所必需的生态因子之一,影响大豆植株的形态、功能和大豆品质[1]。大豆植株个体净光合速率体现了单株大豆有机物积累,大豆植株群体净光合速率则为一个区域内大豆植株个体净光合速率总和,反映该区域内大豆植株群在一段时间内总光合作用合成有机物积累情况,对于分析区域大豆植株整体形态、功能和大豆品质有重要参考价值,因此有效预测大豆植株群体净光合速率在指导大豆植株种植生产中具有重要现实意义。

单植株叶面积反映其个体净光合速率大小[2],建立叶面积与个体净光合速率之间回归方程,可以实现对个体净光合速率预测[3],但实现对区域大豆植株群体净光合速率预测,则需要大量样本数据,工作量繁重,不易实现。本研究详细介绍获得区域可见光各波段光谱辐射配比关系数据和获得群体净光合速率数据方法,利用支持向量机(support vector machine, SVM),得到不同公式、不同核函数下大豆植株群体净光合速率预测模型,并详细讨论参数优化、模型组合过程以及不同预测模型对不同预测集的预测准确率问题。

1 数据来源及处理

1.1 区域可见光各波段光谱辐射配比关系数据

大豆植株试验基地为吉林大学植物科学学院位于吉林省梅河口市大豆种植基地。采用美国MSR-16便携式多光谱辐射仪,分析、采集辐射仪上方入射的可见光在460~710 nm波段间光谱辐射成分、各成分比例关系[4],测试方式如图1所示。

图1 获得区域可见光各波段光谱辐射配比关系方法示意图

设大豆植株试验区域面积为S和MSR-16便携式多光谱辐射仪放置于大豆植株冠层上方,高度为H,根据MSR-16便携式多光谱辐射仪工作手册,辐射仪在其正下方地面有效测量直径为H/2,则辐射仪有效观测面积S1=[π×(H/4)2],其中:π为圆周率,故试验区域划分的测试单元个数M=[S/S1]。取S=17 m2,H=2 m,则可得到有效观测直径H/2=1 m,有效观测面积S1=0.785 m2,故S/S1=21.656,测试单元数量M=21。

图2 归一化后的可见光各波段光谱辐射配比关系数据

测量时间跨度为2014年7月1日至8月31日,试验当日测量时间为9:00—16:00,每个时间段随机选取N个测试单元,其中N

1.2 大豆植株群体净光合速率数据

采用美国CID公司CI-310便携式光合作用测定系统测量大豆植株个体净光合速率[4]。在选定的每个测试单元内随机挑选3株大豆,若该测试单元内大豆植株数量低于3株,则按实际植株数量进行测量。每株大豆随机挑选5片叶片,若叶片数量低于5片,则按实际叶片数量进行测量。每片叶片采用CI-310便携式光合作用测定系统测量一次净光合速率,取平均值作为大豆植株个体净光合速率,3个测验单元平均值作为该时段试验区域内大豆植株群体净光合速率。与获得区域可见光各波段光谱辐射配比关系时间段相一致,获得测量时间跨度内大豆植株群体净光合速率C_D,进行[0, 1]归一化处理,得到归一化后的数据C_D1,如图3所示。

图3 归一化后的群体净光合速率数据

2 建立大豆植株群体净光合速率预测模型

2.1 影响群体净光合速率因素分析与数据处理

大豆植株群体净光合速率受多种生态因子影响,且各生态因子之间有互相影响、制约关系,难以确定群体净光合速率与各生态因子之间精确数学模型。经试验研究表明,植株个体净光合速率与M_D、叶温、光合有效辐射、散射辐射、气温、空气相对湿度、空气中CO2浓度、直射辐射、气孔导度、蒸腾速率、胞间CO2浓度等具有一定的关系。本研究主要分析区域可见光各波段光谱辐射配比关系与大豆植株群体净光合速率之间关系模型,故将叶温、光合有效辐射、散射辐射、气温、空气相对湿度、空气中CO2浓度、直射辐射、气孔导度、蒸腾速率、胞间CO2浓度等影响因子归为一个粒子,称为ε粒子。ε中各测试数据单位不相同,为将不同数量级数据统一到一个参考系下,对ε采取[0, 1]归一化方法。不同测试阶段、不同测试单元ε中各生态因子变化规律难以确定,故对ε中数据采取在[0, 1]区间随机赋值的数据处理方法。

2.2 建立支持向量机训练集和预测集

取M_D1在2014年7月1日至8月15日期间数据M_D11,取C_D1同一期间数据C_D11,将M_D11和C_D11作为SVM训练集。取M_D1在2014年8月16日至8月31日期间数据M_D12,取C_D1同一期间数据C_D12,将M_D12和C_D12作为SVM预测集1。将M_D12,C_D12,ε作为SVM预测集2。

2.3 参数寻优

采用训练集分为10组的K-fold交叉验证方法,利用grid-search[3],Genetic Algorithm(GA)[4-5],particle swarm optimization(PSO)[6],对SVM惩罚参数c、核函数参数g值进行参数寻优。

2.4 试验结果分析

采用epsilon-SVR公式、nu-SVR公式、polynomial核函数、gauss核函数、sigmoid核函数[7-8]、bio-selfadaption核函数[9],通过libsvm中model = svmtrain(C_D11,M_D11, cmd),其中cmd=[’-c’, num2str(bestc), ’ -g’, num2str(bestg) , ’-s3 -p0.01 -t2’],s代表采用的公式类型,p代表设置公式 中损失函数的值,t代表SVM中采用核函数类型,即通过训练集训练,得到不同公式、不同核函数下的大豆植株群体净光合速率预测模型,不同预测模型下对训练集C_D11拟合精度如表1、表2所示。

表1 Epsilon-SVR公式下训练集C_D11拟合精度

由表1可见,epsilon-SVR-bio-selfadaption-grid-search模型,称为EBSGS模型, 对训练集C_D11拟合精度最高,为86.757%。EBSGS模型参数优化选择结果如图4所示,对训练集C_D11拟合效果如图5所示。

图4 EBSGS模型下参数c和g优化结果图

图5 EBSGS模型对训练集C_D11拟合结果

表2 Nu-SVR公式下训练集C_D11拟合精度

Table 2 Fitting accuracy on training setC_D11based on nu-SVR formula

PolynomialGaussSigmoidBio-selfadaptionGrid-search72.89783.44669.79285.204GA73.00283.84569.99885.734PSO74.99285.67370.28187.069

由表2可见,nu-SVR-bio-selfadaption-PSO模型,称为NBSPS模型, 对训练集C_D11拟合精度最高,为87.069%。NBSPS模型参数优化选择结果如图6所示, 对训练集C_D11拟合效果如图7所示。

图6 NBSPS模型下的适应度曲线

EBSGS模型、NBSPS模型对训练集C_D11拟合精度相差0.312%。针对大豆植株群体净光合速率问题,EBSGS模型、NBSPS模型对训练集C_D11拟合精度水平相当。但由图4、图6可见,EBSGS模型惩罚参数c值为0.5,NBSPS模型惩罚参数c值为19.608,由于惩罚参数c值越小,表明该模型泛化能力越强,故EBSGS模型优于NBSPS模型。采用EBSGS模型对预测集1C_D12进行预测,预测效果如图8所示。

图7 NBSPS模型对训练集C_D11拟合结果

图8 EBSGS模型对预测集1 C_D12预测结果

由图8可见,EBSGS模型对预测集1C_D12预测精度达到85.518%。

采取[0, 1]归一化处理以及ε中各生态因子变化规律的不确定性,ε数据以步长0.1在[0, 1]间变化,经K-fold交叉试验,EBSGS模型对预测集2C_D12最差预测精度、对预测准确性影响最大的ε数据,如表3所示。

表3 加入ε后最差的相关系数r

EBSGS模型对预测集2C_D12预测效果如图9所示。

图9 EBSGS模型对预测集2 C_D12预测曲线

引入ε后,EBSGS模型对C_D12预测精度由85.518%下降到82.391%,但是高于80%,对于预测区域内大豆植株群体净光合速率问题而言,利用M_D,EBSGS模型对大豆植株群体净光合速率具备预测能力。

表4 H=2 m情况下EBSGS模型对预测集2 C_D12预测精度

表5 H=1.2 m情况下EBSGS模型对预测集2 C_D12预测精度

在H=2 m、S1=[π×(H/4)2]=0.785 m2、不同S条件下,EBSGS模型对预测集2C_D12预测精度,如表4所示。

在H=1.2 m、S1=[π×(H/4)2]=0.283 m2、不同S条件下,EBSGS模型对预测集2C_D12预测精度,如表5所示。

由表4、表5可见,不同S和H条件下,EBSGS模型对预测集2C_D12预测精度最低为81.654%。

3 结 论

依据区域可见光各波段光谱辐射配比关系数据,采用两种支持向量机公式、四种核函数、三种参数优化算法,建立大豆植株群体净光合速率预测模型,经K-fold交叉验证,EBSGS模型预测效果最佳。将影响大豆植株群体净光合速率的其他各生态因子归为一个粒子,并对粒子中各数据进行归一化处理,为有效检验区域可见光各波段光谱辐射配比关系与大豆植株群体净光合速率之间相关性提供了必要前提条件。利用EBSGS模型,在加入干扰因子ε条件下,对大豆植株群体净光合速率进行了有效预测,拟合程度达到80%以上,为有效分析区域大豆植株生长状态、大豆产量、大豆品质等提供了技术支持和试验方法。

[1] WANG Ying, CHENG Li-rui, LENG Jian-tian, et al(王 英, 程立锐, 冷建田, 等). Acta Agronomica Sinica(作物学报), 2010, 36(7): 1092.

[2] YU Hai-ye,ZHANG Lei,ZHOU Li-na,et al(于海业, 张 蕾, 周丽娜, 等). Journal of Jilin Agricultural University(吉林农业大学学报), 2007, 29(3): 237.

[3] WU Hai-wei(武海巍). Research on Support Vector Machine and Bionic Intelligent Algorithm to Light Environment Evaluation System of Planting Ginseng(支持向量机与优化算法在林下参光环境评价系统中的研究). Shengyang: Northeastern University Press(沈阳: 东北大学出版社), 2013.

[4] XU Bing, WANG Xing, Dhaene Tom, et al(徐 冰, 王 星, Dhaene Tom, 等). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(3): 638.

[5] YIN Yao-tian, WEI Wen-bo, YE Gao-feng, et al(尹曜田, 魏文博, 叶高峰, 等). Chinese Journal of Geophysics(地球物理学报), 2012, 55(2): 671.

[6] LIU Rui-lan, WANG Xu-liang, TANG Chao(刘瑞兰, 王徐亮, 唐 超). Acta Physica Sinica(物理学报), 2014, 63(2): 28105.

[7] Ramathilagam S, Huang Yueh-Min. Expert System with Applications, 2011, 38(2): 3793.

[8] Vapnik V N. The Nature of Statistical Learning Theory. New York: Sprinr Press, NY, 1995.

[9] YU Hai-ye, WU Hai-wei, TIAN Yan-tao, et al(于海业,武海巍,田彦涛,等). Chinese Patent(中国专利),CN103234916B,2015.

(Received Mar. 31, 2015; accepted Jul. 25, 2015)

*Corresponding author

Prediction Model on Net Photosynthetic Rate of Soybean Plant Groups Based on Kernel Function and Visible Light Spectrum

WU Hai-wei1, YU Hai-ye2,TIAN Yan-tao2, WANG Qing-yu3*

1. College of Electrical and Information Engineering, Beihua University, Jilin 132013, China 2. Key Laboratory of Bionic Engineering, Ministry of Education, Jilin University, Changchun 130022, China 3. College of Plant Science, Jilin University, Changchun 130062, China

The paper uses MSR-16 portable multispectral radiometer made in the USA and computes the numbers of the test units by pulling the formula on the radiometer effective observation area, which solves the problem on the uncertain numbers of computing the times on region visible light band spectral radiation ratioM_D. The paper uses CI-310 portable photosynthesis measurement system made by American CID Company and measures the net photosynthetic rate of a group of soybean plant.M_DandC_Dare normalized by the normalization method [0,1]. Then, the normalization dataM_D1andC_D1are gained . Based on the different test time,M_D1is divided ofM_D11andM_D12.C_D1is divided ofC_D11andC_D12. The paper uses polynomial kernel function, gauss kernel function, sigmoid kernel function and bio-selfadaption kernel function constructed by us with Support Vector Machine. Penalty parameter c and parameter g separately are optimized with optimization algorithms such as grid-search,genetic algorithm and particle swarm optimization. Based on the formula epsilon-SVR and the formula nu-SVR with Support Vector Machine, the paper constructs the prediction model on the net photosynthetic rate of a group of soybean plant by using of the cross combination with four kernel functions, three optimization methods and two formulas. The test results are as follows: in the condition ofS=17 m2which is the test plan area of soybean plant and theH=2 m which is the high on MSR-16 portable multispectral radiometer above the canopy of soybean plant, the prediction accuracy is up to 85% on the No.1 prediction setC_D12and the prediction accuracy is up to 82% on the No.2 prediction setC_D12based on the model epsilon-SVR-bio-selfadaption-grid-search. In the condition of other combinations withSandH, the prediction accuracy is up to 81% on the No.2 prediction setC_D12based on the model epsilon-SVR-bio-selfadaption-grid-search. The model epsilon-SVR-bio-selfadaption-grid-search indicates the validity of bio-selfadaption kernel functions which is constructed by our previous research with support vector machine. The model epsilon-SVR-bio-selfadaption-grid-search indicates the rationality of the measure method on visible spectral data in the test area. The model epsilon-SVR-bio-selfadaption-grid-search indicates the feasibility of the prediction method on net photosynthetic rate of soybean plant groups by using of visible spectrum.

Different bands of visible light spectrum; Support vector machine; Kernel function; Soybean plantl; Prediction model

2015-03-31,

2015-07-25

国家留学基金项目(201408220077),国家自然科学基金项目(31371641),“十二五”农村领域国家科技计划课题子课题项目(2011BAD35B06-2-)和国家转基因生物新品种培育科技重大专项分题项目(2014ZX08004-003)资助

武海巍,1978年生,北华大学电气信息工程学院副教授 e-mail: wuhwjlu08@mails.jlu.edu.cn *通讯联系人 e-mail: wangqy_jlu@yahoo.com

S132

A

10.3964/j.issn.1000-0593(2016)06-1831-06

猜你喜欢

净光合大豆光谱
注意防治大豆点蜂缘蝽
基于三维Saab变换的高光谱图像压缩方法
从大豆种植面积增长看我国粮食安全
巴西大豆播种顺利
大豆的营养成分及其保健作用
高光谱遥感成像技术的发展与展望
如何区分总光合与净光合
星载近红外高光谱CO2遥感进展
Photosynthetic Responses of A New Grapevine Variety‘Xinyu'in Turpan
苦味酸与牛血清蛋白相互作用的光谱研究