APP下载

谷子叶绿素含量高光谱特征分析及其反演模型构建

2022-03-26彭晓伟张爱军杨晓楠

干旱地区农业研究 2022年2期
关键词:拔节期反射率叶绿素

彭晓伟,张爱军,2,杨晓楠,王 楠,赵 丽

(1.河北农业大学国家北方山区农业工程技术研究中心,河北 保定 071000;2.河北省山区研究所,河北 保定 071000;3.河北农业大学机电工程学院,河北 保定 071000;4.河北农业大学农学院,河北 保定 071000)

叶绿素直观反映作物的生长状态,其含量与植被胁迫、光合作用能力以及健康状况密切相关[1-2],很大程度决定了作物的产量[3-4]。及时准确地估算叶绿素含量有助于发现叶片缺素症状,从而避免作物减产。目前,估测叶绿素的方法主要为点位采样测定,及基于卫星遥感影像大面积估算[5]。其中,点位测定依赖作物叶片组织,耗时耗力,难以实时、大范围估测[6];卫星遥感影像时空分辨率较低、存在易受到大气及空间辐射影响等缺陷也严重制约大面积评估作物生长状态的精度[7]。无人机技术的出现以其高时空分辨率、低干扰及使用简便灵活的优点,填补了现有农业监测技术的缺陷,能通过监测氮素含量[8]、叶绿素[9]、叶面积指数[10]等生理生化指标快速精准评估大田作物长势[11]。因此,无人机航测在农业生产中的广泛应用有助于指导农业生产及保证作物产量,并为集群农业管理提供新技术、新思路。

高光谱数据反演叶绿素含量的研究已相当成熟,400~700 nm波段的透射率及反射率与叶绿素含量高度相关,众多研究通过构建不同的数学模型来量化高光谱数据与叶绿素含量的关系[12]。一元线性回归模型,及多元线性回归模型被广泛应用于构建光谱一阶导数与叶绿素含量的关系,其精度(R2>0.8)较高,具有估测叶绿素含量的能力[13-14]。但单一的线性关系不足以表征变量间的相互作用,模型参数具有极大的局限性[15]。亦有研究基于敏感波段建立优化型土壤调节指数TCARI(Transformed chlorophyll absorption ratioindex)/OSAVI(Optimization of soil adjust vegetation index),以估测植株的叶绿素含量[16]。随着计算机技术的高速发展,基于大数据基础的机器学习方法提升了叶绿素含量估算数学模型的适用性和精度[17]。BP神经网络能大大提高利用高光谱反射数据估算玉米叶绿素含量的精度[18],支持向量机和粒子群优化算法亦能对作物叶绿素含量有较优(R2>0.88)的精度估算[19-20]。现有基于高光谱估算叶绿素含量的研究基本基于单一的数学模型,集中在作物的某一生育期[21-22],而对于多模型结合能否有效估算不同生育期的叶绿素含量这一问题仍缺乏充分的回答。因此,构建不同数学模型估算叶绿素含量有助于补充科研空缺,为多模型综合估算农作物长势提供科学基础。

本研究基于无人机平台,通过机载高光谱相机进行田间光谱测定,并综合分析农作物的长势状况,探究不同模型对不同生育期谷子叶绿素含量估算的适宜性。并且,选择了不同生育期的最佳参数,基于一元线性模型、PLSR模型及BP神经网络建立估算模型,比较不同模型的估测精度及其对谷子各时期的适用性。

1 材料与方法

1.1 光谱测定

分别在拔节期(8月11日)、抽穗期(8月21日)、灌浆期(9月10日)、成熟期(9月28日)利用大疆公司经纬M600 Pro无人机搭载双利合谱公司10 cm分辨率的Gaiasky mini 2-VN高光谱相机对谷子冠层的光谱进行采集,无人机飞行高度为200 m,测量时段为10∶00—14∶00,天气晴朗无风。无人机测量前用白板进行校正,以保证数据的准确性,每个小区均随机采集3个样点的光谱数据,并利用ENVI 5.3对每个小区的光谱数据进行校正。与光谱测量同步,使用日本柯尼卡美能达公司叶绿素仪(SPAD-502)测定样点附近5株植株的叶绿素含量,每片叶子均匀测量3次,取平均值作为样本的叶绿素含量,实现与叶片光谱数据的一一对应。

1.2 模型构建

1.2.1 一元函数模型及植被参数的选取 采用五点加权平滑法对原始光谱数据进行预处理,并利用SPSS 20.0软件计算光谱数据与叶绿素值的相关性,从而选取相关系数最大的波段即特征光谱,采用指数函数、一元线性函数、对数函数、多项式以及幂函数构建叶绿素含量估算模型,选取最优的函数模型作为叶绿素含量的一元线性回归模型,光谱反射率中的近红外波段会受到作物中叶片的色素、水分、细胞结构的影响,而这些影响会导致可见及近红外区域特定范围内特定位置与特定面积的改变[23],基于光谱曲线,计算植被指数及三边参数(表1),并建立相应的拟合方程。

表1 基于光谱曲线构建的植被指数和三边参数

1.2.2 偏最小二乘回归 偏最小二乘回归方法(Partial least squares regression,PLSR)集主成分分析、典型相关分析及多元回归分析的优点为一体,可以有效解决多元回归分析中的变量高度自相关及噪声问题[24-25]。除此之外,模型具有一定的预测功能,而且允许在样本数量少于自变量个数的条件下回归建模,且能在最终模型中包含原有的所有自变量,亦于辨识系统信息与噪声。本研究中,光谱参数为自变量,叶绿素含量为因变量。为了避免过度拟合,引入交叉验证以确定 PLSR模型中的主成分数量[26]。当R2值大于 0.5 时,PLSR模型被认为对结果有良好的预测[27]。一般具有最大的Q2和最小的RMSECV(交叉验证均方根误差)的PLSR模型最优。计算公式如下:

PLSR使用SIMCA-P14.1计算。SIMCA-P14.1是由Sartorius Stedim公司开发的一款多元变量统计分析软件,通过SIMCA-P14.1的PLS模块建立回归模型,计算得出主成分个数、解释能力、累积解释能力、交叉验证均方根误差(RMSECV)和变量投影重要性(VIP)。

1.2.3 BP神经网络模型 本研究构建了一个输入层、一个输出层、五个隐含神经元、一个输出所构成的BP神经网络进行训练,迭代次数为1 000,学习精度为0.01。训练目标为均方根误差小于0.001。BP神经网络算法的参数如表2,针对各时期108组谷子叶片样本,利用神经网络建立叶绿素估算模型,选取各个时期的入选植被指数作为输入层,以谷子叶片的叶绿素值作为输出层,隐含层由公式1确定节点数,经过多次模拟训练,最优节点数确定为9。用其中72个样本作为建模集,32个样本为测试集,在Matlab 2019b软件中通过编写程序代码进行BP神经网络建模,对各生育期谷子叶片叶绿素值进行训练,建立不同生育期谷子叶片叶绿素值的BP神经网络模型。

表2 BP神经网络算法参数

式中,k为输入层单元数;m为输出层单元数;α为[1,10]之间的常数。

1.2.4 模型精度检验 本研究采用决定系数(Coefficient of determination,R2)、均方根误差RMSE(Root mean square error)两个指标来评估模型的精度,主要公式如下:

据报道,截至2018年6月25日,第一批中央环保督察“回头看”已通报32起环境违法问题,均为企业所为。中央环保督察组“回头看”通报典型案例,湖北鄂州葛店开发区敷衍整改,臭气扰民问题依然如故;湖南岳阳绿色化工产业园云溪片区企业偷排问题突出,严重影响松杨湖水环境质量;吉林省辽源市整改敷衍应对,52个企业的工业废水、生活废水直接排入仙人河,黑臭问题依然突出。

2 结果与分析

2.1 谷子叶片反射光谱特征分析

不同生育期的谷子叶片叶绿素值如表3所示,谷子叶片叶绿素含量在不同生育期呈先增加后减少的趋势,最大值出现在抽穗期,约为66.40。

表3 谷子叶片叶绿素含量统计分析

谷子叶片的光谱反射率变化趋势基本一致,而光谱反射率随着叶绿素的增加呈现出降低的趋势(图1a)。在可见光波段400~700 nm,拔节期和抽穗期谷子分别在550、660 nm处存在明显的吸收峰和吸收谷。在此波段内,光谱反射率并不随叶绿素含量线性变化,而呈先增加后减小的趋势,SPAD值分别为44.80、50.14及60.40时,对应的光谱反射率归一化均值分别为0.048、0.054、0.050,有10.86%和3.0%的增幅。反射率在700~780 nm波段开始急剧上升,SPAD值分别为44.80、50.14及60.40的光谱反射率归一化均值分别为0.582、0.573、0.648,有1.87%的降幅和11.24%的增幅。在780~1 300 nm波段,亦有一个明显的吸收峰(800 nm)和一个明显的吸收谷(900 nm),其中,3种叶绿素含量对应的光谱反射率的归一化均值亦随着叶绿素的增加存在1.70%和18.56%的增加。

如图1b所示,近红外波段的光谱一阶导数可以显著地增强红边波段,红边波段的一阶导数光谱是整个波段范围的最大值,对应为反射率在600~800 nm的强吸收效应。SPAD值分别为44.80、50.14及60.40时,对应的一阶导数光谱反射率归一化均值分别为0.298、0.401、0.339,有34.70%和13.93%的增幅。在700~780 nm波段,740 nm左右出现波峰,780 nm处出现波谷,SPAD值分别为44.80、50.14及60.40的一阶导数光谱反射率的归一化均值分别为0.619、0.667、0.635,有7.70%和2.65%的增幅。在780~1 300 nm波段,SPAD值分别为44.8、50.14及60.4的一阶导数光谱反射率的归一化均值分别为0.391、0.448和0.363,有14.67%的增幅和7.16%的降幅。

图1 谷子叶片不同SPAD值下的光谱反射率

2.2 谷子叶片叶绿素一元预测模型的构建

光谱特征参量与叶绿素的相关性分析显示,NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy与不同生育期的叶绿素均呈极显著相关关系(表4)。因此,可用NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy6种指数作为建立估算谷子叶绿素含量的自变量。

表4 光谱特征参数与谷子叶片叶绿素的相关系数(n=108)

如表5所示,在不同生育期,分别基于一次线性、二次非线性、指数及对数形式构建各因子与叶绿素含量的对应关系。在拔节期和抽穗期NDVI与叶绿素含量有较好的对应关系(R2>0.52),估算值也具有最小的残差(RMSE<2.28)。在灌浆期和成熟期,RENDVI(R2=0.51,RMSE=2.21)、PSSRc(R2=0.62,RMSE=2.47)则分别对叶绿素含量估算有较好的适用性。其中,NDVI的二次非线性、一次线性模型分别在拔节期和抽穗期表现良好;RENDVI、PSSRc则分别以一次线性及指数形式出现在灌浆期和成熟期。

表5 基于光谱指数的谷子叶片叶绿素含量预测模型

2.3 谷子叶片叶绿素含量PLSR预测模型构建

基于高相关的光谱特征参数NDVI、GNDVI、PSNDa、PSSRc、RENDVI及Dy构建了谷子叶片叶绿素含量PLSR预测模型(表6)。PLSR模型的Q2均高于0.56,对因变量的解释程度一般,R2均在0.6以上,而预测集的R2在0.55~0.71之间,其RMSECV在1.41~2.66之间。在拔节期,PLSR模型的第一主成分对叶绿素变化的解释能力为67.8%,加入第二、三主成分解释能力增加到82.7%、95.8%;抽穗期、灌浆期和成熟期PLSR模型对叶绿素的总解释能力分别为63.1%、84.5%和84.7%。

表6 谷子叶片叶绿素值与敏感光谱指数的PLSR模型

由图2可知,在拔节期PLSR模型第一主成分Dy和PSSRc权重较大,分别在负侧和正侧起主导作用。第二主成分则为RENDVI(正侧)和GNDVI(负侧)起主导作用。抽穗期分析结果与成熟期一致,PLSR模型第一主成分Dy(负侧)和NDVI(正侧)权重较大,起主导作用,第二主成分则由NDVI(正侧)和GNDVI(负侧)起主导作用。在灌浆期,第二主成分的正侧权重由NDVI变为Dy,其他权重结果与抽穗期一致。

图2 谷子叶片SPAD值的第一、第二 PLSR模型组分权重

PLSR主成分权重显示了光谱指数对叶绿素的重要程度,通过挖掘光谱指数的变量投影重要性(VIP),可以更全面地表达光谱指数的相对重要性,如表7,4个时期的NDVI与PSNDa及PSSRc对叶绿素的变量投影重要性均大于1,NDVI(VIP抽穗期=1.38,VIP灌浆期=1.17,VIP成熟期=1.33),PSNDa(VIP抽穗期=1.30,VIP灌浆期=1.18,VIP成熟期=1.24);拔节期叶绿素的光谱指数与其他时期有所不同,主要表现为RENDVI(VIP拔节期=1.18),该参数对拔节期叶绿素的影响达到最大。叶绿素的变量投影重要性表明,NDVI、PSNDa和PSSRc是影响不同时期谷子叶绿素的最重要光谱指数。

表7 各敏感光谱指数对SPAD值的投影重要性(VIP)

2.4 谷子叶片叶绿素含量的BP神经网络分析及精度检验

表8列出了基于6个光谱参数构建的BP神经网络模型,以6个光谱参数(NDVI、GNDVI、PSNDa、PSSRc、RENDVI、Dy)作为模型的输入层,叶绿素含量作为输出层,经过多次训练隐含层达到最佳精度,从建模集来看,4个时期的模型决定系数均大于0.84,模型的稳定性较高,而其中模型在灌浆期达到最佳估测精度,建模集R2达到了0.96,而RMSE最低,说明该时期的模型稳定性和预测能力较好。

表8 不同时期的建模结果

从图3可以看出,相比于传统的一元模型,利用BP神经网络对谷子叶片的SPAD值估测具有较高的精度,4个时期的预测精度均在0.66以上。谷子在灌浆期具有较好的预测精度(R2=0.80)和较小的均方根误差(RMSE=1.82),在成熟期虽然预测精度较高,但其均方差误差RMSE达到了2.49,表示模型的稳定性较差,而拔节期和抽穗期的预测精度及均方差误差相差不大,模型预测效果较好。

图3 谷子各时期光谱反射率BP神经网络模型测试集SPAD值预测结果

3 讨 论

研究表明,谷子在生育期叶绿素含量呈现先增高后降低的趋势,从拔节期到抽穗期叶片均处于营养生长阶段,叶绿素含量不断增加。到了灌浆期谷子从营养生长阶段进入生殖生长阶段,此阶段叶绿素含量逐渐下降,这可能是由于植物体内的营养元素从供给植株生长转向供应籽粒的发育和形成[28]。在400~1 000 nm之间,由于谷子叶面内部细胞壁和细胞空隙间折射率的影响,导致波段范围内的高反射率及差异性[12]。而叶绿素的含量也会引起光谱反射率的变化,在波段范围内,光谱反射率会随着叶绿素的增加而降低,这与陈澜等[29]的研究结果一致。作物产生“红移”现象,其主要原因是由于作物即将成熟时,叶绿素向着叶黄素的转变[30-31]。

本研究采用一元线性模型对不同生育期的叶片叶绿素进行估测,王丹[32]、赵占辉[33]等分别对夏玉米、玉米冠层的叶绿素进行高光谱建模,均发现NDVI与SPAD值得关系密切,与本文部分研究结果一致,4个生育时期最佳模型的建模集及验证集精度在0.4~0.6之间,由此可以看出利用一元线性模型进行建模有一定的局限性,在一定程度上制约着叶绿素的反演精度[34-35],因此本研究利用BP神经网络对叶绿素进行非线性模型构建,可以看出,利用BP神经网络建模可使模型精度大幅度提高,模型的回归拟合结果R2在0.6~0.8之间。

4 结 论

1)不同SPAD值的光谱反射率具有相似的光谱特征,表现为光谱反射率会随着叶绿素的增加而降低,在740 nm处吸收特征越来越明显。

2)在拔节期和抽穗期以NDVI光谱指数为自变量建立的二次函数模型(R2=0.52,RMSE=1.97)和线性模型(R2=0.60,RMSE=2.28)效果最佳,而灌浆期和成熟期分别以RENDVI和PSSRc建立的指数模型(R2=0.51,RMSE=2.21)和二次函数模型(R2=0.62,RMSE=2.47)的效果最佳,可以较好地估算出该时期的叶绿素变化。

3)利用偏最小二乘法建模的精度(R2)在拔节期、抽穗期、灌浆期和成熟期分别为0.67、0.57、0.60、0.88,模型的预测精度(R2)分别为0.55、0.66、0.56、0.71。NDVI、PSNDa和PSSRc是影响不同时期谷子叶绿素的最重要光谱指数。

4)在BP神经网络中,在拔节期、抽穗期、灌浆期和成熟期的建模集精度(R2)分别为0.95、0.84、0.96、0.67,模型的预测精度(R2)分别为0.67、0.67、0.79、0.75,综合比较,相较于偏最小二乘回归模型与一元线性模型,利用BP神经网络建模效果最佳。

猜你喜欢

拔节期反射率叶绿素
夜间增温对小麦干物质积累、转运、分配及产量的影响
中红外波段超广角抗反射微纳结构的研究
车灯反射腔真空镀铝反射率研究
四川水稻分蘖-拔节期低温连阴雨时空特征
提取叶绿素
提取叶绿素
提取叶绿素
麦田欢歌
绿茶保存要精心
分步催化制备纳米SiO2减反射膜的性质与结构研究