APP下载

基于变换光谱与光谱指数的夏玉米叶片含水率高光谱估算

2024-01-22郑智康常庆瑞符欣彤张子娟姜时雨宋子怡

江苏农业学报 2023年9期
关键词:正态分布夏玉米波段

郑智康, 常庆瑞, 符欣彤, 张子娟, 李 铠, 姜时雨, 宋子怡

(西北农林科技大学资源环境学院,陕西 杨凌 712100)

叶片含水率(LWC)是作物重要的生长指标,是作物光合作用和蒸腾作用等生理生化过程的关键限制因素,直接影响作物生长发育及产量的形成[1]。快速高效估算作物叶片含水率对作物长势监测、水资源合理利用以及农田水分管理有着重大意义。传统的烘干称质量法测定作物叶片含水率不仅耗时费力,且难以实现大范围作物叶片含水率的持续监测。高光谱技术的出现与发展为作物叶片含水率的遥感监测提供了新的手段。

目前,利用高光谱遥感估算作物叶片含水率已成为研究热点[2],国内外大量众多学者的研究结果表明光谱反射率与作物叶片含水率之间存在显著相关,作物叶片含水率的特征光谱位于近红外波段和短波红外波段[3-4]。光谱的各种变换和不同光谱指数的构建,提高了特征光谱与叶片含水率之间的响应水平及相关估算模型的精度[5-9]。刘小军等[10]综合分析任意两波段构成的比值光谱指数(RSI)、差值光谱指数(DSI)和归一化光谱指数(NDSI)与水稻叶片含水率的相关关系,证明了利用光谱指数估算水稻叶片含水率是可行的。

截至目前,利用高光谱估算作物叶片含水率大多集中在水稻、小麦、枸杞等作物,对玉米的研究相对较少。本研究以关中地区夏玉米为研究对象,基于原始光谱和变换光谱构建任意两波段的差值光谱指数(DSI)、比值光谱指数(RSI)和归一化光谱指数(NDSI),并结合人工智能算法,分析窄波段光谱指数与夏玉米叶片含水率之间的关系,构建夏玉米叶片含水率的单因素和多因素估算模型,为关中地区夏玉米长势监测和农田灌溉提供理论依据和技术支持。

1 材料与方法

1.1 研究地点与试验设计

试验于2017年在陕西省咸阳市乾县齐南村(108°07′04″E,34°38′32″N)进行。该村位于黄土高原与关中平原的过渡地带,试验田位置如图1所示。本研究以陕单226为试验材料,开展氮磷钾配施试验和纯氮肥试验。氮磷钾配施试验共设18个处理,各处理的施肥方案如表1所示。

表1 氮磷钾配施试验设计

上述18个处理设置2次重复,小区面积为90 m2。纯氮肥试验设4个水平,施氮量分别为0 kg/hm2、60 kg/hm2、120 kg/hm2、180 kg/hm2,不施磷肥和钾肥,小区面积为153 m2。上述肥料均于播种前一次性施入,水分管理与当地保持一致。每小区设2个采样点,共80个采样点。于夏玉米拔节期开展叶片含水率和高光谱测定。

图1 研究区玉米试验田位置Fig.1 Location of maize test field in the study area

1.2 数据获取与处理

1.2.1 叶片高光谱测定 于玉米拔节期,选取晴朗无风日(7月3日)采用非成像全光谱地物波谱仪SVC HR-1024i(美国Spectrum Vista公司产品)获取夏玉米叶片高光谱数据。测定时间为10:00-12:00,每隔30 min进行一次白板校正。光谱测定范围350~2 500 nm,其中350~1 000 nm光谱分辨率为3.5 nm,1 001~1 850 nm光谱分辨率为9.5 nm,1 851~2 500 nm光谱分辨率为6.5 nm。测量前使用纸巾将叶片表面擦拭干净,在玉米叶片尖部、中部、基部各测量3次,每片叶片测9次,每个样点测3张叶片,共获得测27条光谱曲线。

1.2.2 玉米叶片含水率测定 采用烘干法进行玉米叶片含水率测定:首先称取光谱测定后的玉米叶片鲜质量,然后将鲜叶置于烘箱中105 ℃杀青30 min,杀青结束后80 ℃烘72 h至质量恒定。玉米叶片含水率计算公式为:

(1)

式中:LWC表示叶片含水率,Wf表示叶片鲜质量,Wd表示叶片干质量。

1.2.3 高光谱数据处理和光谱指数构建 利用SVC HR-1024i光谱仪自带的软件对原始光谱数据进行350~2 500 nm重采样,采样间隔为1 nm,取每个样点重采样之后的27条光谱曲线平均值为该样点的原始光谱(PS)曲线。进一步利用Excel 2019和MATLAB R2019b软件对原始光谱分别进行一阶导数(FDS)和标准正态分布(SNV)的变换。

为了分析光谱指数与玉米叶片含水率之间的相关关系,本研究利用原始光谱、一阶导数光谱和标准正态分布光谱分别构建任意两波段差值光谱指数(DSI)[11]、比值光谱指数(RSI)[12]和归一化光谱指数(NDSI)[13],其计算公式如下:

DSI=Ri-Rj

(2)

(3)

(4)

式中,i和j分别表示波长,Ri和Rj分别表示波长为i和j时对应的光谱反射率。

1.3 模型构建和精度检验

以原始光谱、一阶导数光谱和标准正态分布光谱构建的任意两波段3种光谱指数(RSI、DSI、NDSI)分别与夏玉米叶片含水率进行相关性分析,选取3种光谱下相关性最高的光谱指数为参数,分别建立玉米叶片含水率的指数、线性、对数、乘幂和多项式估算模型,比较筛选得到夏玉米叶片含水率单因素估算优化模型;进一步以相关性最高的光谱指数为参数,基于支持向量回归算法(SVR)、反向传播神经网络回归算法(BPNN)和麻雀搜索优化随机森林回归算法(SSA-RFR),构建玉米叶片含水率多因素估算模型。单因素模型和多因素模型分别利用Excel 2019和MATLAB R2019b软件建立与实现。

本研究对80个样本按3∶1比例进行随机抽样,分为建模样本60个,验证样本20个。采用决定系数(R2)、均方根误差(RMSE)和相对误差(RE)来评价模型精度,计算算法如下:

(5)

(6)

(7)

2 结果与分析

2.1 夏玉米叶片含水率与高光谱特征分析

不同数据集叶片含水率的统计特征如表2所示。由表2可知,总数据集玉米叶片含水率最大值为80.67%,最小值为72.62%,极差为8.05个百分点。采用等距离方式将含水率划分为5个等级,分别统计5个等级的样本数,结果如图2所示。

由图2可知,玉米叶片含水率的分布近似于标准正态分布,含水率75.85%~77.45%的样本数最多,占总样本数的32.5%。不同含水率玉米叶片的高光谱曲线如图3所示。其中,在可见光波段(390~780 nm)和近红外波段(781~1 300 nm),反射率最高和反射率最低分别对应含水率最低和含水率最高的梯度范围,含水率74.24%~79.06%时,光谱曲线变化与含水率之间没有明显变化规律,说明在上述波段范围内玉米叶片含水率不是导致光谱变化的主导因子。在短波红外波段(1 301~2 500 nm),则严格遵循随着叶片含水率的降低光谱反射率逐渐升高这一规律,因此该波段对玉米叶片水分含量变化更为敏感,是估算玉米叶片含水率的理想波段。以玉米叶片含水率中位数(76.07%)的原始光谱为依据绘制的玉米叶片一阶导数光谱和标准正态分布光谱如图4所示。其中一阶导数光谱相较于原始光谱变化明显,反射率大多集中于(-0.001,0.001);标准正态分布光谱与原始光谱变化趋势相同,但是反射率的变化区间发生了较大变化,反射率最小值为-1.37,最大值为1.53。

表2 不同数据集玉米叶片含水率统计特征

a:72.62%~74.23%;b:74.24%~75.84%;c:75.85%~77.45%;d:77.46%~79.06%;e:79.07%~80.67%。图2 玉米叶片含水率样本分布Fig.2 Sample distribution of maize leaf moisture content

图3 不同含水率玉米叶片高光谱变化特征Fig.3 Hyperspectral variation characteristics of maize leaves with different moisture contents

a:一阶导数光谱; b:标准正态分布光谱。图4 玉米叶片变换光谱特征Fig.4 Characteristics of transformed spectrum of maize leaves

2.2 不同光谱与玉米叶片含水率相关性分析

原始光谱、一阶导数光谱及标准正态分布光谱与玉米叶片含水率相关性如图5所示。由图5可知,原始光谱在全波段都与叶片含水率呈负相关,仅在400 nm和1 000 nm附近与玉米叶片含水率相关性没有达到极显著水平(P>0.01),相关性达到极显著性水平(P<0.01)的敏感波段数为1 869个,相关系数绝对值最大值出现在1 878 nm处,对应相关系数为-0.76。一阶导数光谱和标准正态分布光谱与玉米叶片含水率相关性达到极显著性水平的敏感波段数分别为1 480个和1 944个,相关系数绝对值最大值分别出现在1 888 nm和1 399 nm处,对应的相关系数分别为0.77和-0.75。与原始光谱相比,一阶导数光谱和标准正态分布光谱与叶片含水率的相关系数波动性增加;一阶导数光谱中相关性达到极显著水平的敏感波段数比原始光谱有所减少,而标准正态分布光谱敏感波段数最多。总体来看,经过光谱变换后,开始出现正相关和负相关,整体相关性都较好。

a:原始光谱; b:一阶导数光谱; c:标准正态分布光谱。图5 不同光谱与玉米叶片含水率的相关性Fig.5 Correlation between different spectra and moisture content of maize leaves

2.3 不同光谱指数与玉米叶片含水率相关性分析

原始光谱、一阶导数光谱和标准正态分布光谱下,不同光谱指数与叶片含水率相关系数绝对值最大值及其对应波长如表3所示。3种光谱指数与叶片含水率的相关系数绝对值范围在0.79至0.83之间,且入选波长相对集中,主要分布在1 300~1 500 nm、1 700~1 900 nm和2 300~2 500 nm。与原始光谱相比,基于一阶导数光谱和标准正态分布光谱得到的相关系数绝对值均有所提高,一阶导数光谱提升较大,RSI和NDSI与叶片含水率的相关系数绝对值均达到0.83;标准正态分布光谱下,NDSI的相关性提升不明显,DSI的最大相关系数达到0.82。3种光谱相比,基于一阶导数光谱构建的光谱指数与叶片含水率相关性更好,说明一阶导数光谱为最优光谱变换类型。

2.4 夏玉米叶片含水率单因素模型构建及精度评价

3种光谱下,基于表3得到的最优光谱指数分别构建夏玉米叶片含水率的指数、线性、对数、乘幂和多项式估算模型,筛选出的最佳模型如表4所示。由表4可知,原始光谱和一阶导数光谱均以RSI为自变量的线性函数为最佳模型,而标准正态分布光谱则以归一化光谱指数(NDSI)为自变量的一元二次函数为最佳模型。基于一阶导数光谱和RSI构建的线性模型建模集决定系数(R2)最高,RMSE和RE均为最低。但该模型验证集的决定系数和RMSE均不及原始光谱和标准正态分布光谱构建的模型。综合建模集和验证集结果来看,以标准正态分布光谱和归一化光谱指数(NDSI)构建的一元二次函数模型为玉米叶片含水量最优估算模型。

表3 不同光谱指数最佳波段组合

2.5 夏玉米叶片含水率多因素估算模型构建及精度评价

由于多因素模型的模拟效果一般要优于单因素模型[14-16],因此,以表3中的9个光谱指数为自变量,玉米叶片含水率为因变量,构建基于支持向量回归算法(SVR)、反向传播神经网络回归算法(BPNN)和麻雀搜索随机森林回归算法(SSA-RFR)的玉米叶片含水率多因素估算模型。3种算法下构建的多因素模型精度如表5所示。结果显示,基于麻雀搜索随机森林回归算法构建的模型精度最高,决定系数(R2)达到0.78,RMSE和RE分别为1.14%和1.09%,均为最低,基于反向传播神经网络回归算法和支持向量回归算法构建的模型建模精度稍低。综合来看,基于麻雀搜索随机森林回归算法构建的模型为最优模型,其次为基于反向传播神经网络回归算法构建的模型,基于支持向量回归算法构建的模型相对较差。

表4 不同光谱曲线及最优光谱指数构建的玉米叶片含水率单因素估算模型及精度

表5 基于不同算法的玉米叶片含水率多因素估算模型的精度比较

2.6 模型验证

最优单因素模型和基于3种算法的多因素模型验证结果如图6所示。综合来看,3种多因素模型的模拟效果都优于单因素模型。基于麻雀搜索随机森林回归算法模型实测值与预测值拟合线更接近1∶1线,因此该模型预测能力最好,精度最高。当玉米叶片含水量实测值低时,4个模型的预测结果一般比实际值大,而当实际含水量高时,预测结果比实际值小。

3 讨 论

本研究发现玉米叶片光谱反射率在短波红外波段较可见光波段和近红外波段对叶片水分含量波动更为敏感,且随着叶片水分含量的减少光谱反射率逐渐升高,这与前人研究结果一致[17-18]。其原因在于,随着叶片水分含量的减少,叶片细胞质壁分离度逐步增加,进而导致短波红外波段光谱反射率的上升。受叶片表面物理特征(叶片粗糙度、角质层等)和内部结构(叶绿素含量等)因素的影响,单一波段原始光谱难以全面反映玉米叶片含水率的状况。高光谱数据具有波段多且窄的特点,信息量大,同时冗余多,光谱变换和光谱指数的构建能降低背景噪声和增强光谱信息的响应强度,提高光谱信息的利用率及估算模型精度[19-20]。基于变换光谱构建的光谱指数与玉米叶片含水率相关系数绝对值得到了提高,这与Tucher[21]和李永梅等[22]的研究结果一致。本研究构建DSI、RSI和NDSI等指标所用波段集中在1 300~1 500 nm、1 700~1 900 nm和2 300~2 500 nm等波段,与Yu等[23]研究结果类似,这说明利用短波红外波段的光谱数据构建光谱指数估算作物叶片含水率是可靠的。

a:基于标准正态分布光谱和归一化光谱指数的叶片含水量估算模型;b: 基于支持向量回归算法的叶片含水率估算模型;c: 基于反向传播神经网络回归算法的叶片含水率估算模型;d: 基于麻雀搜索随机森林回归算法的叶片含水率估算模型。R2:决定系数;RMSE:均方根误差;RE:相对误差。图6 不同模型模拟效果比较Fig.6 Comparison of simulation effects of different models

本研究利用单因素模型和基于机器学习的多因素模型对玉米叶片含水率进行估算,其中多因素模型的模拟效果明显优于单因素模型,这与前人研究结果[24]基本一致。主要由于单因素模型所用信息少,没有涵盖影响玉米叶片含水率的众多要素,因此模型精度不如多因素模型。多因素模型中以基于麻雀搜索随机森林回归算法(SSA-RFR)构建的模型效果最好。随机森林回归算法中的随机性使得该方法不易出现过拟合现象,且抗噪能力和泛化能力强,是处理非线性问题的一种良好选择。麻雀搜索算法(SSA)的应用,能快速优化随机森林模型内部参数,从而提高模型估算精度。目前,麻雀搜索算法和随机森林回归算法在农业遥感中集合应用还未有报道,本研究中首次将2种算法结合应用于玉米叶片含水率估算,取得了较好的效果。然而,本研究建立的模型普遍存在低值高估和高值低估的现象,这可能与处理中玉米叶片水分含量差异较小有关。一般来说,数据集的变异较小时,估算模型的精度会受到一定影响[25-26]。因此,在后续研究中尚需进一步优化模型,以提高模型的估算精度。

玉米拔节期开始出现雌雄穗分化,特别是雄穗形成后,雌穗开始小花、小穗分化,对水分要求较大[27]。对该时期玉米叶片含水量的遥感监测,可更好地指导田间水分管理。本研究中仅对关中地区夏玉米拔节期的叶片含水率进行了监测,在将来的研究中,可结合无人机进行全生长期的叶片含水率监测及玉米叶片适宜含水率的分析,进而实现精确的区域农田水分管理。

猜你喜欢

正态分布夏玉米波段
小麦收割之后 如何种植夏玉米才能高产
夏玉米高产的关键栽培技术措施
基于对数正态分布的出行时长可靠性计算
正态分布及其应用
M87的多波段辐射过程及其能谱拟合
正态分布题型剖析
χ2分布、t 分布、F 分布与正态分布间的关系
日常维护对L 波段雷达的重要性
基于SPOT影像的最佳波段组合选取研究
L波段雷达磁控管的使用与维护