APP下载

等效水厚度梯度的玉米叶片氮素反演模型研究

2022-09-05陈桂芬曹丽英

光谱学与光谱分析 2022年9期
关键词:大田氮素反演

王 希, 陈桂芬, 2*, 曹丽英, 马 丽

1. 吉林农业大学信息技术学院, 吉林 长春 130118 2. 长春人文学院, 吉林 长春 130117

引 言

使用高光谱数据对作物叶片氮素含量进行反演的实验已不少见。 但不少实验对叶片水分因素并未给予相应的重视。 目前已知植物叶片光谱特性主要由水分、 色素、 干物质等的光吸收和散射的特性所决定[1]。 从新鲜叶片的反射光谱估算氮的准确性低于植株或地上的干叶[2]。 叶片水分因素对叶片光谱特性的主要影响是水分对入射光辐射的吸收, 比如975, 1 200, 1 450和1 950 nm等水分子振动的倍频或合频处的光谱吸收特征[3]; 次要影响是叶片细胞因含水量的变化而膨胀/收缩, 从而改变光在叶片内部的多次散射特性, 并影响叶片近红外波段的光谱反射率[4-5]。 不难看出, 如果不充分评估叶片水分因素对反演精度的影响, 相关实验很有可能存在整体偏差。

国内外在此领域的相关研究已有一些报道, 如: Ramoelo等采用了Gao和Goetz最初提出的一种除水技术[6], 以消除吸水分带来的影响, 从而改进了对氮含量的估计[7]。 Pacheco-Labrador等提到氮素的一些吸收特征被水分吸收所掩盖, 因此在新鲜叶片的SWIR反射光谱中无法清晰可见, 从而导致整个光谱中氮素的信号较弱[8]。 Li将连续小波分析(CWA)与水分去除技术相结合, 通过减少水分吸收的影响和增强SWIR区域的吸收信号, 提高了N含量和LMA的估计[9]。 邓来飞等以梭梭作为研究对象, 设置了三个水分梯度; 使用原始光谱、 红边位置参数, 结合植被指数及二维相关光谱研究其叶片光谱特征以及在不同水分胁迫作用下的梭梭叶片光谱反射率差异[10]。

使用玉米叶级高光谱数据, 依据等效水厚度梯度, 对叶片叶绿素含量进行了对比反演, 以期定量探索等效水厚度因素对叶片反射率特性及反演建模精度的影响。 实验对比了使用原光谱与参考等效水厚度因素大小滑动划分后的子光谱的模型的反演精度, 并对相关模型进行了验证和评价, 希望能对探索更加贴合实际的无损、 稳健叶片叶绿素高光谱反演技术做出一定贡献。

1 实验部分

1.1 高光谱数据集

数据集延用美国林肯大学Schnable实验室报道中的数据, 其中包含高光谱数据1 210条。 分为温室及大田两种氮肥施用制度下(大田和大田高氮)的共5种情况。 大田数据于2018和2019年采集于美国内布拉斯加州林肯大学哈夫洛克研究农场(45°51′49″N, 96°31′09″W), 温室数据于2018年采集于林肯温室创新中心。 数据集详情见表1。

表1 数据集明细表

此次实验并未使用温室组数据, 这是因为其他四组数据(2018大田低氮, 2018 Field -N; 2019大田低氮, 2019Field -N; 2018大田高氮, 2018 Field +N; 2019大田高氮, 2019 Field +N)更贴近实际农业生产。

1.2 数据集滑动划分

首先构建等效水厚度(equivalent water thickness, EWT)参数,

EWT=(LFW-LDW)/LA

(1)

式(1)中, LFW是叶鲜重, LDW是叶干重, LA是叶面积。 然后根据数据集中样本的EWT数值按从小到大进行排序。 滑动窗口宽度取值范围是40~80, 步进长度都是10, 对排序后的数据集进行滑动划分。 实验使用的具体划分情况见表2。

1.3 光谱预处理方法

常见的光谱预处理方法一般有基线矫正类, 散射校正类和平滑处理类。 基线校正是为了消除仪器背景或漂移对信号的影响, 常见方法包括一阶导、 二阶导等。 散射校正是为了消除由于颗粒分布不均匀及大小不同导致的散射光对光谱的影响, 常见方法包括MSC和SNV等。 平滑处理是为了消除光谱信号中的随机噪声, 提高样本信号的信噪比。 Savitzky-Golay(SG)平滑法是使用多项式对移动窗口内的原始光谱进行多项式分解并用最小二乘法进行拟合, 其实质是一种移动加权平均法。

1.4 模型及其评价指标

PLSR是一种线性建模技术, 在响应变量和潜在变量(PLS latent variables)之间进行回归[11]。 潜在变量是原始波段的线性组合, 可以实现: (1) 高光谱数据的最大可变性, (2) 与响应变量间的最大相关性[12]。

在模型训练中采用10倍交叉验证来平衡模型复杂度和预测精度(即避免过拟合)。 将数据集分成10份, 轮流将其中9份作为训练集, 1份作为测试集进行试验, 每次试验会获得对应的结果, 再将10次结果的平均值作为对模型精度的估计值。

对模型的评价指标有R2(coefficient of determination), RMSE(root mean squared error)和RPD(ratio of performance to deviation)。

RMSE基本公式如式(2)

(2)

RPD基本公式为

RPD=SD/RMSE

(3)

式(3)中, SD为标准差。

根据文献[13-14]中的一些指导原则, 我们将RPD值的评价标准划分为4级: RPD>3.5, 甚至达到代替化学实验水平; 3.5>RPD>2.5, 模型具有定量测量水平; 2.5>RPD>1.5, 模型具有定性测量水平; RPD<1.5, 模型无效。

1.5 实验环境

实验在Python语言环境下完成, 核心依赖库有Scikit-Learn, SciPy, NumPy, Pandas和Matplotlib。

2 结果与讨论

2.1 参数优化

PLSR模型中需要优化的参数是n_components, 其数量在1~30范围内遍历。 当RMSECV数值最小时对应的n_components数就是建模所需的最优参数。 在光谱预处理方法中, SG平滑法的窗口宽度也是需要优化的参数。 窗口宽度取值从3开始, 只取奇数。

2.2 实验结果

表3 氮素反演结果

2.3 分析与讨论

由图1可知, 2018和2019大田低氮两组EWT均值分别为0.016 6和0.016 5, 差值较小; 2018和2019大田高氮两组EWT均值分别为0.019和0.018, 差值也不大。 但若对比同一年度高低氮两组的EWT均值则会发现, 2018大田高氮组的EWT均值出现了14.46%的提升, 而2019大田高氮组的EWT均值出现了9.09%的提升。 这说明在保障氮肥供应条件下, 叶片的单位面积含水量也出现了明显提升。

图1 父集EWT数值分布图

图2 变窗口宽度反演精度分布图

由图3, 借助PLSR模型中的coef_参数观察一下各个频率(400~2 500 nm)对模型反演水平的贡献情况。 最明显的差异在近红外区域(750~2 500 nm)出现, 2 200 nm一带父集相应频率有较高贡献值出现, 而子集对应频率贡献值则偏低。 但考虑到父集反演水平整体是低于最优子集的, 这也许是在表明2 200 nm一带出现的高贡献值其实意义有限。 而在可见光, 红边和近红外水分吸收峰区域, 整体趋势未见特别明显差异。

图3 频率贡献值分布图

3 结 论

使用叶级高光谱数据, 依据等效水厚度梯度划分样本, 建立了梯度连续的全波段氮素PLSR反演模型, 初步定量探索了等效水厚度因素对反演精度的影响。 实验结果表明: (1)等效水厚度对于氮素建模精度存在显著影响, 该因素应该引起相应重视; (2)四组数据最优子集的反演精度均达到甚至超过定性模型水平; (3)存在一个最优子集区域, 本实验中该区域的反演精度比使用全样本反演时附加任何一种光谱变换方法所得的精度都要高, 以效果而论这种子集的划分方法堪比光谱变换方法; (4)在今后制作反演数据集时需要将等效水厚度因素纳入考虑, 以避免过于宽泛的样本选取导致整体反演精度的损失。

据检索, 我们尚未发现依据EWT梯度划分子集的方式来分析水分含量因素对叶级高光谱氮素反演建模精度影响的实验。 对比前人的比如水去除技术(water removed technique), 我们的方法不存在机理不明的顾虑, 且反演精度提升明显。 当然, 这次实验使用的数据毕竟有限, 所进行的探索也还很初级。 希望能对探索更加实用的无损、 连续监测玉米叶片养分的反演方法做出一定贡献。

猜你喜欢

大田氮素反演
反演对称变换在解决平面几何问题中的应用
基于ADS-B的风场反演与异常值影响研究
利用锥模型反演CME三维参数
一类麦比乌斯反演问题及其应用
大田百余名留守儿童有了“爱心家长”
“大田后生仔”歌唱家乡
小田变大田破解农地零碎化
桃树氮素营养研究进展(2) ——桃树的氮素贮藏与循环利用
桃树氮素营养研究进展(1)——桃树对氮素的吸收、运转与利用
“小田并大田”要有序推进