APP下载

基于无人机高光谱影像的玉米叶绿素含量估测

2022-09-07常庆瑞郑智康蒋丹垚高一帆宋子怡姜时雨

江苏农业学报 2022年4期
关键词:反演波段光谱

郭 松, 常庆瑞, 郑智康, 蒋丹垚, 高一帆, 宋子怡, 姜时雨

(西北农林科技大学资源环境学院,陕西 杨凌 712100)

叶绿素作为植被叶片的主要色素,是植被光合作用的核心,其含量能反映植被的长势,指导田间氮肥施用[1-2]。原子吸收光谱法、研磨法[3]、分光光度法[4]等传统的植被叶绿素含量检测方法不仅对样品本身有着不可逆的损害,还耗时耗力;SPAD仪[5]、植物多酚叶绿素测量计[6]等新型叶绿素含量检测仪器虽然能有效避免损害样品,增加检测效率,但是需要接触测量,不适合大规模样本和面尺度下的叶绿素含量检测[7]。近年来,高光谱遥感技术因其具有数据量大、精度高的特点,在作物生理生化参数反演研究方面逐渐被学者们所重视。然而,地面高光谱遥感存在灵活性较低,获取数据时人力、物力损耗较大的缺点;航天高光谱遥感对机场等基础设施和专业人员的技术水平要求比较高;航空高光谱遥感面临重访周期长,受大气影响较大,数据质量偏低的挑战[8-9]。上述缺陷限制了高光谱遥感在作物生理生化参数反演方面的应用,而低空无人机高光谱遥感的出现,使得上述问题得到一定解决,低空无人机高光谱影像的数据质量高,受大气影响小,较为便捷且学习成本低[10]。

目前,在基于低空无人机遥感平台反演植被生理生化参数方面,国内外学者做了大量研究。陈鹏飞等[11]发现对高空间分辨率无人机影像剔除土壤背景和计算纹理信息,均能提升棉花氮素估测模型的精度,建模决定系数从0.33上升至0.57。陈晓凯等[12]基于随机森林算法反演冬小麦叶面积指数(LAI),并对无人机搭载UHD185传感器获取的冬小麦影像进行填图,填图验证均方根误差为0.27。陶惠林等[13]通过无人机高光谱影像数据计算不同植被指数,运用多种回归方法建立冬小麦各生育期的长势监测指标(GMI)估测模型,结果表明开花期的多元回归模型精度最高,其归一化均方根误差为15.9%。Singhal等[14]结合核脊回归算法和无人机影像光谱信息,反演姜黄叶片的叶绿素值,结果表明该机器学习算法具有良好的建模能力,最佳模型的决定系数达0.76。Colorado等[15]利用无人机影像提取光谱曲线,采取多元线性回归、支持向量回归以及神经网络回归估测水稻叶片氮素含量,发现机器学习算法(支持向量回归以及神经网络回归)的建模效果优于多元线性回归。综上所述,利用低空无人机影像数据反演植被生理生化参数的研究已经较为成熟,配备的传感器包括Rededge、UHD185等,使用的方法由传统回归算法向机器学习算法扩展,但是目前有关无人机搭载S185高光谱相机以及基于核极限学习机算法建模的报道较少。

本研究拟以关中地区抽雄期玉米为研究对象,使用无人机搭载S185高光谱相机获取研究区的遥感影像,结合地面采样点实测的叶绿素含量,构建传统回归模型和核极限学习机回归模型,从中选取鲁棒性、泛化性较好的玉米叶绿素含量估测模型并填图,以期为关中地区的绿色农业发展提供技术、决策支持。

1 材料与方法

1.1 研究区概况和试验设计

研究区位于陕西省杨陵区西北农林科技大学试验农场(108.092°E,36.303°N),地处关中平原中部,属于温带季风气候,四季分明,年均气温12.85 ℃,平均降水量630.35 mm,平均海拔480 m,试验地土壤为塿土,水肥充足,适宜耕作。此次试验开展于2021年6月20日,试验共设置20个小区,小区面积30 m2(5 m×6 m),每个小区选取3个采样点并记录其GPS坐标(图1),施用氮、磷、钾3种肥料,其中氮肥和钾肥均设5个水平,磷肥仅设1个水平,共10个处理,每个处理重复2次,氮肥处理N1~N5纯氮施用量分别为0 kg/hm2、50 kg/hm2、100 kg/hm2、150 kg/hm2、200 kg/hm2,钾肥处理K1~K5的K2O施用量分别为0 kg/hm2、144 kg/hm2、288 kg/hm2、432 kg/hm2、576 kg/hm2,磷肥处理P1的P2O5施用量为1 125 kg/hm2,所有肥料播种前全部施入,后期不追肥,田间管理与当地一般大田一致。10个处理分别为N1P1K2、N2P1K2、N3P1K2、N4P1K2、N5P1K2、N2K1、N2K2、N2K3、N2K4、N2K5。

图1 研究区玉米试验田位置Fig.1 Location of maize test field in the study area

1.2 测定项目和方法

1.2.1 无人机高光谱影像和RGB影像的获取 无人机高光谱影像数据通过M600 Pro无人机(大疆创新科技有限公司产品)搭载S185高光谱相机(Cubert公司产品)获取。S185高光谱相机采用画幅式成像技术,结合了高光谱数据的精确性和快照成像的高速性,可在0.001 s内采集整个视场内的高光谱影像数据,影像光谱范围为450~998 nm,包含138个波段,光谱采样间隔4 nm。影像采集于2021年8月20日,此时玉米处于抽雄期,是其生长发育的关键时期[16],无人机飞行时间为14∶00-16∶00,天气晴朗无风,飞行前进行黑白板校正,设定飞行高度为50 m,飞行速度为5 m/s,航向与旁向重叠度均为80%,镜头垂直向下,影像地面分辨率为1.4 cm。由于获取的无人机高光谱影像缺失地理参考,故使用自带GPS仪的精灵4 RTK无人机(大疆创新科技有限公司产品)同步获取研究区RGB影像,设定的飞行参数与M600 Pro无人机一致,用于高光谱影像的地理配准和几何校正。

1.2.2 叶绿素含量测定 玉米叶片叶绿素含量使用植物多酚-叶绿素测量计Dualex scientific+TM(上海泽泉科技股份有限公司产品)测定,测定项目中的Chl值代表叶绿素含量[6],单位为μg/cm2,测定时间为无人机影像采集后的1 h内,每个采样点选择3片健康、无病虫害的冠层叶片,于叶尖、中部、基部3个位置分别测量3个Chl值,每个采样点获取27个Chl值,取平均值作为该采样点的Chl值。

1.3 数据处理

在S185高光谱相机处理软件Cubert Utils Touch中进行高光谱影像的波段融合,并输出为单张Multiff格式的高光谱影像,使用Agisoft Photoscan软件分别将单张Multiff影像与精灵4 RTK无人机获取的RGB影像拼接为研究区的完整影像。在软件ENVI 5.3中以精灵4 RTK无人机获取的RGB影像作为基准影像,以无人机高光谱影像作为待校准影像,实施地理配准和几何校正,使高光谱影像具有正确的地理坐标,并消除几何变形,然后对高光谱影像进行平滑滤波以减小影像数据采集过程中的随机噪声,依据采样点的GPS坐标,在高光谱影像上生成半径为30 cm的圆形感兴趣区(ROI),通过ROI提取出各采样点的反射光谱曲线。在前人研究结果[17]的基础上,本次研究提取的光谱曲线范围在450~850 nm,影像处理流程如图2显示。依据从小到大的原则对采集的各采样点Chl值进行排序,通过分层抽样法以3∶1的比例获取建模样本45个,验证样本15个。

1.4 模型建立

通过各采样点的原始光谱以及一阶导数光谱获取建模参数。使用任意2波段组合的方式构建单因素建模参数,包括归一化光谱指数(NDSI)、差值光谱指数(DSI)和比值光谱指数(RSI)[18];基于连续投影算法(SPA)构建多因素建模参数。单因素模型的构建方式有线性回归、指数回归、幂回归、对数回归以及多项式回归,多因素模型的构建方式包括多元线性回归(MLR)以及核极限学习机回归(KELMR),对比各类模型的精度,从中筛选出反演效果最佳的模型。所有模型的建立以及高光谱遥感影像的填图均在软件Matlab的环境下实现。

Cubert Utils Touch、Agisoft Photoscan、ENVI5.3为处理数据的软件名称。图2 影像处理流程Fig.2 Processing flows of images

(1)

(2)

2 结果与分析

2.1 玉米叶片Chl值光谱特征分析

2.1.1 玉米叶片Chl值基本统计特征 供试玉米叶片Chl值统计结果(表1)表明,建模集和验证集的各项统计特征均与总数据集较为接近,3类样本的Chl值平均值和变异系数分别为47.75~48.20、6.61%~6.88%,说明使用分层抽样法划分的建模集和验证集代表性较好[19],各集群所反映的采样点Chl值较一致。

表1 玉米叶片叶绿素含量(Chl值)统计特征

2.1.2 Chl值与光谱反射率的相关性 图3显示,原始光谱反射率与Chl值相关性曲线变化较为平缓,且所有波段反射率与Chl值均呈现负相关,通过0.01相关性检验的波段主要位于500~624 nm以及710~850 nm,在766 nm波长处相关性最佳,相关系数为-0.61。一阶导数光谱反射率与Chl值相关性曲线的走势波动性较大,通过0.01相关性检验的波段在504~654 nm零星分布,在686~766 nm集中分布,相关性最佳的波长为714 nm,相关系数为0.64。整体上看,在通过0.01相关性检验的波长数量上,原始光谱要大于一阶导数光谱,但是在相关性大小方面,一阶导数的最大相关系数绝对值要高于原始光谱。

图3 不同类型光谱反射率与Chl值的相关性Fig.3 Correlation between different types of spectral reflectance and Chl values

2.1.3 Chl值与光谱指数的相关性 根据光谱指数计算公式(表2),分析统计Chl值与任意2波段组合光谱指数的相关性,绘制相关系数等势图(图4),选择相关性最好的波长组合方式确定敏感光谱指数。从不同类型光谱指数来看,仅差值光谱指数(DSI)存在连片的相关性较高的区域,主要分布在700~850 nm,而归一化光谱指数(NDSI)、比值光谱指数(RSI)的相关系数偏低且分布较为零散。从相关性最佳来看,原始光谱和一阶导数光谱中均为DSI与Chl值的相关性大于NDSI和RSI,相关系数分别为0.71、0.68,表明DSI是此次研究中的最优光谱指数。

表2 光谱指数计算方法

a:PS-RSI;b:PS-NDSI;c:PS-DSI;d:FDS-RSI;e:FDS-NDSI;f:FDS-DSI。PS:原始光谱;FDS:一阶导数光谱;RSI:比值光谱指数;NDSI:归一化光谱指数;DSI:差值光谱指数。图4 不同类型光谱指数与Chl值的相关性等势图Fig.4 Equipotential diagram of correlation between different types of spectral indices and Chl value

2.2 单因素模型构建及精度评价

以表2中的光谱指数作为自变量,玉米叶片Chl值为因变量,构建单因素估算模型,应用线性回归、2次曲线、指数回归和对数回归4种方法,筛选出各光谱指数的最佳模型(表3)。从不同类型光谱指数来看,DSI的建模效果最好;从不同光谱类型来看,原始光谱构建模型整体优于一阶导数光谱。由此可得,单因素模型中的最优模型是基于原始光谱的DSI模型,其建模、验证R2均为0.52,MRE分别为4.09%、4.36%,使用单因素估测玉米Chl值时,应优先考虑该模型。

表3 不同光谱类型的单因素模型

2.3 多因素模型构建及精度评价

2.3.1 连续投影算法提取多因素建模参数 连续投影算法是一种特征选择方法,通过连续投影的方式从原始光谱矩阵中选出预测响应变量的子集[20],该算法不仅确保所筛选的光谱矢量共线性最小,还实现了对响应变量预测能力的最大化,其原理为第一次迭代时任选光谱矩阵一列赋予迭代向量,此后分别计算该迭代向量对剩余向量的投影并提取最大投影的波段,提取完成后开始第二次迭代循环,直至所筛选的波段数量等于给定数量,随着提取波段数量的增加,每循环一次即进行一次筛选波段对响应变量的预测能力计算。以预测能力最佳为原则,分别将原始光谱和一阶导数光谱中通过0.01相关性检验的波段反射率作为自变量,Chl值作为响应变量,提取多因素建模参数(表4),提取出的原始光谱、一阶导数光谱多因素建模参数分别为14个和8个,二者的多因素建模参数波长集中在506~766 nm,即绿光波段至近红外波段。

表4 不同类型光谱多因素建模参数

2.3.2 多因素模型建立及精度比较 由于SPA所提取的建模参数在保证预测性最佳的同时还使得变量之间的共线性最低,故多因素模型的建立不再考虑建模参数的共线性问题,使用多元线性回归(MLR)法、核极限学习机(KELM)算法构建多因素模型。

核极限学习机是单隐含层前馈神经网络的一种,由Huang等[21]提出,其输入层到隐含层的权值是随机产生的,而隐含层到输出层的权值是计算产生的,随机产生的权值通过不断迭代,能得到较好的预测结果,该算法在普通极限学习机的基础上引入了“核”的概念,与普通神经网络相比,提升了学习速率和泛化性,在大样本下也能保证较快的计算速率,与随机森林回归相比,在样本数量偏少时也能快速学习到数据的规律,并且预测的结果能超越给定的训练集,但是在建模样本向高维空间映射的过程中,由于其函数参数的生成具有一定的随机性,往往需要迭代多次才能取得较好的结果。为了减小计算成本,本研究采用狮群优化算法(LSO)[22]对KELM迭代过程进行优化,使计算过程向着R2增大、MRE减小的方向收敛。采用径向基函数(RBF)作为KELM的核函数,狮群数量(POP)以及迭代次数(N)分别设置为10、50,优化所得的正则化系数(C)、核函数参数(S)以及多因素建模结果(表5)显示,与单因素模型相比,多因素模型精度有较大提升,各类多因素模型的建模R2、验证R2均在0.57以上,高于单因素的R2最大值0.52。就建模方法而言,MLR算法的建模效果要低于KELM算法;从光谱类型来看,原始光谱的模型精度优于一阶导数光谱;综合比较可得,原始光谱的LSO-KELM模型是所有方法中的最优模型,其建模、验证R2分别为0.73、0.70,相应MRE处于较低水平,为3.56%和3.53%。

表5 不同光谱类型下多因素回归模型

2.4 模型精度比较

基于单因素、多因素模型中的最优模型,分别进行高光谱遥感影像Chl值反演估算,同时将反演得到的预测值与实地采样得到的实测值进行拟合,实现模型精度比较,1∶1线设置为虚线。图5显示,PS-DSI模型和PS-LSO-KELM模型下的Chl值反演图基本符合小区排列,但是外在表现有所差异。与PS-DSI模型相比,PS-LSO-KELM模型的反演图不仅体现了玉米冠层Chl值的空间分布,还体现了玉米冠层的形态特征,Chl值的位置信息更加准确,蕴含的信息更多,可见在Chl值的遥感反演估算方面,机器学习算法优于传统回归算法。图6显示,PS-LSO-KELM模型的预测值比PS-DSI模型更加贴近拟合线,同时拟合线与1∶1线差距不大,故模型精度更高,其拟合方程R2为0.70,因此,PS-LSO-KELM模型是此次研究中的最优模型。

A:基于原始光谱的差值光谱指数模型;B:基于原始光谱的狮群算法优化的核极限学习机算法模型。Chl值:叶绿素含量。图5 不同类型最优模型下玉米冠层Chl值空间分布图Fig.5 Spatial distribution of Chl values in maize canopy under different types of optimal models

3 讨 论

玉米冠层Chl值与S185高光谱相机的原始光谱主要在绿光波段和近红外波段处通过0.01相关性检验,与一阶导数光谱则主要在近红外波段处通过0.01相关性检验,这与王婷婷等[6]等的研究结果基本一致。构造的光谱指数中,2种光谱下均为DSI的相关性最好,这与前人的研究结果[12,23-24]不一致,一方面是因为光谱指数本质上是一种消除背景噪声、增强反演特征的算法,故该算法对仪器、作物种类以及光谱预处理方式等具有一定依赖性;另一方面是尺度效应,前人的光谱曲线多是地面遥感获取,属于叶片尺度,本研究的光谱曲线来自于低空无人机影像,属于冠层尺度。这两方面原因都会造成光谱指数对Chl值的敏感性差异。未来的研究应该增加关中地区冠层玉米叶片的采样数量,同时还要分多个生育期进行试验,基于S185高光谱相机确立不同生育期的最优光谱指数。

A:基于原始光谱的差值光谱指数模型;B:基于原始光谱的狮群算法优化的核极限学习机算法模型。x:Chl值的实测值;Y:Chl值的预测值;R2:决定系数。图6 不同类型最优模型预测值与实测值分布Fig.6 Distribution of predicted and measured values of different types of optimal models

SPA算法属于特征选择的一种,与基于相关性的特征选择算法(FCBF)相比,SPA所筛选的自变量数量可控,所建立模型相对简单,与传统的特征提取算法如主成分分析(PCA)等相比,SPA提取的自变量可解释性高,所建立的模型具有一定的物理化学意义。

在处理非线性回归问题时,机器学习算法往往比传统回归算法效果更佳[25]。原因在于机器学习算法是通过决策树或模拟人类神经元工作的方式来学习数据本身的规律,相较于单一的传统回归算法,机器学习算法体现了群体的特点。核函数的选取以及参数的不同会影响到KELM对Chl值的拟合结果,KELM的核函数包括径向基核、线性核、小波核等,由于不同核函数的侧重点不同,也有学者提出双核函数的想法,充实机器学习算法的实用性[26]。麻雀搜索算法、灰狼算法等群体智能算法能快速确定KELM的最佳参数,减小KELM的运行成本,本研究采用狮群算法优化KELM,以较少的迭代次数取得较好的玉米冠层Chl值拟合结果。

在本研究构建的所有模型中,多因素模型拟合效果优于单因素模型,机器学习算法优于传统回归算法,这与前人的研究结果[27-28]一致。实际应用时,通过无人机搭载S185高光谱相机获取目标区域抽雄期玉米高光谱遥感影像,从中提取模型参数,应用于已经训练好的KELM模型中即可得到玉米冠层叶片Chl值的空间分布图。采样点的Chl值高,说明玉米长势较好,无需追肥;采样点的Chl值低,说明玉米长势较差,需要适量追肥。但是此次研究的区域局限在关中地区,研究时期限制在抽雄期,构建的模型是否适用于其他地区和其他生育期的玉米还有待测试。故未来应该在不同地区、不同生育期背景下开展低空无人机搭载S185高光谱相机反演玉米冠层Chl值的研究,在更多样本的支持下,确立相应的敏感波段,以期未来可以通过无人机高光谱技术监测大区域的玉米Chl值。

4 结 论

本研究以陕西省关中地区抽雄期玉米为研究对象,基于玉米叶片Chl值和S185高光谱影像,构建反演玉米叶片Chl值的单因素模型、多因素模型以及狮群算法优化的核极限学习机模型并填图,得到如下结论:第一,玉米抽雄期冠层原始光谱反演Chl值的敏感波段主要集中于绿光波段至近红外波段,一阶导数光谱反演Chl值的敏感波段主要集中于近红外波段,二者的单因素最优建模参数均为DSI,相关系数分别为0.71、0.68。第二,连续投影算法降维效果较好,从原始光谱和一阶导数光谱中分别提取了14个、8个建模参数,该算法未对光谱作修改,所提取的建模参数可解释性较好。第三,从填图效果以及预测值验证结果来看,PS-LSO-KELM模型是此次研究中的最优模型,其建模R2和验证R2分别达到了0.73、0.70,MRE分别为3.56%、3.53%。

猜你喜欢

反演波段光谱
基于三维Saab变换的高光谱图像压缩方法
反演对称变换在解决平面几何问题中的应用
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
基于3D-CNN的高光谱遥感图像分类算法
新型X波段多功能EPR谱仪的设计与性能
金卤灯太阳模拟设备中滤光片的设计
最佳波段选择的迁西县土地利用信息提取研究
反演变换的概念及其几个性质
基于ModelVision软件的三维磁异常反演方法