APP下载

基于小波变换和分数阶微分的冬小麦叶绿素含量估算

2021-08-27李长春施锦锦马春艳崔颖琪王艺琳李亚聪

农业机械学报 2021年8期
关键词:微分冬小麦波段

李长春 施锦锦 马春艳 崔颖琪 王艺琳 李亚聪

(河南理工大学测绘与国土信息工程学院, 焦作 454000)

0 引言

叶绿素是绿色植物在光合作用中不可或缺的基础物质,植物叶片中叶绿素含量直接影响植物的光合能力[1]。叶绿素是冬小麦生长过程中的重要理化参数,准确、快速获取叶绿素含量不仅有助于对冬小麦病虫害信息进行精准诊断和管理调控,而且对监测冬小麦长势以及估算冬小麦产量具有重要意义。

传统方法通过野外采样和室内分析获得叶绿素含量,该方法费时、费力、成本较高,且具有破坏性和不可恢复性,难以大面积实时获取叶绿素含量[2]。近年来,随着高光谱遥感技术在农作物生长监测方面的研究和应用,为农作物叶绿素含量估算提供了有效手段[3-5],利用高光谱原始数据或由原始数据构建的植被指数、基于经验统计模型反演叶绿素含量是目前比较常用的方法。YODER等[6]研究发现,可见光波段是反演叶绿素含量的最佳波段范围。SABERIOON等[7]利用植被指数估算了不同生长期水稻的冠层叶绿素含量,其估算精度R2达到0.78。杨峰等[8]分别利用次修正土壤调节植被指数(MSAVI2)和波长800 nm处光谱反射率建立叶绿素含量估算模型,建模精度R2可达0.88。刘丹丹等[9]利用高光谱数据,耦合连续小波变换和随机森林方法,构建了夏玉米氮含量估算模型,实现了氮含量的遥感估算,提高了建模精度。孟沌超等[10]利用植被指数、纹理特征,结合逐步回归、偏最小二乘回归和支持向量机回归等方法建模估算玉米叶绿素相对含量,为叶绿素定量反演提供了新的思路。BLACKBURN等[11]对叶片高光谱数据进行连续小波分解,生成的小波系数用于建模估算叶片叶绿素含量,研究表明,小波分析是进一步研究定量提取高光谱数据信息的方法。茹克亚·萨吾提等[12]对原始光谱和经数学变换后的光谱进行0~2阶分数阶微分处理,使用微分光谱建模最优R2可达0.87,研究表明,分数阶微分是一种可以细化光谱信息、提高建模精度的方法。

近年来,对农作物叶绿素含量估算模型的研究主要利用原始光谱反射率、整数阶微分、特征参数、植被指数等,并结合传统回归方法构建叶绿素估算模型,这些方法建模精度不够理想。使用原始高光谱数据容易忽略细部信息,而连续小波变换和分数阶微分均可细化光谱信息,但用于冬小麦叶绿素含量估算的研究较少,而且一般都是单一使用,鲜见两者效果对比研究。本文以冬小麦为研究对象,对冠层高光谱数据进行分数阶微分处理,同时利用连续小波变换对原始光谱进行分解,得到小波能量系数,基于逐步回归分析、支持向量机、人工神经网络等方法构建不同生育期冬小麦叶绿素含量估算模型,并对模型精度进行验证,优选每个生育期最佳估算模型,探讨不同生育期冬小麦冠层叶绿素含量高光谱估算方法,以期提高冬小麦冠层叶绿素含量估算能力,进而为冬小麦营养监测提供科学依据。

1 材料与方法

1.1 研究区概况

研究区位于北京市昌平区小汤山镇国家精准农业研究示范基地,其边界范围为40°10′31″~40°11′18″N,116°26′10″~116°27′5″E,属于温带大陆性季风气候,平均海拔36 m,降雨集中于6—9月,年均降水量507 mm,年均日照2 684 h,年均气温13℃。

2017年10月—2018年6月在研究区展开实验,共设置48个实验小区,每个小区面积为6 m×8 m。在2018年冬小麦拔节期(4月13日)、孕穗期(4月27日)、开花期(5月12日)、灌浆期(5月27日)分别采集实验数据。实验数据主要包括冠层高光谱和叶绿素含量。在分别建立4个关键生育期叶绿素反演模型时,每个时期分别有48个样本数据,选取75%的样本数据(36个)用来建立模型,25%的样本数据(12个)用来验证模型精度;在建立全生育期叶绿素含量反演模型时,共有192个样本数据,选取75%的样本数据(144个)用来建立模型,25%的样本数据(48个)用来验证模型精度。4个关键生育期和全生育期的冬小麦叶绿素含量箱线图如图1所示。

1.2 冬小麦冠层高光谱和叶绿素含量测定

1.2.1高光谱数据测定

使用美国ASD(Analytica spectra deviecs,Inc)生产的Field Spec便携式地物光谱仪采集冠层高光谱数据。选择晴朗无云的天气,于北京时间10:00—14:00采集冠层高光谱数据。高光谱数据采集时,传感器探头始终保持垂直向下,探头距离冠层高度约30 cm,视场角25°,其光谱范围为350~2 500 nm,每个实验区测量前后均使用40 cm×40 cm BaSO4白板校正,以消除自然光变化对光谱的影响[13]。每个小区均匀采集10条光谱数据,采集完成后用ViewSpecPro软件导出无量纲反射率,计算每个小区10条光谱数据的平均值作为各小区的冠层反射率,因为水分吸收带噪声影响严重,所以实验数据选取的波段范围为350~1 350 nm。

1.2.2叶绿素含量测定

在采集冠层高光谱数据的同时,在每个实验区中选取3株长势均匀且对整个小区长势有代表性的样本带回实验室内,在每株样本上选取最上面3个叶片的叶绿素含量,即每个实验区测量9个叶绿素含量,取其平均值作为该实验区叶绿素含量。在室内使用直径为0.8 cm的打孔器取18片叶圆片,使用精度为0.001 g的天平称量,称量后分别装入80 mL的试管中,用95%乙醇在黑暗中浸泡7 d直至叶片变白,再用分光光度计测定叶绿素溶液在光谱波长655、649 nm处的吸光度并计算冬小麦的叶绿素含量。

1.3 数据处理方法

1.3.1小波变换

小波变换始于1974年,由法国工程师MORLET首次提出,近年来,很多学者对小波变换进行了改进优化[14-17]。HUANG等[18]利用小波变换对高光谱数据进行分解,得到小波系数,建立了叶片叶绿素含量估算模型,并取得了较高的精度。小波变换可以将一个复杂的信号分解为不同尺度(频率)的小波信号,具有丰富的基函数以及良好的时频局部化特性,且具有多尺度特性。小波变换主要有连续小波变换(Continuous wavelet transform,CWT)和离散小波变换(Discrete wavelet transform,DWT)。本文采用CWT对高光谱反射率进行分解,得到一系列不同尺度的小波能量系数,小波系数含有2维,分别是分解尺度(i=1,2,…,m)和波段(j=1,2,…,n)。因此,一维高光谱反射率通过连续小波变换转换为二维小波能量系数。计算公式为

(1)

(2)

式中f(λ)——冠层高光谱反射率

λ——350~1 350 nm范围的光谱波段

Ψa,b——小波基函数

a——尺度因子b——平移因子

1.3.2分数阶微分

分数阶微分是一种基本的数学运算,在图像增强处理和信号分析等领域有着广泛的应用[19-21]。HONG等[22]利用分数阶微分对可见光和近红外光谱进行细化,结合支持向量机建立土壤有机质反演模型,得到了较高的估算精度。传统的整数阶微分会忽略一些与叶绿素含量相关的信息,影响模型精度,分数阶微分能够细化高光谱数据的局部信息,也可以有效去噪和获取细部信息。常用的分数阶微分包括Riemann-Liouville、Caputo和Grünwald-Letnikov 3种类型[23],本文采用Grünwald-Letnikov微分形式对冠层高光谱数据进行处理,微分公式为

(3)

式中Γ(·)——Gamma函数

α——任意阶数

m——微分上下限之差

1.3.3建模方法

(1)逐步回归

逐步回归分析(Stepwise regression analysis,SRA)是多元回归分析中的一种方法,基本思想是逐个引入新变量,每引入一个新变量时考虑是否剔除已选变量,直至不再引入新变量。这种方法既能保留影响显著的变量,又能够剔除非显著的变量。它以向前回归为主,结合向后剔除法,通常可以获得较好的拟合效果,因此被广泛应用于建模与预测[24]。

(2)支持向量机

支持向量机(Support vector machine,SVM)是一种监督学习的机器学习算法,具有良好的泛化能力和鲁棒性,没有过拟合缺陷,通常用于模式识别、分类以及小样本回归分析[25]。

(3)人工神经网络

人工神经网络(Artificial neural network,ANN)是根据人脑的功能设计出能够解决现实生活中具体问题的算法模型,它能够从信息处理的角度对人脑进行最简单的抽象,具有很好的逼近能力以及信息处理能力[26]。

1.3.4相关系数

采用皮尔逊相关系数表示两随机变量之间的相关程度,取值范围为[-1,1],当相关系数的绝对值越大,则表明两变量相关性越高[27]。

1.3.5模型精度检验方法

采用决定系数(R2)、均方根误差(RMSE)和标准均方根误差(nRMSE)作为模型精度评价指标。

2 结果与分析

2.1 原始光谱、小波能量系数、微分光谱与叶绿素含量相关性分析

采用Gaussian函数的二阶导数Mexican Hat作为连续小波变换的小波基,分别对各生育期的冬小麦冠层高光谱数据进行分解,得到不同尺度下的小波能量系数。同时,用阶数范围为0~2,步长以0.1增加的Grünwald-Letnikov分数阶微分,当α=0、1、2时,表示原函数(原始光谱)、一阶微分光谱或二阶微分光谱,分别对各个时期的冠层高光谱数据进行了20种分数阶微分变换。原始光谱反射率、小波能量系数和各阶微分光谱与拔节期、孕穗期、开花期、灌浆期、全生育期叶绿素含量的相关性如图2~4所示。

2.1.1拔节期

利用原始光谱反射率与叶绿素含量进行相关性分析,由图2a可知,在波段350~716 nm范围内与叶绿素含量在0.01水平上极显著负相关,在波段739~1 184 nm、1 225~1 291 nm范围内与叶绿素含量在0.01水平上极显著正相关,相关系数绝对值最大为0.58,且大部分波段的相关系数处于0.4~0.6之间,通过0.01极显著相关波段多达880个。

利用小波能量系数与叶绿素含量进行相关性分析,由图3a可知,随着分解尺度的增大,小波能量系数与叶绿素含量之间的相关系数绝对值先增加后降低,除分解尺度10以外,绝对值最大值均在0.63以上,当分解尺度为5,最大可达0.75;随着分解尺度的增大,通过0.01极显著水平检验的光谱波段数量逐渐增加,当分解尺度为10,最多可达1 001个波段。

利用微分光谱与叶绿素含量进行相关性分析,由图4a可知,各阶微分光谱与叶绿素含量之间的相关系数绝对值的最大值均在0.51之上,当阶数为1时,最大可达0.69。除整数阶(1阶和2阶)外,通过0.01极显著水平检验的光谱波段数量均在873以上,当阶数为1.2时,最多可达895个波段。

综上分析,在拔节期,小波能量系数与叶绿素含量的相关性最好,所以选取10个相关系数较高的小波能量系数作为构建叶绿素含量估算模型的输入变量,进行冬小麦叶绿素含量估算。10个相关系数较高的小波能量系数所在分解尺度和波段分别为5、461 nm,6、453 nm,6、446 nm,4、472 nm,6、442 nm,5、464 nm,3、485 nm,7、729 nm,1、682 nm,2、656 nm,其与叶绿素含量的相关性矩阵如图5a所示。

2.1.2孕穗期

利用原始光谱反射率与叶绿素含量进行相关性分析,由图2b可知,在波段443~725 nm范围内与叶绿素含量在0.01水平上极显著负相关,在波段749~1 130 nm范围内与叶绿素含量在0.01水平上极显著正相关,相关系数绝对值最大为0.68,通过0.01极显著相关波段多达665个。

利用小波能量系数与叶绿素含量进行相关性分析,由图3b可知,随着分解尺度的增大,小波能量系数与叶绿素含量之间的相关系数绝对值先增加后降低,除分解尺度10以外,绝对值最大值均在0.72以上,当分解尺度为5,最大可达0.86;随着分解尺度的增大,通过0.01极显著水平检验的光谱波段数量先增加后减少,当分解尺度为6,波段数量最多可达786个波段。

利用微分光谱与叶绿素含量进行相关性分析,由图4b可知,各阶微分光谱与叶绿素含量之间的相关系数绝对值的最大值均在0.47之上,当阶数为1时,最大可达0.77。除整数阶(1阶和2阶)外,通过0.01极显著水平检验的光谱波段数量均在657以上,当阶数为1.2时,最多可达670个波段。

综上分析,在孕穗期,小波能量系数与叶绿素含量的相关性最好,所以选取10个相关系数较高的小波能量系数作为构建叶绿素含量估算模型的输入变量,进行冬小麦叶绿素含量估算。10个相关系数较高的小波能量系数所在分解尺度和波段分别为5、455 nm,5、458 nm,7、729 nm,6、442 nm,6、411 nm,3、525 nm,7、725 nm,1、686 nm,6、383 nm,4、471 nm,其与叶绿素含量的相关性矩阵如图5b所示。

2.1.3开花期

利用原始光谱反射率与叶绿素含量进行相关性分析,由图2c可知,在波段438~726 nm范围内与叶绿素含量在0.01水平上极显著负相关,在波段750~1 136 nm范围内与叶绿素含量在0.01水平上极显著正相关,相关系数绝对值最大为0.62,通过0.01极显著相关波段多达676个。

利用小波能量系数与叶绿素含量进行相关性分析,由图3c可知,在开花期,随着分解尺度的增大,小波能量系数与叶绿素含量之间的相关系数绝对值先增加后降低,除分解尺度10以外,绝对值最大值均在0.65以上,当分解尺度为6,最大可达0.80;随着分解尺度的增大,通过0.01极显著水平检验的光谱波段数量先增加后减少,当分解尺度为6,波段数量最多可达763个波段。

利用微分光谱与叶绿素含量进行相关性分析,由图4c可知,在开花期,各阶微分光谱与叶绿素含量之间的相关系数绝对值的最大值均在0.45之上,当阶数为1时,最大可达0.75。除整数阶(1阶和2阶)外,通过0.01极显著水平检验的光谱波段数量均在664以上,当阶数为1.2时,最多可达680个波段。

综上分析,在开花期,小波能量系数与叶绿素含量的相关性最好,所以选取10个相关系数较高的小波能量系数作为构建叶绿素含量估算模型的输入变量,进行冬小麦叶绿素含量估算。10个相关系数较高的小波能量系数所在分解尺度和波段分别为6、446 nm,2、677 nm,6、424 nm,2、679 nm,6、417 nm,5、455 nm,3、487 nm,5、459 nm,3、673 nm,1、681 nm,其与叶绿素含量的相关性矩阵如图5c所示。

2.1.4灌浆期

利用原始光谱反射率与叶绿素含量进行相关性分析,由图2d可知,在波段350~728 nm、1 330~1 349 nm范围内与叶绿素含量在0.01水平上极显著负相关,在波段737~1 144 nm范围内与叶绿素含量在0.01水平上极显著正相关,相关系数绝对值最大为0.76,通过0.01极显著相关波段多达807个。

利用小波能量系数与叶绿素含量进行相关性分析,由图3d可知,在灌浆期,随着分解尺度的增大,小波能量系数与叶绿素含量之间的相关系数绝对值逐渐降低,除分解尺度10以外,绝对值最大值均在0.75以上,当分解尺度为1,最大可达0.80;随着分解尺度的增大,通过0.01极显著水平检验的光谱波段数量先增加后减少,当分解尺度为6,波段数量最多可达929个波段。

利用微分光谱与叶绿素含量进行相关性分析,由图4d可知,在灌浆期,各阶微分光谱与叶绿素含量之间的相关系数绝对值的最大值均在0.73之上,当阶数为1时,最大可达0.83。除整数阶(1阶和2阶)外,通过0.01极显著水平检验的光谱波段数量均在722以上,当阶数为0.2时,最多可达787个波段。

综上分析,在灌浆期,微分光谱与叶绿素含量的相关性最好,所以选取10个相关系数较高的微分光谱作为构建叶绿素含量估算模型的输入变量,进行冬小麦叶绿素含量估算。10个相关系数较高的微分光谱所在阶数和波段分别为1阶、498 nm,1阶、742 nm,1.1阶、723 nm,1.1阶、730 nm,1.9阶、598 nm,1.2阶、717 nm,1.9阶、707 nm,0.9阶、697 nm,1.8阶、584 nm,1.3阶、711 nm,其与叶绿素含量的相关性矩阵如图5d所示。

2.1.5全生育期

利用原始光谱反射率与叶绿素含量进行相关性分析,由图2e可知,在波段350~731 nm、1 331~1 350 nm范围内与叶绿素含量在0.01水平上极显著负相关,在波段741~1 146 nm范围内与叶绿素含量在0.01水平上极显著正相关,相关系数绝对值最大为0.65,通过0.01极显著相关波段多达808个。

利用小波能量系数与叶绿素含量进行相关性分析,由图3e可知,在全生育期,随着分解尺度的增大,小波能量系数与叶绿素含量之间的相关系数绝对值先升高后降低,除分解尺度9和分解尺度10以外,绝对值最大值均在0.69以上,当分解尺度为7,最大可达0.75;随着分解尺度的增大,通过0.01极显著水平检验的光谱波段数量先增加后减少,当分解尺度为6,波段数量最多可达937个波段。

利用微分光谱与叶绿素含量进行相关性分析,由图4e可知,在全生育期,除2阶微分光谱以外,其他各阶微分光谱与叶绿素含量之间的相关系数绝对值的最大值均在0.65之上,当阶数为1.1时,最大可达0.72。除整数阶(1阶和2阶)外,通过0.01极显著水平检验的光谱波段数量均在803以上,当阶数为1.7时,最多可达809个波段。

综上分析,在全生育期,小波能量系数与叶绿素含量的相关性最好,所以选取10个相关系数较高的小波能量系数作为构建叶绿素含量估算模型的输入变量,进行冬小麦叶绿素含量估算。10个相关系数较高的小波能量系数所在分解尺度和波段分别为7、720 nm,7、716 nm,6、430 nm,3、641 nm,6、557 nm,2、640 nm,3、638 nm,1、704 nm,1、775 nm,5、724 nm,其与叶绿素含量的相关性矩阵如图5e所示。

2.2 建模结果与分析

根据相关性分析结果,将分别在拔节期、孕穗期、开花期、全生育期挑选出的10个与叶绿素含量相关性较好的小波能量系数和在灌浆期选取的10个相关系数较高的微分光谱作为输入变量,叶绿素含量作为输出变量,使用逐步回归、支持向量机、人工神经网络3种方法进行建模,75%的数据用于建模,25%的数据用于验证,建模和验证R2、RMSE、nRMSE如表1所示。

表1 基于连续小波变换和分数阶微分结合逐步回归、支持向量机、人工神经网络的建模结果

在拔节期,使用连续小波变换结合逐步回归、支持向量机、人工神经网络进行建模,人工神经网络建模R2、RMSE和nRMSE分别为0.93、1.03 μg/cm2和2.84%,较逐步回归和支持向量机的建模R2分别提高0.22和0.21,RMSE分别降低1.37、1.42 μg/cm2,nRMSE分别降低了3.76、3.91个百分点,模型验证结果如图6a~6c所示。

在孕穗期,使用连续小波变换结合逐步回归、支持向量机、人工神经网络进行建模,人工神经网络建模R2、RMSE和nRMSE分别为0.93、1.22 μg/cm2和3.04%,较逐步回归和支持向量机的建模R2分别提高0.13和0.13,RMSE分别降低1.08、1.0 μg/cm2,nRMSE分别降低了2.69、2.49个百分点,模型验证结果如图6d~6f所示。

在开花期,使用连续小波变换结合逐步回归、支持向量机、人工神经网络进行建模,人工神经网络建模R2、RMSE和nRMSE分别为0.93、1.06 μg/cm2和2.41%,较逐步回归和支持向量机的建模R2分别提高0.18和0.12,RMSE分别降低1.84、1.49 μg/cm2,nRMSE分别降低了4.17、3.38个百分点,模型验证结果如图6g~6i所示。

在灌浆期,使用分数阶微分结合逐步回归、支持向量机、人工神经网络进行建模,人工神经网络建模R2、RMSE和nRMSE分别为0.97、2.19 μg/cm2和6.22%,较逐步回归和支持向量机的建模R2分别提高0.17和0.17,RMSE分别降低3.67、4.05 μg/cm2,nRMSE分别降低了10.42、11.49个百分点,模型验证结果如图6j~6l所示。

在全生育期,使用连续小波变换结合逐步回归、支持向量机、人工神经网络进行建模,人工神经网络建模R2、RMSE和nRMSE分别为0.86、3.08 μg/cm2、7.90%,较逐步回归和支持向量机的建模R2分别提高0.17和0.11,RMSE分别降低1.82、1.07 μg/cm2,nRMSE分别降低了4.68、2.74个百分点,模型验证结果如图6m~6o所示。

因此,在拔节期、孕穗期、开花期和全生育期,利用连续小波变换和人工神经网络方法,叶绿素含量估算效果最好;在灌浆期,基于分数阶微分和人工神经网络方法建立小麦叶绿素含量估算模型精度最高,估算效果最好。

3 讨论

(1)作物不同于土壤、水体以及其他典型地物,其光谱特性主要是由生理生态和营养水平决定的,与作物的发育阶段、健康状况以及环境条件密切相关,所以作物的光谱曲线随着其生长时期的变化,呈现出不同的形态特征[28-30]。以往在建立冬小麦叶绿素估算模型时,一般选择一个生育期的实验数据,所以建立的估算模型往往普适性较差[31-32]。本文选择在冬小麦的拔节期、孕穗期、开花期、灌浆期4个生育期分别观测冠层光谱和叶绿素含量,建立4个关键生育期和全生育期的叶绿素估算模型,由建模结果可知,在各个生育期,人工神经网络建模结果最优,灌浆期估算模型的R2较拔节期、孕穗期、开花期和全生育期都分别提高4个百分点,较全生育期提高11个百分点,因此灌浆期叶绿素含量估算结果最好。这主要是由于该生育期的冠层叶绿素含量开始由大向小转变,叶绿素含量与冠层光谱相对比较敏感。

(2)用高光谱数据反演叶绿素含量的困难在于:提取高光谱数据中对叶绿素敏感的光谱信息,采集过程中,由于受土壤背景、环境因素等影响,致使原始光谱存在噪声,影响敏感信息的提取,以往叶绿素含量的高光谱反演模型大多基于原始光谱反射率以及其数学变换、整数阶微分和植被指数等方法消除噪声影响,本研究使用连续小波变换、分数阶微分来进行光谱信息的细化,通过分析各个关键生育期和全生育期的原始光谱反射率、小波能量系数和微分光谱与叶绿素含量的相关性可知,在拔节期、孕穗期、开花期、灌浆期和全生育期,小波能量系数与叶绿素含量的相关系数绝对值最大值较原始光谱与叶绿素含量的相关系数绝对值最大值分别提高了29%、26%、29%、5%和15%,微分光谱与叶绿素含量的相关系数绝对值最大值较原始光谱与叶绿素含量的相关系数绝对值最大值提高了19%、13%、21%、9%和11%。研究结果表明连续小波变换、分数阶微分可以提高光谱数据对叶绿素含量的敏感性,这与方圣辉等[33]和姚胜男等[34]的研究结果相一致。

4 结束语

以冬小麦为研究对象,基于地面冬小麦冠层高光谱和实测叶绿素含量数据,分别利用原始光谱、分数阶微分光谱、原始光谱经连续小波变换后得到的小波能量系数与实测叶绿素含量数据进行相关性分析,选取相关性较好的分数阶微分光谱和小波能量系数,采用逐步回归分析、支持向量机、人工神经网络等方法构建冬小麦叶绿素含量估算模型。结果显示,在4个关键生育期和全生育期建立的叶绿素估算模型中,灌浆期叶绿素含量估算精度最高,人工神经网络叶绿素含量反演效果最好。

猜你喜欢

微分冬小麦波段
Ku波段高隔离度双极化微带阵列天线的设计
多飞行器突防打击一体化微分对策制导律设计
2022年山西省冬小麦春季田间管理意见
最佳波段组合的典型地物信息提取
冬小麦田N2O通量研究
一类带有Slit-strips型积分边值条件的分数阶微分方程及微分包含解的存在性
新型X波段多功能EPR谱仪的设计与性能
冬小麦的秘密
最佳波段选择的迁西县土地利用信息提取研究
不误农时打好冬小麦春管“第一仗”