APP下载

基于局部去趋势波动分析的油菜光谱红边位置确定方法

2018-11-20高菲蕊沈陆明廖桂平

江苏农业科学 2018年20期
关键词:冠层识别率分形

高菲蕊, 沈陆明, 王 访,2, 廖桂平,2

(1.湖南农业大学理学院/农业数学建模与数据处理研究中心,湖南长沙 410128; 2.南方粮油作物协同创新中心,湖南长沙 410128)

随着科学技术及经济的发展,精细农业[1]已成为现代农业的重要发展方向,高光谱遥感技术能够快速、无损、准确地监测作物的生长状况,已经越来越广泛地应用于研究玉米[2]、棉花[3]、马铃薯[4]、小麦[5]、油菜[6-7]等农作物之中。

如今植被光谱分析成为了大田作物监控和检测的重要手段,对植被光谱红边特征参数[8]的分析尤为重要,红边参数主要包括红边位置、红边幅值和红边面积。其中,红边位置是作(植)物绿色器官光谱曲线在680~760 nm之间变化率最快的点,也是一阶导数光谱在该区间的转折点,是作物光谱最明显的标志,红边位置的变动与作物生理状况密切相关,是作物营养含量[9]、有无病虫害[10]、是否受胁迫[11-14]的最佳指示器,红边位置的变化对利用高光谱建模具有很重要的意义。目前已有很多方法[8]提取红边位置,如最大一阶导数法、倒高斯拟合法、四点线性插值法、拉格朗日插值法、多项式拟合法和线性外推法等。对农作物红边信息的研究大致可分为2类[8]:一是估测植被生物参数[9,15-18],红边参数常用来监测植株的长势和生理指标。姚霞等通过不同算法提取红边位置,分析并比较不同算法提取的红边位置对氮素营养监测模型的准确性和可靠性差异,确定监测小麦叶片氮素营养的最佳红边位置算法及定量模型[15]。薛利红等以菠菜的叶片为例,详细比较了6种红边位置提取方法得到的红边信息与叶绿素的关系,并从其对叶绿素含量预测的准确度、计算难度、所需数据的精度及适用范围等几个方面进行讨论,来比较这些方法的优劣[16]。丁永军等为了快速准确地估测番茄叶片的叶绿素含量,分析了不同营养水平下的番茄冠层光谱红边参数变化规律,发现红边位置最能表征番茄叶绿素状况,并统计分析了6种算法提取的光谱红边位置的差异[18]。二是鉴定植被生长状况[10-14,19],病虫害严重威胁作物的产量和质量,给农业带来的灾害非常严重,利用红边信息预防病虫生物灾害有着重要的意义。乔红波对受麦蚜、白粉病危害的小麦冠层光谱反射率求一阶导数得到红边幅值,受麦蚜、白粉病危害后,小麦冠层的红边幅值在近红外波段(650~780 nm)发生剧烈的变化,而红边位置变化不明显[19]。黄木易等对小麦条锈病冠层光谱的红边参数进行了分析[20]。

Mandelbrot于1975年正式提出分形理论,分形理论是一种可描述非线性事物的强大工具,被广泛应用于各个领域。去趋势波动分析(DFA)是由Peng等于1994年提出,先去除局部趋势后再来估计对象的Hurst指数,用于分析DNA序列的长程相关性[20]。它可以有效地滤去序列中的各阶趋势成分,能检测含有噪声且叠加有多项式趋势信号的长程相关性,适合非平稳时间序列的长程幂律相关分析。此后,Kantelhardt等将其推广为多重分形的形式(MF-DFA),可以从不同的波动区间描述非平稳对象的长程相关性[21]。在作物诊断领域中,该方法得到了很好的应用[22-28]。王访等为了描述油菜缺素叶片图像的特征,提出了局部多重分形去趋势波动分析,这个方法提取的h(q)指数能有效地刻画叶片图像每个像素点的多重分形特征[22]。王晓乔等对苗期的油菜光谱进行了多重分形分析,并对叶绿素诊断建模[23]。Wang等提出了利用二维多重分形渐趋波动分析识别植物物种的新方法[25]。施文等利用多重分形理论中的基于sum容量测度、max容量测度和min容量测度的多重分形谱分割方法,分别对油菜菌核病害、白斑病害、油菜潜叶蝇虫害叶片图像进行识别与分割[26]。Jiang等利用了多尺度多重分形去趋势波动分析方法提取了苗期的敏感波段,并确立了油菜叶绿素定量回归模型和定性回归模型,最后提取了4种种植条件下的最敏感的波段[28]。

本研究以大田试验为手段,以角果期油菜冠层光谱为研究对象,提出基于局部去趋势波动分析的油菜冠层光谱红边位置提取方法。以该方法提取的Hurst指数为红边特征进行不同种植条件的定性识别,与6种常见的红边位置提取方法作比较,考察用不同方法提取红边位置的差异。

1 材料与方法

1.1 试验材料

以2014—2015年湖南农业大学浏阳试验基地(湖南省永安镇红旗村,28°12′36″N,113°17′24″E)水田种植的24个移栽小区和24个直播小区的中熟油菜为研究对象,每个小区面积为20 m2。于2014年10月11日直播种植和11月5日移栽种植,利用美国ASD公司(Analytical Spectral Device)产FieldSpec®3 Hi-Res便携式地物波谱仪(有效波段为 350~2 500 nm,其中,350~1 000 nm光谱采样间隔为 1.4 nm,光谱分辨率为3 nm;1 000~2 500 nm光谱采样间隔为2 nm,光谱分辨率为10 nm)在09:00—13:00采集油菜各个时期的光谱样本,选取2015年4月28日(角果期)采集的样本进行分析。测量时传感器探头向下,距冠层顶垂直高度约0.7 m。每个小区随机选取长势平均的5个位置采集油菜冠层光谱。

1.2 数学方法

1.2.1 去趋势波动分析(DFA) 去趋势波动分析(DFA)[21]主要用于研究非平稳序列的多重分形特性,具体步骤如下:

首先计算序列{xi},i=1,2,…,N(N为光谱波长最大范围)的累积离差和Xk。

(1)

(2)

进而得到每个区间的残差序列Ys(k):

(3)

然后计算每个区间的残差的方差:

(4)

(5)

于是再对所有2Ns个区间求和计算平均波动方差函数:

(6)

对于不同长度s,能得到相应的F(s),若波动函数F(s)与s满足幂律关系[29],即满足关系F(s)∝sH,则表明序列{xi}具有分形特征。此时,H的值可由ln[F(s)]/ln(s)通过线性回归的斜率得到,即在双对数坐标(ln(s),ln[F(s)])的散点图中利用最小二乘法对数据点进行拟合,其中直线部分的斜率即为H,即Hurst指数。H=0.5表明不存在相关性(白噪声),H>0.5说明序列{xi}是长程相关性的,H<0.5说明序列{xi}存在长程反相关性。

1.2.3 基于L-DFA的红边位置确定方法 本节利用 L-DFA 提出一种油菜光谱红边位置提取方法。首先利用 L-DFA 得到光谱反射率序列每个波长的Hurst指数,取wt=17,s取4、5、6、7、8和9,对Hurst指数求一阶导数,找到一阶导数的最大值对应的波长即为红边位置。

为了验证上述方法的有效性,本研究与以下6种常见的红边位置提取方法作比较[12,30]:最大一阶导数光谱(MFD)[12]、倒高斯拟合法(IGF)[12]、四点线性插值法(FPI)[12]、拉格朗日插值法(LIP)[12]、多项式拟合法(PFT)[12]、线性外推法(LET)[30]。

2 结果与分析

红边是绿色作物光谱反射率曲线在680~760 nm之间变化率最快的点,也是一阶导数光谱在该区间内的拐点,红边左侧的反射率主要与叶绿素的含量有关,右侧的反射率主要与叶片内组织结构和植物体内含水量有关[31],因此红边位置为研究油菜健康和胁迫以及品质监测提供了一个非常敏感的指标。本节将上节提出的基于L-DFA的红边位置确定方法与常见的6种方法作比较。

2.1 不同算法下红边位置的差异分析

对48个小区随机选取长势平均的5个冠层位置采集油菜角果期冠层光谱,分别应用上述方法提取其红边位置,图1是各种方法下的红边位置频率直方图。其中图1-a为本研究所提出的基于L-DFA的红边位置确定方法,所提取的红边位置均位于752 nm;图1-b为最大一阶导数(MFD)光谱法求得的红边位置频率直方图,一阶导数处理可以消除线性或者接近线性的背景、噪声光谱对目标光谱的影响。一阶导数光谱的最大值所对应的波长即为红边位置,48个小区每个小区5个样本点的红边位置均位于波长为732 nm的位置;图1-c为倒高斯拟合法(IGF)提取的红边位置,从图中可以看出,用倒高斯拟合法确定的红边位置主要集中在708 nm和 715 nm 附近;图1-d为四点线性插值法(FPI)提取的红边位置频率直方图,四点线性插值法求出的红边位置主要集中在 717 nm 附近;图1-e为拉格朗日法(LIP)提取的红边位置,分布在731 nm附近;图1-f为多项式拟合法(PFT)确定的红边位置在737 nm和738 nm之间,变幅比较小;图1-g为线性外推法(LET)确定的红边位置,主要分布在727 nm处。

表1为上述7种方法提取的红边位置的统计分析,其中倒高斯法提取出的红边位置极差最大,其次是线性外推法和四点线性插值法。这说明了这几种方法提取出的红边位置不稳定,原因可能是拟合时采用迭代逐步逼近或转换为线性拟合对其结果有较大的影响。其中基于L-DFA和最大一阶导数光谱法提取的红边位置相对较稳定。这2种方法的区别在于,前者是利用L-DFA得到每个波长的Hurst指数,再对Hurst指数求一阶导数,其最大值点对应的波长即为红边位置,而后者是根据红边位置的定义,求得原始光谱一阶导数的最大值点对应的波长即为红边位置。然而,最大一阶导数光谱法虽然可以消除线性或者接近线性的背景、噪声光谱的干扰,但易受生物量测量误差的影响,作物光谱对环境等外在因素极其敏感,对采集距离、角度也有一定的依赖性,且不同光谱所含有效信息也存在差异。而基于L-DFA的红边位置提取方法能有效刻画非平稳序列在不同尺度上的密度分布,能捕捉波形细微的变化,获取光谱的有效信息。

2.2 定性识别模型

为了检测所提取红边位置的有效性和准确性,分别以基于L-DFA的红边位置对应波长的Hurst指数和6种方法提取的红边位置对应的光谱反射率为特征建立3种不同种植条件的定性识别模型,考察两两不同种植条件的识别准确率。利用支持向量机核方法(SVMKM)[32]和随机森林法(RF)[33]作为分类器分别考察识别率,并采用K-折交叉验证(这里取K=10),重复100次以消除随机因素的影响,结果分别如表2和表3所示(最佳识别效果已标粗)。

表1 7种不同方法提取的油菜冠层光谱红边位置

从表2、表3可以看出,以基于L-DFA的光谱红边位置对应的Hurst指数作为特征和以6种方法提取的红边位置对应的光谱值为特征建立的定性识别模型对不同种植条件下的两两对比样本的识别率有所差异。利用SVMKM和RF为分类器时,都以局部Hurst指数为特征的2种种植方式和2种种植密度的识别效果最佳。而对于2种施肥类型的识别,最好的分类效果分别来自多项式拟合法(PFT)和拉格朗日插值法(LIP)。

表2 SVMKM分类器识别不同种植方式、种植密度的准确率

注:A指种植密度为1万株/667m2,B指种植密度为 2万株/667m2。表3同。

一个有趣的现象是,无论采用何种分类器,直播与移栽的识别效果都优于另外2种对比的油菜生长条件,这表明油菜的直播与移栽方式对光谱反射率的影响最大。

2.3 模型检验

为了检验以红边位置的光谱特征建立的不同种植方法和不同密度的油菜样本识别模型的有效性,本节中改变K折的大小,仍利用SVMKM为分类器,考察以上7种方法得到的红边位置光谱建立的模型识别准确率,重复100次,平均识别率及其标准差如图2所示。图2-a和图2-b的主图分别为不同种植方法(移栽和直播)和不同种植密度(1万株/667m2和2万株/667m2)的油菜样本平均识别准确率;里图分别为2种对比组样本平均识别率的标准差。从主图中可以看出对于移栽和直播的油菜样本,利用基于L-DFA提取的油菜红边位置的光谱Hurst作为特征建立的识别模型准确率显著高于其余6种方法。而且不同K折下的识别率相差很小,说明利用L-DFA得到的红边位置区分移栽和直播2种种植方式效果很好。对于2种密度的区分,基于L-DFA和线性外推法得到的区分效果差别不大,且明显优于其他5种方法。对比7种方法,L-DFA得到100次识别率的标准差最小,表明该方法的识别效果十分稳定。

表3 RF分类器识别不同种植方式、施肥类型、种植密度的准确率

3 结语

基于去趋势波动分析,本研究提出了一种提取油菜光谱红边位置的方法,以油菜角果期冠层光谱为研究对象,分别利用局部去趋势波动分析(L-DFA)和6种常见方法提取了供试油菜的红边位置,并考察这些红边位置的差异。然后,以 L-DFA提取的红边位置的Hurst指数与6种方法确定的红遍位置的光谱反射率为特征建立油菜不同生长条件下的分类识别模型,并考察了它们的识别率,最后对模型进行了检验。具体结论如下:(1)利用L-DFA提取的48个试验小区的油菜角果期冠层光谱红边位置都为752 nm,较其他方法稳定。(2)利用L-DFA确定的红遍位置光谱的Hurst指数作为特征对不同种植方式和种植密度的识别模型中,其识别准确率明显高于另外6种方法。以SVMKM和RF为分类器,在K=10折交叉检验下对移栽和直播2种种植方式的油菜样本平均识别率分别为0.9和0.975,对1万株/667m2和2万株/667m22种种植密度的油菜样本平均识别率分别为0.808 4和0.958 3。(3)在模型检验中,改变K折的大小,利用SVM为分类器,L-DFA方法下对移栽与直播的识别率远高于其他6种方法,对1万株/667m2和2万株/667m2的识别效果略优于线性外推法,明显优于其他5种方法。且L-DFA得到的平均识别率最为稳定。

最后值得说明的是,基于L-DFA提取油菜光谱红边位置的方法是利用现代数学、统计学理论在作物光谱信息领域的一次尝试,该方法较传统方法的优势在于:(a)对原始数据要求较低,不需要作复杂的预处理;(b)模型中红边位置的提取方法普适性强;(c)该方法实现简单,智能化程度较高;(d)提取红边位置的过程不需要选取某些特殊的点,因此提取出的红边位置对某些特殊点的影响比较小。

猜你喜欢

冠层识别率分形
基于低空遥感的果树冠层信息提取方法研究
基于激光雷达的树形靶标冠层叶面积探测模型研究
安徽省淮南森林冠层辐射传输过程的特征
感受分形
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
分形之美
分形——2018芳草地艺术节
提升高速公路MTC二次抓拍车牌识别率方案研究
分形空间上广义凸函数的新Simpson型不等式及应用