APP下载

三江源高寒退化草原土壤有机质含量的光谱模拟估算

2023-01-29关文昊刘志刚何国兴纪童李强杨军银柳小妮

草原与草坪 2022年5期
关键词:微分倒数对数

关文昊,刘志刚,何国兴,纪童,李强,杨军银,柳小妮

(甘肃农业大学草业学院,草业生态系统教育部重点实验室,甘肃省草业工程实验室,中‐美草地畜牧业可持续发展研究中心,甘肃 兰州 730070)

土壤有机质(Soil organic matter,SOM)含量是衡量土壤肥力的重要指标[1],土壤SOM可以改善土壤结构,积蓄土壤水分,增加土壤养分,促进土壤团聚体形成,对作物生长、土壤肥力的保持、环境保护及农、林、牧业可持续发展都有极重要的意义[2]。但用传统方式对SOM野外大面积调查时,需要人工采集大量样品带回实验室后使用化学方法测定,工作效率低、工作量大且耗费时间久[3]。高光谱技术具有快速、连续、无损等特点,可用于野外或实验室快速地采集植被、土壤、水体等地物光谱信息,不受试验地区的制约,可以动态地监测地区的高光谱信息[4]。同时,现阶段高光谱技术有纳米级的分辨率,能够反映出不同理化性质研究对象的光谱特征,因而为土壤SOM含量的监测和反演提供了技术与理论支持[5]。自1960年以来,对于土壤物理化学性质的高光谱研究已经受到国内外专家学者的广泛关注[6]。

近年来,随着先进的光谱科学技术、计算机科学技术、工业科学技术及物理和化学计量科学快速进步和发展,光谱仪的分辨率和信噪比也越来越高,对土壤物理化学特性的高光谱研究以及它们的反演模式在精准农业尤其是土壤遥感监控中的作用愈加明显[8]。闫姗姗[9]、沙晋明[10]、卢艳丽[11]、贺军 亮[12]、周萍[13]和 Gunsaulis等[14]研究结果表明,SOM 含量与土壤光谱反射率R的红光波段之间具有较强的相关性。但土壤原始光谱反射率R含有较多的冗余信息,将R经过一系列数学转换后,可以放大波段特征信息,在进行模型的建立时可以有效提高反演模型的精度。于士凯[15]等研究表明,利用经一阶微分R’、倒数的对数log(1/R)等数学处理后的光谱数据所建模型的精度高于使用原始光谱反射率R建模的精度。何挺[16]、张娟娟等[17]和李伟等[18]分别建立了不同数学转换后光谱数据与SOM的反演模型,模型效果良好。

目前有很多基于土壤高光谱数据建立SOM反演模型的方法[19],不同建模方法优缺点各不相同,其中多元逐步回归(Stepwise multiple linear regression,SMLR)模型能反映光谱数据之间的自相关问题,已被广泛应用于SOM含量的建模[20];支持向量机(Sup‐port vector machine,SVM)避免高维空间的复杂性,直接在高维空间解决相应的决策问题,具有较好的泛化推广能力[21];决策树法(Decision Tree,DT) 在卫星和机载高光谱数据图谱的综合提取中发挥着很好的作用[22];而随机森林(Random forest,RF)可以使建立的模型难以陷入过度拟合[23]。因此,SMLR、SVM、DT和RF均可用于土壤SOM含量的模拟反演。

三江源地区不同土壤的质地、含水量及成土母质等因素不尽相同,其光谱敏感波段与最优模型也不尽相同[24]。本研究以三江源地区普遍退化的高寒草原为背景,利用ASD地物光谱仪对不同退化程度的高寒草原土壤光谱数据进行测量,分析光谱数据与SOM含量的关系,并运用不同光谱数据转换方法,确定三江源区最适宜的SOM反演模型,探讨基于土壤反射光谱特性的SOM估测,为三江源区高寒草地土壤养分含量的快速测量,及其恢复与重建提供技术支持。

1 材料和方法

1.1 研究区概况

试验地位于青海省三江源区果洛藏族自治州西北部的玛多县,地理坐标 N 33°50′~35°40′,E96°50′~99°20′,平均海拔 4 200 m,属高寒草原气候,年平均气温-4.1 ℃,除5~9月,其他月平均气温均在-3.0 ℃以下,全年无绝对无霜期。试验地草地类型为高寒草原,优势植物主要为紫花针茅(Stipa purpurea)、线叶嵩草(Kobresia capillifolia)、草地早熟禾(Poa praten⁃sis)、多茎委陵菜(Potentilla multicaulis)、弱小火绒草(Leontopodium pusillum)等。

1.2 土壤的采集与测定

2019年7 月在5个不同退化程度[25]样地中(表1),用随机采样法于每个样地中各取3个点,每个点用环刀分别采集0~30 cm土样各6份,共计90份土样。去除石子、植物根系等杂质,放入自封袋中封口,贴好标签,冷藏并带回实验室采集光谱数据、测定SOM含量。

光谱数据选用 ASD(ASD FieldSpec®4 Hi-Res NG,USA)地物光谱仪采集。该仪器的波长在350~2 500 nm,光谱分辨率为3 nm@700 nm和6 nm@1 400/2 100 nm,具有节能、便携、高效、光谱数据精确等特点。在黑暗、无光的室内环境采集土壤样品的反射光谱。将12 V、50 W卤素光源固定在距土壤样品60 cm、地面夹角60°的位置,以减小阴影的影响。每个土壤样本重复测定10次,每测1次使用标准板校准1次。

SOM含量采用重铬酸钾氧化法测定[25],并计算SOM含量的变异系数(Coefficient of Variation,Cv),Cv≤0.1为弱变异,0.1

1.3 SOM含量的模拟估算

1.3.1 数据处理和光谱特征波段选取 使用ASD光谱仪自带的ViewSpecpro软件预览光谱数据,剔除异常波段,取重复样本的平均值作为标准光谱,并对标准光谱进行Savitzky Golay滤波平滑,将平滑后的光谱作为原始光谱反射率R。为了增强特征波段信息,提高建模精度,在原始光谱反射率R的基础上,进行一阶微分R’、倒数的对数log(1/R)、倒数一阶微分[log(1/R)]’[27]变换。

将SOM含量与原始光谱反射率R、倒数对数log(1/R)、一阶微分 R’、倒数对数一阶微分[log(1/R)]’的相关性作为选取特征波段的依据。使用4种不同光谱曲线分别与SOM含量进行皮尔森相关分析,然后对得出的4种相关系数分别进行P<0.01水平下的显著性检验,并绘制相关关系曲线图,确定显著波段的位置,再次进行P<0.001水平下的显著性检验,根据相关系数(P<0.001)挑选用于建模的光谱波段。

1.3.2 模型的建立及精度评估 使用1种线性模型多元逐步回归(MLSR)方法和3种非线性模型:支持向量机(SVM)、决策树(DT)、随机森林(RF)方法进行模型的建立,在建模过程中,随机抽取70%的数据作为建模组,30%作为检验组。选用决定系数(R2)和均方根误差(RMSE)作为精度评价指标。R2用来评价回归模型系数的拟合优度,取值范围为0~1,越接近1,拟合度越好。RMSE用于测量预测值和观测值之间的偏差,RMSE越小,说明预测效果越好。若建模组跟检验组精度评价指标都好,证明反演模型较理想[28-29]。决定系数R2与均方根误差RMSE的公式如下:

式 中 :yi表 示 实 测 值 ,̂表 示 预 测 值表 示 平均值。

1.4 统计数据处理与分析

原始光谱反射率预处理以及倒数对数log(1/R)、一阶微分 R’、倒数对数一阶微分[log(1/R)]’处理均在ASD光谱仪配套的数据处理软件ViewSpecpro中处理,原始光谱反射率、倒数对数log(1/R)、一阶微分R’、倒数对数一阶微分[log(1/R)]’与土壤SOM含量的相关性分析、显著性分析及绘图均在Excel 2010和SPSS 21中进行。多元逐步回归(MLSR)、支持向量机(SVM)、决策树(DT)、随机森林(RF)建模及检验在RStudio中进行。

2 结果与分析

2.1 不同退化程度高寒草原的土壤有机质含量

研究区80个样本总体平均值为19.559 7 g/kg,变异系数为45.25%,属于中等变异,有机质含量较高,变化范围较大。各退化程度中有机质平均值大小为ND>LD>HD>MD>ED,各个退化程度变异系数大小为HD>MD>ND>ED>LD(表2)。各退化程度中LD变异系数最小,为弱变异,剩余退化程度皆为中等变异。

表2 SOM含量基本统计特征Table 2 SOM basic features

2.2 SOM含量的模拟估算

2.2.1 土壤光谱特征 对不同处理下的光谱曲线(图1)分析发现:不同退化程度反射光谱曲线形状变化基本一致,反射光谱区间在350~780 nm时,反射率快速上升;在780~1 790 nm时,反射率上升较缓慢。ND的平均SOM含量最高,对应的反射光谱曲线最低;ED与之相反(图1‐A)。倒数对数变换后,光谱曲线在350~780 nm时,随着SOM含量的增加,倒数对数快速下降,780 nm以后导数对数变化趋于平缓(图1‐B)。ND的平均SOM含量最高,对应的导数对数光谱曲线最高;ED与之相反。用一阶微分和倒数对数一阶微分对土壤光谱进行处理后的光谱曲线在正值与负值之间波动,并不稳定(图1‐C,图1‐D)。

图1 不同退化程度土壤的光谱曲线Fig.1 Spectral curve relative to soil type

2.2.2 特征波段筛选 SOM含量与土壤光谱反射率R负相关,土壤光谱反射率367 nm前呈下降趋势,367~1 100 nm相呈上升趋势,关系曲线在1 100 nm后变化不大。SOM含量与log(1/R)转化下的土壤光谱反射率在全波段成正相关,变化趋势与R曲线相反。R’在750 nm前呈负相关(图2‐A),750~900 nm呈正相关,随后不断波动,[Log(1/R)]’变化趋势大体与R’相似(图2‐B)。

图2 SOM含量与光谱反射率相关性(P=0.01)Fig.2 Correlation between SOM content and spectral reflectance (P=0.01)

为了进一步的选择更准确的光谱波段,再次进行P<0.001水平下的显著性检验(图3),P<0.001水平的光谱波段主要集中在600 nm左右,据此挑选出6个P<0.001水平的特征波段(表3)。

图3 SOM含量与光谱反射率相关性(P=0.001)Fig.3 Correlation between SOM content and spectral reflectance (P=0.001)

从表3可知,原始光谱反射率R在波长657 nm时相关系数绝对值最大,为0.546,倒数对数log(1/R)在波长597 nm时相关系数最大,为0.645 9,一阶微分R’在波长852 nm时相关系数绝对值最大,为0.702 1,倒数对数一阶微分[log(1/R)]'在波长892 nm时相关系数绝对值最大,为0.705 9。3种经过处理的光谱数据与SOM含量相关性对比原始光谱反射率R与SOM含量相关性有了显著提高。

表3 相关系数Table 3 Correlation coefficient

2.2.3 基于光谱特征波段的SOM 模拟估算 支持向量机(SVM)、决策树(DT)、随机森林(RF)3种模型的决定系数(R2)明显比多元逐步回归(MLSR)的高,均方根误差(RMSE)低(表4),这意味使用非线性模型估测效果要优于线性模型多元逐步回归(MLSR),随机森林(RF)模型估测的效果较好,其决定系数(R2)均高于另外3种方法所建立的反演模型,均方根误差(RMSE)均低于另外3种方法所建立的反演模型,检验组同样也是如此。

表4 模型精度对比Table 4 Model accuracy comparison

同一模型下的不同光谱处理中,倒数对数Log(1/R)和倒数对数一阶微分[Log(1/R)]’处理下模型的决定系数(R2)明显高,均方根误差(RMSE)明显低。倒数对数Log(1/R)、倒数对数一阶微分[Log(1/R)]’之间差别不大,原始光谱反射率R、一阶微分R’之间差别不大。随机森林(RF)方法建立的Log(1/R) -RF、[Log(1/R)]’- RF模型的预测效果较好,其建模组的决定系数(R2)和均方根误差(RMSE)分别为0.949 1、0.252 7和0.948 0、0.253 2,检验组的决定系数(R2)和均方根误差(RMSE)分别为 0.717 2、0.496 9和0.703 0、0.515 5。

原始光谱反射率R和倒数对数R’回归模型预测值与实测值之间存在着很大的偏离,样本点数分散,样点距直线距离远,模型的效果不好;倒数对数Log(1/R)和倒数对数一阶微分[Log(1/R)]’ 回归模型预测值与实测值较均匀的分布在直线两侧(图4)。模型的精度指标和图形拟合效果表明,用随机森林方法建立的Log(1/R)-RF模型优于[Log(1/R)]’- RF模型,并且明显高于用另外两种光谱数据数学处理建立的模型。

图4 SOM含量的实测值与预测值比较Fig.4 Correlation between SOM measured and predicted SOM contents

3 讨论

SOM含量很大程度上决定着土壤光谱反射率的大小。本研究中,不同退化程度高寒草原土壤的光谱反射率不同,随着土壤样品SOM含量的升高,土壤原始光谱反射率相对降低,与玉米提·买明等[30]的研究结果一致,这是由于土壤光谱反射率与土壤质地、成土母质、水分、有机质、氮、磷、钾等土壤理化性质息息相关。Bowers[31]指出,土壤的各类物理、化学性质和有机质含量是影响土壤反射率的主要因素,牛芳鹏[8]研究也表明土壤光谱反射率与土壤SOM呈极显著负相关。

原始光谱反射率R经数学转换后,可以有效地缩小、放大光谱数据特征峰反射率,并且提高光谱数据的识别概率[32]。本研究发现,利用SOM含量与原始光谱反射率R、倒数对数log(1/R)、一阶微分R’、倒数对数一阶微分[log(1/R)]’所挑选出的敏感波段建立的反演模型中,通过数学转换后的反演模型精度有了明显提升,土壤特征波段光谱数据与土壤SOM含量的相关性大大提高,这与史舟[33]、赵明松[34]等的研究结果一致。这是因为原始光谱反射率经数学转换后可以起到增强波段信息,从而提高反演模型精度[35]。郑立华[36]、王永敏[37]等也分别利用经数学转换后的光谱数据建立了有机质等养分元素的预测模型,决定系数均达到0.8。

利用高光谱数据构建反演模型从而对土壤SOM含量进行快速估测已经得到一致认可[38-39],赵瑞等[40]结合遥感影像进行土壤SOM反演模型也取得了满意的结果。本试验中,通过随机森林法建立的模型精度远高于其他3种方法,这是因为随机森林法是随机的引入2个变量,避免了模型陷入过拟合。所建立的16个反演模型中,随机森林倒数对数处理建立的Log(1/R)- RF模型的预测精度和稳定性较好,该模型可以有效的增强或减弱光谱波段特征峰,且降低数据之间的拟合性,提高建模精度,可为三江源地区土壤SOM含量预测,以及草地生态系统的恢复与重建提供理论依据。

由于土壤理化性质复杂多变,不同地区土壤理化性质不同,同一地区不同土壤理化性质也不尽相同,导致建立的土壤SOM含量反演模型的适用性需进一步研究与验证。因此,需要进一步采集三江源不同地区、不同种类土壤样本,进行更多的研究,为三江源地区生态系统的恢复与重建提供数据支持。

4 结论

1) 试验地土壤有机质(SOM)含量为41.659 4~8.761 3 g/kg,样本平均值为19.559 7 g/kg,变异系数是45.25 %,属于中等变异。不同退化程度土壤光谱曲线变化趋势大体一致,且随着SOM含量的增加,原始光谱反射率曲线降低,呈负相关变化。

2) 通过对不同光谱转换方式与土壤SOM含量相关性关系的分析可知,原始光谱反射率通过倒数对数、一阶微分、倒数对数一阶微分转换后与土壤SOM含量的相关系数有了显著提升,说明光谱数据的数学转换可以扩大光谱的一些吸收特征。

3) 跟其他模型相比,Log(1/R)-RF具有更高的预测精度和稳定性,可以较准确的估测本试验区土壤SOM含量。

猜你喜欢

微分倒数对数
含有对数非线性项Kirchhoff方程多解的存在性
指数与对数
Ap(φ)权,拟微分算子及其交换子
拟微分算子在Hp(ω)上的有界性
一类非线性复微分差分方程解的不存在性
多复变整函数与其关于全导数的微分多项式
指数与对数
惊喜倒数日历
对数简史