APP下载

黄河中游退耕还林地土壤有机碳含量的高光谱估测
——以大宁县为例

2022-06-16邓永鹏朱洪芬丁皓希孙瑞鹏毕如田

山西农业科学 2022年6期
关键词:反射率波段光谱

邓永鹏,朱洪芬,丁皓希,孙瑞鹏,毕如田

(山西农业大学 资源环境学院,山西 太谷 030801)

黄河中游地处黄土高原和鄂尔多斯高原干旱-半干旱沙漠区,流域面积约为34.4 万km2,易蚀松散的黄土物质、植被覆盖率低和不合理的土地利用等原因导致黄河中游水土流失严重,生态环境脆弱[1]。为改善黄河中游的生态环境问题,自2000 年以来,黄河中游进行了大规模的退耕还林工程[2]。土地利用方式的转变会导致土壤有机碳含量发生变化,进而影响土壤碳循环过程[3]。因此,快速、准确地获取退耕还林地土壤有机碳含量对评估退耕还林工程的生态效益具有重要意义。

土壤有机碳(Soil Organic Carbon,SOC)是全球碳循环和气候变化研究的一个重要内容,也是评价土壤肥力的重要指标[4]。目前,诸多学者开展了退耕还林地土壤有机碳含量的研究[5-7]。黎鹏等[8]采用重铬酸钾氧化法测定不同退耕还林措施土壤有机碳含量,结果表明,退耕还林能够显著提高土壤有机碳储量。张祎等[9]采用TOC 分析仪测定土壤有机碳含量,分析不同生态建设方式对土壤有机碳含量的影响。关于土壤有机碳测定方法,常用的有重铬酸钾容量法、重铬酸钾氧化-分光光度法、非水滴定法、离子色谱前处理法等[10]。尽管这些方法测定结果准确,但由于必须对野外采集的土壤样品进行风干、研磨、过筛等处理,整个过程费时费力,无法满足快速获取土壤有机碳含量的目的[11]。高光谱遥感技术具有波段多、分辨率高、光谱信息连续等特点,为土壤养分的快速、准确测定提供了一条新途径。近年来,国内外学者在利用高光谱技术预测土壤养分方面开展了诸多研究[12-16]。例如,赵明松等[17]以苏中平原典型土壤为研究对象,分别计算弓曲差、差值指数、比值指数和归一化指数等光谱特征指数,基于光谱特征指数建立有机质预测模型,结果表明,3 种光谱特征指数结合弓曲差建立的模型精度最好。钟亮等[18]以江西省奉新县北部248 个红壤样本为研究对象,构建了5 种不同卷积神经网络结构模型,结果表明,采用小卷积核的VGGNet-7具有极好的预测能力,证明可以通过高光谱遥感技术快速准确地估算土壤有机质含量。马国林等[19]以艾比湖保护区为研究区,利用高光谱估算土壤有机质的同时加入土壤协变量(土壤电导率、pH 和Fe),结果表明,将可见光-近红外光谱信息和土壤协变量相结合的方法可以显著提升土壤有机质的预测性能。总之,高光谱技术的发展为快速、准确地监测土壤养分状况提供了一种新的方法。

本研究以黄河中游大宁县退耕还林地土壤为研究对象,进行光谱采集和有机碳测定,分析其光谱特征,利用倒数的对数、倒数对数一阶微分、一阶微分、去包络线等光谱处理方法,结合皮尔逊相关系数法、主成分回归法、偏最小二乘回归法和支持向量回归法建立土壤有机碳高光谱预测模型,比较不同光谱变换形式建模精度,以期为快速、准确测定退耕还林地土壤有机碳含量提供技术参考。

1 材料和方法

1.1 研究区概况

大宁县 地处黄 河中游(东 经110°27′55″~111°0′40″,北纬36°16′40″~36°36′25″),隶属于山西省临汾市,位于山西省吕梁山南端,地势南北高、中间低,属典型的黄土残垣沟壑区,是黄河泥沙的主要输入区之一[2]。全县东西长50 km,南北宽38 km,总面积为967 km2,该县属暖温带亚干旱气候,四季分明。2000 年大宁县被定为黄河中上游退耕还林(草)生态工程试点县之一,布置有刺槐、柠条等树种[2]。查询国家土壤信息服务平台(http://www.soilinfo.cn/map/)中国1∶400 万土壤类型图可知,研究区内主要土壤类型为黄绵土和褐土。

1.2 土壤样品采集与处理

2020 年11 月,在研究区退耕还林地内布设128 个样点(图1),记录每一样点经纬度坐标及高程数据。采样点土壤类型均为黄绵土,质地类别为粉壤土。土壤样品采集选用“S”形布点法,采集0~20 cm 表层土壤,每一个采样点取5 个点的土壤混合后作为该采样点土样。混合均匀的土样在室内自然风干、研磨并过2 mm 筛,将土样均分为2 份,用于土壤光谱和有机碳含量测定。土壤有机碳含量采用重铬酸钾氧化-外加热法测定[8]。

图1 研究区位置、高程与采样点分布Fig.1 Location of the study area and the distribution of elevation and sampling points

1.3 光谱测试及数据处理

采用美国FiledSpec 4 便携式光谱仪(简称ASD)测定土壤反射光谱曲线,其波谱范围为350~2 500 nm。土壤光谱测量在暗室中进行,光源由1 个50 W 的卤素灯提供,光纤探头视场角为10°,距离土样表面15 cm。每次测试前进行白板标定,每个土样测定10 条光谱曲线,取平均值作为该土样的实际光谱曲线。

去除噪声较为强烈的350~399、2 451~2 500 nm波段,并对剩余波段进行Savitzky-Golay 平滑处理。同时,为避免数据冗余,对原始光谱反射率(R)进行10 nm 重采样,并对重采样后的光谱曲线分别进行倒数的对数(RL)、倒数的对数一阶微分(FRL)、一阶微分(FD)、去包络线(CR)等4 种光谱变换。相关数据处理在ViewSpec Pro、The Unscrambler X 10.4、ENVI 5.3 以及MATLAB R2019b 中完成。

1.4 模型建立与评价

本研究采用主成分回归(Principle component regression,PCR)、偏最小二乘回归(Partial least squares regression,PLSR)和支持 向量回 归(Principle component regression,SVR)3 种模型进行土壤有机碳含量估测。PCR 方法是一种结合了主成分分析与多元线性回归的分析技术,可以有效对自变量数据进行降维[20]。PLSR 方法融合主成分、典型相关分析及多元线性回归等3 种分析方法的优点,可以消除波长变量共线性从而对数据降维,有较好的预测能力[12]。SVR 方法是支持向量机函数在回归领域的应用,在解决非线性和高维数据有独特的优势[21],本研究选用径向基核函数,惩罚参数(C)设为3,Gamma 参数设为0.33。

将128 个土壤样本按有机碳含量从低到高依次排序,以3∶1 的比例分为2 组,其中,建模集包含96 个样本,验证集包含32 个样本,用于模型的精度检验。为了评估模型的预测精度,本研究采用决定系数(R2)、均方根误差(RMSE)和相对预测偏差(RPD)作为精度评价指标。其中,R2越大,RMSE越小,说明模型稳健性更好,预测精度更高。RPD是样本标准差与均方根误差RMSE 的比值,反映模型的预测能力,一般分为3 类,当RPD≤1.4 时,模型不可用于样本的预测;当1.4<RPD<2.0 时,模型具有较好的预测能力;当RPD≥2.0 时,模型具有极好的预测能力[22]。

2 结果与分析

2.1 土壤光谱曲线特征分析

研究区土壤有机碳含量总体较低且变化范围偏大,最小值为2.12 g/kg,最大值为30.11 g/kg,均值为9.22 g/kg,变异系数为60.52%,属于中等强度变异。

按照全国第二次土壤普查养分分级标准中土壤有机质的5 个等级对研究区土壤有机碳数据进行分级,分 为<3.50、3.50~5.80、5.80~11.80、11.80~16.50、>16.50 g/kg 等5 个级别,计算各级别内的土壤光谱反射率平均值,得到5 种不同土壤有机碳含量的平均光谱反射率曲线(图2)。不同土壤有机碳含量的土壤光谱曲线形状基本一致,总体上呈现递增的趋势;土壤有机碳含量与光谱反射率呈负相关,土壤有机碳含量越高,反射率越低,说明土壤原始光谱反射率可以反映土壤有机碳含量的差异;在可见光波段范围内,随着波长的增加,光谱反射率迅速增大,在近红外波段范围内,随着波长的增加,光谱反射率增大的速度减缓;由于受到氧化铁的影响,光谱曲线在900 nm 处出现微小的吸收谷;并且光谱曲线在1 400、1900、2 200、2 300 nm处出现了较为明显的吸收谷,吸收谷的深度、宽度、面积都存在一定的差异。一般认为,1 400、1 900 nm处的吸收谷是受到土壤表面吸附水、土壤中水分子的O-H 官能基发生伸缩震动和转角震动所造成的[23],2 200、2 300 nm 附近存在着Al-OH 黏土矿物(高岭石)和蒙脱石类矿物的吸收带,从而导致了光谱曲线明显的吸收谷[24]。

图2 不同有机碳含量土壤光谱曲线Fig.2 Spectral curves of soil with different organic carbon contents

2.2 土壤有机碳特征波段的选取

将土壤有机碳含量数据与5 种光谱数据进行相关性分析,绘制相关关系曲线,结果表明(图3),土壤有机碳含量与R 在全波段范围均呈极显著负相关(P<0.01),与RL 均呈极显著正相关(P<0.01),曲线整体较平滑,相关系数绝对值均在0.550以上。土壤有机碳含量与R、RL 在550~1 000 nm波段范围内,相关性远高于其他波段,相关系数绝对值均在0.700 以上,在630~670 nm 波段范围相关性最高,相关系数绝对值分别为0.758、0.762。经过一阶微分转换后的光谱反射率FD 和FRL 与土壤有机碳含量之间呈正负相关,相关系数有了显著提高,在2 250、2 260 nm 相关性最高,相关系数绝对值分别为0.799、0.815。去包络线变换后的光谱反射率CR 与土壤有机碳含量之间呈现不同程度的正或负相关,在2 230 nm 相关性最高,相关系数绝对值为0.810,相关程度总体上大于R 和RL。以上分析表明,对原始光谱进行数学转换和去包络线变换可以显著提升一些细微的光谱吸收特征,有利于特征波段的选取。

图3 土壤有机碳含量与光谱数据相关性分析Fig.3 Correlation analysis between soil organic carbon content and spectral data

本研究选择相关系数|r|>0.700 的波段作为特征波段用于模型构建。特征波段分别为:R 的550~980 nm;RL 的530~1 300、1 430~1 560、1 930~2 180、2 250~2 330 nm;FRL 的730~930、1 420、1910~1 920、2 230~2 260 nm;FD 的430~610、800~880、1 420~1 430、1 910~1 920、2 150~2 190、2 230~2 260 nm;CR 的820~950、1 790~1 860、2 160~2 250、2 350~2 370 nm。选用R 进行土壤有机碳含量预测时,特征波段主要位于可见光波段范围;选用RL、FD、FRL 和CR 时,特征波段选择范围较广,涉及可见光、近红外和短波红外波段范围。

2.3 基于PCR 的土壤有机碳建模

PCR 方法建模结果表明(表1),除CR-PCR 和RL-PCR 外,其余模型预测精度较为均衡。其中,FRL-PCR 模型预测精度最差,建模集和验证集R2分别为0.638 和0.601,RPD 为1.554。CR-PCR 模型预测精度最好,建模集R2为0.700,验证集R2为0.689,RPD 为1.772,可以对土壤有机碳含量进行较好预测。RL-PCR 模型预测能力不稳定,建模集R2与验证集R2相差0.076。为了对比模型预测效果,绘制CR-PCR 和FRL-PCR 模型拟合效果图。从图4 可以看出,CR-PCR 模型验证结果较好,除少数几个样本偏离1∶1 线较远外,其余样本点均位于1∶1 线附近,有较好的预测能力。

表1 PCR 方法土壤有机碳含量建模精度统计Tab.1 Modeling accuracy statistics of soil organic carbon content with PCR

图4 土壤有机碳实测值与模型(PCR)预测值比较Fig.4 Comparison of measured values of soil organic carbon and predicted values by PCR modeling

2.4 基于PLSR 的土壤有机碳建模

以5 种光谱数据构建PLSR 模型可知(表2),模型精度均高于PCR 模型,说明PLSR 模型比PCR 模型具有更好的预测能力。CR-PLSR 模型预测效果最好,可以对研究区土壤有机碳含量较为精确的预测,建模集和验证集R2分别达到0.702 和0.699,RPD 为1.812,说明对于PLSR 模型来说,经过CR 处理后的光谱数据预测效果更好;RL-PLSR模型预测能力不稳定,建模集R2为0.699,而验证集R2仅为0.611,相差较大;FRL-PLSR 模型的预测效果最差,建模集R2为0.641,相比R-PLSR 模型降低1.687%。

表2 PLSR 方法土壤有机碳含量建模精度统计Tab.2 Modeling accuracy statistics of soil organic carbon content with PLSR

为了进一步分析模型的拟合效果,绘制CRPLSR 和FRL-PLSR 模型拟合效果图。从图5 可以看出,CR-PLSR 模型的验证样本均匀分布于1∶1 线附近,模型的拟合效果比较好,预测能力最优。

图5 土壤有机碳实测值与模型(PLSR)预测值比较Fig.5 Comparison of measured values of soil organic carbon and predicted values by PLSR modeling

2.5 基于SVR 的土壤有机碳建模

基于5 种光谱数据建立土壤有机碳含量SVR预测模型,结果表明(表3),与相应的PLSR 模型相比,FRL-SVR、FD-SVR 和CR-SVR 模型的建模集R2均有所提高,分别提高21.685%、13.609%、5.840%,RMSE分别降低21.471%、15.278%、6.452%;5 种光谱数据的SVR 模型预测能力依次为FRL>FD>CR>RL>R,其中,FRL-SVR 模型的建模集R2最高,RMSE 最小,分别为0.780、2.615 g/kg,模型预测效果最好,说明对于SVR 模型来说,FRL 光谱数据具有更好的预测效果;FD-SVR 模型的建模集R2为0.768,RMSE 为2.684 g/kg,模型预测效果较好;R-SVR 模型的建模集R2最低,为0.649,RMSE最大,为3.307 g/kg,模型预测效果最差。利用验证集实测值与预测值绘制R-SVR 和FRL-SVR 模型验证效果图,进一步分析模型的验证效果。由图6可知,R-SVR 模型的验证样本分布较散,偏离1∶1线程度较大,RMSE 为3.403 g/kg,模型验证效果较差;FRL-SVR 模型的验证样本相对集中,均位于1∶1 线附近,R2为0.707,RMSE 为3.017 g/kg,RPD为1.850,模型验证效果最好。

表3 SVR 方法土壤有机碳含量建模精度统计Tab.3 Modeling accuracy statistics of soil organic carbon content with SVR

图6 土壤有机碳实测值与模型(SVR)预测值比较Fig.6 Comparison of measured values of soil organic carbon and predicted values by SVR modeling

2.6 模型对比分析

对比分析不同模型的精度,可以发现PCR、PLSR 方法的最优光谱变换形式相同,均为CR,而SVR 方法的最优光谱变换形式为FRL。以FRL 为建模因子时,FRL-SVR 模型建模集R2为0.780,验证集R2为0.707,RPD 为1.850,是本研究土壤有机碳含量最优预测模型;而FRL-PCR 模型建模集R2为0.638,验证集R2为0.601,RPD 为1.554,是本研究土壤有机碳含量最差预测模型。FRL-SVR 模型建模集和验证集的R2分别高于FRL-PLSR 模型21.685%、17.833%,建模集与验证集的RMSE 分别低于FRL-PLSR 模型21.471%、14.119%。相同光谱变换形式所建模型预测效果具有显著差异,说明对于不同的建模方法,有其相匹配的光谱变换形式。

3 结论与讨论

自黄河中游退耕还林工程实施以来,随着植被的逐渐恢复,土壤有机碳含量发生了巨大的变化,从而对区域碳循环产生一定影响[25-27]。针对实验室化学分析方法无法快速获取土壤有机碳含量的问题,研究发现,利用高光谱技术可以高效、快速、准确地反演土壤有机碳含量[28-31]。本研究以土壤有机碳含量和光谱曲线数据为基础,分析不同光谱数据与土壤有机碳含量的相关性,从而建立PCR、PLSR 和SVR 土壤有机碳高光谱预测模型,为快速、准确获取土壤有机碳含量数据提供技术参考。

多数研究表明,土壤理化性质与土壤光谱反射率存在一定的关系,土壤理化性质的差异会造成独特的光谱特征[24]。南锋等[12]研究发现,随着土壤有机质含量的增加,土壤反射率减小。这与本研究结果一致。土壤水分是影响土壤光谱反射率的一个重要因素,土壤水分吸收带主要位于1 400、1 900 nm附近,并且1 900 nm 是土壤水分的特征波段[32],本研究对不同土壤有机碳含量的光谱曲线进行分析,同样发现了显著的吸收特征。土壤母质又会以直接或间接的方式影响土壤光谱反射特征,如土壤氧化铁含量、主要矿物等[33]。土壤中的氧化铁在土壤光谱900~1 100 nm 波段范围内吸收特征最强,对土壤光谱特性的影响极大[32]。一般来说,土壤中氧化铁含量增加,会导致反射率下降[32]。由于黄绵土仅含有少量褐铁矿、水云母及氧化铁混合物[34],因此,在900 nm 处产生了细微的光谱吸收特征。史舟等[24]研究认为,高岭石和蒙脱石类矿物会在2 200、2 300 nm 处形成显著的吸收特征,而黄绵土矿物组成以石英和长石为主,仅有少量的高岭石[34],从而导致2 200、2 300 nm 处吸收特征微弱。

应用土壤光谱数据构建模型反演土壤养分含量前,对光谱数据进行各种形式的变换会显著提升土壤养分含量与光谱数据的相关性,从而提高模型精度[32]。倒数对数变换可以减少光照等随机因素的影响,增强可见光区域的差异[35]。本研究土壤有机碳含量与R 呈极显著负相关,与RL 呈极显著正相关,符合前人研究结果[17]。一阶微分和去包络线变换可以消除光谱曲线噪声,突出光谱的吸收和反射特征,从而提高光谱数据与土壤有机碳含量的相关性[13]。玉米提·买明等[36]、吴倩等[37]研究发现,对土壤光谱数据进行去包络线处理,相关系数分别增加0.097 和0.160。本研究 将FRL、FD 以 及CR 光谱数据与土壤有机碳含量进行相关分析,相关系数绝对值较R 分别增加0.041、0.057、0.052。

本研究使用5 种光谱数据形式与3 种建模方法,进行黄河中游退耕还林地土壤有机碳含量高光谱反演。总体上,SVR 模型的效果要优于PCR 和PLSR 模型,能对土壤有机碳进行较好的预测,这与郭云开等[21]、周伟等[35]、纪文君等[38]研究结果大致相同。SVR 模型可以在高维空间里处理非线性问题,具有强大的泛化能力[21],因此,被广泛应用于土壤理化性质反演研究中[13,21,30]。刘恬琳等[39]采用高光谱技术反演苹果园土壤有机质含量,结果表明,SVR 模型具有较好的精度。张雅梅等[40]采用高光谱技术探讨土壤质地不同粒径含量的统一估测模型,结果表明,SVR 模型可以实现土壤中黏粒、粉粒和砂粒的统一估测。对比分析建模集、验证集R2、RMSE 和RPD 发现,本研究效果最优的土壤有机碳预测模型为FRL-SVR 模型。然而,本研究未能采用机器学习算法对SVM 模型参数进行优化,一定程度上会影响模型精度。因此,在后续研究中,将继续围绕模型参数优化方法开展进一步研究。

猜你喜欢

反射率波段光谱
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
基于3D-CNN的高光谱遥感图像分类算法
新型X波段多功能EPR谱仪的设计与性能
鲁棒多特征谱聚类的高光谱影像波段选择
基于最佳邻域重构指数的水下高光谱目标检测
显微光度计在偏光显微镜鉴定不透明金属矿物的应用
高光谱遥感数据下城市植被碳汇的研究