APP下载

基于高光谱图像技术的土壤全氮检测方法研究

2023-01-07原,吴

皮革制作与环保科技 2022年5期
关键词:反射率频谱光谱

薛 原,吴 爱

(江苏省徐州环境监测中心,江苏 徐州 221000)

农业在国民经济中占有举足轻重的地位,但由于小农化和肥料的不合理,使得农业的发展受到多种因素的制约。在发达国家,精准农业施肥是一种以农业生产为特征的,以信息技术和知识管理为基础的现代农业生产方式。通过对土地和作物的实时动态进行分析,从而达到降低成本获得更高效益的目的,使农业资源和农业生产力得到最大限度的提高,以达到减少浪费、增加产量、避免农业生态风险的目的。

土壤是作物生长的基础,土壤属性信息是作物生产过程中不可忽略的一项重要内容。它包含了土壤有机质、有机碳、氮、铁、锰、团聚体、矿物等特征,能够快速、高效地提取和反馈土壤各阶段的土壤信息,为区域作物针对性的施肥提供依据。氮是植物的重要组成部分,其影响了蛋白质、核酸、叶绿素、酵素等的合成,对植物的光合作用发挥着重要作用。通过对土壤全氮快速、精确地检测,可以为农业生产提供技术支撑,并能有效地促进农田土壤的有效管理,提高氮素的利用率。

1 高光谱技术的优越性

利用高光谱遥感技术可以快速、反复地获取相同区域的土壤信息,是一种准确、快速获取农田土壤属性信息的有效方法。实验室高分光光度法是一种非破坏性的测量技术,它可以通过对土壤的反射性和土壤的物理特性对土壤进行分析,并对土壤进行化学成分分析和扫描,从而得出土壤有机质、N、P、K、水分等各种指标。该技术的快速、无破坏性,为进一步阐明光谱数据的数学方法和对土壤中TN含量的快速监控,提供了一种有效的手段。

2 高光谱技术发展及研究概况

高光谱遥感技术是二十世纪八十年代发展起来的。随着遥感技术、传感器技术、空间技术和计算机技术的飞速发展,遥感技术逐渐进入了以高光谱遥感技术为主导的时代。尼加提卡斯木等人利用两频谱指标和偏最小二乘回归理论,通过对光谱数据的频谱分析,提出了一种新的土壤有机质高光谱估计模型;国外学者通过两频段优化算法对新的土壤有机质进行了频谱参数的优化,从而得到了一个更精确的高光谱估计模式;国内学者张瑶[1]等根据标准化频谱指标和偏最小二乘回归,建立了土壤有机质二维关联分析和估计模式;学者崔玉露[2]等通过556 nm、1 642 nm和2 491 nm的频谱信息,通过标准化频谱指数转换,得到了R2=0.829的最优预测模式。

目前,许多学者对其进行了深入探讨,但大多数的模型都有一定的时间和空间上的限制,而且由于土壤类型和地理位置的不同,采用的模型也有很大的差别。用离散小波方法对876个澳大利亚的土壤样品进行了频谱分析,建立了随机树(RF)、支持向量机(SVM)、神经网络(BPNN)等,其中SVM模型的预测准确率最高;学者方臣[3]等采用 PLSR方法和SMLR方法,对美国的165个玉米表面样品和697个样品进行了PLSR和 SMLR模型,对亚热带红壤中的全 N进行了分析,得到了较好的结果。过去,高光谱技术主要是以点对面为主,而对地块地力的长期监测则少有研究。

3 研究区概况

3.1 光谱数据的预处理方法

光谱数据的预处理方法分为两个部分,分别是去噪和数据转换。各种本源的反射率有很大的差别,并且有基线平移、倾斜等现象,这是由于土体的粒径和装填密度的不同而引起的。利用高光谱预处理技术可以有效地对高光谱中的噪声进行筛选,避免了数据的冗余,增强了模型的鲁棒性。利用一次差分转换技术,可以有效地减弱土壤背景的干扰,增强波段之间的差别,增加了土壤中的某些波段反射率和土壤中营养成分之间的关系。采用11点光顺法对测量环境、样品研磨、筛选等因素进行了平滑处理[2]。

为验证本文所建立的土壤全 N含量预测模型的准确性,将15种预处理技术与频谱指标相结合,对土壤盐分反演进行了优化。利用相关分析方法,对不同频段的反射和土壤中的总氮含量进行了分析,选择420~444 nm、480~537 nm的相关系数为420~444 nm,480~537 nm。计算后的反射率与全氮含量之间的相关关系表明,MSASI的平均、极大值比其他三个指标都要高。在此基础上,选取了平均与极大值相结合的方法,选取了最终82个波长,并将其应用于不同的频谱参数。利用该模型建立了土壤全 N和特征波段的线性模型,并将其进行了预处理,将测量结果作为参数,利用IBM SPSS统计方法进行了回归分析。

3.2 反向传播神经网络

反向传播神经网络是一种分布式的处理数学模型,它能够模拟大脑神经的神经活动,通常包含输入层、隐含层和输出层。将每个波长的响应值输入到输入层,然后用神经网络求取其加权和,利用非线性函数求出被测浓度的估计值,然后输出到输出层。具体的,研究者可以通过反向神经网络模型对大量样本进行学习,提取所有学习样本关于氮含量的特征值,并建立相应神经网络节点。而后,当输入检测样本时,通过预处理及归一化等运算操作,对其氮含量特征值进行统计与比对。如果该特征值在神经网络置信区间内,将赋予该样本约定的较高权重;若特征值不在置信区间,将赋予样本较低权重。通过对多组样本进行运算后,对测试样本进行加权和运算,最后对估算值进行估算,可利用模糊算法提升结果的鲁棒性和准确性。

3.3 偏最小二乘法

偏最小二乘法(PLSR)是一种将多元线性回归与最小二乘回归相结合的方法。通过对所抽取的主分量进行判定,判定自变量是否能够显著地改善估计性能,能够解释多个高光谱特征之间的相互关系,在剔除多余数据的情况下,保持最大贡献率的数据,有效地使用简化信息构建了预测模型。在进行最小二乘分析前,将资料进行主分量分解,以求出对因变量解释力最大的综合变项,以改善主成分与因变量之间的关联度,并克服多元相关所带来的负面效应。在主成分选择1,2,3,6时,R2值为0.22,0.32,0.37,0.69,最后用最大的6个主成分进行最小二乘分析。

3.4 模式解析法

有国内学者采用多元线性回归模型、神经网络回归模型、偏最小二乘法对62份样品进行了统计,对其中31份样品进行了检验,并对82个特征频带进行了检验。选取确定系数R2、均方根误差 RMSE(Root Mean SQUARE Error)、相对平均偏差 RPD(Relative Percent Deviation)以进行最优模型的筛选。R2愈大,RMSE愈小,则表示模式估计的准确度越高,RPD>2则说明该模式的估计能力好,1.4< RPD<2时,该模式的估计能力为中等,若 RPD<1.4,则说明该模式的估计能力及一致性都不 佳。

3.5 多元线性回归(multiplex)

多变量线性回归也称为最小二乘,它利用最小二乘法来估算系数矩阵。在62个模型样本中,使用多变量线性回归(2)神经网络后向扩散神经网络(BPNN)是一种分布式的处理数学模型,其主要内容有输入层、隐含层和输出层。将每个波长的响应值输入到输入层,然后用神经网络求取其加权和,然后利用非线性函数求出被测浓度的估计值,最后输出到输出层。可选择Logsig函数作为神经网络模型的非线性函数。光谱数据集是输入层,在满足训练精度的条件下,网络将会持续地进行网络测试,直到网络达到一定的测试精度才能被确定为一个模型。

4 土壤全氮含量与高光谱响应特征

由于色谱中包含C-H、N-H、O-H等基团的有机物质,故常被用在有机物质中。由于土壤中的 N元素以有机结合态为主,与有机质的关系非常密切,因此,它的灵敏波段分布范围与上述规律相符,可以利用高光谱技术对其进行快速分析。通过对350~540 nm、670~920 nm范围内的光谱反射率进行了初步的模拟,一阶差分谱与土壤总氮有良好的相关性。本研究采用420~444,480~537,618~626,801~804,1 248~1 249,1 322,1 410~1 412,1 566~1 568 nm等,从数理统计的观点来看,相关系数越高,这个波段选择的价值就越大,对后续的建模工作也就越有利。选择了相关系数大于0.4的连续频段,与崔玉露等人的结论类似。土壤中的全 N含量反射率受区域和土壤类型的显著影响,而太湖桃园黄棕壤的土壤中铁锰含量高、锰含量高。崔玉露等人的研究发现,在可见光频段,大部分的土壤吸收特性都与铁氧化物有关。学者方臣等的结果也表明,在300~580 nm的区域,铁谱响应较高,铁谱带的近红外区可以达到1 300 nm。

5 高光谱数据集提取和分析模型优化

5.1 有效信息的解冗余

高光谱数据的光谱信噪比低,光谱信息与被测特征之间的线性不相关,且光谱间的多重相关性很强,光谱易受外界环境的影响。所以,必须进行特征波长的选取,也就是最好的建模参数组合,以获得最小误差和最精确的估计模式。本论文在选择敏感频段的基础上,对复杂数据进行有效剔除,并对其进行有效提取,以最大程度地保持特征频带,避免了冗余数据对操作的负担。通过对土壤全 N的频谱响应特性和相关关系,对不同类型的土壤全N进行了频谱转换,利用三种模型建立了相应的数学模型。

5.2 反演模型的应用

5.2.1 模式法的缺点和优点

利用最小二乘法进行多因素线性回归,可以有效地减少有效信息的丢失。偏最小二乘法是将主分量分析引入最小二乘回归,以便于数据的降维,但二者都存在着不能处理非线性关系的缺点,而神经网络模型可以通过三个层次的训练来提高数据的准确率。在本论文中,样本的数量很少,使得模型的处理能力和冗余度不能得到很好地利用。

5.2.2 模型的精度和有效性

在偏最小二乘法回归中,RMSE值仍需进一步改善。因此,虽然这些模型的估计结果都很好,但是仍有一些不足之处需要在以后的研究中加以修正。在建立BPNN模型的过程中,输入神经元的数量越多,模型的性能越好,网络神经算法就越复杂。在玉米生长季,R2值较大,RMSE值偏小,这与选择的敏感性频段相关。玉米季的9个敏感频带比小麦的季节敏感区要多,因此在分析时可以获得更多的资料。虽然BPNN的样本数目很小,但是BPNN的模型准确率与张瑶等人的结果是一样的。

这三种模型在不同地区的应用效果都比较理想,可以为土壤全 N的快速、准确诊断提供依据,为精确的农业生产和有效的土地利用提供技术支撑。另外,可利用卫星遥感图像等资料,对土壤营养状况进行动态监控和反馈。

5.3 土壤特征及其对高光谱响应的研究

5.3.1 影响高光谱反射率的几个因素

在实际建模过程中会出现大量的异常样品,大致可以划分为高光谱测定的异常和化学测试的异常。导致这些异常的原因有:由环境造成的异常光谱,例如仪器检测器的背景变化、样品的温度、湿度的大幅变化,仪器本身的不稳定以及个别零件的老化;还有样品本身造成的光谱异常,例如质地不均匀,水分控制不严格;由于基本数据造成的样品异常,如当使用错误的参考方法或样品混杂时,则会造成样品与样品的近红外光谱不相符。

5.3.2 高光谱和反应的研究

有研究结果表明,同龄夏玉米与冬小麦的光谱反射率存在较大的差异,在236天的生长期内,玉米秸秆的腐化程度已趋于稳定,脂肪性降低,羧基含量升高。由于秸秆不断分解,残渣中剩下的大部分是单宁、木素,具有较好的稳定性,不易降解,腐烂的时间也较长。但玉米生长期为90天,在收获期间,麦秆分解速率达到48.88%-59.95%,且秸秆中易于降解的物质如淀粉、蔗糖、有机酸等具有丰富的碳源和能量。

作物秸秆与玉米不同季节土壤样品之间的高光谱反射率有一定的差别,通过对其机制的探讨,结果表明:玉米季节的土壤样品之间的 IR谱也有很大的差别。因为在腐化的过程中,各基质成分和含量会有一定的损失。因此,小麦秸秆的活性会对土壤的红外反应产生一定的影响。土壤显微组织学的研究表明,小麦生长季节的土壤中存在着大量不均匀的、破碎的颗粒,这是由于玉米秸秆的腐朽程度比较高,已经完全分解,只剩下木质素、纤维素、单宁等造成的。就农作物秸秆自身来说,其易降解的水溶性物质、粗蛋白含量高,但不易降解的纤维素、木质素含量低;在1 969、2 377、2 215 nm的高光谱范围内,不同作物的土壤表现出了明显的差异。有研究表明,在1 710 nm、2 100 nm和2 350 nm处反射率与半纤维素、纤维素、木质素含量有很大关系。学者方臣发现,在2 100-2 300 nm的农作物残渣中,木质素和纤维素含量显著,而在2 100~2 300 nm时,玉米秸秆的反射比在2 100~2 300 nm时表现得更好,表明小麦秸秆中纤维素和木质素含量更高。

另外,小麦、玉米期土壤高光谱反射率存在较大差异的原因之一是作物的生长时期。小麦在每年的五月收割,玉米一般在九月末到十月上旬收割,而本地的雨水则以六月到九月(一年中75%)为主。土壤湿度较高,对小麦和稻草的分解效果较好,所以九月的土壤的反射性与六月份不同。土壤成分和水文资源的整体差异很有可能是导致小麦、玉米不同季节土壤高光谱反射率存在差异的一个重要原因,这也为季节性资料的建立奠定了基础。长期固定施肥方式对土壤的总氮水平无明显影响,但在收获阶段,其反射谱反应存在差异。试验区采用了稻草还田,前一季的秸秆直接用于土壤。由于不同作物的秸秆成分和腐熟期的气候存在很大的差别,因此,在讨论的轮作系统中需要按作物类型对资料进行分类。

猜你喜欢

反射率频谱光谱
利用镜质组反射率鉴定兰炭与煤粉互混样的方法解析
基于三维Saab变换的高光谱图像压缩方法
商品条码印制质量检测参数
——缺陷度的算法研究
车灯反射腔真空镀铝反射率研究
基于3D-CNN的高光谱遥感图像分类算法
高光谱遥感成像技术的发展与展望
一种用于深空探测的Chirp变换频谱分析仪设计与实现
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
FCC启动 首次高频段5G频谱拍卖
动态频谱共享简述