APP下载

土壤PH值和全钾含量高光谱反演方法比较

2020-03-27沈从旺徐丽华

江苏农业学报 2020年1期
关键词:pH值

沈从旺 徐丽华

摘要:为了预测土壤pH值和全钾含量,采集111个土壤样本的高光谱信息,采用小波变换后去包络的方法对原始光谱信息进行预处理,利用相关性分析法选择土壤光谱特征波段,进行偏最小二乘法回归(PLSR)、主成分分析回归(PCR)、支持向量回归(SVR)3种方法的土壤pH值和全钾含量高光谱反演精度的比较研究。结果显示,在水稻土和紫色土全钾含量和水稻土pH值的反演中,SVR方法都取得了比PLSR方法和PCR方法更好的反演效果。在紫色土pH值反演中,PLSR方法和PCR方法反演效果均优于SVR方法。比较不同类型土壤和不同土壤参数的反演效果发现,水稻土土壤pH值和全钾含量的反演效果均强于紫色土,全钾含量的反演效果优于pH值。本研究结果说明高光谱快速反演土壤pH值和全钾含量具有可行性。

关键词:支持向量回归;pH值;全钾含量;高光谱反演

中图分类号:TP79文献标识码:A文章编号:1000-4440(2020)01-0092-07

Abstract:In order to predict soil pH value and total potassium content, hyperspectral information of 111 soil samples was collected. The original spectral information was pretreated by continuum removal after wavelet transform. The characteristic bands of soil spectra were selected by correlation analysis method. A comparative study on hyperspectral inversion accuracy of soil pH and total potassium content was carried out by using partial least squares regression (PLSR), principal component analysis regression (PCR) and support vector regression (SVR). SVR method was better than PLSR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil and PCR method in the inversion of total potassium content of paddy soil and purple soil and pH value of paddy soil. In the inversion of pH value of purple soil, the inversion results of PLSR method and PCR method were better than those of SVR method. Comparing the inversion models of different types of soil and different soil parameters, the inversion results of pH value and total potassium content of paddy soil were stronger than those of purple soil, and the inversion effect of total potassium content was better than that of pH value. THese results of this study indicate that it is feasible to retrieve soil pH value and total potassium content by hyperspectral method.

Key words:support vector regression;pH value;total potassium content;hyperspectral inversion

土壤中的pH值和全钾(TK)含量是影响作物生长的重要因素[1]。利用高光谱反演土壤理化性质可以快速、准确地获得土壤的pH值、全钾含量,极大地节省人力和物力,為土壤性质研究提供了一个新的途径和方法[2]。

基于高光谱的土壤性质反演研究中,如何选用合适的反演方法,提高土壤性质的预测精度是一个重要的研究方向。目前基于高光谱的土壤性质反演方法主要包括多元线性回归(Multivariate linear regression,MLR)、偏最小乘法回归 (Partial least squares regression,PLSR)、主成分回归(Principle component regression,PCR)、人工神经网络(Artificial neural network,ANN) 、支持向量机(Support vector machine,SVM)、回归树(Regression tree,BT)、随机森林(Random forest ,RF)、多元自适应回归样条(Multivariate adaptive regression splines ,MARS)[3-4]等。由于方法复杂难以解释,对数据量要求很大等原因,在一定程度上限制了ANN、BT、MARS等方法的应用范围[4]。PCR方法在利用高光谱技术反演江西省万安县脐橙果园的土壤全钾含量方面具有一定的优势,建模相关系数可达到0.966[4]。江西省兴国县的黄绵土土壤全钾含量预测方法比较研究中发现,对于土壤全钾含量的预测,MLR方法的效果优于PLSR方法,但是对于速效钾,PLSR方法的拟合效果优于MLR方法(R2为0.681)[5]。对山东省齐河县的潮土速效钾的研究中,PLSR方法也取得了良好的拟合效果,决定系数R2为0.976[6]。对呼伦贝尔干旱半干旱土壤地区进行土壤pH值光谱特性和反演研究中发现,SVR方法比PLSR方法的预测效果(R2分别为0.910和0.890)更好[7]。但PLSR方法在预测陕西关中地区的塿土pH值时的决定系数为0.995[8],其值高于SVR方法的决定系数。土壤属性预测方法种类繁多且各具优势,如PLSR方法是MLR方法和PCA方法的有机结合,一般用于数据小,但是变量维数比较大,且相关性较大的样本。PCR方法通过主成分分析降低元素之间的共线性,选择几个不相关的变量作为PCR方法的独立变量进行建模,可以很好地降低方法的运算量,提高拟合效果。SVR方法能够使用大量的核密度函数,解决非线性化的问题,适用范围广,鲁棒性强,是小样本估计预测的最佳理论方法。但由于土壤类型、母质、土地利用等因素及测量光谱时的条件差异,使得难以找到一种通用的反演方法能在所有土壤性质预测中取得较高的精度。因此,对于不同地区获得的光谱数据,仍需要通过方法的比较来确定最适的方法,以便提高土壤性质的反演精度。

西南地區由于特殊的地质构造造就了生态坏境的脆弱性,土壤退化情况严重。快速、省力地测定西南地区土壤中的pH值和全钾含量,对改善西南地区土壤退化具有重要意义。但基于高光谱技术对西南地区的土壤pH值和全钾含量的反演鲜有人研究。

因此,本研究拟分别用PLSR、PCR、SVR 3种方法对三峡库区王家沟小流域的紫色土、水稻土土壤的pH值、全钾含量进行高光谱反演。通过对3种方法的比较分析,从中选择最优方法,以期提高土壤pH和全钾含量的反演精度,为土壤pH值和全钾含量的快速预测提供理论依据。

1材料与方法

1.1研究区概况

本研究所选择的研究区为重庆市涪陵区珍溪镇东部王家沟小流域区域,地理位置为E107°29′~ E107°31′,N29°53′~N29°54′。该区域为三峡库区典型的农业小流域区域,总面积为257.91 hm2。研究区地处四川盆地和山地过渡地带,地貌以丘陵为主,地势自北向南逐渐降低,属于亚热带季风气候区,土壤类型为紫色土和水稻土。研究区的土地利用类型较为复杂,具有较长农业耕作历史。主要的土地利用类型为林地、菜地、农作物耕地、旱地、少量未被利用的荒地以及少量民用地。该流域主要农作物为水稻、玉米和榨菜,上半年主要以种植水稻和玉米为主,下半年主要种植榨菜。由于耕地的零星分布,当地农业耕作方式仍然保持原始人工耕作方式,大型机械耕作较少[9]。三峡库区王家沟小流域农业结构类型具有西南地区农业的典型性,针对该区域土壤中的pH值和全钾含量高光谱反演进行研究,具有区域代表性。

1.2土样采集与制备

对研究区域内的耕地土壤进行多点混合采样,如图1,共采集紫色土和水稻土土壤样本111个。采集的土壤样本依次进行编号,带回实验室自然风干、碾碎,除去土壤中的杂质,然后过100目尼龙筛混合均匀。每个土壤样本分成2份,分别用于实验室化学分析测定土样中的pH值、全钾含量以及光谱测量。pH采用水浸(1∶1,质量比)电极法进行测量,土壤全钾含量采用氢氧化钠熔融——火焰光度法[10]。水稻土和紫色土土壤样本的pH值与全钾含量统计参数如表 1所示。水稻土土壤pH值为4.400~8.100,紫色土pH值为4.600~8.100,水稻土和紫色土酸碱度的变化范围较为一致。水稻土土壤全钾含量为11.200~21.100 g/kg,平均值为17.550 g/kg。紫色土全钾含量为6.800~22.700 g/kg,平均值为17.738 g/kg,紫色土全钾含量的平均值略高于水稻土。水稻土全钾含量的变异系数低于紫色土全钾含量的变异系数,可能原因是农户在此类型土壤中施肥较多[11],影响了全钾含量。pH在水稻土和紫色土的变异系数大致相同,说明该研究区域土壤的酸碱性差别不大。紫色土和水稻土的pH值和全钾含量的变异系数均属于中等程度的变异。

1.3光谱反射率的测定及预处理

1.3.1光谱反射率的测定利用FieldSpec Pro FR 野外光谱仪对土样光谱数据进行采集,仪器测定波长为350~2 500 nm,350~1 000 nm波段的采样间隔为1.4 nm,光谱分辨率为3 nm,1 000~2 500 nm的采样间隔为2.0 nm,光谱分辨率为10 nm[11]。土壤光谱测量在暗室进行,暗室内灯源高度130 cm,将ASD探头稳定在三脚架上,距离3 cm的位置垂直扫描土壤样品,以50°的俯角照射土样,测量前进行白板定标,重复采集10次光谱数据,选择平均值作为其原始光谱。

1.3.2光谱数据预处理FieldSpec Pro FR 野外光谱仪测定不同波段使用的探测元件不同,可能造成光谱的测量偏差,在光谱分析仪器上对原始光谱进行断点拟合[12],边缘波段350~399 nm和2 450~2 500 nm 2段数据受外界噪音影响较大,将其剔除[13](图2)。保留其余波段(400~2 449 nm)数据作为土样的实际光谱反射数据[12]。利用R语言软件的Wavelet程序包中的Least Asymetric类型小波函数[14],对实际光谱反射数据进行4层分解,通过小波分解舍去小波高频系数从而进行小波去噪变换[15],再通过R语言软件中的Prospectr 程序包中的Continuum removal 功能分别对紫色土、水稻土样本光谱数据进行去包络线处理[16](图3)。图2中,土壤样本的反射和吸收特征并不明显。经过小波变换和去包络预处理后,土壤样本具有明显的反射和吸收特征:在400~2 449 nm中有4个明显的吸收谷,吸收谷波长位置分别大概位于515 nm、1 405 nm、1 915 nm和2 210 nm。

1.4建模方法及精度评价指标

1.4.1土壤pH值、全钾含量高光谱预测方法PCR方法是通过主成分分析的方法选择多个变量中影响因素较大的几个主要变量进行降维,根据得分系数矩阵将原变量代回得到新的方法[16]。PLSR方法与主成分回归有关,但不是寻找响应和独立变量之间最小方差的超平面,而是通过投影预测变量和观测变量到一个新空间来寻找一个线性回归的方法[17]。SVR方法主要是通过升维后,在高维空间中构造线性决策函数来实现线性回归,用e不敏感函数,其基础主要是e不敏感函数和核函数算法[18]。

分别从紫色土土壤样本和水稻土土壤样本中按RS(Random sample)样本集划分方法选择1/3样本数据作为验证集,2/3样本数据作为标定集。紫色土土壤的标定集和验证集的样本数分别为52和26;水稻土土壤样本标定集和验证集的样本数分别为22和11。小波分析后去包络线反射率作为输入量,分别采用PLR、PCR、SVR 3种方法对紫色土、水稻土pH值和全钾含量进行反演。其中PLSR、PCR、SVR 3种方法是用The UnscreamblerX10.5软件实现的。

2结果与分析

2.1土壤pH值、全钾含量与光谱反射率的相关性分析

对预处理后的水稻土、紫色土土壤样本光谱反射率分别与土壤pH、全钾含量进行相关性统计,结果如图4~图7所示。从图中可以看出,水稻土土壤预处理后的光谱反射率与pH值的相关系数范围为-0.621~0.524(图4),相关系数最大绝对值出现在波长1 100 nm处。预处理后的紫色土光谱反射率与pH值的相关系数范围为-0.589~0.441(图5),相关系数最大绝对值出现在波长1 146 nm处。对于紫色土和水稻土2种不同土壤类型,其光谱反射率与pH之间都在近红外1 100 nm左右的波段出现了最大相关系数绝对值。

水稻土全钾含量与预处理后的光谱反射率的相关系数范围为-0.671~0.576(图6)。541 nm波段的反射率与水稻土土壤全钾含量表现出了最强的负相关,其相关系数值为-0.671。紫色土全钾含量与预处理后光谱反射率的相关系数范围为-0.727~0.494(图7),最大相关系数绝对值出现在波长517 nm处。紫色土全钾含量与预处理后的光谱反射率的最大相关系数与水稻土不同,但二者均在绿波段表现出了极强的负相关。

2.2土壤pH值和全钾含量的反演方法及效果评价

2.2.1土壤pH值的反演方法对土壤光谱数据进行预处理后,利用SPSS软件对土壤pH值与土壤反射光谱进行相关性分析,并进行显著性检验。在通过P<0.01显著性检验的基础上,选择相关系数较大的4个波段作为特征波段。其中,水稻土的特征波段为669 nm、785 nm、1 100 nm、2 390 nm,紫色土的特征波段为570 nm、1 147 nm、2 151 nm、2 238 nm。以特征波段所对应的光谱反射率为输入变量,分别用PCR、PLRS 和 SVR 3个方法对土壤的pH值进行预测,结果如表2、表3所示。

从表2中可以看出,SVR方法的标定集和验证集的R2高于PCR和PLSR方法,其值分别为0.630和0.423; SVR方法的标定集和验证集的MRE均为最低,其值分别为8.604%和12.778%。这说明SVR方法比PCR、PLSR方法具有较稳定的拟合效果和更可靠的精度。

对紫色土pH值进行反演(表3)发现,对于标定集,SVR方法获得了最大的R2(0.481)和最小的MRE(11.390%)。对于验证集,PCR、PLSR方法的R2均高于SVR方法的R2。PCR和PLSR方法的MRE低于SVR方法。PCR方法和PLSR方法的反演效果相同。计算紫色土总体样本的实测值和预测值的相关系数和总体MRE发现,PLSR和PCR方法的总体相关系数均高于SVR方法(其值分别为0.654、0.654、0.628),其总体MRE均低于SVR方法(其值分别为13.295%、13.295%、13.530%)。因此,PLSR和PCR方法获得了比SVR方法更好的反演效果。

2.2.2土壤全钾含量的反演方法利用SPSS软件对土壤全钾含量与土壤反射光谱进行相关性分析,并进行显著性检验。在通过P<0.01显著性检验的波段基础上,选择相关系数较大的4个波段作为特征波段。水稻土特征波段选择542 nm、754 nm、1 703 nm、2 390 nm,紫色土特征波段选择542 nm、972 nm、1 836 nm、2 160 nm。利用PCR、PLRS 和 SVR 3种方法进行水稻土、紫色土的全钾含量高光谱反演。结果如表4、表5所示。

3种方法预测水稻土全钾含量的拟合效果都较好,其中SVR方法的标定集R2和验证集R2均为最大值(0.729、0.590)。这说明3种方法中SVR的稳定性最好。对比3种方法的MRE,发现SVR标定集的MRE为最低值,但其验证集的MRE为最高值。计算其总体MRE,可知SVR方法具有最小的MRE值,其值为6.316%。所以,总体上SVR方法比PLSR和PCR方法具有更好的稳定性和更高的精度。

从表5可以看出,对于标定集,PCR、PLSR、SVR 3种方法获得的R2分别是0.573、0.573、0.628,其MRE分别为11.661%、11.650%、10.268%,其中SVR方法获得了最大的R2和最小的MRE。但对于验证集SVR则具有最小的R2和最大的MRE。计算SVR 、PLSR、PCR3种方法获得的全钾实测值和预测值的总体相关系数,其值分别为0.762、0.755、0.755,总体MRE分别为9.235%、9.470%、9.573%。从总体相关系数和MRE可以看出,对紫色土全钾含量反演,SVR方法的反演效果优于PLSR和PCR方法。

3讨论

利用土壤高光谱技术可以准确、快速、大范围地反演紫色土和水稻土的土壤pH值和全钾含量。该技术的成熟为土壤属性信息收集和利用提供了技术手段,但土壤高光谱信息中的噪音和冗余问题一直存在[20]。本研究利用小波分析后去包络的方法作为光谱预处理方法,相比于常见光谱预处理方法,该方法对数据进行压缩后去包络能够减少噪音突出光谱差异[21],极大增强了水稻土和紫色土土壤中全钾,pH值與高光谱反射率的相关性,为土壤高光谱反演精度的提高提供了条件。基于相关分析法选择特征波段进行SVR、PLSR、PCA 3种方法的反演精度,得出以下结论:(1)在水稻土pH值反演中,SVR方法获得了最好的反演效果。SVR方法标定集的R2和MRE分别是0.630、8.604%,验证集R2和MRE分别是0.423、12.778%。水稻土pH反演中PLSR方法略优于PCR方法。在紫色土pH值反演中,PLSR方法与PCR方法效果相同且优于SVR方法,所以PLSR方法和PCR方法皆可以作为反演紫色土pH值的方法。(2)SVR方法在水稻土和紫色土全钾含量的反演效果均优于PLSR和PCR 2种方法,其水稻土的实测值与预测值的相关系数和MRE分别为0.805、6.316%,紫色土的实测值与预测值的相关系数和MRE分别为0.762、9.235%。(3)比较不同类型土壤和不同土壤参数的反演模型发现,水稻土pH值和全钾的反演效果均强于紫色土,全钾含量的反演效果优于pH值。

SVR方法对水稻土的pH值、全钾含量和紫色土的全钾含量的反演效果优于PLSR和PCR方法,PLSR和PCR方法对于紫色土pH值的反演具有比SVR方法更好的反演效果。当样本数大于变量数,且变量之间的相关系数较大时,PCR方法和PLSR方法的反演效果差别并不大 [22]。本研究中特征波段数4个远小于紫色土样本数78个和水稻土样本数33个,4个特征波段进行相关分析后相关系数高达0.970以上,所以试验中PLSR方法和PCR方法反演土壤pH值和全钾含量无明显差别。SVR方法是非线性的回归方法,在解决特征波段与土壤属性复杂关系时通常比PCR方法和PLSR方法具有更好的表现[23]。在对呼伦贝尔草原干旱半干旱土壤pH值的预测中,SVR方法也取得了比PLSR方法更好的反演效果[7]。在紫色土pH值反演过程中,SVR、PLSR和PCR 3种方法的反演效果均不理想,SVR方法的反演效果不如PLSR方法和PCR方法。紫色土样本pH值在整个样本空间内分布极不均衡,样本pH值非正态分布往往导致模型不能取得较好的预测效果[24]。

SVR、PLSR、PCR 3种方法对水稻土、紫色土 pH值和全钾含量的预测均具有可行性。水稻土pH值和全钾含量的反演效果均高于紫色土,但水稻土pH值反演获得的标定集和验证集的R2(0.630、0.423)均低于陕西关中塿土土壤pH值反演的R2(0.996、0.989) [8];水稻土全钾反演获得标定集和验证集的R2(0.729、0.590)均低于黄绵土土壤全钾反演的R2(0.872、0.773)[5]。这说明土壤类型、样本自身的光谱特性和测量环境影响光谱反演土壤pH值和全钾含量的效果[25]。

本研究利用高光谱技术快速准确地反演土壤pH值和全钾含量,为土壤pH值和全钾含量的高光谱反演提供了理论支撑。但本研究的重点在于土壤高光谱反演方法比较研究,对土壤光谱反演其他方面缺少系统的研究。在未来的研究中,需对光谱数据的预处理、特征波段选择以及样本集划分方法等方面进行详细的研究,以期进一步提高土壤pH值和全钾含量的高光谱反演精度。

参考文献:

[1]尤承增,杨新源,束安,等. 土壤TK含量高光谱估测模型[J].遥感信息, 2017, 32(4): 92-97.

[2]李薇薇. 高光谱数据库的地物特征反演研究[D].武汉:华中师范大学, 2012.

[3]刘燕德,熊松盛,吴至境,等. 赣南脐橙园土壤全磷和TK近红外光谱检测[J].农业工程学报, 2013, 29(18) : 156-162.

[4]张东辉,赵英俊,秦凯,等. 高光谱土壤多元信息提取模型综述[J].中国土壤与肥料, 2018 (2): 22-28.

[5]刘秀英,石兆勇,常庆瑞,等. 黄绵土钾含量高光谱估算模型方法研究[J].土壤学报, 2018, 55(2): 325-337.

[6]陈红艳,赵庚星,李希灿,等. 小波分析用于土壤速效钾含量高光谱估测研究[J].中国农业科学, 2012, 45(7): 1425-1431.

[7]李诗朦,包妮沙,刘善军,等. 土壤电导率和pH值光谱特征及反演模型方法——以呼伦贝尔草原干旱半干旱土壤为例[J].测绘科学, 2018, 43(8): 14-22,44.

[8]魏雨露,刘金宝,李劲彬. 基于PLS的陕西关中地区土壤pH高光谱预测 [J].西部大开发(土地开发工程研究), 2018, 3(4): 51-57.

[9]王齐磊,江韬,赵铮,等.三峡库区典型农业小流域土壤溶解性有机质的紫外-可见及荧光特征[J].环境科学,2015,36(3):879-887

[10]杨剑虹,王成林,代亨林. 土壤农化分析与环境监测[M].北京:中国大地出版社, 2008:5-47.

[11]ASADZAEH S, ROBERTO C, FILHO D S. Iterative curve fitting: a robust technique to estimate the wavelength position and depth of absorption features from spectral data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(10): 5964-5974.

[12]陈红艳. 土壤主要养分含量的高光谱估测研究[D].泰安:山东农业大学, 2012.

[13]徐丽华. 土壤养分预测方法的比较研究[D].重庆:西南大学, 2012.

[14]WEBSTER R,LARK R M G P. Nason:wavelet methods in statistics with R[M]. New York: Springer, 2008:287-289.

[15]CHENG K P, GUO H F, SHEN H H, et al. An inversion method of leaf area index based on spectral absorption features[C]. Beihang University. Proceedings of the 36th chinese control conference. Beijing: Beihang University Press, 2017:1549-1554.

[16]彭小婷,高文秀,王俊杰. 基于包络线去除和偏最小二乘的土壤参数光谱反演[J].武汉大学学报(信息科学版),2014,39(7): 862-866.

[17]雷宇斌,刘宁,郭云开,等. 高光谱组合变换下土壤Cd含量GWR模型反演研究[J].测绘工程,2018, 27(11): 71-76.

[18]张东辉,赵英俊,秦凯. 一种新的光谱参量预测黑土养分含量模型[J].光谱学与光谱分析,2018,38(9): 2932-2936.

[19]徐夕博,吕建树,吴泉源,等. 基于PCA-MLR和PCA-BPN的莱州湾南岸滨海平原土壤有机质高光谱预测研究[J].光谱学与光谱分析, 2018, 38(8): 2556-2562.

[20]金慧凝,张新乐,刘焕军,等. 基于光谱吸收特征的土壤含水量预测模型方法研究[J].土壤学报, 2016, 53(3): 627-635.

[21]CANDOLFI A,MAESSCHALCK R D,JOUANRIMBAUD D. The influence of data pre-processing in the pattern recognition of excipients near-infrared spectra1[J]. Journal of Pharmaceutical and Biomedical Analysis,1999,21:115-132.

[22]GALLMIER E,ZHANG S,MCFARLANE T.Using PCA and PLS on publicly available data to predict the extractability of hydrocarbons from shales [J]. Journal of Natural Gas Science and Engineering, 2017,44:109-121.

[23]鄒慧敏,李西灿,尚璇,等. 粒子群优化神经网络的土壤有机质高光谱估测[J].测绘科学, 2019, 44(5): 146-150,170.

[24]贾方方,宋瑞芳,王芳,等. 基于变异系数法的灰色关联决策模型在烤烟品质评价中的应用[J].中国农学通报,2016,32(4): 124-128.

[25]刘焕军,王翔,李厚萱,等. 土壤矿物对松嫩平原主要土壤类型反射光谱特征的影响机理[J].光谱学与光谱分析,2018,38(10): 3238-3244.

(责任编辑:陈海霞)

猜你喜欢

pH值
降低粗选石灰PH值在沙溪铜矿的运用
园地主要经济作物氮磷钾与pH相关性研究
电镀镍钴合金镀液与操作
粉末树脂过滤器优化案例
pH值对处理电镀含银废水的影响关系分析
含氟废水优化处理试验研究
pH值对南美白对虾虾苗成活率的影响
水的酸碱性与健康无关