APP下载

基于灰色理论-支持向量机的Gardner模型参数的预报模型

2018-03-21李浩然樊贵盛太原理工大学水利科学与工程学院太原030024

节水灌溉 2018年1期
关键词:土壤水分关联度向量

李浩然,樊贵盛(太原理工大学水利科学与工程学院, 太原 030024)

0 引 言

土壤水分特征曲线是表示土壤水势与水分含量之间关系的曲线,是研究土壤水分保持和运动所用到的基本特性曲线[1],对于推求土壤比水容重、田间持水率、凋萎系数等水力学参数具有重要意义,因此准确获取土壤水分特征曲线模型参数是精确推求上述水力学参数的关键。而传统的实验方法(负压计法、压力膜仪法、砂形漏斗法等)均存在耗时费力,应用范围受限制等问题。土壤传输函数的发展为土壤水分特征曲线的获取提供了机遇,备受众多学者关注。王欢元[2]等通过不同的土壤传输函数对土壤水力学参数进行了预测,并且精度较高;朱安宁[3]等通过多元逐步回归分析的方法建立了VG模型的土壤传输函数模型,并且拟合效果较好;韩勇鸿等[4]利用土壤传输函数,建立了关于田间持水率的神经网络预报模型。

在众多的土壤传输函数方法当中,支持向量机对于处理小样本、非线性、高维数等问题表现出较好的运算能力,能有效避免在预测中出现“过拟合”和“欠学习”,是一种基于核展开,将样本空间通过非线性映射,映射到高维空间解决样本空间的非线性分类与回归问题的机器学习方法,具有较高的预测精度,广泛运用于预测方面的研究。郑立华[5]等利用近红外光谱与支持向量机对有机质含量的支持向量机预报模型;吕烨[6]等运用支持向量机对微咸水灌溉土壤的EC与pH值的变化规律进行了预测研究,预测效果较好;雷国庆[7]等通过支持向量机对土壤水分入渗参数进行了预测并取得较高的精度。但将支持向量机运用于土壤水分特征曲线模型参数的预测的文献还鲜有报道。

支持向量机模型的输入因子是决定预测参数精度的关键条件,目前大多数研究主要是通过定性分析与实践经验对输入因子进行选取。灰色关联理论通过数学手段在一定程度上量化界定了输入、输出因子之间的关联性,有效保证了输入因子选择的科学性。本文试图在采用灰色关联理论,分析土壤各基本理化参数与Gardner模型参数之间的关联度的基础上,科学选定其输入因子,建立基于土壤基本理化参数的支持向量机预测模型,实现对土壤水分特征曲线Gardner模型参数的预测。

1 材料与方法

1.1 试验区土壤条件

试验土壤来源于黄土高原区山西省中西部耕作农田,地貌单元包括平原、丘陵、高原和盆地等。试验区春季、秋季短,夏季潮湿多雨,冬季寒冷干燥,年温差大。年平均降水量为350~620 mm,降水主要集中在6-9月份,占总降水量的60%以上;年平均蒸发量达750~1 250 mm,蒸发强度高;土壤类型丰富,主要包括黄褐土、栗钙土、棕壤土;土壤质地类型粉砂质黏壤土、壤土、粉砂质壤土、砂质壤土。试验区土壤各基本理化参数变化范围如表1所示。

1.2 试验设备与方法

本试验分为土壤基本理化参数测定试验和土壤水分特征曲线及其参数的测定试验:

(1)土壤基本理化参数测定试验。对试验区耕作层与犁底层的土壤进行粉粒、黏粒、砂粒含量的测定,通过激光粒度分析仪测出相应的百分比;由于是扰动土,将土样按照1.10~1.70 g/cm3的密度值进行配置;有机质的测定使用重铬酸钾容量法测定土样中的有机碳含量,根据相关换算得到有机质含量;对土样中的八大离子进行测定所用的方法有EDTA标液滴定法、火焰光度计等,并将八大离子的累加和作为全盐量。

表1 试验区土壤理化条件

(2)土壤水分特征曲线及其参数测定。利用压力膜仪对土壤水分特征曲线进行测定。土样风干过筛并均匀装填在环刀内,放入压力膜仪中进行令其吸水到达饱和含水率。达到后按照0.3~15 bar的压力级差对土样施压,使得土壤中的水分排出并每隔24 h对重量进行测定。在同等压力之下,如果土样在前后两次的重量变化小于0.005 g则认为土样水分全部排出,并进行下一组试验。最终,根据实验结果计算出体积含水率,并对结果进行拟合得到Gardner模型参数值。

1.3 Gardner模型

Gardner模型是Gardner[8,9]在1970年提出幂函数持水式,因其经验参数较少而广泛应用于实际当中。 Gardner模型的具体表达式为:

h=aθ-b

(1)

式中:h代表的是土壤水吸力,cm;θ代表的是土壤体积含水率,%;a、b均为拟合参数,无单位量纲且均为正数。其中,参数a随着土壤持水能力的增大而增大;参数b随着土壤含水率变化速率的增大而增大。

2 土壤基本理化参数灰色关联分析

2.1 主要影响因素

根据土壤水分特征曲线的性质可知,土壤持水性能影响着Gardner模型的参数,而土壤持水性与不同的土壤基本理化参数密切相关。目前,大多数研究认为,对于土壤持水性能影响较大的土壤基本理化参数有土壤质地、土壤容重、土壤有机质含量、土壤无机盐含量。

(1)参数a与影响因素的定性关系。参数a反映的是土壤的持水能力,对于土壤而言,不同的土壤基本理化参数通过改变土壤中的孔隙情况而影响着土壤的持水能力。当土壤中的黏粒含量与粉粒含量较多时,土壤质地变重,产生较多的中小孔隙;密度的增加大,代表着土壤变得板结,从而土体收到挤压产生中小孔隙;有机质含量的增加使得让土壤中的孔隙变得更加稳定;无机盐含量的增加则是改变了土壤分散度,从而大孔隙破坏变为中小孔隙。中小孔隙增加不仅使得土壤毛管吸力增加,而且增大了孔隙表面积,使得土体颗粒对水分的吸附能力增强,从而影响土壤的持水能力,最终影响参数a的变化。

(2)参数b与影响因素的定性关系。参数b反映了土壤持水能力随着水吸力增大时的变化速率。当黏粒含量与粉粒含量上升时,中小孔隙增加,高水吸力下的持水性能增强;土壤容重增大,土壤孔隙变小,土壤水力传导度下降,毛管作用变强,持水性能增强;有机质含量的增加,土壤结构越固结,从而是的孔隙连通性变差;无机盐含量的变化,使得土壤溶质势发生变化,从而影响到土壤含水率的变化量。土壤条件的改变会影响到土壤持水能力的变化情况,最终影响到参数b的变化。

2.2 主要影响因素的关联度分析

灰色关联分析是一种用灰色关联度顺序来描述影响因子间关系的强弱大小次序的方法[10]。其基本思想是以因素数据序列为依据,然后通过数学手段研究其内在的几何对应联系。因此,本文将运用灰色关联分析对影响土壤水分特征曲线的主要因素土壤质地、土壤体积质量、土壤有机质含量、土壤无机盐含量进行关联度分析及灰色关联排序。具体步骤如下:

(1)首先随机抽取试验数据中的30组进行关联度计算。然后将因变量模型参数a、b构成参考序列,自变量各土壤基本理化参数构成比较序列。具体如下:

(3)

式中:式(2)为参考序列,y01与y02分别为模型参数a与模型参数b的因变量序列;式(3)为比较序列,x01~x05分别为土壤容重、土壤黏粒含量、土壤粉粒含量、土壤有机质含量、土壤无机盐含量的自变量序列。

(2)无量纲化处理:具体公式如下:

(4)

(5)

(3)灰色关联系数:具体公式如下:

Δ0i(k)=|y0i(k)-x0i(k)|

(6)

(7)

式中:式(6)为求差序列的公式,差序列为自变量序列与因变量序列相减,取其绝对值;式(7)位关联系数计算公式,式中x0(min)与x0(max)分别为差序列中的最小值与最大值;ε为分辨系数,一般取0.5。

(4)关联度计算:

计算公式如下:

(8)

式中:n为样本容量,在本次计算中n=30。

2.3 关联计算结果与分析

根据灰色关联度计算,最终得出土壤水分特征曲线Gardner模型参数a、b与个土壤基本理化参数之间的关联度。具体结果如表2所示。

表2 Gardner模型参数与土壤基本理化参数关联度表

由表2可以看出,对于Gardner模型参数a与b而言,土壤容重、土壤黏粒含量,土壤粉粒含量、土壤有机质含量与土壤无机盐含量对模型参数a、b的关联排序是一样的,由大到小均为土壤粉粒含量>土壤容重>土壤无机盐含量>土壤有机质含量>土壤黏粒含量。

一般认为,关联度在0.8以上则认为自变量与因变量关联度很好;关联度在0.6~0.8之间则认为自变量与因变量关联度好;关联度在0.5以下则认为不相关[11]。根据结果可知,各土壤基本理化参数与Gardner模型参数关联度均属于很好或者好。因此,以下以土壤容重、土壤黏粒含量、土壤粉粒含量、土壤有机质含量、土壤无机盐含量可以作为重要的影响因素,用于构建支持向量机Gardner模型参数的预测模型。

3 Gardner模型参数的支持向量机预测模型

3.1 建模样本

基于灰色关联理论分析可得,土壤质地、土壤容重、土壤有机质含量、土壤无机盐含量与Gardner模型参数有着较高的关联度。因此,本文最终选取土壤黏粒含量、土壤粉粒含量、土壤容重、土壤有机质含量、土壤无机盐含量作为预测模型的输入因子,Gardner模型参数作为输出因子,并选取90组土样数据作为建模样本,10组数据作为检验样本。建模样本数据如表3所示。

表3 建模样本数据表

3.2 支持向量机基本算法

选定输入因子建立样本点(x1,y1),(x2,y2),…,(xn,yn),xi∈Rm,y∈{-1,1}。将其映射到高维空间中,建立最优分割的超平面。具体方程如下:

Y=f(X)=[ω·φ(X)]+d

(9)

式中:ω为权系数向量;d为阈值;φ(x)为建立的高维空间的映射。

为了对最优平面方程进行求解,引入惩罚因子C与松弛变量ξ和ξ*。因此,对最优平面方程的转化为求以下方程最小值问题:

min{1/2‖ω‖2+C(∑ni=1ξi+∑ni=1ξ*i)}

(10)

同时引入不敏感损失函数ε,从而确定约束条件:

(11)

为了求得式(11)的最小值,引入拉格朗日乘子法对其进行求解:

L(ω,n,ξi,ξ*i)=1/2‖ω‖2+C(∑ni=1ξi+∑ni=1ξ*i)-

αi∑ni=1(ε+ξi-Yi+ωXi+d)-

α*i∑ni=1(ε+ξ*i-Yi+ωXi+d)

(12)

式中:αi,α*i为拉格朗日乘子,αi,α*i≥0;ξi,ξ*i≥0; i=1,2,…,n。

根据拉格朗日乘子法的原理,对w,d,ξi,ξ*i偏导数,并领其偏导等于0。具体方程式如下:

(13)

将以上公式带入回到式(12)中,并引入核函数对其进行求解。常用的核函数一般有多项式核函数、高斯核函数以及Sigmoid核函数3种。本文中使用的核函数为高斯核函数,函数具体方程形式如下:

(14)

最终求出最优解即为所建立的支持向量机预测模型表达式:

f(X)=[ω·φ(X)]+d=∑ni=1(αi-α*i)K(x,xi)+d

(15)

3.3 支持向量机预测模型参数的选取

对于支持向量机预测模型而言,参数的取值对于模型的精度有着重要的影响。对于本次所建立的预测模型而言,需要确定的参数有C(惩罚因子)、ε(不敏感损失函数值)和σ(核函数参数)。其中,对于惩罚因子而言,C的大小决定着支持向量机模型的复杂程度与预测精度,C值过大,则代表着对干扰误差的惩罚较大,从而导致模型过于复杂,而C值过小,则会导致训练精度的降低,从而误差过大,影响预测结果;ε的取值则是控制着拟合精度与支持向量的个数,ε值过大则会导致支持向量较少,模型结构相对简单,但是拟合误差相对较大,ε值过小,模型结构变得相对复杂,同时提高预测精度,但是会影响到拟合的运算速率,求解时间过长;σ是核函数参数,一般取自变量数量的倒数附近的数值,σ值决定了支持向量机的学习程度,σ值过小可能会导致“过学习”、“过拟合”的现象,σ值过大则会导致学习无效。

因此,根据以上参数的选取情况,本文采用较为常用的“穷举法”对参数进行选取,即通过试算比较并根据均方根误差作为指标来确定参数的最优值。参数选取结果如表4。

表4 支持向量机模型参数

3.4 支持向量机预测模型检验

3.4.1 建模样本精度分析

最终,经过所建立的支持向量机预报模型,得到了90组建模样本中Gardner模型参数a与b的预测结果,分析其相对误差如表5。

表5 建模样本误差分析表

通过表5可以看出,建立的关于参数a、b的支持向量机预测模型误差较小。其中,关于参数a最大相对误差为17.33%,最小值为0.28%,平均相对误差为5.65%;关于参数b最大相对误差为21.56%,最小值为0.85%,平均相对误差为4.87%。建模样本的相对误差均在可控范围之内,说明建立的模型对于参数a、b均有较好的预测效果。

3.4.2 检验样本精度分析

为了验证所得模型的精确度,因此使用随机预留的10组数据,对建立的支持向量机预测模型进行预测验证。检验结果如表6。

由表6可以看出,对于Gardner模型参数a的进行检验的结果中,相对误差最大值为11.55%,最小值为 0.68%,平均相对误差为3.96%;对于Gardner模型参数b的结果中,相对误差最大值为12.6%,最小值为0.42%,平均相对误差为4.68%。通过检验结果可以看出,根据90组训练样本所建立的支持向量机预测模型的预测精度较高,可以为Gardner模型参数的预测提供较好的理论依据。

4 结 论

(1)采用支持向量机的方法,以建立以土壤常规理化参数为输入变量,以土壤水分特征曲线Gardner经验模型参数(a、b)为输出变量的预测模型是可行的。建模样本的模型参数(a、b)平均相对误差分别为5.65%和4.87%;检验样本平均相对误差分别为3.96%和4.68%,完全在可接受范围。误差小,预测精度高。因此所建预测模型可信、可行,实现了土壤水分特征曲线模型过程或参数的预测。

表6 检验样本误差分析表

(2)采用灰色关联分析方法对预测变量影响因素量化选择是一种有效方法。本文对土壤质地、土壤容重、土壤有机质、土壤无机盐进行的关联度分析以及排序,定量定义了输入变量与Gardner模型参数的关联性和取舍,不妨更多地应用于其他多元影响因素的量化选择中。

本文试验和建模预测的结果表明,运用支持向量机对土壤水分特征曲线模型参数的预测方面有着良好的表现。但是,在选择建模参数的问题上,大多采用的是经验选取。在以后的研究中,应尝试不同的方法,比如交叉验证法、梯度下降法、遗传算法等,以进一步提高支持向量机的预测模型精度。

[1] 雷志栋,杨诗秀,谢传森.土壤水动力学[M].北京:清华大学出版社,1988.

[2] 王欢元, 韩霁昌, 罗林涛,等. 两种土壤传递函数在预测砒砂岩与沙复配土的水力学参数中的应用[J]. 土壤通报, 2013,(6):1 351-1 355.

[3] 朱安宁, 张佳宝, 陈效民,等. 封丘地区土壤传递函数的研究[J]. 土壤学报, 2003,40(1):53-58.

[4] 韩勇鸿, 樊贵盛, 孔令超. 田间持水率土壤传输函数研究[J]. 农业机械学报, 2013,44(9):62-67.

[5] 郑立华, 李民赞, 安晓飞,等. 基于近红外光谱和支持向量机的土壤参数预测[J]. 农业工程学报, 2010,26(s2):81-87.

[6] 吕 烨, 阮本清, 管孝艳,等. 基于支持向量机的微咸水灌溉下土壤盐分预测[J]. 中国水利水电科学研究院学报, 2014,(2):162-169.

[7] 雷国庆, 樊贵盛. 基于支持向量机的土壤水分入渗参数预测研究[J]. 节水灌溉, 2015,(12):28-30.

[8]GardnerWR,HillelD,BenyaminiY.Post-irrigationmovementofsoilwater:I.Redistribution[J].WaterResourcesResearch,1970,6(3):851-861.

[9]GardnerWR,HillelD,BenyaminiY.Post-irrigationmovementofsoilwater:P.SimulationsRedistributionandevaporation[J].WaterResourcesRrsearch,1970,6(4):1 114-1 153.

[10] 赵晓芬. 灰色系统理论概述[J]. 吉林省教育学院学报, 2011,(3):152-154.

[11] 邱国良, 吴基文, 王厚柱. 基于灰色BP神经网络的水位矿井涌水量预测[J]. 矿业安全与环保, 2011,38(6):28-30.

猜你喜欢

土壤水分关联度向量
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
磷素添加对土壤水分一维垂直入渗特性的影响
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
北京土石山区坡面土壤水分动态及其对微地形的响应
向量的分解
衡水湖湿地芦苇的生物量与土壤水分变化的相关性研究
太行低山区荆条土壤水分动态及其对不同降雨量的响应
聚焦“向量与三角”创新题
中国制造业产业关联度分析
中国制造业产业关联度分析