APP下载

基于EMD-LSSVM的地下水水质综合评价法*1

2016-07-21马旭东

通化师范学院学报 2016年4期
关键词:水质评价

王 众,马旭东

(长春工业大学 基础科学学院,吉林 长春 132012)



基于EMD-LSSVM的地下水水质综合评价法*1

王众,马旭东

(长春工业大学 基础科学学院,吉林 长春 132012)

摘要:在支持向量机(SVM)的基础上,使用经验模态分解法(EMD)对原始数据进行处理,并利用该方法评价李官堡水源地的地下水水质,同时与模糊综合评判和神经网络评价结果对比,结果表明,经验模态分解和最小二乘支持向量机模型在水环境的水质预测与综合评价中具有突出优势.

关键词:最小二乘支持向量机;经验模态分解;水质评价

地下水是水资源的重要组成部分,由于其丰富的储量和广泛的应用越来越受到人们的关注.地下水质量综合评价成为地下水水资源开发利用的重要环节,科学地评价地下水质量,正确地判定地下水水质状况,对地下水污染的预测与防治具有重要意义.但是在实际水质数据监测与评价中,很难获得足够多的水质监测数据来进行训练,从而导致神经网络的训练样本较少,所以神经网络在学习过程中陷入“过学习”和局部极小化的可能性极大,这也对神经网络泛化能力和水质综合评价效果的可靠性产生很大影响.支持向量机(SVM)是由Corinna Cortes和Vapnik提出的[1],它跟神经网络相比具有两个优点,一是SVM 是一种新颖的小样本学习方法,有坚实的理论基础;二是SVM能够防止模型陷入局部极小.本文提出了一种基于EMD和SVM的混合模型经验模态分解和最小二乘支持向量机(EMD-LSSVM),它能在输入数据和敏感参数上对SVM进行优化,从而提高分类和预测的准确性,适合水环境中地下水水质预测与综合评价的要求.

1模型介绍

1.1本征模态函数(IMF)

对于一个函数或信号,如果它在整个数据长度内极值点的数目和过零点的数目相等或者至多相差一个,而且任意数据点局部上下包络线是对称的,那么这样的函数或者信号我们就叫它本征模态函数.本征模态函数的概念是由Huang提出的.

1.2经验模态分解法(EMD)

在实际应用中,多数信号是非平稳非线性的,不能够完全满足本征模态函数的要求,因此,必须先将信号分解成为一系列的本征模态函数.这种能分解非平稳非线性的信号的分析方法,就是经验模态分解法(EMD)[2].

经验模态分解法的过程如下:

(1)对于分解数列x(t)=(t=1,2,…,n),首先要找出它所有极值点,包括极大值和极小值在内,然后分别拟合所有的极大值形成上包络线xup(t)和所有的极小值形成下包络线xlow(t),拟合原理是三次样条曲线拟合.

(3)定义数列x(t)与平均包络值m1(t)得差为d1:d1=x(t)-m1(t).

(5)计算残余函数r1(t)=x(t)-dk(t).

(6)把r1(t)看作新数列,重复上述步骤(1)~(5)得到残余函数r2(t).用这种方法,重复n次得到

EMD技术可以把任意信号分解成所需的本征模态函数,具有几个优点.第一,这种方法比较容易理解,并且被广泛应用,因为它避免了复杂的数学算法.第二,EMD适用于处理非线性非平稳数据系列.第三,EMD更合适用于分析数据系列,如天气,水质,经济趋势等[3].

1.3最小二乘支持向量机(LSSVM)

(1)为了改进传统支持向量机计算周期长的缺点,使其更好更广泛地应用于各个领域,可以将原支持向量机中算法的二次寻优通过构造损失函数变为求解线性方程,从而产生了最小二乘支持向量机[4].

(2)最小二乘支持向量机回归.LS-SVM对于给定的训练集(xi,yi),xi∈Rn,yi∈Rn,i=1,2,…,l,利用k(k≥n)维特征空间F里线性函数y(x)=ϖTΦ(x)+b来拟合样本集,其中,非线性映射Φ(·)把数据集从输入空间映射到高维特征空间,这使得输入空间中的非线性拟合问题转变成为高维特征空间中的线性拟合问题.可以根据结构风险最小化原理,用约束优化问题来表示该回归问题,综合考虑函数复杂度和拟合误差,约束优化问题可以表示为

(1)

式中,c是正则化参数;b为常值偏差.为了便于求解上述优化问题,需要把约束优化问题转变成为无约束优化问题,建立相应的拉格朗日函数

L(a,b,ϖ,e)=

(2)

式中,ai是拉格朗日乘子,对拉格朗日函数各变量求偏导并令偏导数为0,得到如下方程组

然后将求解的优化问题转化为求解线性方程

(4)

(1)RBF核函数K(x,y)=exp(-‖x-y‖2/2δ2),δ为核函数宽度.

(2)线性核函数K(x,y)=x·yT.常见的正则化参数和核函数宽度选择法有K-Fold交叉验证法和留一法等.

2实例研究

2.1研究区概述

本文研究区李官堡水源地,如图1所示,位于沈阳市区的西南部,东面紧邻铁路线,西北在沈辽路,西面紧靠沈大高速,南面依傍浑河,地势平坦,大体趋势从东北向西南逐渐降低,地面平均海拔35~40米.研究区地下水系统是一个开放的系统,主要通过浑河入渗、大气降水得到补给,非常适合城市用水开采利用.该地区降雨主要集中在七、八、九月份,而且入渗条件良好,水量充足.排泄途径主要是人类生活生产开采,蒸发排泄.该地区常年气温较低,潜水蒸发量小.

2.2原始数据

对研究区域从1998年到2002年21个采样点中8个水质标准:氨氮、硝酸盐氮、亚硝酸盐氮、硫酸盐、PH值、总硬度、总铁、锰,标准参照GB/T14848-93《地下水水质评价标准》进行水质综合评,得到各采样点24组综合水质指标F值.

图1 沈阳李官堡水源地

2.3建立EMD-LSSVM模型和优化过程网络学习

首先,对原始数据进行EMD分解,将其分解成若干IMF;然后,分别对他们选择适当核函数的LSSVM进行预测;最后将得到的结果进行综合分析,得到最终预测结果.分别以前16组数据作为训练样本,建立预测模型,以后8组数据作为测试集进行预测检验,结果如图2、表1所示.

图2 李官堡和朗家的训练集和测试集

2.4分析

从结果图可以看出,预测模型高度拟合了待预测值的变化趋势,预测结果较为准确.为了对比,用模糊综合评判法和神经网络法进行了评价计算,具体结果,如表2所示.

表1 训练集与测试集mse与R2值

表2 3种方法结果比对

从表2看出,3种综合评价模型的结果基本一致.但是EMD-LSSVM方法的计算步骤、训练速度和计算效率有突出优势[5].

3结论

基于EMD-LSSVM回归模型的地下水水质评价,首先,它对原始数据进行处理,然后对除去噪声的数据进行建模,能够简化计算过程和提高预测精度;其次,它是在统计学理论的基础上提出的,仅需以各样本点综合指标为训练样本进行训练,得到的回归模型可以对所需评价的地下水水质样本进行综合评价,具有很好的推广性和通用性;最后,该方法的参数均由大量学习得到,因而评价结果更真实可靠.因此,该方法在地下水综合评价计算中具有更好的效果和发展前景.

参考文献:

[1]卢虎,李彦,肖颖.支持向量机理论及其应用[J].空军工程大学学报,2003,4(4):89-91.

[2]J A K Suykens,J Vandewalle.Least Squares Support Vector Machine Classifiers[J].Neural Processing Letters,1999,9(3):293-300.

[3]王秋生,段丹辉.经验模态分解的边界效应处理技术[J].计算机测量与控制,2006,14(12):1673-1675.

[4]徐洪钟,杨磊.基于最小二乘支持向量机回归的基坑变形预测[J].南京工业大学学报,2008,30(2):51-54.

[5]刘坤,刘贤赵,孙瑾,等.基于支持向量机的水环境质量综合评价[J].中国环境监测,2007,23(3):81-84.

(责任编辑:陈衍峰)

DOI:10.13877/j.cnki.cn22-1284.2016.04.008

*收稿日期:2015-10-20

基金项目:国家自然科学基金“基于三维随机模拟的傍河型水源地污染物迁移转化规律研究”(51278065)

作者简介:王众,山东莱阳人,长春工业大学基础科学学院硕士研究生.

中图分类号:O242

文献标志码:A

文章编号:1008-7974(2016)02-0026-03

猜你喜欢

水质评价
宿州市河流水化学特征及水质评价
阿什河哈尔滨段水质评价
黄河玛曲至临河段硅藻群落组成及水质评价
秦皇岛北部地表水和地下水水化学特征及水质评价
浞河浮游藻类的调查研究与水质评价
不同评价方法对水库水质评价的适应性
济南流域秋季底栖动物多样性研究
在Excel VBA中实现水环境质量评价
济南流域夏季大型底栖动物群落结构调查及水质评价
模糊数学评价法在水质评价中的应用