APP下载

地下水环境脆弱性评价的模型研究

2020-07-08史兰爽

江西水利科技 2020年3期
关键词:学习机脆弱性神经网络

史兰爽

(山东美誉工程咨询有限公司,山东 济宁 272000)

0 引言

区域地下水的可持续发展与综合评价主要依赖地下水环境脆弱性评价,因为地下水环境脆弱性评价能够如实刻画出地区地下水超采与地下水污染情况,对于地区地下水开发(特别是干旱地区的饮水安全工程等)与环境生态保护、促进水资源可持续利用有非常重要的作用[1]。同时相对于地下水监测,地下水环境脆弱性评价能够在保护地下水资源的同时,减少时间和资金的浪费[2]。

目前针对地下水环境脆弱性评价,国内外的主要方法为:GOD指标法[3]、Drastic指标法[4]、神经网络模型[5]、加权评分法和模糊综合评价法[6~10]。其中GOD指标法的应用地区较为局限[11],如岩溶地区[3],这也对GOD指标法的进一步推广带来一定困难。Drastic指标法需要假设各个地区含水层具有均一趋势,但是现实中的这一条件难以达到,且Drastic指标法也具有一定局限性[12]。加权评分法不能够反映各个因素的连续变化对地下水环境脆弱性的影响,而模糊综合评价法需要构建隶属度函数,但构造隶属度函数的过程则存在较大的主观性[6~10]。神经网络模型模拟人脑的神经网络,属于非线性模型,具有较好的容错和抗干扰能力,因此受到许多学者的关注,具有较多地改进和发展[13~15]。极限学习机(Extreme Learning Machine,ELM)作为人工神经网络一个新的发展模型,具有实现简单、学习速度极快和人为干预较少等显著优势,已成为当前最热门的研究方向之一[16]。因此本文以收集到的地下水相关指标为基础数据,采用极限学习机对地下水环境脆弱性进行评价,并对极限学习机进行地下水环境脆弱性评价的结果进行合理性分析,以期为地下水环境脆弱性评价提供参考。

1 模型介绍

极限学习机(部分文献称为“超限学习机”)的基本原理是前馈神经网络(Feedforward Neuron Network,FNN),是一种较为新型的人工神经网络模型。极限学习机能够应用于监督与非监督学习,应用范围较为广泛。该模型的主要特点是隐含层节点权重初值的赋权过程,一般为随机赋权,与此同时模型的权重不需要更新,运行过程中仅仅输出节点权重[17]。同时极限学习机能够反映被评价因子与影响因子之间的非线性关系,适合用于地下水环境脆弱性评价;极限学习机的工作原理见图1。

从图1可以看出,极限学习机模型是一个3层结构,依次分别为输入层、隐含层、输出层,现分别进行具体说明。

(1)输入层:本次主要指影响地下水的因素,因此该层的节点数也和影响地下水的因素个数相等。

(2)隐含层:目前对以隐含层的节点数没有统一的确定方法,较为流行的方法是经验法,即取为输入层节点数的75%,最后在这个范围附近可以使用试错法进行微调,从而最终确定该层节点数的数目。

(3)输出层:本文该层主要指地下水环境脆弱性等级,在本次该层的节点个数定为1。

图1 极限学习机网络结构图

在确定了极限学习机的主题框架之后,对极限学习机进行地下水环境脆弱性评价的过程进一步探讨,具体算法见式(1)~(6):

根据收集到样本容量为N的资料(xi,ti),其中xi=(xi1、xi2、…、xin)T∈Rn,ti=(ti1、ti2、…、tim)T∈Rm,设隐含层节点数为M,激励函数g(x)为:

式中,ai为输入到第i个隐含节点的权值。ai=(ai1、ai2、…、ain)T,bi为第 i个隐含节点的偏差;βi为对应于 ai的输出权值。βi=(βi1、βi2、…、βin)T,激励函数 g(x)为“Sigmoid”函数。

式(1)中的方程可以写为矩阵形式,具体见式(2):

式中,H 可由式(3)求得

而β与T分别可以通过式(4)、(5)求得,具体见下式:

整个极限学习机模型构造的目的是通过调整权值W=(a,b,β)使得期望值和实际值之间的误差平方和最小,使用E(W)代表期望值和实际值之间的误差平方和,一般将E(W)称为代价函数。目标函数见式(6)。

约束见式(7),具体如下:

式中,εj表示样本 j的误差,εj=(εj1、εj2、…、εjm)。

Huang等人指出[17,18]单隐层前向神经网络能够以很高的精度拟合任意一个数学函数,即使以随机的方式输入权重,但要实现这一目标,需要模型的隐含层具有足够多的节点。但是节点设置的过多,就会造成模型过拟合,因此需要考虑模型的泛化能力,即适当降低隐含层节点数。当以随机的方式赋权并输入模型后,隐含层矩阵H就是一个固定的矩阵,因此模型的训练问题就可以看做计算Hβ=T的最小二乘解问题。

2 实例演示

北方地下淡水天然资源,相对于南方每年的可利用量少3 362.38亿m3,从全国范围来看,北方地下淡水天然资源只占31%,北方实际可开采资源量每年仅为1 536亿m3,只占全国地下水可开采资源量的44%。但随着气候变化和人类活动的影响,北方多年平均天然水资源量减少122亿m3,可开采水资源量减少56亿m3,同时还具有持续减少的趋势,因此北方的地下水情况不容乐观[19~21]。在一些干旱地区,包括饮水安全工程在内的一些供水工程,地下水仍然在供水总量中占据一定比例[22],如山东省临沂市罗庄区农村饮水安全工程(该工程解决了105个自然村,15.7万人的饮水安全问题),地下水在总的供水水源中仍然占据着一定的比例。如何合理地开发地下水资源是一个很关键的问题,而实行地下水环境脆弱性评价是解决这个问题的基础手段之一。因此本文参考文献[5]选定研究区,对研究区的地下水进行地下水环境脆弱性评价。根据文献[5]可得地下水环境脆弱性分级标准(见表1)。

从表1可以看出,影响地下水脆弱性的主要因素为土壤层厚度、土壤层性状、包气带厚度、包气带岩性、包气带渗透系数、含水层厚度、含水层岩性、含水层渗透系数、水力坡度、地下水补给强度、地面坡度、污染源、地下水矿化度和地下水位埋深。将以上表1中的14项作为极限学习机的输入,因此极限学习机模型的输入层设置为14个节点。隐含层为1层,根据经验公式,即节点取14的75%,约为11。输出层取一个节点。

表1 研究区地下水环境脆弱性分级标准

表2 地下水水样特性指标与分级

2.1 数据预处理

收集到研究区的地下水资料结合表1,可以得到研究区地下水情况,见表2(来自文献[5])。

2.2 地下水环境脆弱性评价

将表2中2~15列数据为训练数据。根据文献[5]的分级,将分级结果作为模型输出。

按照以上方法输入极限学习机模型进行评价。最后的评价结果见表3。

表3 极限学习机评价结果

将本文极限学习机的评价结果分别与文献[5]的模糊综合评价法、改进的BP神经网络法以及常用的Drastic法、加权平均法的评价结果进行比较,结果见表4。

表4 各个方法评价结果比较

从表4可以看出,极限学习机的评价结果与文献[5]中提出的改进的BP神经网络法、Drastic法的评价结果完全一致,而与模糊综合评价法、加权平均法的评价结果略有差异,具体为第四组和第九组的评价结果不同,但是糊综合评价法在构建隶属度函数时,具有较强的主观性,而不同的隶属度函数会造成不同的评价结果,加权平均法的权重主观性较强,改进的BP神经网络法则需要的基础资料较多,Drastic法由于需要一致性假设,所以其实用性需要进一步改进。这都会对模型的评价结果造成一定的影响。由于本文模型与改进的BP神经网络法都属于神经网络模型,因此本文模型的缺点是需要大量的数据训练模型,这也使得本文模型难以用于资料缺乏的地区。但本文模型的优点是评价方法较为客观,能够反映被评价因子与影响因子之间的非线性关系,适合用于资料充足的地区地下水环境脆弱性评价。总的来看3个方法评价的结果基本一致,这也说明本文极限学习机模型具有一定科学性。

3 结论

从讨论可以看出本文提出的评价方法的缺点是需要大量的数据训练模型,这也使得本文模型难以用于资料缺乏的地区。但本文模型的优点是评价方法较为客观,能够反映被评价因子与影响因子之间的非线性关系。

本文以极限学习机为评价模型,对研究区地下水环境脆弱性进行评价,并将本文评价结果与模糊综合评价法、改进的BP神经网络法、Drastic法与加权平均法的评价结果进行比较,结果表明,5种方法的评价结果基本一致(其中与改进的BP神经网络法、Drastic法的评价结果完全一致)。说明本文模型适合用于资料充足地区的地下水环境脆弱性评价。可以为我国资料充足地区地下水环境脆弱性评价的研究提供一定的参考依据。

猜你喜欢

学习机脆弱性神经网络
工控系统脆弱性分析研究
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于DWT域的脆弱性音频水印算法研究
基于极限学习机参数迁移的域适应算法
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
煤矿电网脆弱性评估
基于攻击图的工控系统脆弱性量化方法
基于神经网络的拉矫机控制模型建立