APP下载

海水富营养化评价的回归支持向量机规范化模型

2015-08-22晴,

四川环境 2015年1期
关键词:超平面富营养化海水

司 晴, 梁 伟

(成都市环境保护科学研究院,成都 610072)

· 水环境 ·

海水富营养化评价的回归支持向量机规范化模型

司晴, 梁伟

(成都市环境保护科学研究院,成都610072)

为了建立具有普适性的海水富营养化评价模型,在对指标值进行规范变换的基础上,采用免疫进化遗传优化算法,对传统的支持向量机(support vector machine, SVM)模型进行了改进,建立了基于回归支持向量机(support vector regression,SVR)的指标规范化的海水富营养化评价模型。并将优化好的模型用于某海域水体富营养化评价,其评价结果与传统的SVM模型的评价结果基本一致,且新模型较传统的SVM模型具有较好的普适性和通用性。

规范变换;支持向量机;海水富营养化;普适性

由于对海洋的开发日益加剧,海洋污染事件频发,海水富营养化日趋严重。对海水富营养化科学、合理的评价可以为海洋的管理保护和合理开发利用提供依据,诸多学者提出了多种海水富营养化评价方法,有单项指数法、内梅罗指数法、模糊评价法、BP神经网络评价法等[1~4]。单项指数法以单项指标代替综合指标难以全面反映海水污染情况;内梅罗指数法仅是突出了一项污染最严重的因子;模糊评价法中权重的确定和隶属度函数设计没有统一标准,而权重和隶属度函数的不同又可能造成评价结果的差异;BP神经网络隐层节点数的确定还没有统一的标准,而隐节点数的变化同样会影响到评价的结果。支持向量机是对线性可分数据寻找最优分类平面发展而来的,合解决小样本、高维度、非线性的问题,具有收敛数度快,推广能力强的特点,但是传统的支持向量机模型[5]因径支持向量的不同,造成核函数对各指标不具备普适性。李祚泳等人[6~9]根据自然界普遍存在的规范化思想,提出评价体系指标值规范变换的思想和方法,通过设置适当的指标参照值和规范变换式,使得相同级别的不同指标之间的差异较小。此方法已在地表水体评价,水资源承载力评价等领域得到了一定程度的应用。而在此基础上建立的支持向量机模型用于海水富营养化评价领域的研究尚未见报道。并且将该模型用于某海域水体富营养化评价并与传统的SVM模型评价的结果进行比较。

1 基于指标规范化的海水富营养化评价的支持向量机模型

1.1海水富营养化指标的参照值、规范变换式及规范值的分级标准

根据天然水体中藻类的光合作用反应式,选择COD、PO4-P、TN、Chl-α浓度及Phytoplankton丰度5项指标作为海水富营养化的评价指标[5],根据海水质量标准(GB3097-1997)和海水富营养化研究成果,设定分级标准如表1所示[2]。为了消除各指标之间在量纲和数值上的差别,使统同级标准的不同指标的规范值之间的差异尽量小。为此,对各指标设定适当的参照值和规范变换式。经多次试算和调试,设定5项海水富营养化指标的参照值cjo如表1所示,设计5项指标的规范变换如式(1)和式(2)所示。

(2)

表1 5项富营养化评价指标参照值cjo和分级标准及标准规范值

1.2支持向量机模型的基本思想

支持向量机(SVM)的工作机理是[5~10]:对于线性可分数据,寻找一个超平面,该超平面既要保证分类精度,又要使超平面两侧的空白区域最大化。理论上,SVM能够实现线性可分数据的最优分类。对于线性不可分数据,则可通过核函数,将其映射成为高维空间中的线性可分数据。

图1 支持向量机示意Fig.1 Schematic diagram of support vector machine

其基本思想可用图1说明,由空心和实心两种点代表两类样本,能够将其分开的线性分类器有很多种(如图1a中的l、m和n)。但最优的线性分类器只有一个,如图1b所示。H为分类超平面,平行于分类超平面H且分别过两类样本中距超平面最近样本的分类平面H1和H2之间的间隔称为分离间隔(margin)。落在平面H1或H2上的样本点称作支持向量。能正确分开两类样本且使分类间隔最大的分类平面H,称为最优分类超平面(optimal separating hyperplane)。

Suykens依据结构风险最小化原则,利用Lagrange法得到支持向量机的线性回归模型(LS-SVR)[9]如式(3)所示:

(3)

(4)

式中,σ为径向基函数宽度参数,确定非线性映射函数的结构,从而影高维特征空间中线性回归的复杂度。σ过小,回归复杂度增加,容易引起模型的过拟合;σ过大,会降低模型的分辨力。过大或过小的σ值都会使模型的泛化能力降低。因此,在模型的优化中选择适当的σ非常关键。‖·‖表示泛数,一般用欧氏距离表示。

1.3基于指标规范值的支持向量机模型

(5)

海水水体样本i的富营养化评价的支持向量机模型表示式如式(4)所示。

(6)

为了优化确定式(6)中的参数,需设计如式

(7)所示的优化目标函数:

(7)

式中,yk为由式(6)计算得到的第k级标准样本的NV-LS-SVR模型的输出值;yk0为设定的第k级标准样本的NV-LS-SVR模型期望输出值,如表2所示K=3为样本总数。

表2 NV-LS-SVR模型各级分级标准径向基核函数中心值和模型期望输出值yk0和实际输出yk

1.4可调参数的优化

经反复调试,设定惩罚因子C=200,核函数参数σ的取值范围设为σ∈[0,2],在满足目标函数式(7)的条件下,以表1中1~3级标准规范变换值作为NV-LS-SVR海水富营养化评价模型的训练样本,用免疫进化遗传算法[6]对模型中的参数αl(l=1,2,3)、σ和b反复迭代优化。优化算法的具体实现步骤及迭代公式详见文献[6]。免疫进化算法的参数设置为:动态调整系数A=10,δ0=0.3,群体规模K=100,最大迭代次数T=1000;误差设置ε0=0.000001,当目标函数minQ(a,b,σ)=9.6566e-007<ε0时停止迭代。得到参数优化结果如表3所示。

表3 海水富营养化评价的NV-LS-SVR模型的参数优化结果

将优化得到的表3中的αl(l=1,2,3),σ和b代入支持向量机模型式(6),得到如式(8)所示指标规范值的海水富营养化评价的NV-LS-SVR模型表达式。

(8)

2 实例分析

表4 某海域水质监测数据cj及不同模型评价结果

3 结 论

3.1优化得到的NV-LS-SVR模型用于海水富营养化评价,不用编程,不需重新优化,只需将各指标代入规范变换式(1)和式(2)计算得到各指标规范值,然后代入优化好的模型表达式(8)计算即可。计算简单, 使用方便。

3.2对于海水富营养化评价的任意m项指标的监测数据均适用。对于表1中的5项指标之外的指标,只需适当设定指标参照值cj0和指标值的规范变换式,使这些指标各级标准的规范值在表1中5项指标的同级标准规范值的变化范围内,则本文优化得出的模型表达式(8)依然可用,且不会有太大偏差。因而相对于传统的SVM模型,NV-LS-SVR模型具有更好的普适性和通用性。

3.3实例分析表明,基于指标规范值的支持向量机模型用于海水富营养化评价,其结果与实际符合较好,因此,该模型具有实用性和合理性。

[1]王焕松, 雷坤, 李子成, 等. 辽东湾海域水体富营养化的模糊综合评价[J]. 环境科学研究, 2010, 23(4): 413-419.

[2]王冬云, 黄焱歆. 海水富营养化评价的人工神经网络方法[J]. 河北建筑科技学院学报, 2001, 18(4): 27-29.

[3]时文博. 我国近岸海水富营养化现状及评价方法的研究探讨[J]. 河北渔业, 2012, 4(16): 42-46.

[4]Justus E E, Van Beusekom. A historica perspective on Wadden Sea Eutrophication[J]. helgol Mer Res, 2005, 59: 45-54.

[5]王洪礼, 王长江, 李胜朋. 基于支持向量机理论的海水水质富营养化评价研究[J]. 海洋技术, 2005, 24(1): 48-51.

[6]李祚泳, 王文圣, 张正健, 等. 环境信息规范对称与普适性[M]. 北京: 科学出版社, 2011. 192-193, 223-226.

[7]梁晓龙, 李祚泳, 汪嘉杨. 基于指标规范值的海水水质评价的SVR模型[J]. 成都信息工程学院学报, 2014, 29(2): 208-212.

[8]李祚泳, 张正健. 基于回归支持向量机的指标规范值的水质评价模型[J]. 中国环境科学, 2013, 33(8): 1502-1508.

[9]Scholkopf B, Smola A J. New support vector algorithms[J]. Neural Computation, 2000, 12(5): 1207-1245.

[10]Cortes C, Vapnik V. Support vector networks[J]. Machine Learning, 1995, 20: 273-297.

Evaluation Model of Seawater Eutrophication with Support Vector Regression Based on Normalized Index Values

SI Qing,LIANG Wei

(ChengduAcademyofEnvironmentSciences,Chengdu610072,China)

The purpose of this study was to explore the universal assessment model of the seawater eutrophication. On the basis of the normalized transformation for indices, the assessment model of the seawater eutrophication with support vector regression (SVR) was established. The SVR model optimized by immune evolutionary algorithm was applied to assess the seawater eutrophication and the evaluation results were basically consistent with that of traditional SVM model. The results showed that the universality and versatility of the new model were better than that of the traditional SVM.

Normalized index;support vector machine (SVM);seawater eutrophication;universal

2014-07-29

司晴(1983- ),女,四川成都人,2004年毕业于西华师范大学环境科学专业,工程师,主要研究方向环境规划与评价。

X55

A

1001-3644(2015)01-0044-04

猜你喜欢

超平面富营养化海水
基于临界点的杭州湾水体富营养化多年变化研究
全纯曲线的例外超平面
涉及分担超平面的正规定则
洪口水库近年富营养化程度时间分布的研究
喝多少杯海水能把人“渴死”?
以较低截断重数分担超平面的亚纯映射的唯一性问题
海水为什么不能喝?
洞庭湖典型垸内沟渠水体富营养化评价
海水
富营养化藻的特性与水热液化成油的研究