APP下载

改进支持向量机在大坝变形预测中的应用研究

2017-03-01刘敏郑上雄

城市勘测 2017年1期
关键词:表达式大坝向量

刘敏,郑上雄

(1.江门市勘测院有限公司,广东 江门 529000; 2.江西理工大学,江西 赣州 341000)

改进支持向量机在大坝变形预测中的应用研究

刘敏1*,郑上雄2

(1.江门市勘测院有限公司,广东 江门 529000; 2.江西理工大学,江西 赣州 341000)

支持向量机算法进行建模的过程中,选取合适的核函数以及相关的参数组合是最重要的部分,参数选取的好坏将直接影响到预测结果的精度。本文采用基因表达式编程算法对支持向量机算法进行参数组选取,得到改进支持向量机算法并将其应用于具体工程实例之中。结果表明改进支持向量机大坝变形预测模型比传统支持向量机大坝变形预测模型得出的预测结果的精度提高了近3倍,从而说明基于基因表达式编程的改进支持向量机的预测模型在大坝变形预测中具有良好的预测效果。

大坝变形;支持向量机;基因表达式编程;预测模型;精度

1 引 言

支持向量机(Support Vector Machine,简称SVM)算法在数据样本范围较小时,也能获得满意预测值,其主要思想是当经验风险降低的时候,期望风险的主界值也能降低,在原有小范围数据的基础上,保证模型能获得满意的预测精度。在处理非线性问题上,由内积函数架构的非线性变换可把输入空间转换成一个高维空间,并在这个高维空间中寻找输入与输出变量之间的非线性关系[1]。大坝变形受到温度、时效因子以及水位等因素影响,所以其变形值呈现出非线性的特性[2],将SVM算法于大坝沉降影响因子建立起数学模型能有效预测出大坝的变形情况。然而,SVM进行建模的过程中,选取合适的核函数以及相关的参数组合是最重要的部分,参数选取的好坏将直接影响到预测结果的精度,基于此本文采取用基因表达式编程算法[3](Gene Expression Programming, 简称GEP)进行对其进行参数选取,利用GEP强大的全局搜索能力寻找出支持向量机的最佳参数组合[4],建立经基因表达式编程优化的支持向量机大坝变形预测模型[5~9]。

2 SVM大坝变形预测模型参数影响分析

SVM大坝变形模型建立受惩罚因子C、松弛变量ε以及核函数K(xi,xj)多个参数的影响,选取合适的参数是本文研究的核心。

2.1 惩罚因子C

惩罚因子C决定了本算法有多重视离群点的损失,定的C越大,则目标函数损失越大,而且C是非变量,它是事先被定好的数值,数值定好之后得到一个分类器,根据样本数据测试,如果测试不及格,就换一个C值,如此循环寻优,直到找出符合条件的C值为止,但是这和优化本身不同,惩罚因子C始终是个定值。

2.2 松弛变量ε

松弛变量ε则代表相对应点的离群程度,其值越大,就代表点离的更远。它能协调经验风险和推广性能两者之间的关系,起到平衡作用。

2.3 核参数g

核参数g代表了核函数性能的优劣。若g过大,则模型泛化能力弱;若g过小,则模型相关性弱,所以选取适当的核参数也是本文的核心部分。

3 改进SVM大坝变形预测模型的建立

改进SVM建模的中心思想是:将参数组合群进行初始化,通过GEP算法对参数组合群进行基本的遗传操作,计算每个个体组合的适应值,若达到计算精度,则进化结束;若没有达到计算精度则继续进行循环操作,直到寻找出最优参数组合[10]。

把监测点原始值分为两组,第一组当作训练样本,第二组作为预测样本。运用GEP算法选出的参数组,建立改进后SVM模型,通过改进SVM模型预测监测点的变形情况得到后期变形数据再与原来预测样本数据作对比,最后进行精度比较。具体分为三大步:首先是通过GEP算法对参数组合群进行择优筛选,以寻选得最优参数组;其次利用最优参数组应用于标准SVM算法中建立改进SVM大坝预测模型;最后将改进SVM大坝预测模型应用在实例中得出结果并进行精度分析,流程图如1所示。

图1 改进SVM预测模型建模流程图

具体步骤如下:

(1)数据预处理。先将所获得大坝原始观测数据经小波变换处理,剔除噪声及相关无用信号,使得原始数据更为平滑完整,便于后期的数据处理分析。

(2)数据样本构造。将大坝原始观测值分成两组,其一为训练样本,另一组为预测样本。其中,训练样本数据被用于进行建模,预测样本数据被用于进行精度对比。

(3)确定参数组(C,g,ε)的约束范围。

(4)设定GEP的控制参数。

(5)初始化参数组种群。参数组合群初始化是随机的,所以想要从种群中找到最优解是比较困难的。然而只要反复的初始化种群直到产生最少一个合法个体,本算法即可开始。

(6)适应度评价。适应度就是来检测个体能否适应外界环境的一个指标。个体表现好坏可以依据适应度函数计算出来。本文选取的适应度函数为:

式中,m为参数组合训练个数,yi为对应的对应训练数据集合的训练数据,yj为利用表达式由训练数据集合得到的yi的估计值。然后根据适应度函数解析GEP的基因编码,计算每个参数组合的适应度值来评价种群,若满足计算精度要求,则进化完成,否则继续下一步。

(7)GEP算法参数设定。设定种群数目、基因数目、变异率、倒串率以及插串率重组率等参数。

(8)输出SVM的参数最优解。通过输入原始参数组合种群经GEP算法运算之后输出最优参数组合即:

(Best-C,Best-g,Best-ε)。

(9)改进SVM模型的建立。通过GEP算法获得最佳参数组合后,结合传统SVM算法通过改变传统SVM算法的参数值获得改进SVM算法,通过改进SVM算法构建改进SVM大坝变形预测模型。

(10)用改进SVM大坝预测模型预测大坝变形量得出的预测结果与传统大坝预测模型得出的预测值作对比分析。

4 工程实例

本次大坝监测数据来源于对云南省某大坝升船机的真实监测采集数据,选取其中左上塔筒ZS-305监测点进行数据研究,通过改进SVM大坝变形预测模型计算出实验结果如下:

两种模型预测值与观测值数据对比表(左上塔筒ZS-305监测点) 表1

对应的数据结果对比图如2所示:

图2 两种模型预测值与观测值数据对比图(左上塔筒ZS-305监测点)

4 结 论

本文利用改进支持向量机大坝变形预测模型对大坝变形进行预测研究,得出以下结论:

(1)参数选择上,如何选取最优参数组是本次研究的核心。本文通利用GEP算法强大的全局搜索能力寻找出支持向量机的最佳参数组合,建立了经基因表达式编程优化的支持向量机大坝变形预测模型。

(2)精度方面,比较基于两种预测模型所得的预测结果,改进SVM预测模型所得预测结果的精度比传统SVM预测模型所得预测结果提高了将近3倍,说明改进SVM大坝变形预测模型相对于传统SVM大坝变形预测模型的预测精度更高[11]。

[1] 白鹏,张喜斌,张斌等. 支持向量机理论及工程应用实例[M]. 西安电子科技大学出版社: 2008,7~40.

[2] 高永刚,岳建平,石杏喜. 支持向量机在变形监测数据处理中的应用[J]. 水电自动化与大坝监测,2005(5):36~39.

[3] 元昌安,彭昱忠,覃晓等.基因表达式编程算法原理与应用[M]. 北京:科学出版社,2010.

[4] 王文栋,钟智,元昌安. 基于GEP的支持向量机参数优化[J]. 广西师范学院学报·自然科学版,2010(2):66~70.

[5] 王新洲,范千,许承权等. 基于小波变换和支持向量机的大坝变形预测[J]. 武汉大学学报·信息科学版,2008(5):469-471+507.

[6] 宋志宇,李俊杰. 最小二乘支持向量机在大坝变形预测中的应用[J]. 水电能源科学,2006(6):49-52+115-116.

[7] 任超,梁月吉,庞光锋等. 基于灰色最小二乘支持向量机的大坝变形预测[J]. 大地测量与地球动力学,2015(4):608~612.

[8] 王腾军,杨海彦,杨志强. 基于云模型的大坝变形监测数据分析研究[J]. 测绘通报,2012(2):23~25.

[9] 徐锋,王崇倡,张飞. 粒子群-BP神经网络模型在大坝变形监测中的应用[J]. 测绘科学,2012(4):181~183.

[10] 龚文引,蔡之华,刘亚东. 基因表达式程序设计在复杂函数自动建模中的应用[J]. 系统仿真学报,2006(6):1450-1454+1457.

[11] 李潇. 灰色最小二乘支持向量机在滑坡变形预测中的应用[J]. 测绘通报,2010(6):44~46.

Application of Improved Support Vector Machine in Dam Deformation Prediction

Liu Min1,Zheng Shangxiong2

(1.Jiangmeng Investigation and Surveying Institute,Jiangmen 529000,China; 2.Jiangxi University of Science and Technology,Ganzhou 341000,China)

SVM modeling process, select the appropriate kernel function and the associated parameter combination is the most important part of the parameter selection will directly affect the accuracy of the prediction results. In this paper, gene expression programming algorithm support vector machine algorithm parameter set selection, get into improved support vector machine algorithm and its application to specific engineering examples. The results show that the improved accuracy of deformation prediction model of dam than the traditional support vector machine Support vector machine prediction model of dam deformation prediction results obtained increased nearly three-fold, so that prediction model described GEP improved support vector machine based on dam deformation prediction has a good prediction.

dam deformation;support vector machine;gene expression programming;prediction model;accuracy

1672-8262(2017)01-126-03

TU196

B

2016—09—19 作者简介:刘敏(1990—),男,硕士,工程师,主要从事测绘工程技术工作。 基金项目:国家自然科学基金资助项目(41561091)

猜你喜欢

表达式大坝向量
向量的分解
聚焦“向量与三角”创新题
一个混合核Hilbert型积分不等式及其算子范数表达式
表达式转换及求值探析
浅析C语言运算符及表达式的教学误区
大坝:力与美的展现
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
正式挡水的马来西亚沐若大坝
议C语言中循环语句