APP下载

基于灰色支持向量机的地铁沉降滚动预测

2016-01-24张育锋李图南

北京测绘 2016年2期
关键词:预测值灰色向量

张育锋 李图南

(陕西省土地工程建设集团,陕西 西安710075)

1 引言

城市地铁线路总体上会穿过城市交通拥挤、人口密集、建筑物林立、地下管线复杂的路段,在施工过程中会引起周边岩土的变形,从而给地表建筑物、地下管线的运营带来安全隐患,因此地铁建设过程中沉降监测预报显得尤为重要。近年来,对变形数据分析与预报方面的方法很多,有回归分析、时间序列分析法、灰色系统理论、BP神经网络法、卡尔曼滤波、小波分析等[1]。由于地铁沉降预测的复杂性,单一模型只能描述其局部的变化规律,预测精度时高时低,不稳定。因此对单一模型进行改进或建立组合预测模型成为提高地铁沉降预测精度的重要途径,孙景领提出了灰色神经网络地铁沉降组合预测模型[2];王新洲等提出基于小波变换和支持向量机的大坝变形监测[3];潘国荣等提出小波神经网络变形监测数据组合预测模型[4]。组合模型继承了单一模型的优点,预测效果较好。

灰色预测在时间序列预测中是一种非常有效的方法,但近年来研究表明灰色模型存在一些理论缺陷,原始离散数据序列的光滑度、模型的背景值、初始值等会使预测结果会出现较大误差[5]。支持向量机(SVM)是一种机器学习算法,是在统计学的VC维理论和结合风险最小化原理的基础上形成的,具有强大的泛化能力,能够很好地解决小样本数据、非线性和局部极小点等问题,避免出现过学习这种现象[6]。本文将灰色预测和支持向量机相融合,通过灰色预测将沉降数据累加产生具有单调递增的新序列,弱化原始数据序列中随机因素的影响,增强其规律性,采用区间滚动的方式将最新的沉降的数据作为部分输入值,使用支持向量机对数据进行训练预测,最后对预测值累减还原,从而构建灰色支持向量机组合预测模型。通过实际测试,取得了较好的结果。

2 灰色支持向量机滚动预测模型

2.1 灰色预测方法

设通过监测得到的地铁原始沉降时间序列X(0)={x(0)(1),x(0)(2),…,x(0)(n)} ,通过一次累 加 形 成 新 的 1-AGO 序 X(1)={x(1)(1),x(1)(2),…,x(1)(n)} ,其 中 x(1)(k)=

对X(1)建立一阶灰色模型微分方程:

其中,a为系统发展灰数,b为系统内生控制变量。对式(1-1)离散化处理,得到:

Y=BP

根据最小二乘法可得:

解微分方程建立预测公式:

累减还原的预测值为:

2.2 支持向量机回归算法

支持向量机回归的目的是通过训练样本,找出相对稳定的函数逼近样本集输入与输出之间的关系,并且对新的输入也能给出准确的输出。支持向量机回归分析分为线性回归和非线性回归,通常样本呈非线性情况,随着Vapnik的ε不敏感损失函数的引入,它已经成功扩展为解决非线性回归估计问题,展现了极好的学习推广性。对于非线性情况,SVM 模型可以有效地实现对基于小样本的高维非线性系统精确拟合,并且采用结构风险最小原则,具有很好的泛化性。已知一组训练数据集 (xi,yi) ,xi∈Rn,yi∈R,i=1,2,…,m,利用非线性映射φ把数据集从输入空间映射到高维特征空间,以使输入空间中的非线性拟合问题变成高维特征空间中的线性拟合问题。高维特征空间的线性回归函数为:

其中,w和b为权值系数和偏差,φ(x)为特征特征空间。根据结构风险最小化原则,f(x) 等价于求下面的最优化问题:

为了寻找w和b,这里需要引入松弛变量ξi,ξi*求解,(2-2)式就变等价于求解下面的优化问题:

约束条件为:

式(2-2)中,m是训练样本,ε是不敏感系数常量。上面的约束优化问题是一个典型的二次规划问题,上述问题可用拉格朗日乘子法求解,得到原问题的对偶问题,该二次规划问题对偶问题为

约束条件为

通过二次优化方法控制参数C和ε就可以控制SVM的泛化性,式(2-6)中αi*和αi是拉格朗日乘子,(αi*-αi) 非零值对应的数据就是支持向量。根据Mercer定理,引入核函数K解算得到支持向量机回归方程的估计式为

支持向量机的特点在于不直接计算复杂的非线性变换,而是计算非线性变换的点积,即核函数,采用的不用的核函数可以构造实现输入空间中不同的非线性回归学习方法。SVM目前常用的核函数主要有多项式核函数、径向基函数(RBF)和Sigmoid核函数等[7]。图1显示了支持向量机结构示意图。

2.3 滚动预测

考虑到地铁沉降数据是一维时间序列,同时SVM多输入单输出结构和不具备根据实际情况动态调整预测值的能力,对原始数据序列可以采用区间滚动预测的方法将其转换成多维时间序列,即从左向右移动该区间,区间内最左的数据从定长区间移动出去,则从区间右侧相应地会有新数据加入,使得区间内的数据始终保持在p个。具体做法:设有时间序列 {x(1),x(2),…,x(n)},取i(i<n)个作为支持向量机的训练样本,(n-i)个样本作为测试集,将输出值反馈到输入端作为下一次输入值的一部分。图2采用区间滚动构成支持向量机的训练样本集的输出与输入。

其中,p是步长。由于不同的时间序列前后数据关联程度很不同,选取不同的数据长度其预测结果也大不相同,将最小平方误差步长为p的xi-p,xi-p+1,…,xi-1作为支持向量机的输入数据,xi作为预测输出量。

2.4 灰色支持向量机地铁沉降滚动预测模型

利用灰色生成弱化原始数据序列随机性,增强其规律性的特性,然后利用支持向量机拟合非线性数据能力的优势对新序列建立预测模型,最后将预测结果进行累减还原得预测值。具体的建模步骤如下:

(1)对原始沉降数据进行一次累加生成新的序列,由于新生成的序列最大值最小值之间差异较大,因此对样本进行了归一化处理,将大小控制在[0,1]之间。

(2)滚动预测

将处理后的地铁沉降样本数据分为两部分:训练集和测试集,训练集用来训练数据从而得到最优模型,选定最佳模型后对测试集进行预测。采用滚动预测的方式对数据进行处理确定训练集和测试集的输入量和输出量。

(3)参数的确定

目前,参数的选择没有统一的理论指导[8]。本文采用最常用的ε-不敏感损失函数作为损失函数,选择径向基函数(RBF)为模型核函数,ε通过控制回归逼近误差管道的大小,从而达到控制支持向量的个数和泛化能力。对于一个基于RBF为核函数的支持向量机而言,其性能由C(惩罚参数)和g(RBF核参数)决定,惩罚因子C用于控制模型复杂度和逼近误差的折中;核参数g决定了映射函数和样本特征子空间分布的复杂程度,C和g取值不当都会影响SVM的学习效果。本文利用网格参数寻优找到最佳参数C和g,即让C和g在一定的范围内取值,为了避免“过学习”和“欠学习”的现象,将训练集利用K-折交叉验证法[9]训练,取交叉检验下平均分类均方根误差最小的那组C和g的值

(4)累减还原

训练样本集经过训练得到最优回归模型,将测试集代入到模型中得到预测值,对预测值反归一化处理,生成的新序列累减还原就得到了原始地铁沉降数据的预测值。

(5)为了方便评价预测模型的准确度,本文选用平均绝对误差(MAE)、平均相对误差(MRE)和均方根误差 (RMSE)作为评价指标。

3 实例分析

根据文献[10]某点实测地铁隧道施工累积沉降数据建立灰色支持向量机滚动预测模型。本文采用 Matlab编程调用LIBSVM工具箱[11]实现组合模型。将2009/4/13~2009/5/24这42期作为样本数据,用前31期的数据作为训练集,后11期作为测试集并将其预测结果与实际值进行比较。经过网格参数寻优得到灰色支持向量机主要参数值如下:取滚动预测的数据步长为6,K=3,C=128,g=0.0313。图1显示了网格参数寻优的三维视图,其中log2c取[-1,7],log2g取[-8,0],MSE表示的是K=3折交叉验证法平均分类均方根误差。

现分别用灰色预测模型、支持向量机、灰色支持向量机对后11期进行预测并对三种预测模型精度进行比较,结果如表1所示。

表1 2009/5/14-2009/5/24地铁沉降预测值及精度比较

从表1可以灰色模型的精度最低,支持向量机预测精度明显优于前者这也体现了机器学习方法泛化性好的优点,组合模型的预测精度最高,这主要是因为灰色预测模型独特的数据生成方式增强了数据的规律性,加上支持向量机良好的泛化性从而提高了预测精度。是灰色模型、SVM模型和灰色SVM组合模型预测值和实测值比较曲线(如图4所示)。

4 结论

支持向量机作为一种机器学习方法,具有强大的非线性逼近能力,相对人工神经网路而言SVM能够很好地解决小样本数据、非线性和局部极小点等问题,避免出现过学习这种现象。灰色预测模型独特的数据生成方式可以削弱数据序列的趋势性,增强数据的规律性。本文将二者结合起来,充分利用两者的优势对地铁沉降数据进行预测,取得了较好的预测效果,可以将此方法借鉴到建筑物、大坝等工程项目中,具有一定的实用价值。

猜你喜欢

预测值灰色向量
向量的分解
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
聚焦“向量与三角”创新题
AI讲座:ML的分类方法
浅灰色的小猪
自体荧光内镜对消化道肿瘤诊断临床应用分析
灰色时代
她、它的灰色时髦观
向量垂直在解析几何中的应用
感觉