APP下载

基于ELM的西部服务业增加值预测建模与仿真

2016-09-20韦艳玲柳州职业技术学院电子信息工程系柳州545006

现代计算机 2016年7期
关键词:隐层增加值服务业

韦艳玲(柳州职业技术学院电子信息工程系,柳州 545006)

基于ELM的西部服务业增加值预测建模与仿真

韦艳玲
(柳州职业技术学院电子信息工程系,柳州545006)

0 引言

服务业是西部地区经济转型升级的主要方向和重要支撑。西部大开发实施以来,西部服务业发展速度很快,但总的来看,绝对规模、相对规模都还仍然偏小。2013年,西部服务业的增加值为50,346.92亿元,是2000年6,839.70亿元的7.6倍,但2013年东部服务业的增加值已达166,605.80亿元,并且西部、东部服务业占GDP的比重分别是39.7%、47.3%,西部与东部相比差距非常明显。为了更好地了解西部的现时经济形势和服务业发展趋势,建立一种可以准确、快速地预测西部服务业增加值的模型不仅必要,也具有重要现实意义。

传统的预测方法通常强调预测因子和预测结果之间的线性关系。服务业相关的预测受众多因素的影响,而且这些影响是非线性的、不确定的、模糊的,所以用传统预测方法进行预测通常效果不理想,而应探索运用数据挖掘技术的新的预测方法。国内运用数据挖掘技术在经济预测方面的研究起步较晚,而在服务业相关的预测研究方面文献尤其较少。人工神经网络擅长处理复杂的、非线性数据,有强大的学习、记忆和归纳能力[1-2],预测效果优于其他传统方法[3-4]。 近年来,已有学者把神经网络等数据挖掘技术应用于服务业增加值预测,都取得了较好结果,如匡后权1、李战江、吕一清等预测各地的服务业增加值和发展趋势[5-7]。但是,神经网络的缺点也很明显,如易陷入局部最优、速度慢等。ELM(极限学习机)是新加坡南洋理工大学黄广斌教授提出的一种快速的新型单隐层前馈神经网络学习算法[8],与单纯的神经网络方法相比,有简单(前者只需设置网络的隐层节点个数,后者则设置大量的网络训练参数)、有效(前者具有最优解唯一性,后者则易陷入局部最优)、学习速度快(后者相对较慢)等明显优点。近年来,ELM在很多行业的预测应用都取得了成功[9-11],同样也适合服务业增加值预测。

预测服务业增加值的数据挖掘预测方法中文献[5] 的BP神经网络算法是较为有效的代表性方法,对服务业增加值预测精度较高,但由于神经网络固有的缺陷,预测精度还可以进一步提高。本文采用ELM预测服务业增加值,并与文献[5]在预测精度和运行时间上进行比较。

神经网络降维可降低复杂性,提高预测的精度和性能。影响服务业增加值的众多因素有复杂的非线性关系,数据信息多有重叠相关,要得到预期好结果,需要把原始指标变为不相关的指标。所以,本文首先把西部服务业指标降维,利用主成分分析法得到少量互不相关的综合指标,获取ELM进行训练和预测的相关数据,再进行ELM预测。本文旨在为预测西部服务业增加值提供一种更为准确、有效的新方法。

2 ELM基本原理

设有N个训练样本 (xi,yi),xi、yi为输入样本与输出样本,其中xi=[xi1,xi2,…,xin]∈Rn,yi=[yi1,yi2,…,yim]∈Rm;又设隐含层有s个节点,输入节点与第个隐节点之间的连接权值为 ωi=[ωi1,ωi2,…,ωin]T,第i个隐节点与输出节点之间的连接权值为βi=[βi1,βi2,…,βim]T,bi是第i个隐层节点的阈值,oj是第j个样本的输出值;设激励函数f(x)无限可微[11]:

如果网络0误差逼近N个训练样本,即:

则有:

则其最小二乘解为:其中H+即H的Moore-Penrose广义逆。

3 实例仿真

为了更好地与文献[5]中的算法相比较,本文与文献[5]一样采用1978~2005年服务业相关数据作为ELM学习样本,2006~2007数据作为预测样本。

3.1指标选择

影响服务业增加值的因素很多,基于对因素的科学性、代表性及数据易得性综合考查,则选取5个服务业发展实力的因素[5],包含4个规模指标:GDP(x1)、服务业就业人口(x3)、工业总产值(x4)、居民总人口(x5)反映服务业的总规模;包含1个结构指标:以城镇化水平(x2)反映城乡结构和城镇化程度。最新的统计年鉴常常因统计标准调整、增补漏统等原因而对以往年份的数据进行一些修订,故文献[5]的相关数据与现有统计年鉴的相关数据略有不同。本文仍采用文献[5]的相关数据作为数据来源,目的是便于与文献[5]的算法作对比。

3.2数据预处理

首先原始数据用标准化处理,然后由主成分分析得到第一主成分和第二个主成分的特征值均大于1,第一主成分的方差贡献率与第二个主成分的方差贡献率之和为88%,选择第一和第二个主成分,其余不用。Y1 和Y2分别代表第一、第二主成分,其线性表达如下。

Y1=0.951x1-0.060x2+0.956x3+0.932x4+0.789x5(4)

Y2=0.168x1+0.961x2+0.001x3+0.164x4-0.325x5(5)

主成分和西部服务业增加值归一化数据如表1所示。

表1 主成分和西部服务业增加值归一化数据

3.3仿真过程

采用ELM预测2006年和2007年的西部服务业增加值。以1978年到2005年共28年的数据作为ELM的训练数据,2006年和2007年的数据作为ELM的测试数据。隐层神经元的激活函数的选择可以考查三个激活函数“sig”、“sin”、“hardlim”,在试验中,后两种激活函数得到的预测误差很大,故排除后两种激活函数,仅选择“sig”激活函数。隐层神经元个数影响预测结果,随着隐层神经元个数增大,会出现预测准确性下滑现象,故选用隐层神经元个数不宜过大,以不大于训练个数为宜。在实验仿真中,经过多次反复选择,当选择隐层神经元个数为4、隐层神经元的激活函数为“sig”函数时,预测效果较好,且模型性能较好。仿真过程如下。

(1)确定隐层神经元个数为4,输入权值与阈值的设置是随机的。

(2)选择激活函数为“sig”;计算隐层输出矩阵。

(3)得到隐层与输出层的最优连接权值。

4 仿真结果及分析

本文算法(下称算法1)预测模拟结果与西部服务业增加值真实值(下称目标值,模拟结果及目标值均为归一化后的值)的对比如图1所示。算法1与文献[5]的算法(下称算法2)的目标值及模拟结果对应如表2所示。在8 GB内存、3.0 GHz Intel处理器、MATLAB 2011版本相同运行条件下实验,两种算法预测实时性比较:算法1运行预测模型时间0.11秒,算法2为35 分26秒,算法1运行速度明显快很多。

使用文献5的基于主成分BP神经网络算法(下称算法2),在同等条件下进行训练。从表2来看,算法1的相对误差最小为0.295%,最大为1.170%,而算法2的相对误差最小为0.611%,最大为1.340%,算法1的预测结果明显优于算法2。

当算法2网络训练达3000步和6000步时,mse分别达到0.01和 0.008,当6000步时基本收敛,运行时间较长[5]。从预测实时性来看,算法1优于算法2。

从图1上看,算法1中的均方误差mse为7.1391e -005,远比算法2中的mse=0.008小,说明本文的预测模型描述实验数据比算法2的预测模型性能好;算法1中的决定系数R=1,也说明本文的预测模型的性能很好。

表2 目标值与模拟结果对应

5 结语

服务业发展关系到国民经济的稳定和持续发展,产业结构升级也需要服务业的支撑。本文的预测模型结合了主成分分析对样本进行去噪及ELM学习速度快、泛化性好的优点,能够提升西部服务业增加值预测的精度和实时性,使政策制定者对西部经济有比较明确的预期,有利于制定针对性政策解决西部服务业发展滞后的问题。该模型也适用于其他经济预测,应用前景看好。

[1]Funahashi K.On the Approximate Realization of Continuous Mappings By Neural Networks[J].Neural Networks,1989,2(3):183-192.

[2]Tai-Yue Wang,Shih-Chien Chien.Forecasting Innovation Performance Via Neural Networks-A Case of Taiwanese Manufacturing Industry[J].Technovation,2006,26:635-643.

[3]Sahoo G B,Ray C.Flow Forecasting for A Hawaii Stream Using Rating Curves and Neural Networks[J].Journal of Hydrology,2006,317:63-80.

[4]Sahoo G B,Ray C.Flow Forecasting for A Hawaii Stream Using Rating Curves and Neural Networks[J].Journal of Hydrology,2006,317:63-80.

[5]匡后权,吉松涛,曾武佳.基于主成分BP神经网络的西部服务业产值预测[J].统计与决策,2011,(11):100-101.[5]李战江,吴公华.基于BP神经网络的内蒙古第三产业增加值预测模型[J].内蒙古农业大学学报:自然科学版,2009,30(04):255-258.

[6]李战江,吴公华.基于BP神经网络的内蒙古第三产业增加值预测模型[J].内蒙古农业大学学报:自然科学版,2009,30(04):255-258.

[6]李战江,吴公华.基于BP神经网络的内蒙古第三产业增加值预测模型[J].内蒙古农业大学学报:自然科学版,2009,30(04):255-258.吕一清.基于灰色神经网络的第三产业发展趋势的预测模型[J].统计与决策,2011,(04):157-159.

[7]吕一清.基于灰色神经网络的第三产业发展趋势的预测模型[J].统计与决策,2011,(04):157-159.Huang G B,Zhu Q Y,SIEW C K.Extreme Learning Machine:Theory and Applications[J].Neurocomputing,2006,70:489-501.

[8]Huang G B,Zhu Q Y,SIEW C K.Extreme Learning Machine:Theory and Applications[J].Neurocomputing,2006,70:489-501.

[9]孙淼,陈涛涛,于洋等.极限学习机在洪涝灾害预测中的应用[J].沈阳农业大学学报,2014,45(02):245-248.

[10]王伟,杨辉华,刘振丙等.基于极限学习机的短期电力负荷预测[J].计算机仿真,2014,31(04):137-141.

[11]潘华贤,程国建,蔡磊.极限学习机与支持向量机在储层渗透率预测中的对比研究[J].计算机工程与科学,2010,32(02):131-134.

Added Value of the Service Industry in Western China;Principal Component Analysis;Extreme Learning Machine;Forecast

Modeling and Simulation about Forecast on the Added Value of the Service Industry in Western China Based on Extreme Learning Machine Method

WEI Yan-ling
(Department of Electronic and Information Engineering,Liuzhou Vocational&Technical College,Liuzhou 545006)

1007-1423(2016)07-0053-04

10.3969/j.issn.1007-1423.2016.07.012

韦艳玲(1970-),女,广西罗城人,副教授,硕士,研究方向为数据挖掘、区域经济

2015-01-15

2016-02-25

1文献[5]文中的西部服务业产值实际为服务业增加值,GDP产值应为GDP。

科学、准确地预测西部服务业发展趋势具有重要现实意义。采用连续30年的西部服务业增加值相关统计数据,在利用主成分分析法预处理后,基于ELM(极限学习机)建模,用于西部服务业增加值的预测仿真,并与BP神经网络在预测精度和运行时间上进行比较。结果表明,所提出的模型综合主成分分析和ELM的优点,预测精度较高,泛化性较好,能够提升西部服务业增加值预测的精度和实时性,使政策制定者更好地了解西部服务业的当前形势和发展趋势,对西部经济有较明确的预期,也可以较好地应用于其他经济预测。

西部服务业增加值;主成分分析;ELM(极限学习机);预测

广西壮族自治区教育厅科研课题(No.LX2014532)、广西哲学社会科学规划2013年度研究课题(No.13FJL006)

Develops a simulation model using the 30-years'relevant statistical data of the added value of the service industry in Western China based on Extreme Learning Machine.This model forecasts the added value of the service industry in Western China and compares the BP neural network in accuracy and run-time.The simulation model combines the advantages of the Principal Component Analysis and Extreme Learning Machine.The results of simulation experiments show that this model has better forecast accuracy and generalization. This method can be also applied to forecast the relevant economic fields.

猜你喜欢

隐层增加值服务业
2021年1—12月机械行业运行情况
基于RTD可编程逻辑门的n变量函数实现算法
一种自适应确定隐层节点数的增量半监督超限学习机算法
一季度国民经济开局总体平稳
2020年10月份规模以上工业增加值增长6.9%
一种深度梯度提升回归预测模型
自动化正悄然无声地重塑服务业
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
今年第一产业增加值占GDP比重或仍下降
服务业:从一二三到三二一