基于GPCA和GAPSO-NN的中国区域经济预测方法研究

2014-08-25付传秀

湖北民族大学学报(自然科学版) 2014年1期

关键词：权值全局阈值

付传秀

(皖西学院金融与数学学院,安徽六安 237012)

基于GPCA和GAPSO-NN的中国区域经济预测方法研究

付传秀

(皖西学院金融与数学学院,安徽六安 237012)

结合全局主成分分析(GPCA)和遗传微粒群-神经网络(GAPSO-NN)，对中国区域经济发展水平进行预测.首先构建区域经济发展水平的评价指标体系并提取相关数据；然后借助GPCA获得全局主成分分值、综合评价值，作为GAPSO-NN的输入、输出；接着构建GAPSO-NN预测模型并训练网络；最后通过预测仿真，表明基于GPCA和GAPSO-NN预测方法的有效性.

区域经济；全局主成分分析；遗传微粒群-神经网络；预测方法

区域经济的合理布局及协调发展，是我国现代化建设中的一个重大战略问题.正确评价及预测中国各地区的经济发展水平，有助于探索区域经济发展和变化的规律，为区域经济的均衡发展提供理论指导.

全局主成分分析(GPCA)是结合了时间序列的主成分分析方法.区域经济发展的评价一般按年为时间跨度，且各评价指标间具相关性，故采用全局主成分分析来评价其发展水平较为适合.

遗传算法(Genetic Algorithms，GA)、微粒群算法(Particle Swarm Optimization，PSO)、神经网络(Neural Network，NN)均属智能计算方法.GA是借鉴生物界中自然选择思想、自然遗传机制的一种全局搜索算法，具有全局寻优性能良好，局部搜索能力较差的特性.PSO是一种基于群体智能的随机寻优算法，局部寻优性能较好.NN是以数学手段来模拟生物神经网络结构和特征的系统，其中，BP网络是NN最重要的模型之一，但BP算法存在不足：收敛速度较慢，易陷入局部极小点.

鉴于此，本文根据GPCA和GA、PSO、BP网络的特点，将它们交叉组合，构建模型对中国区域经济发展水平进行预测，得到一些有意义的结论，可以为统筹区域经济发展的有关决策提供参考.

1 区域经济发展水平评价指标体系的构建

现代区域经济学形成于20世纪50年代，是揭示区域与经济相互作用规律的一门科学[1].它主要研究市场经济条件下生产力的空间分布及发展规律，探索促进特定区域经济增长的途径和措施，以发挥各地区优势、实现资源优化配置、提高区域整体经济效益.

中国改革开放以来，随着市场经济的发展，许多区域性的经济问题越来越突出，如：东中西部经济差距问题、地区二元经济结构问题、城乡经济联系问题、区域分工协作及资源配置问题、区域经济可持续发展问题等，需要有区域经济理论加以指导解决.

正确评价区域经济发展水平，首先需要合理构建评价指标体系.

根据科学性、系统性和可行性的指标选取原则，本文从经济发展水平、社会发展水平、经济结构、人民生活水平、区域开放程度、经济发展的可持续性等几方面综合衡量，在总结相关研究成果的基础上[2-4]，建立评价指标体系，选取反映地区经济发展的20项主要评价指标如下：

①A1—人均GDP(元)，②A2—第二产业占GDP的比重(%)，③A3—第三产业占GDP的比重(%)，④)A4—人均进出口总额(元)，⑤A5—人均社会消费品零售总额(元)，⑥A6—人均财政收入(元)，⑦A7—人均固定资产投资(元)，⑧A8—投资效益系数(每元固定资产投资所产生的GDP)，⑨A9—外资占固定资产投资的比重(%)，A10—GDP增长速度(%)，A11—城市化率(%)，A12—在岗职工平均工资(元)，A13—每十万人高等学校在校生数(人)，A14—每千人执业医生数(人)，A15—城市绿化覆盖率(%)，A16—人均R&D经费(元)，A17—城市居民人年均可支配收入(元)，A18—城市居民家庭人均年现金消费支出(元)，A19—农村居民家庭人均纯收入(元)，A20—农村居民家庭人均年现金消费支出(元).

注：本文数据源于2007-2012年《中国统计年鉴》、《全国科技经费投入统计公报》.

2 区域经济发展的全局主成分分析

全局主成分分析(GPCA)，是融合了时间序列的主成分分析方法，是经典主成分分析的发展[5].其主要思想：在研究有时间跨度的若干数据表序列，需对数据进行横向、纵向比较时，首先将若干数据表整合为一个全局数据表，将所有数据统一到同一空间中，然后进行主成分分析.GPCA实现了有时间跨度数据的动态分析，保证了系统分析的整体性和可比性.

区域经济发展的评价一般按年为时间跨度，评价指标间具相关性，故采用GPCA进行全局数据表整合及数据的降维处理.中国地区经济发展的GPCA，具体步骤如下：

②计算样本相关系数矩阵R=(rij)20×20(i，j=1，2，…，20)，其中rij为变量Xi与Xj的相关系数；

③利用雅克比方法，求出相关系数矩阵R的非负特征值(λ1，λ2，…，λ20)及相应的特征向量ai=(ai1，ai2，…，ai20)(i=1，2，…，20)，得到主成分Yi=ai1A1+ai2A2+…+ai20A20(i=1，2，…，20)；

将主成分分值作为GAPSO-NN的输入，综合得分值作为GAPSO-NN的目标输出.

3 GAPSO-NN模型建构

3.1 遗传算法(GA)、微粒群算法(PSO)、BP网络结构及算法

GA模拟生命进化机制，从初始种群出发，通过选择、交叉、变异操作，产生一群新的更适应环境的个体，使群体进化到搜索空间中较好的区域，这样逐代繁衍、进化，最后收敛到一群最适应环境的个体上，求得问题的最优解[6].

PSO是利用微粒间的协作与竞争，通过群体智能指导搜索的优化算法.初始种群中，每个微粒对应优化问题的一个可行解，由目标函数评价其适应度值.微粒在解空间中迭代搜索，不断调整位置来寻找新解.每次迭代时，微粒追随两个“极值”更新自己：本身搜索到的个体最优解，种群目前搜索到的全局最优解[7].

BP(误差反向传播)网络是多层神经网络，由输入层、隐含层、输出层组成.BP算法的学习过程分为两个阶段：①前向传播：输入信息从输入层，经隐含层、输出层逐层处理后，得到网络的输出.如得不到期望输出，则转入反向传播；②反向传播：误差信号由输出层，经隐含层向输入层反传，逐层修正各层神经元的连接权.此过程不断迭代，最终使误差信号达到允许的范围内.

3.2 模型建构

构建GAPSO-NN模型，分3个步骤：

①确定BP网络结构，利用GA良好的全局搜索能力，粗搜索网络的权值及阈值；

②利用PSO较强的局部寻优性能，进行细搜索，获得网络当前的最优权值及阈值.

具体实现：GA-PSO算法中，采用实数编码，分别用矩阵A、B表示隐含层，输出层神经元的权值和阈值：

其中，n为输入神经元数，h为隐层神经元数，o为输出神经元数；矩阵A、B的最后一列对应隐层、输出层神经元的阈值，其它值对应隐层、输出层神经元的权值.矩阵展开的向量：(a11,a12,……,a1n,a1(n+1),a21,…,ah(n+1),b11,b12,…,b1h,b1(h+1),b21,…,bo(h+1))对应码串：隐含层与输入层连接权值、输出层与隐含层连接权值、隐含层阈值、输出层阈值，构成GA-PSO种群的个体.

经过GA-PSO迭代运算，得到一组完整、误差相对最小的BP网络初始权值和阈值.

③将得到的权值、阈值重新代入BP网络，利用BP算法进行训练.

4 实例分析与结论

1)根据区域经济发展水平评价指标，选取作为评价对象的中国31个地区、2006年至2011年共6年的31×6×20个数据，整合为全局数据表，进行全局主成分分析.

经GPCA可知，前4个主成分的累积贡献率已达到86.64%，因此选择这4个主成分为综合指标，替代原20项评价指标.

4个主成分的表达式为：

综合得分表达式为：F=0.7278y1+0.1217y2+0.0872y3+0.0633y4.

2)利用GAPSO-NN模型进行训练，预测2011年中国地区经济发展水平.

将主成分分值、综合得分值的2006年至2010年数据，作为GAPSO-NN的训练样本；2011年数据作为GAPSO-NN的测试样本，对2011年中国地区经济发展水平进行预测.同时，通过标准BP网络、GAPSO-NN的预测结果对比，进行预测模型的可行性校验.

选取一次的仿真结果并分析如下：

图1 GA目标函数J优化过程

图2 PSO适应度函数F优化过程

图3 GAPSO-NN预测输出拟合曲线

3)训练时，GA利用良好的全局搜索能力，对权值和阈值进行粗搜索，目标函数J的优化过程如图1所示；PSO的局部寻优性能较好，可提高收敛速度，对权值和阈值进行细搜索，适应度函数F的优化过程如图2所示.

图1、2反映出GA和PSO的优化效果较好.

4)通过标准BP网络、构建模型的测试对比，校验“GAPSO-NN模型”的计算性能.

5)2011年中国地区经济发展水平预测值、目标值的拟合曲线如图3所示，拟合精度较高，表明“GAPSO-NN模型”的数据拟合性能较好.

本文构建预测模型，对中国区域经济发展水平进行预测.通过2011年中国地区发展水平的预测仿真，得到较满意的结果，表明基于GPCA和GAPSO-NN预测方法是合理有效的.

[1]吴传清.区域经济学原理[M].武汉：武汉大学出版社,2008：17-29.

[2]李雪梅.主成分分析在区域经济分析中的应用[J].计算机工程与应用,2009,45(19)：204-206.

[3]耿海清.基于全局主成分分析的我国省级行政区城市化水平综合评价[J].人文地理,2009(5)：47-51.

[4]张建平.基于主成分分析的区域经济发展水平的综合评价[J].农业与技术,2007(6)：125-128.

[5]高惠璇.应用多元统计分析[M].北京：北京大学出版社,2005：265-290.

[6]韩瑞锋.遗传算法原理与应用实例[M].北京：兵器工业出版社,2009:25-36.

[7]曾建潮,介婧,崔志华.微粒群算法[M].北京：科学出版社,2004.

[8]Van den Bergh F,Engelbrecht A P.Cooperative learning in neural networks using particle swarm optimization[J].South African Computer Journal,2000,11：84-90.

[9]赵欣.一种保持PSO与GA独立性的混合优化算法[J].计算机工程与应用,2009,45(26)：53-55.

[10]闻新,周露.MATLAB神经网络仿真与应用[M].北京：科学出版社,2006：303-319.

责任编辑：时凌

StudyonPredictionMethodforChineseRegionalEconomyBasedonGPCAandGAPSO-NN

FU Chuan-xiu

(College of Finance and Mathematics,West Anhui University,Liu′an 237012,China)

A research model combining the Global Principal Component Analysis (GPCA) with GA (genetic algorithm) - PSO (particle swarm optimization) Neural Network in this paper has been suggested to predict the regional economic development level in China. First, the index system to evaluate the regional economic development level is established. Then, the global principal component scores and the comprehensive evaluation value are obtained by means of GPCA, as the input of GA-PSO Neural Network. Last, the prediction model of GAPSO-NN is constructed. The result of simulation test proves the validity of this method.

regional economy; global principal component analysis; GAPSO neural network; prediction method

2014-01-21.

付传秀(1974- ),女,硕士,主要从事现代数学及其应用的研究.

F224；O29

1008-8423(2014)01-0071-04