混沌算子模型在人口预测中的应用

2011-05-10邹晓玫修春波

统计与决策 2011年15期

邹晓玫，修春波

(1.天津商业大学法学院，天津300134；2.南开大学周恩来政府管理学院，天津300071；3.天津工业大学电气工程与自动化学院，天津300160)

0 引言

中国是世界人口第一大国，人口问题一直是关系中国发展的重要因素之一。人口数量以及人口增长趋势的正确预测对于人口和宏观调控政策的制定具有重要的指导意义。目前，用于人口预测的数学模型有很多，如一元线性回归法、自回归法、指数函数法、幂函数法、多元回归模型法、灰色系统法、神经网络方法等。这些方法通常是采用拟合历史数据的方法建立近似的数学模型。

由于人口系统十分复杂，其变化与生育、死亡、疾病、环境、社会、经济等诸多因素有关。简单的数据拟合方法很难揭示其内在的本质，因此上述模型的建立具有一定的局限性。

本文提出一种新的混沌算子模型用于预测我国人口数量。该模型通过不断训练控制参数逐渐逼近人口系统的动力学行为，从而得到良好的预测结果。

1 模型的建立

根据已有人口数据建立人口模型十分困难，这主要是由于人口系统是一个非常复杂的非线性动力系统，有多种因素直接或间接地对该系统产生影响，这些因素之间也存在着各种复杂的耦合关系，无法解析表达。另外，目前已有的人口数据量少，数据信息不全面，数据的采样间隔大，通常两个相邻的数据之间的采样间隔为1年。几个相邻的数据跨越几年的时间。在这几年中，社会环境和自然环境可能发生了巨大的变化，人口模型也可能已经发生了本质的改变。也就是说，人口模型实质上是一个随着时间的推移不断变化的动态模型，本质上无法用一成不变的静态数学模型对其进行描述。

据此，本文提出一种新的预测模型，预测模型由多个混沌算子加权和的形式构成。通过不断调整混沌算子的控制参数，来改变各个混沌算子的动力学行为。最终使得预测模型的动力学特性逐渐趋近于人口系统的动力学特性，并不断随之变化，从而实现人口数据的预测。

混沌映射具有丰富的动力学特性，例如式(1)的映射即为一个混沌映射，调节控制参数α可使该映射产生不同的动力学行为。图1给出了控制参数α变化时该映射的Lyapunov指数图。Lyapunov指数大于0时意味着混沌的发生，且Lyapunov指数越大，混沌度也越大。

图1 函数xn+1=sinαxn的Lyapunov指数随α变化图

本文将式(1)映射选为混沌算子，采用多个混沌算子加权和的形式构造出如下的预测模型：

其中y为模型的预测值，xj为模型的第j个输入，zi为第i个混沌算子的总输入，αi为第i个混沌算子的控制参数。wi2为第i个混沌算子的加权系数，wji1为第j个输入与第i个混沌算子的连接系数。M为混沌算子的数量，m为输入数据个数。为了简化模型，权值系数设置为：wi2=1/M，wji1=1。这样，预测模型的动力学行为就完全由混沌算子的控制参数决定。调整每个混沌算子控制参数的大小，可使得每个混沌算子具有不同的动力学特性，从而可使得预测模型表现出不同的动力学行为。利用已知数据可构造出预测模型的训练样本，通过不断调整混沌算子控制参数，可使得预测模型逐渐逼近待预测系统的动力学行为，并保持其随之变化，从而完成时间序列的预测功能。

2 人口数量的预测

设已知的人口数据为{x1,x2,…,xn}，预测的步长为p，则可构造出(n-m+1-p)个训练样本，第i个训练样本为：Xi=[(xi,xi+1,…,xi+m-1)(xi+m-1+p)]，其中(xi,xi+1,…,xi+m-1)为第 i个训练样本的输入数据，(xi+m-1+p)为第i个训练样本的期望输出。

由于混沌算子具有复杂的动力学行为特性，通常的学习算法很难实现混沌算子参数的调整，这里采用一种简单的试凑法完成混沌算子参数的训练。具体描述如下：

Step1.初始化参数。样本序号k=1，混沌算子序号l=1，在(0,1)范围内随机初始化混沌算子参数αi。

Step2.输入第k个训练样本，计算预测模型的输出及其与期望值之间的误差。

Step3.正向调节第l个混沌算子参数值。增大该混沌算子参数，即