APP下载

人工神经网络在首次公开募股价格预测中的运用

2010-07-25夏禹

微型电脑应用 2010年6期
关键词:人工神经网络数据量权值

夏禹

0 引言

神经网络已经被广泛运用于决策系统的非线性数据关系的建模。首次公开募股价格的预测大都又基于不完整的外部信息,因此神经网络的特性适合于首次公开募股的价格研究。当代,为了提高金融决策的质量,人们把大量的神经网络的知识运用于金融界,特别是那些需要模式匹配和模式区分的情况中。

1 人工神经网络的结构

人工神经网络起源于对大脑及其神经系统的研究,是一种信息处理的技术。它模仿人类大脑对知识习得和信息组织的过程。人工神经网络由最基本的处理器、神经元和它们之间的联系通道的阵列构成。通过向这一阵列输入数据信息,经过处理器处理后输出或得到结果。

每个神经网络是由在其各层中的一系列神经元构成的。下图1所示就是神经网络的基本结构。

图1 本文人工神经网络的基本结构

2 人工神经网络的设计

神经网络设计,主要目的是通过对一个实验对象处理来研究和辨识神经网络的模型,使输出拥有更高的精确度。人工神经网络的预测模型,特别是在经济领域中的预测,通常采用反向传播的监督式的学习模型。

2.1 数据量的要求

本文数据由Merrill Lynch和www.ipo.com提供。针对各种模型,所要求的数据量是不同的。本文采用的数据量要求的公式[2]如下:

Dmin=2×(1+N+0)

Dmax=10×(1+N+0)

I表示输入数目,N表示神经元数目,O表示输出数目运用这一公式本文研究一个17个输入,6个神经元和1个输出的问题,所需48个到240个数据点,网络含有一个隐含层。

● 数据量是介于200天到600天之间的市场数据。

● 输入数据量应该至少是神经元之间联络数量的2倍。

2.2 设计流程图

本文所运用的研究方法描述如图3.1的流程表。

2.3 人工神经网络的输入

人工神经网络模型的输入变量如表3.1

?

2.4 数据归一化

人工神经网络的原始数据在输入之前进行归一化是十分重要的。因此,我们需要对神经网络的每个输入数据进行归一化处理,把输入限制于可接受的范围内。这里的范围通常是指-1到1区间。

运用双曲正切方程进行归一化处理:

F(x)=μ代表所有输入x的均值;sd是x的标准差。

实践表明,通过双曲正切方程处理,可以把原始数据压缩到本文所要求的区间范围内。

2.5 神经网络的传递方程及其参数选择

2.5.1 传递方程

高斯补充方程是高斯方程的修正方程,这是本文提出的创新型的方程,未见于任何文献之中,但是通过大量实际研究,它对神经网络的收敛速度的提升以及精确度的提高有一定程度的帮助。本文所选取的神经网络具有较高的实用价值。

高斯补充方程

F(x)=1-e-x2

2.5.2 学习率,权值和动量因子

反向结构中的权值矢量的变化与差值的负梯度有直接关系,当训练对象给定之后,在采用不同权值时差值也随之变动。权值大小的取决于所选择的学习率。选择较大学习率值可能会引起权值的巨烈变化,另外,选择偏小的学习率值会导致学习缓慢。因此,本文将会以一个默认的权值为始,然后增大或减小该权值以减小输出值与期望值的误差。同样的尝试也可以运用到动量因子的选择之中。

2.6 神经网络的训练

2.6.1 反向传播

作为训练算法,反向传播的主要目的是通过调整网络的权值,对应于预先所设置的训练模式的17个输入,使之得到满意的输出结果。反向传播理论是一种监督式的学习算法,对于每种模式都存在作为学习过程目标的修正输出。网络输出与目标之间的差异是需要减小的误差。

训练神经网络需要一系列的输入和相应的令人满意的输出。另外,误差方程是衡量网络输出和理想值的差异。反向传播算法的基本步骤:

1) 提出一种训练模式,通过网络传播获得结果。

2) 将所得有输出与期望的结果对比,计算差值。

4) 调整权值减小误差。

5) 从步骤2)重复以上过程直到差值足够小。

2.6.2 反向传播网络的算法推导

反向传播网络推导的基本步骤如下:

1.根据网络设定训练模式,进行前向传播获取输出。网络可以计算出输出值与期望值之间的误差,通常依据下列的平方求和方程求得误差:

P参数代表训练组的当前模式,i代表输出节点数,dpi和ypi分别代表在p模式下第i个输出节点的网络输出和目标值。每个节点i计算得到一个输入的权值和ai,然后把ai送到传递方程或激活方程部分,获得节点的输出yi。参见图3.2。

2.误差计算

误差的显著性是由误差方程E来描述。

3. 求导方程

在计算完误差,下一步根据权值对所求得的误差进行求导。

上述方程在反向传播网络中有很好的效率,该方程的变形如下:

K值涵盖了所有输出节点,aj是j节点从求和方程获得的权值的和作为输入,基于每个节点的误差δi,误差计算如下:

上式表明了在当前的模式下ai对衡量误差的贡献。对于输出节点,误差的导数方程如下:

方程(8)是由方程(4)得来,方程(9)是在当前激活值下的激活方程求导的结果。因为隐含层节点只能通过对与输出相连的节点k作用来影响误差,所以:

方程(11)的第一个因子δk是输出节点k的误差,所以替代方程(11)中的δk,我们可以得到:

方程(11)中的第二个因子起标记作用,当节点i直接与节点k相连,那么,否则等于0。因此, 隐含层节点的误差方程如下:

方程(13),除了因子,相对于激活单元,对误差的平方和模式作微分是导数方程的一部分,它也同时控制着这一单元变量的大小值。

通过上述推导进行总结,前向传播后,在输出节点上运用方程(10)来计算误差,通过人工神经网络运用方程(13)计算隐含层节点的误差。因为δk必须在δi前计算,整个过程开始于输出节点,再返回到输入部分,因此该算法被称为“反向传播”,见图3.3。另外,误差对于权值的微分方程如下:

图3 前向传播

图3 反向传播

2.7 网络测试的结果

为了测试网络的性能,测试数据(由 Merrill Lynch和www.ipo.com 提供)可以从数据集 A(n=480)和数据集B(n=198)中获得,测试数据大约占所有数据的20%左右。

2.7.1 数据集A(n=480)

通过训练数据集 A训练网络后,最优的神经网络是含有一个隐含层的反向传播的前馈网络。均值表示首次公开募股的价格的平均值;标准差表示是首次公开募股价格偏离平均价格的距离的平均数,它是离均差平方和平均后的平方根;中值(或中位数)是个类似平均值的统计学概念,是把所有数值从大到小(或从小到大)排列后,数列队中居于正中央的那个数值。通过训练数据集 A训练网络后,最优的神经网络是含有一个隐含层的反向传播的前馈系统,其预测中间值与首次公开募股的市场价格的中间值很接近。

表3.2 数据集A是首次公开募股价格

表3.3 基于神经网络由数据集A获得的首次公开募股的价格

NN(19)(0.1;0.1;0.3)中NN(19)表示神经网络的隐含层中的神经元的数目为19;(0.1;0.1;0.3)表示(学习率;动量项;权值).

2.7.2 数据集B(n=198)

根据数据集B(n=147)的训练过程,神经网络最终形成的基本结构是一个具有一个隐含层的反向传播的神经网络系统,它拥有13个输入节点和一个隐含层。

表3.4 首次公开募股价格

表3.5 基于神经网络由数据集B获得的首次公开募股的价格

NN(19)(0.1;0.1;0.3)中NN(19)表示神经网络的隐含层中的神经元的数目为19;(0.1;0.1;0.3)表示(学习率;动量项;权值)

3 性能的评估

神经网络的性能可以同多重回归算法的性能作比较。运用多重回归的方法,进行预测所用的输入输出变量与神经网络的输入输出变量是相同的;即输入量是独立变量,输出量是应变量。

3.1 多重回归算法

在多重线性回归中,趋势图的离散点绘成一条直线;这条线形成的方程被称为多重回归方程。多重回归算法是估计方程中的βi

其中X是独立变量;Y是应变量。下标i代表观测次数。β是未知的回归系数。β是原始未知的参数,而b是β的估计值。e1是第i行的误差。尽管回归问题可以由一系列的方法解决,但是最常用的方法是最小二乘方法。在最小二乘方回归分析中,通过对b值的选择来减少平方和的值。b值的集合不一定是正确真实的数据集,因为它们的值可能会受到外部扰动的影响。基本方程的形式为:

bo是回归面与Y轴的交点,b1s是回归面与Xi轴方向的斜率。这些系数被称为偏回归系数。每个偏回归系数代表第i个变量对于应变量的净效应,使方程中剩余X的值保持为常量。

3.2 多重回归的结果

正如前文所述,神经网络的性能同多重回归的结果作比较。多重回归所运用的输入变量和数据集同前文神经网络模型一样。输入变量如表3.1。多重回归对于数据集A和B的结果示于表4.1。

表4.1 回归价格分布

结果表明由线性回归产生首次公开募股价格不能达到理想的预测效果(精确度比神经网络预测的精确度差)。另外,数据量全面且足够多时,多重回归训练数据预测性能和神经网络预测的性能近似,但是数据量的因素会带来多重回归算法过拟合,所以误差出现且不断加大。

4 结语

首次公开募股的价格预测是一个十分艰难,复杂和繁琐的工作。真正的首次公开募股的市场价格只有在公司上市和股票开始交易后才为人所知。在本文中,由神经网络的产生预测价格会同首次公开募股的首发价格作对比。另外,神经网络模型的性能会同多重回归技术的性能相比较。实验表明神经网络模型在提高首次公开募股的预测价格的准确度方面比多重回归技术有效。

[1]Wang F.Efficient Verification of Timed Automata with BDD-like Data-structures[M]. London:Springer-Verlag,2003.

[2]Jain B A. Nag B N.Artificial neural network models for pricing initial public offerings[J]. Decision Sciences,1995.

[3]BILLINGS S A,Radial Basis Function Network Configuration using Genetic Algorithms[J-].Neural Networks,1995.

[4]阎平凡,张长水,人工神经网络与模拟进化算法[M].清华大学出版社,2000.

[5]Shaikh A. Hamid Primier on using neural networks for forecasting market variable working paper No.2004-03.

猜你喜欢

人工神经网络数据量权值
一种融合时间权值和用户行为序列的电影推荐模型
基于大数据量的初至层析成像算法优化
CONTENTS
高刷新率不容易显示器需求与接口标准带宽
利用人工神经网络快速计算木星系磁坐标
宽带信号采集与大数据量传输系统设计与研究
人工神经网络实现简单字母的识别
滑动电接触摩擦力的BP与RBF人工神经网络建模
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究