APP下载

基于云—自组织神经网络的交通流预测模型

2014-07-18廖瑞辉周晶

交通运输系统工程与信息 2014年4期
关键词:交通流量交通流定性

廖瑞辉,周晶

(南京大学工程管理学院,南京210093)

基于云—自组织神经网络的交通流预测模型

廖瑞辉,周晶*

(南京大学工程管理学院,南京210093)

现代交通系统结构复杂,涉及的数据类型和数量众多,模糊性、随机性和不确定性等因素的存在增加了数据分析过程中定性与定量综合集成的难度.本文对城市交通流预测进行了研究,根据云模型和自组织神经网络的特点,构建了云—自组织神经网络交通流预测模型.该预测模型运用云模型处理数据的模糊性和随机性问题的优势,提高了自组织神经网络预测中学习样本数据的可靠性.通过对某城区的实际数据进行对比测算,改进的预测模型比单纯使用自组织神经网络预测模型决定系数更高.结果表明,本文提出的模型在交通流预测中提高了准确率,降低了预测泛化误差.

城市交通;数据预测;云—自组织神经网络;交通流

1 引言

城市交通系统是一个人、车、路和环境相互交融的复杂系统,该系统呈现出微观的随机性与宏观的规律性.其中,随机性主要体现在道路状况、天气、出行者等对交通运行状态的影响,规律性则表现为各个交通流参数遵循它们之间的关系及变化的趋势.城市交通系统涉及的数据类型众多,数据量庞大,不同类型的数据所表现的意义不同,其所属范围也有很大差异.交通流预测分析中,预测模型输入数据的质量很大程度上决定了预测模型的有效性,它不仅是模型输出结果的精度保证,也可以有效地检验预测模型的设计偏差.但是,从路网中所采集到的交通数据不可避免地会存在着一些缺陷,例如:交通系统随机扰动导致数据传输故障、交通流过大造成检测器无法有效检测车辆、检测器的采集频率不稳定等,都会使得检测器所采集到的交通数据出现数据缺失情况,这大大增加了交通数据的不确定性.目前常用的分析方法中,例如:层次分析、量化加权、专家群体打分等,夹杂着一些数学模型和定量计算,但都不能兼顾交通数据的随机性和模糊性.为了降低交通数据的不确定性,本文引入云模型为交通流预测提供数据预处理.

云模型(Cloud Model,CM)是在模糊数学与概率论基础上发展的一种人工智能模型,用于定性与定量信息的精确互换,能够较好地处理数据快速分类与数据挖掘等应用需求,在数据挖掘、知识发现等领域得到了广泛地应用,并取得了良好的应用效果[1-4].云是用语言值描述的某个定性概念与其数值表示之间的不确定性转换模型,简而言之,云模型是定性定量间转换的不确定性模型.其定义为:设U是一个用精确数值表示的定量论域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次随机实现,x对C的确定度μ(x)∈[0,1]是有稳定倾向的随机数,则称μ(x)在U上的分布为云模型.μ(x)在U上的分布称为“隶属云”,也简称为“云”.而神经网络作为人工智能方法的产物,已有近三十年的研究历史,是一种比较成熟的信息处理手段.通过模拟人脑的运行机理,对一定量的数据样本进行有记忆的和自适应的学习,鲁棒性较强,在解决交通流预测问题时具有一定的优势.虽然目前云模型已经广泛应用,但是其与神经网络相结合应用于交通领域的比较少.

神经网络方法有很多种,自组织神经网络(Self-Organizing Neural Network,SONN)是Kohonen教授于1981年根据神经元有序的排列可以反映出感觉到的外界刺激的某些物理特性而提出的,其主要思想是在学习的过程中逐步缩小神经元之间的作用领域,并依据相关的学习规则增强中心神经元的激活程度,从而去掉神经元之间的侧向连接,以达到模拟真实大脑神经系统“近兴奋远抑制”的效果.SONN是非监督学习网络,它具有很强的模式识别能力,这个特征对于交通流预测十分有力[5].SONN可以很好地提取出交通数据中的重要特征信息,并能够自动将这些特征进行类别标识,从而有效避免了人为的类别标识,减轻了主观因素的影响[6].但是目前自组织神经网络容易受到样本数据质量的限制,比如数据缺损或者数据集模糊,将云模型与自组织神经网络相结合,不但具有自组织神经网络的学习能力,还结合了云模型处理信息的不确定性的能力,更适用于复杂的城市交通系统研究.现有关于交通流预测的文献中[3],对样本数据缺失的处理效果并不太理想,本文针对交通数据中存在的不确定性问题,将云模型与自组织神经网络相结合,建立了云—自组织神经网络预测模型(CMSONN)对存在样本数据缺损情况下的交通流预测进行优化.

2 基于CM-SONN的预测模型

交通流量数据是常用的交通数据之一,是典型的时间序列数据,运用数据挖掘方法对交通流量数据进行深入对比分析,可以掌握交通现状,分析交通流量变化规律,为交通管理与控制、交通规划、道路设计和交通流理论研究等提供可靠依据,从而改善道路交通秩序,提高道路通行能力.通过预测模型分析,得到城市交通系统中关联的交通模式或运动趋势的潜在信息,是实现整个城市交通系统有效运行的关键.本文采用五层网络结构进行预测模型设计,如图1所示.

图1 CM-SOFM结构示意图Fig.1 Structural representation of CM-SOFM

生成云滴的算法称为云发生器(Cloud Generator,CG),如图2所示.每个节点内部由一组云发生器CG1,CG2,…,CGm组成,云模型的数字特征为(Ex,En,He),对于每个输入x,通过这组云发生器得到输出μ1,μ2,…,μn即属性值x与云模型A1(Ex1,En1,He1),…,An(Exn,Enn,Hen)的隶属度.在图1中:

(1)输入层有n个输入,即一次输入含有n个估计元素的输入序列.

(2)云化层中包含n个x正态云发生器,将对输入层的数据进行预处理,形成的云滴drop(xi,μi),输入到包含n个自组织神经元的隐含层(在SONN中称为竞争层),类似度准则采用欧式距离公式为映射层的权值向量),隶属度通过神经网络隐含层进行映射学习,隶属度通过神经网络隐含层进行映射学习.

(3)隐含层采用Log-Sigmoid函数进行学习,计算并选择使输入向量和权值向量的距离最小的神经元,称为胜出神经元并记为j∗,并给出其邻接神经元集合.连接权值的更新由下式计算:其中:领域函数以获胜神经元为中心设定了一个邻域半径,称为胜出邻域.学习初期,胜出神经元和其附近的神经元全部接近当时的输入向量,形成粗略的映射.σ2随着学习的进行而减小,胜出邻域变窄,胜出神经元附近的神经元数变少.因此,学习方法是一种从粗调整向微调整变化,最终达到预定目标的过程.wij(t+1)和wij(t)分别表示t+1和t时刻从节点i到节点j的连接权值,Δwij是连接权值的变化量,拟合后进入逆云化层.

图2 云发生器Fig.2 Cloud generator

(4)逆云化层包含n个Y正态云发生器,逆云化后输出n个估计值.在本文的方法中,预测的趋势值计算次数与测试样本训练次数相关,由于当前趋势反映的是未来的可能性,不能根据当前数据产生一个确定的趋势值作为预测结果,所以云计算的单次结果是不确定的,但是当前趋势的知识表达应遵循当前数据的分布规律,因此它应当表示为定性趋势.为了实现这种定性趋势与定量数值之间的转换,本文引入的G(Ex,En,He)可以表示当前趋势.其中,期望值Ex表明当前趋势的中心值,作为期望预测值;熵En表示当前趋势的模糊度量,反映了可被当前趋势所接受的预测值;超熵He是熵En的不确定性度量,He越大表示当前趋势的模糊性越大.

CM-SONN的优点是隶属度由云发生器产生,而不是由传统的模糊方法等产生.由于云模型的数据边界是模糊的,每次训练或泛化的值都是随机的,保留了数据原有的模糊性和随机性.在进行训练之前,先要将交通数据进行拟合,转换成定性的概念,即进行云变换.云变换是指对于任意一个不规则的数据分布,根据设定原则进行数学变换,使之成为若干个不同的云的叠加,常用的云变化方法有峰值云变换法和原子云模型集的归整法.本文采取基于峰值的云变换算法,它依据两个启发性原理:①论域中的元素对定性概念的隶属程度是一统计属性,具有随机性;②高频率元素对定性概念的贡献大于低频率元素对定性概念的贡献.具体如下:式中g(x)为数据分布函数;cj为权重函数;m为叠加云的个数;ε为用户定义的可允许最大误差,m与ε有关,ε越小则m越大.

交通流周期变化的知识表示是由历史云来完成的,历史云由时间值t和X条件云发生器来确定,由图1中的云化层来实现.

3 算例分析

本文利用江苏省某城市城区交通数据进行分析.该城市交通量记录是以天为基准周期性变化的,这样有利于分析挖掘出其中的规律.为了简化数据处理且不失交通流量的规律性,把连续三周的一条主干道通行交通量作为历史数据集来解决周末交通量出现突变的问题.现就该主干道的交通流量进行预测,车辆检测器每天24小时检测并记录经过该站的车辆信息,得到各检测周期内的交通流量序列并折算成小时流量.选择2013年的交通数据作为样本,采用CM-SONN对选定的一个工作日(以周三为例)的交通流进行预测分析.

取交通流序列前300组数据为训练样本,后100组为测试样本,表1为部分样本数据(单位为:百辆),其中星号表示数据缺失.输入样本集N=300,分别计算样本均值一阶样本绝对中心矩,样本方差得到以云模型参数熵En,超熵He,期望Ex初值作为初始权值,训练次数取5 000,训练目标误差ε取0.01,其中学习率取0.1.

表1 交通车流量数据Table 1 Traffic flow data

图3 交通流量预测对比图Fig.3 Comparison of traffic flow prediction

为了便于定量评价该方法预测的性能,通过以下指标来进行分析:

(1)均方误差(Mean Square Error,MSE)可以评价数据的变化程度,说明预测模型描述实验数据误差分布的集中与离散程度.设θˆ为原数据序列θ的预测值,则

(2)平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)是一个综合评价预测性能高低的指标,数值越低,预测效果越好,

(3)均等系数(Equal Coefficient,EC)反映的是预测曲线跟踪观测曲线的走向趋势,

表2 预测性能参数比较Table 2 Comparing of forecasting performance

由于云模型本身集合了数值分析中的随机性和模糊性,每次实验的结果不是固定的.如图3所示,横轴为时间轴,纵轴为交通流量,圆圈表示预测值,星点表示真实值.通过对一天内每个小时的交通预测,预测性能参考数比较如表2所示,云—自组织神经网络的均方误差是0.001 091 6,比自组织神经网络的均方误差(MSE=0.012 347)要小很多.在表2中还可以看出,云—自组织神经网络的平均绝对百分比误差远低于自组织神经网络的指标值.总体来看,本文的预测方法是可行的,比自组织神经网络能更好地跟踪观测曲线的走向趋势.

4 研究结论

本文针对多属性分类技术中的不确定性和神经网络预测方法中训练样本数据质量的局限性,将云模型与神经网络相结合,建立了云—自组织神经网络模型.该方法在保证预测中数据的模糊性和随机性的基础上,引用云模型基础理论及云模型计算方法,对实际检测的交通流量数据进行了分析,云—自组织神经网络模型降低了预测的泛化误差,并提高了预测的准确率.

[1]Qin Kun,Xu Kai,Liu Feilong,et al.Image segmentation based on histogram analysis utilizing the cloud model[J]. Computers&Mathematics with Applications,2011,7 (62):2824-2833.

[2]Bo Jin,Yong Wang,Zhenyan Liu,et al.A trust model based on cloud model and bayesian networks[J].Proce⁃dia Environmental Sciences,2011(11):452-459.

[3]董春娇,邵春福,熊志华,等.基于Elman神经网络的道路网短时交通流预测方法[J].交通运输系统工程与信息,2010,10(1):145-151.[DONG C,SHAO C F, XIONG Z H,et al.Short-term traffic flow forecasting ofroad network based on elman neural network[J].Journal of Transportation Systems Engineering and Information Technology,2010,10(1):145-151.]

[4]刘海军,柳征,姜文利,等.基于云模型和矢量神经网络的辐射源识别方法[J].电子学报,2010(12):2797-2804. [LIU H J,LIU Z,JIANG W L,et al.Approach based on cloud model and vector neural network for emitter identi⁃fication[J]ActaElectronicaSinica,2010(12):2797-2804.]

[5]黄强,吴建军.基于云-神经网络的液体火箭发动机故障检测方法[J].国防科技大学学报,2010,32(1):11-15. [HUANG Q,WU J J.Fault detection method based on cloud-neural network of liquid-propellant rocket engine [J].Journal of National University of Defense Technology, 2010,32(1):11-15.]

[6]万映红,胡万平,曹小鹏.基于粗糙神经网络的客户消费分类模型研究[J].管理工程学报,2011,25(2):142-148.[WAN Y H,HU W P,CAO X P.Constructing cus⁃tomer consumption classification models based on rough sets and neural network[J].Journal of Industrial Engi⁃neering and Engineering Management,2011,25(2):142-148.]

Traffic Flow Forecasting Model Based on Cloud-Self-Organizing Neural Network

LIAO Rui-hui,ZHOU Jing
(School of Management and Engineering,Nanjing University,Nanjing 210093,China)

ract:Modern transportation systems have complex structure,and the existence of fuzzy,stochastic and uncertainty factors increase the difficulty of huge data involved in qualitative and quantitative integrated analysis.This paper developed the cloud neural network self-organization of traffic flow forecasting model based on the characteristics of cloud model and self-organizing neural network.Using cloud model fuzziness and randomness advantages,the paper proposed the prediction model that can improve the reliability of selforganizing neural network prediction learning sample data to process data problems.Through comparing two models to a city traffic flow forecasting with actual data,the paper found that the forecasting model has higher coefficient of determination than the only using of self-organizing neural network.The results show that the model proposed in the traffic flow forecasting can improve accuracy and reduce generalization error.

rds:urban traffic;data forecasting;cloud-self-organizing neural network;traffic flow

1009-6744(2014)04-0154-06

TP391

A

2013-11-26

2014-04-18录用日期:2014-04-25

国家自然科学基金项目(71371094);国家自然科学基金青年基金项目(71201078);教育部人文社会科学研究青年基金项目(12YJCZH017);江苏省自然科学基金项目(BK2012305).

廖瑞辉(1986-),男,江西赣州人,博士生.*通讯作者:jzhou@nju.edu.cn

猜你喜欢

交通流量交通流定性
分裂平衡问题的Levitin-Polyak适定性
基于XGBOOST算法的拥堵路段短时交通流量预测
当归和欧当归的定性与定量鉴别
基于GA-BP神经网络的衡大高速公路日交通流量预测
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
共同认识不明确的“碰瓷”行为的定性
殴打后追赶致人摔成重伤的行为定性
具有负压力的Aw-Rascle交通流的Riemann问题
基于复合卡和ETC的交通流量采集研究