APP下载

大数据分析的景区客流量预测模型研究

2021-03-17李冬

微型电脑应用 2021年2期
关键词:客流量景区神经网络

李冬

(云南机电职业技术学院 工业信息技术系, 云南 昆明 650203)

0 引言

随着人们生活水平的日益提高,人们对生活质量要求也越来越高,出去旅游成为人们享受生活,休闲度假的一种重要方式,这使得景区管理面临的压力越来越大。在节假日,景区客流量急剧增加,而淡季时,景区客流量很少,如何对景区客流量进行有效管理,提高景区的经济收益,同时又不破坏景区生态显得越来越重要,而景区客流量的预测可以描述景区客流量的变化态势,因此景区客流量预测与建模研究具有十分重要的理论意义,同时具有一定的经济价值[1-3]。

几十年以来,景区客流量预测的研究一直没有中断过,主要有定性的景区客流量预测建模技术和定量的景区客流量预测建模技术,其中定性的景区客流量预测建模技术主要从整体上对景区客流量变化态势进行分析和研究,但是其景区客流量预测结果的可解释性比较差[4],而定量的景区客流量预测建模技术可以更加细致地对景区客流量变化特点进行分析,其实际应用范围更加广泛,成为当前景区客流量预测建模方向[5]。当前定量的景区客流量预测建模技术主要有线性建模和非线性建模两种。线性建模方法最常用为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA),其主要对景区客流量的季节性变化特点进行描述,当景区客流量具有随机性时,ARIMA模型的景区客流量预测缺陷就体现出来了,如景区客流量预测误差大等[6];非线性建模方法最常用为人工神经网络,主要有RBF神经网络、BP神经网络[7-9],其主要对景区客流量的随机性变化特点进行描述,无法对景区客流量的季节性、周期性等变化特点进行描述,因此局限性也十分明显,得到的景区客流量预测结果并非真正的最优,经常出现一些偏差比较大的景区客流量预测结果[10]。

由于景区客流量变化十分复杂,具有一定的季节性变化特点,并且具有随机性变化特点,单一的ARIMA模型或者人工神经网络无法有效的反映景区客流量的全部变化特点,为了提高景区客流量预测结果,降低景区客流量预测误差,提出了大数据分析的景区客流量预测模型,该方法集成了ARIMA模型和BP神经网络的优点,对景区客流量的季节性、随机性变化特点同时进行描述,并与其他景区客流量预测模型进行了对比实例分析,结果表明,大数据分析是一种精度高、时间少的景区客流量预测模型。

1 大数据分析的景区客流量预测模型设计

1.1 ARIMA模型

ARIMA是一种常用的时间序列分析方法,可以对具体问题不需要详细的描述就可以找到适合的预测模型,常用的形式为ARIMA(p,d,q),其中p表示自回归过程的阶数、d表示差分的阶数、q表示移动平均阶数,ARIMA(p,d,q)的结构,如式(1)—式(4)。

(1)

式中,

d=(1-B)d

(2)

Φ(B)=1-φ1B-…-φpBp

(3)

Θ(B)=1-θ1B-…-θqBq

(4)

ARIMA的建模流程如下。

Step1:数据预处理。

Step2:时间序列平稳性的检验。

Step3:差分运算。

Step4:自回归移动平均定阶。

Step5:对回归拟合结果进行显著性检验。

Step6:选择效果最好的ARIMA(p,d,q)作为最终的预测模型。

1.2 BP神经网络

BP神经网络属于多层前馈网络,相对于其他人工神经网络,最大的优点为:误差反向传播机制,对一般的回归问题,可以对其输入和输出的非线性映射关系进行自适应学习,工作过程为:

第1阶段:信号前向传播,具体步骤如下。

Step1:隐含层第i个节点的输入和输出,如式(5)、式(6)。

(5)

(6)

Step2:输出层第k个节点的输入和输出,如式(7)、式(8)。

(7)

(8)

第2阶段:误差反向传播,具体步骤如下。

Step1:第p个训练样本的误差计算式,如式(9)。

(9)

Step2:所有训练样本的误差计算式,如式(10)。

(10)

Step3:根据误差梯度下降法对各层的连接权值和阈值进行修正,直到误差满足实际应用要求为止,权值和阈值修正公式,如式(11)—式(14)。

(11)

(12)

(13)

(14)

1.3 大数据分析的景区客流量预测模型的工作步骤

(1) 收集景区客流量的历史样本数据,并将这些数据根据时间先后顺序组成一个时间序列样本集合。

(2) 采用ARIMA对景区客流量时间序列样本集合进行建模,得到ARIMA的景区客流量预测结果。

(3) 采用BP神经网络对景区客流量时间序列样本集合进行建模,得到BP神经网络的景区客流量预测结果。

(4) 确定ARIMA的景区客流量预测结果和BP神经网络的景区客流量预测结果的权值w1和w2。

(5) 根据w1和w2对ARIMA的景区客流量预测结果和BP神经网络的景区客流量预测结果进行加权操作,得到最终的景区客流量预测结果。

2 实例分析

2.1 数据来源

为了分析大数据分析的景区客流量预测有效性,选择10个景区一段时间内客流量作为分析目标,每一个景区的客流量样本数据量不一样,将样本数据划分为训练样本集合和验证样本集合,其中训练样本集合用于构建景区客流量预测模型,并对景区客流量预测模型的拟合效果进行分析,验证样本集合用于测试景区客流量预测模型的预测能力,它们的样本数量,如表1所示。

表1 景区客流量预测的实验分析数据源

采用VC++6.0编程实现景区客流量预测仿真实验。

2.2 景区客流量拟合精度比较

选择文献[11]的景区客流量预测模型进行对比测试,统计它们的拟合精度,如图1所示。

图1 景区客流量的拟合精度对比

从图1的景区客流量拟合精度可以看出,两种模型的景区客流量拟合精度都比较高,大数据分析的景区客流量拟合精度平均值为95.32%,文献[11]的景区客流量拟合精度平均值为91.55%,相对于文献[11]的景区客流量预测模型,大数据分析的景区客流量拟合精度提升了3.67%,可以更好地描述景区客流量的变化特点,对比结果验证了大数据分析的景区客流量预测模型的优越性。

2.3 景区客流量预测精度比较

对于一个景区客流量预测模型来说,拟合结果只能描述其对过去景区客流量变化特点的描述,无法对将来的景区客流量变化特点进行描述,因此需要通过对验证样本集合进行测试,统计选择文献[11]和本文模型对景区客流量的验证样本的预测精度,如图2所示。

图2 景区客流量的预测精度对比

从图2的景区客流量预测精度可以看出,两种模型的景区客流量预测精度相差比较大,大数据分析的景区客流量预测精度平均值为90.69%,文献[11]的景区客流量预测精度平均值为83.20%,相对于文献[11]的景区客流量预测模型,大数据分析的景区客流量预测精度有了较大的提升,有效减少了景区客流量预测误差,对比结果再次验证了大数据分析的景区客流量预测模型的优越性。

2.4 建模时间比较

为了测试景区客流量建模时间,分别统计所有预测模型的平均拟合时间和预测时间,如表2所示。

从表2可以看出,本文模型的景区客流量的拟合时间和预测时间均少于对比模型,精简了景区客流量建模过程,获得了较好的景区客流量建模效率。

3 总结

景区客流量变化具有一定的季节性,即周期性,同时具有一定的非平稳性,即随机性,使得当前传统模型的景区客流量预测偏差较大,不能对景区游客的管理工作提供更有价值的指导意见。为此,提出了大数据分析的景区客流量预测模型,实例分析结果表明,大数据分析模型集成了当前经典模型的优点,解决了当前景区客流量预测误差大的难题,获得了比当前其他模型更优的景区客流量预测结果,可以应用于实际的景区游客的管理工作中。

表2 不同的景区客流量建模时间比较

猜你喜欢

客流量景区神经网络
云南发布一批公示 10家景区拟确定为国家4A级旅游景区
『摘牌』
神经网络抑制无线通信干扰探究
“摘牌”
基于神经网络的中小学生情感分析
某景区留念
基于灰色预测理论在交通枢纽客流量的实际应用
基于灰色预测理论在交通枢纽客流量的实际应用
基于嵌入式系统的商场客流量统计算法
基于神经网络的拉矫机控制模型建立