APP下载

基于SAPSO_RBF神经网络的网络舆情预测研究

2017-08-31陈福集黄亚驹

关键词:模拟退火舆情粒子

陈福集,黄亚驹

(福州大学 经济与管理学院,福建 福州 350108)

基于SAPSO_RBF神经网络的网络舆情预测研究

陈福集,黄亚驹

(福州大学 经济与管理学院,福建 福州 350108)

网络舆情的发展具有复杂、时变的特征,构建时间序列分析模型对网络舆情预测具有现实意义,为了提高径向基神经网络模型的预测准确率,利用模拟退火算法优化后的粒子群算法实现对RBF神经网络的优化,构建SAPSO_RBF神经网络的网络舆情预测模型,并以“魏则西”事件为例进行实验仿真和分析,结果表明该模型在预测性能上具有较好的优越性和稳定性。

网络舆情;RBF神经网络;粒子群算法;模拟退火算法

根据中国互联网中心(CNNIC)发布的第38次《中国互联网发展状态统计报告》[1]显示,截至2016年6月,互联网普及率为51.7%,互联网正在改变着人们的生活习惯,对我国的政治、经济、文化、社会等领域的发展产生了深刻影响,已成为民情、民意的表达和传播平台。在互联网时代,网络时刻都在产生大量的舆情信息,网络舆情传播具有人数众多、信息量大、意见众多、内容公众化、传播开放化和控制难度大等特点[2],网络影响力的提升使得网络舆情对社会的稳定和发展产生至关重要的影响。因此,对网络舆情发展趋势的研究和预测有利于政府相关部门及时发现潜在的舆情危机,并采取措施进行合理引导,这对维护社会稳定具有非常重要的意义。

网络舆情指的是由于各类事件推动刺激而产生的借助互联网平台传播的网民对于该社会现象所持有的不同意见、态度、情绪和行为倾向的综合[3]。现有的网络舆情预测研究主要是从定量方面考量,在时间序列分析的基础上,采用数学模型进行拟合,主要步骤是:网络舆情数据采集、热点话题的发现、热点话题的时间序列数据收集、数据清理及变换、预测模型的建立、网络舆情预测及结果评定。苏创等[4]考虑网络舆情传播过程中存在的不确定因素,提出了基于不确定微分方程的网络舆情传播模型。杜智涛等[5]构建了判研指标体系,运用灰色预测方法建立网络舆情预测模型。吴鹏等[6]基于Agent建模技术,对突发事件中网络舆情演变过程中网民群体行为进行建模与仿真,揭示了突发事件网络舆情演变的规律。王新猛[7]通过划分状态空间、构建状态转移矩阵、开展舆情热度趋势预测等步骤建立了基于马尔科夫链的政府负面网络舆情热度趋势预测模型。李彤等[8]提出基于模型集成的微博情感分析与预测模型,对突发事件微博舆情进行了情感分类与趋势预测。魏德志等[9]在证明网络舆情发展趋势具有混沌特征的基础上,提出了EMPSO_RBF神经网络的方法,并对网络舆情进行预测。黄敏等[10]针对网络舆情时变和混沌特性,建立了一种基于支持向量机的网络舆情混沌预测模型。

已有的研究主要是对长期话题性质的网络舆情进行预测,其对数据量的要求较为严格,然而突发事件具有一定的随机性,短时间内能收集到的数据量较小,且由于事件性质的不同,影响程度往往具有较大的差异。因此,利用神经网络具有良好鲁棒性的特点,以及RBF神经网络结构简单、逼近能力良好、学习速度快的特点[11],进行网络舆情的热度预测研究。对于较为复杂的非线性系统的拟合,RBF神经网络的参数设置需要进行全局动态寻优,单独利用RBF神经网络构建预测模型,在数据量较小的情况下,结果往往精度较差。粒子群优化算法(particle swarm optimization,PSO)是基于群体智能的思想,是一种基于全局搜索策略的进化算法,收敛速度快,但是粒子群的随机初始化会对算法的寻优结果产生很大的影响,有可能陷入局部最优,且精度不高,故利用模拟退火算法概率突跳的性质来优化粒子群算法,解决粒子群容易陷入局部最优的问题,并利用优化后的SA_PSO算法优化RBF神经网络,建立SAPSO_RBF神经网络的网络舆情预测模型。

1 利用模拟退火算法优化粒子群算法

1.1 粒子群优化算法

粒子群优化算法[12]是由KENNEDY等在1995年提出的基于群体智能(swarm intelligence)的优化算法,源于对鸟群行为的模拟。在算法的每次迭代中,粒子跟踪自身遍历过的最优位置和整个粒子群遍历过的全局最优解进行迭代寻优,直到得到最优解。

假定在D维空间,存在N个粒子,Xi=(xi1,xi2,…,xid)为粒子i的当前位置;Vi=(vi1,vi2,…,vid)为粒子i当前的速度;pbesti=(pi1,pi2,…,pid)为粒子i经过的适应度值最优的位置,称为个体最优;gbest=(g1,g2,…,gd)为N个粒子所经历过的适应度值最优的位置,称为全局最优。PSO算法的迭代方程可以描述为:

c2r2(gbesttj-xtij)

(1)

式中:i=1,2,…,N;j=1,2,…,d;t=1,2,…,tmax,tmax为最大迭代次数;r1,r2为[0,1]之间的随机数;ω为惯性权重;c1,c2为学习因子。

参数ω、c1和c2的设置会影响PSO的收敛,ω和c2较大时,PSO具有全局收敛的特性,但运算量很大;ω较小而c2较大时,算法容易收敛,但容易陷入局部最优,因此设置ω和c1随着迭代次数的增加而减小,c2随着迭代次数的增加而增加,这样可以保证算法在初期具有较强的全局搜索能力,而在末期更倾向于局部搜索。

式中:ct1,ct2为第t次迭代的学习因子;ωt为第t次迭代的惯性权重。

粒子群优化算法在解空间搜索时,粒子的初始化对寻优的结果会产生很大的影响,有时会出现粒子在最优解附近“震荡”的现象,是一种过早陷入局部最优的“早熟”现象,调整学习因子和惯性因子也无法完全避免,而且这个最优解可能就是局部最优[13]。

1.2 SA_PSO算法

解决较复杂的搜索寻优问题,粒子群算法由于自身的局限性容易陷入局部最优,增加粒子群规模可以在一定程度上改善“早熟”现象,但并不能从根本上解决问题,且增大的计算量会降低算法效率。模拟退火(simulated annealing,SA)算法的思想最早是由METROPOLIS等提出的,Metropolis准则以一定的概率接受劣解,这样就使算法跳离局部最优的陷阱[14]。其基本思想是对当前解S1随机扰动产生一个新解S2,计算增量Δf=f(S2)-f(S1),若Δf<0,则接受S2作为新的当前解,S1=S2;否则计算S2被接受的概率exp(-Δf/T),即随机产生(0,1)区间上均匀分布的随机数r,若exp(-Δf/T)>r,则接受S2作为新的当前解,S1=S2,否则保留当前解S1。

利用SA算法对PSO算法进行改进,当PSO算法收敛到一个局部最优解时,可以利用SA的概率突跳,跳出局部最优,根据Metropolis准则,假定粒子i当前的位置Xi=(xi1,xi2,…,xid)作为个体最好位置pbesti=(pi1,pi2,…,pid),则pbesti采用式(2)进行更新:

pbesti(t+1)=

(2)

2 SAPSO_RBF预测模型的构建

2.1 标准RBF神经网络

BROOMHEAD等[15]将径向基函数(radial-based function,RBF)应用于神经网络的设计,并将低维空间的非线性问题转化为高维空间的线性问题。径向基神经网络是单隐层的前向网络,包括输入层、隐层和输出层,如图1所示。

图1 RBF神经网络结构

设输入向量Zi=[zi1,zi2,…,zin]T,i=1,2,…,m,径向基向量H=[h1,h2,…,hm]T,实际输出为Y=[y1,y2,…,yk]T,神经网络的隐层输出是输入向量与径向基函数中心的距离,径向基函数选择高斯函数,则隐层的输出为:

(3)

式中:tj为期望输出;yj为实际输出。

2.2 利用SA_PSO算法优化RBF神经网络

图2 算法流程图

RBF神经网络参数的设置对其整体性能起到很强的制约作用,而作为参数的网络隐层的中心向量Bi和标准化常数σi的求解是一个困难的问题,因此,利用SA_PSO算法用于神经网络的学习,对RBF神经网络进行优化,算法流程图如图2所示,具体步骤如下:①随机初始化种群中各个粒子的初始位置和速度,假定RBF神经网络模型具有InNum个输入层,HiddenNum个隐层,OutNum个输出层,则粒子的维度d=(InNum+2)×HiddenNum+OutNum;②模拟退火算法初始化,对于任何一个粒子,给定初始温度T1;③根据式(3)的均方误差计算每个粒子的适应度值,确定粒子的个体最优位置和粒子群的全局最优位置;④根据式(2)对粒子的个体最优位置进行更新,根据式(1)对全局最优位置进行更新;⑤利用SA_PSO算法进行迭代,得到一个全局最优解gbest;⑥以gbest为初始解,根据模拟退火算法的思想,利用rand函数给予最优位置一个扰动,并且设定阈值将扰动设置在一定范围之内,产生一个新的解greplace,如果greplace的适应度值优于gbest,则转向步骤⑦,否则转向步骤⑧;⑦利用轮盘赌的思想,将greplace随机替代种群中的一个粒子,令其当前位置和最优位置均为greplace,返回步骤⑤;⑧SA_PSO算法结束,将gbest作为神经网络训练的参数设置;⑨将通过SA_PSO算法优化后的RBF神经网络用于网络舆情的预测。

3 预测实验

3.1 样本数据处理

通过互联网获取2016年5月份“魏则西”事件的网络舆情数据,以百度指数为例,取2016年5月2日至5月31日的时间序列数据作为实验数据,用于模型的训练和预测,该事件时间序列趋势如图3所示。根据多次实验,可以利用前5天的时间序列数据来预测第6天的数据,采用滚动方法,以6天为一个周期,数据分为30组,取前15组的时间序列数据作为RBF神经网络的训练数据集,后15组的时间序列数据作为测试训练集。为了加快训练网络的收敛性,笔者利用Matlab的mapminmax函数对样本数据进行归一化处理,将原始数据映射到[0,1]区间内。

图3 魏则西事件百度指数趋势

3.2 参数设置

RBF神经网络采用单隐层的3层拓扑结构,为了实现对网络舆情的预测研究,笔者以6天为周期,用前5天的时间序列数据来预测第6天的舆情发展情况,因此输入层的节点数设置为5,输出层的节点数设置为1,将隐层的节点数设置为15,传递函数采用高斯函数,以标准RBF神经网络作为对比组,经过重复实验,当基宽函数σ设置为0.214时,预测结果拟合程度较好。

令粒子群算法中的cmax=3.0,cmin=0.5,最大迭代次数tmax=100,粒子群规模N=40,惯性权重ωmax=0.9,ωmin=0.3,粒子初始化位置在[-1,1]之间,粒子的初始化速度在[-1,1]之间;令模拟退火算法中初始温度T1=6 000,温度衰减指数λ=0.75。

3.3 仿真及结果分析

利用Matlab进行仿真实验,为了证明SA_PSO优化后的RBF神经网络有更好的预测效果,在构建SAPSO_RBF神经网络与预测模型的基础上,分别构建基于粒子群算法优化RBF的PSO_RBF神经网络预测模型、标准RBF神经网络预测模型、标准的BP神经网络预测模型[16]作为对照组。模型预测结果的拟合曲线如图4所示。

图4 预测结果对比

为进一步对比各模型的拟合优劣性,根据式(4),利用预测值与真实值的相对误差进行优劣判断,根据式(5)计算其平均值,结果如表1所示,其中tj为期望输出,yj为实际输出。

(4)

(5)

从拟合性能和预测精度指标来看,绝大部分的相对误差在8%以下,结果令人满意。SAPSO_RBF神经网络预测模型相对于其他预测模型的预测结果表现得更加优越。

从图4可以看出,标准RBF、标准BP神经网络预测模型的预测结构稳定性较差,预测精度上也有所欠缺;利用PSO优化RBF神经网络构建的预测模型,在预测精度上有所提升,相对于标准RBF网络,优化后的PSO_RBF神经网络舆情预测模型在预测效果上有一定的改善,但是经过重复试验发现,PSO_RBF神经网络的预测结果欠缺良好的稳定性,这主要是由于粒子群算法本身的不足,在迭代寻优中出现的“早熟”现象,使得预测效果浮动较大;SAPSO_RBF神经网络预测模型的拟合效果更好,相对误差也较小,而且通过重复实验发现,预测结果拟合程度高且波动率较小,具有更好的稳定性。实验结果表明,利用模拟退火算法优化粒子群算法可以有效地降低粒子群初始化随机性对预测结果带来的不确定性影响,由表1可以看出SAPSO_RBF神经网络预测模型的预测值的平均误差明显小于其他预测模型,分别为0.077 4、0.102 6、0.178 2、0.122 2。

表1 相对误差对比

仿真实验中4个预测模型的相对误差的曲线如图5所示,可以看出SAPSO_RBF神经网络的预测结果相对误差整体上更趋近于零。SAPSO_RBF神经网络预测模型适应度值的变化情况如图6所示,适应度值计算以SAPSO_RBF预测模型训练输出的拟合误差最小化为目标。

从模型的运行效率进行分析,4个模型的运行时长如表2所示,标准的RBF神经网络预测模型的时间在1 s左右,标准BP神经网络预测模型的时间在10 s左右,PSO_RBF神经网络预测模型和SAPSO_RBF神经网络预测模型的是时间在2 min左右,可以发现相对于基本的人工神经网络,优化后的RBF神经网络预测模型在运行效率上有一定的劣势,但是网络舆情的预测需要追求一定的准确率,花费一定的时长是可以接受的,运行的时间主要花费在粒子群算法的寻优过程中,而SAPSO_RBF与PSO_RBF的运行时长几乎一样,且预测的准确度有明显的提高。

图5 相对误差

图6 SAPSO_RBF适应度值的变化

模型SAPSO_RBFPSO_RBF标准RBF标准BP时长/s139.892139.6550.8949.039

4 结论

笔者以热点话题的百度指数作为网络舆情趋势预测的时间序列指标,构建SAPSO_RBF神经网络预测模型,同时构建PSO_RBF神经网络预测模型、标准RBF神经网络预测模型和标准的BP神经网络预测模型作为仿真实验的对照组。实验结果表明,利用粒子群算法寻优的思想优化RBF神经网络的连接权值,可以在一定程度上优化RBF神经网络预测效果,但是粒子群算法自身的缺陷会影响预测的稳定性和拟合优度,粒子群的随机初始化会对预测模型的寻优结果产生较大影响,利用模拟退火算法概率接受劣解的思想对粒子群算法进行优化,可以较好地改善粒子群算法“早熟”陷入局部最优的问题。因此,笔者建立SAPSO_RBF神经网络预测模型,利用Matlab编程进行仿真实验,将不同模型预测结果的拟合程度和相对误差进行比较,结果表明,笔者构建的SAPSO_RBF神经网络预测模型是有效的,且预测准确率较高。笔者的创新在于:将模拟退化算法和粒子群算法应用于RBF神经网络的优化,为网络舆情热度趋势的预测提供了一种有效的模型,但是由于网络舆情传播具有一定的随机性且影响因素较多,笔者的研究尚处于方法探索阶段,有待更深入的研究,以做到更为及时、准确地进行预测,防患于未然。

[1] 中国互联网络信息中心(CNNIC).中国互联网络发展状况统计报告[EB/OL].[2016-08-03].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201608/P020160803367337470363.pdf.

[2] 兰月新,曾润喜.突发事件网络舆情传播规律与预警阶段研究[J].情报杂志,2013,32(5):16-19.

[3] 王国华,曾润喜,方付建.解码网络舆情[M].武汉:华中科技大学出版社,2011:1-7.

[4] 苏创,彭锦,李圣国.基于不确定微分方程的网络舆情传播模型研究[J].系统工程理论与实践,2015,35(12):3201-3209.

[5] 杜智涛,谢新洲.利用灰色预测与模式识别方法构建网络舆情预测与预警模型[J].图书情报工作,2013,57(15):27-33.

[6] 吴鹏,杨爽,张晶晶,等.突发事件网络舆情中网民群体行为演化的Agent建模与仿真研究[J].现代图书情报技术,2015,31(z1):65-72.

[7] 王新猛.基于马尔可夫链的政府负面网络舆情热度趋势分析:以新浪微博为例[J].情报杂志,2015,34(7):161-164.

[8] 李彤,宋之杰.基于模型集成的突发事件舆情分析与趋势预测研究[J].系统工程理论与实践,2015,35(10):2582-2587.

[9] 魏德志,陈福集,郑小雪.基于混沌理论和改进径向基函数神经网络的网络舆情预测方法[J].物理学报,2015,64(11):44-51.

[10] 黄敏,胡学刚.基于支持向量机的网络舆情混沌预测[J].计算机工程与应用,2013,49(24):130-134.

[11] 周绍磊,周正.一种通用自动测试系统软件平台的设计与实现[J].计算机测量与控制,2003,11(7):525-527.

[12] KENNEDY J, EBERHART R. Particle swarm optimization[C]∥1995 IEEE International Conference on Neural Networks. [S.l.]: IEEE Service Center,1995:1942-1948.

[13] 王华秋,曹长修.基于模拟退火的并行粒子群优化研究[J].控制与决策,2005,20(5):500-504.

[14] 张华强,张晓燕.基于混沌理论和LSSVM的蒸汽负荷预测[J].系统工程理论与实践,2013,33(4):1058-1066.

[15] BROOMHEAD D S, LOWE D. Multivariable functional interpolation and adaptive networks[J]. Complex Systems,1988, 2(3):321-355.

[16] 赵磊,王松.基于BP神经网络的舆情热度趋势仿真模型研究[J].情报学报,2016,35(9):989-999.

CHEN Fuji:Prof.; School of Economics and Management, Fuzhou University, Fuzhou 350108, China.

Research on the Prediction of Network Public Opinion Based on SAPSO_RBF Neural Network

CHENFuji,HUANGYaju

The characteristics of the development of network public opinion are complex and time-varying. Therefore, constructing the time series analysis model to forecast the development of network public opinion has practical significance. In order to improve the prediction accuracy of the radial basis function neural network model, we optimize the RBF neural network by using the particle swarm optimization algorithm optimized by simulated annealing algorithm and then construct network public opinion forecasting model of SAPSO_RBF neural network. The simulation and analysis of "Zexi Wei" event were carried out and the experimental results show that this model has better superiority and stability in prediction performance.

network public opinion; RBF neural network; particle swarm optimization; simulated annealing

2095-3852(2017)04-0422-05

A

2017-02-09.

陈福集(1954-),男,福建泉州人,福州大学经济与管理学院教授,主要研究方向为网络舆情.

国家自然科学基金项目(71271056).

G350

10.3963/j.issn.2095-3852.2017.04.009

猜你喜欢

模拟退火舆情粒子
结合模拟退火和多分配策略的密度峰值聚类算法
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
基于改进模拟退火的布尔函数生成算法
基于膜计算粒子群优化的FastSLAM算法改进
Conduit necrosis following esophagectomy:An up-to-date literature review
改进模拟退火算法在TSP中的应用
基于粒子群优化极点配置的空燃比输出反馈控制
消费舆情
舆情
舆情