APP下载

基于组合模型的网络流量预测

2016-10-18王雪松李苏洋

微型电脑应用 2016年6期
关键词:网络流量学习机训练样本

王雪松,李苏洋

基于组合模型的网络流量预测

王雪松,李苏洋

网络流量是多种因素综合作用的结果,具有一定的混沌性和非线性,为了对网络流量将来变化趋势进行准确预测,提出了一种网络流量的组合预测模型(PHR-ELM)。分别采用C-C算法和Cao算法对原始网络流量数据进行混沌分析,构建极限学习机的训练样本集和测试样本集,然后将训练样本输入到极限学习机进行学习,建立网络流量预测模型,最后测试样本集输入到模型中进行单步和多步预测的验证性实验。结果表明,PHR-ELM可以反映网络流量的混沌性和非线性变化趋势,获得了高精度的网络流量预测结果,且预测结果要优于其它模型。

网络流量;组合建模;混沌特性;极限学习机;相空间重构

0 引言

随着网络用户数量的不断增加,以及各种网络业务增加,网络阻塞的频率日益增加,如何保证网络正常工作面临巨大的挑战[1,2]。网络流量预测是解决该问题的一种途径,其预测结果可帮助人们提前知道网络的变化信息,因此如何提高网络流量的预测精度直接影响网络管理水平的高低[3]。

为了更好的保证网络正常运行,防止网络拥塞现象的出现,人们通过各种途径、采用多种技术对网络流量预测进行了探索和研究,当前使用最为广泛的方法为时间序列分析法[3],它们按时间收集网络流量变化的历史数据,然后采用线性回归方法对数据进行分析,找出其中隐藏的变化规律,对于小规模的网络,它们具有建模速度快、效率高,预测结果可靠等特点[4,5],然而现代网络的规模大,使得网络流量具有强烈的非线性,时间序列分析法仅能描述线性变化趋势,无法实现网络流量的非线性建模与预测,局限性明显[6]。为了解决传统时间序列方法存在的问题,学者们引入了一些非线性预测算法对网络流量数据进行建模与分析,如BP神经网络、RBF神经网络、支持向量机、最小二支持向量机等,取得了更好的网络流量预测效果[7-10]。对大规模网络流量数据,支持向量机以及最小二支持向量机的训练时间长,无法实现网络流量的在线预测[11];BP神经网络、RBF神经网络要经过多次迭代才能确定网络结构,收敛速度慢,且参数难以确定[12]。随着网络流量预测研究的不断深入,人们发现网络流量具有一定的混沌特性,因此在网络流量预测建模,如何将混沌理论与非线性理论结合起来以提高网络流量预测的准确性,是当前主要研究的方向[13,14]。

极限学习机(extreme learning machine,ELM)是一种根据Moore-Penrose广义逆矩阵理论的神经网络,通过线性方程组对训练迭代进行求解,一次可以完成训练,不存在传统神经网络的问题,且具有支持向量机的预测性能[15]。本文将混沌理论和ELM组合在一起,提出一种网络流量预测的给合模型(PHR-ELM),首先采用C-C算法和Cao算法构建网络流量的训练样本集和测试样本集,然后采用极限学习机对训练样本集和测试样本集进行学习和性能测试,验证PHR-ELM的网络流量预测的有效性和优越性。

1 PHR-ELM的网络流量预测模型

1.1混沌理论

网络流量受到网络价格、用户上网时间以及上网人心理因素的影响,且因素之间互相影响,导致网络流量变化一定的混沌特性,要进行网络流量准确建模,首先就要分析其混沌性,重建模学习样本。设网络流量数据为{x(tj), j=1,2,…,n},那么网络流能够重构为公式(1):

式中,τ为延迟时间,m为嵌入维数。

1.1.1C-C算法

(1)本文选择C-C算法对网络流量的τ进行分析,得到网络流量数据之间的时间相关性,设X(i)=[x(i), x(i+τ),L ,x(i+(m-1)τ)]和X(j)=[x(j), x(j+τ),L ,x(j+(m-1)τ)]分别表示相空间的相邻点,则两点间的距离为公式(2):

采用关联积分描述点对数所占比例,具体为公式(3):

公式(3)中,r为临界半径为;N为序列规模;H(·)表示Heaviside函数,具体为公式(4):

全部网络流量被划为t个子序列,得到它们的统计量为公式(5):

设ΔS(m,t)=max[S(m, rj,τ)]-min[S(m, rj,τ)],则有公式(6):

公式(6)中,l和k分别表示可能的最大和最小嵌入维数。

1.1.2CAO算法

采用Cao算法对网络流量数据的嵌入维数m进行分析,设Xi(m+1)和Xn(i,m)(m+1)分别表示第i个重构向量Xi(m+1)和其最近邻,则有公式(7):

1.2极限学习机(ELM)

公式(8)中,k为训练集规模;αi为输入权值,bi为偏差;βi为输出权值。

对公式(8)进行矩阵变换,可以得到公式(9):

公式(9)中,Tk为输出向量;Hk为神经元矩阵,其定义如公式(10):

一般条件下,K>>L,通过式(10)可以得到输出权值为公式(11):

根据

iβ就可以确定ELM,然后采用ELM对网络流量训练样本进行重新学习,建立如下的网络流量预测模型为公式(12):

1.2网络流量的预测过程

(1)对一个具体网络服务器,采用数据采集软件收集原始网络流量。

(2)网络流量具有一定的波动性,为了消除数据值波动过大带来的负面作用,其对原始数据进行预处理,具体为

公式(13):

公式(13)中,Ex和σx分别为网络流量的均值和标准差。

(3)分别采用C-C算法和Cao算法对原始网络流量数据进行混沌分析,构建极限学习机的训练样本集和测试样本集。

(4)训练样本输入到极限学习机进行学习,建立网络流量预测模型。

(5)测试样本集输入到模型中进行单步和多步预测的验证性实验。

2 网络流量的预测结果测试

2.1网络流量数据

为了分析PHR-ELM的网络流量预测效果,选择一个主节点路由器的每小时网络流量作为研究对象,具体如图1所示:

图1 仿真对象

选择最后100个数据对PHR-ELM的泛化能力进行分析,其它样本作为训练样本集建立基于PHR-ELM的预测模型。

2.2重建网络流量样本

分别采用C-C算法和Cao算法对图1中的网络流量进行分析,它们仿真结果变化曲线如图2所示:

图2 网络流量的τ和m确定

2.3单步预测性能分析

将训练样本集输入到ELM进行学习,并建立单步预测模型,测试样本的预测结果如图3所示:

图3 PHR-ELM的预测结果

从图3可以看出,PHR-ELM可以很好的跟踪网络流量变化态势,预测值与网络流量值之间的偏差很小,可以忽略不计,从而获得较高的网络流量预测精度高,初步验证了PHR-ELM应用于网络流量预测中的有效性。

2.4多步预测性能分析

网络流量建模的目的是对网络将来状态进行描述,而单步预测只是一种短期预测方式,无法对将来的网络流量进行刻画,为此要进行网络流量的多步预测性能分析,本文进行提前2步和4步预测实验,结果如图4(a)、(b)所示:

图4 PHR-ELM的多步预测结果

对图4(a)、(b)的预测结果进行分析发现,随着预测步长的增加,PHR-ELM的网络流量预测误差越来越大,但预测误差仍然还是控制在实际要求的范围内。

2.5与当前其它模型的性能比较

为了分析PHR-ELM的结果更具说服力,选择当前预测性能较好的网络流量预测模型进行对照测试,具体为:极限学习机+没有混沌分析(ELM)、PHR-BPNN、文献[14]和文献[15]模型,采用平均百分相对误差(MAPE)进行衡量,其定义如公式(14):

公式(14)中,n为测试样本的数量。

PHR-ELM与对照模型预测结果的MAPE如表1所示:

表1 与其它网络流量预测模型的误差比较

对表1模型的MAPE进行对比分析可以发现,与其它模型相比,PHR-ELM有效降低了网络流量的预测误差,获得了更高的预测精度,验证了PHR-ELM的优势。

3 总结

网络流量预测可以帮助网络管理人员提前了解网络流量的态势,有利于防止网络阻塞,一直是学者们关注的焦点,本文提出一种基于PHR-ELM的网络流量组合预测模型,首先挖掘原始网络流量数据的混沌特征,对数据进行重建,然后采用极限学习机挖掘网络流量的非线性变化特征,建立网络流量预测模型。验证性实验结果表明:PHR-ELM可以获得高精度的网络流量预测结果,且相对于其它预测模型,具有比较明显的优势,可以为网络管理员提供价值的信息。

[1] Nguyen T T, Armitage G. A survey of techniques for internet traffic classification using machine learning [J]. IEEE Communications Surveys and Tutorials, 2008,10(4): 56- 76.

[2] 姜明,吴春明,张曼,胡大民. 网络流量预测中的时间序列模型比较研究[J]. 电子学报, 2009, 37(11):2353-2358

[3] Callado A, Keu R J, Sadok D, et a1. Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.

[4] 董梦丽,杨庚,曹晓梅. 网络流量预测方法[J]. 计算机工程. 2011, 37(16):98-100

[5] 高波,张钦宇,梁永生,等. 基于EMD及ARMA的自相似网络流量预测[J]. 通信学报, 2011, 32(4): 47-56.

[6] Jin Yi, Zhou Gan. Theoretical mean-variance relationship of IP network traffic based on ON/OFF model [J]. Article Science in China Series F: Information Sciences, 2009,52(4): 645-655.

[7] 赖锦辉,梁松. 一种新的基于GCS-SVM的网络流量预测模型[J]. 计算机工程与应用, 2013, 49(21): 75-78.

[8] 赵振江. 基于PSO-BP神经网络的网络流量预测与研究[J]. 计算机应用与软件, 2009, 26(1): 218-221.

[9] 姚奇富,李翠凤,马华林,张森. 灰色系统理论和马尔柯夫链相结合的网络流量预测方法[J]. 浙江大学学报(理学版), 2012, 34(4):396-400.

[10] 李明迅,孟相如,袁荣坤. 融合提升小波降噪和 LSSVM的网络流量在线预测[J]. 计算机应用, 2012,32(2):340-342,346.

[11] 魏永涛,汪晋宽,王翠荣,张琨. 基于小波变换与组合模型的网络流量预测算法[J]. 东北大学学报(自然科学版), 2011, 32(10):1382-139.

[12] 王雪松、梁昔明. 基于BPSO-RBF神经网络的网络流量预测[J]. 计算机应用与软件, 2014, 31(9):102-105

[13] 王雪松,赵跃龙. 遗传算法优化延迟时间和嵌入维的网络流量预测[J], 计算机工程与应用, 2014, 50(12):66-70

[14] 罗赘骞,夏靖波,王焕彬. 混沌-支持向量机回归在流量预测中的应用研究[J]. 计算机科学, 2009, 36(7):244-246.

[15] 党小超,郝占军. 季节周期性Elman网络的网络流量分析与应用[J]. 计算机工程与应用, 2010, 46(28): 98-101.锦军, 王执铨. 一种基于混沌特性的网络流量改进预测算法. 兵工学报, 2007, 28(11): 1346-1350.

Network Traffic Prediction by Using Combination Model

Wang Xuesong1, Li Suyang2
(1.Department of Electronic Information, FoShan Polytechnic College, FoShan 528137, China;2. Faculty of Electromechanics Engineering, Guangdong University of Technology, Guangzhou 510006, China)

Network traffic is the result of many factors, which is chaos and nonlinear. A combined prediction model of network traffic is proposed to predict the future trend of network traffic accurately by using combination model. C-C algorithm and Cao algorithm are separately used for chaotic analysis of original network traffic data to construct training set and test set, and then training samples are input into extreme learning machine to learn and establish prediction model, finally, test samples are input into the model to verify the performance by using single step and multi-step prediction experiments. The results show that PHR-ELM can reflect the network traffic chaos and nonlinear trend, predict the results of network traffic with high accuracy, and the prediction results are better than other models.

Network Traffic; Establish Model; Chaotic Characteristics Extreme Learning Machine; Phase Space Reconstruction

TP391

A

1007-757X(2016)06-0011-04

2015.12.02)

广东工业大学校博士启动基金资助项目(405105015);佛山职业技术学院科研专项(KY2013G04).

王雪松(1974-),男,佛山职业技术学院,电子信息系,副教授,硕士,研究方向:神经网络、粒子群算法、物联网应用,佛山,528137

李苏洋(1974-),女,广东工业大学,电机工程学院,讲师,博士,研究方向:RFID研发、数值优化设计,广州,510006

猜你喜欢

网络流量学习机训练样本
基于多元高斯分布的网络流量异常识别方法
基于神经网络的P2P流量识别方法
人工智能
基于极限学习机参数迁移的域适应算法
AVB网络流量整形帧模型端到端延迟计算
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
宽带光谱成像系统最优训练样本选择方法研究
基于稀疏重构的机载雷达训练样本挑选方法
一种基于AdaBoost的极限学习机分类方法