APP下载

基于校园网络负载特性的数据分析与研究

2020-01-10李业谦熊红云

现代计算机 2019年34期
关键词:学生宿舍楼宇无线网络

李业谦,熊红云

(1.中山大学南方学院,广州 510970;2.中南大学自动化学院,长沙 410083)

0 引言

随信息技术的发展,现大部分大学都建立校园网。本文以某目标学校为例,学校已实现有线网络与无线网络全覆盖。建校初期主要以有线为主,后来逐渐随着学校信息化建设需求,改为无线网络为主。学校区域分布明确,主要分为学生宿舍区域、教学实验区域、行政办公区域以及其他场馆等区域。

学校采用目前很多高校采用五层无线网络框架结构,移动设备层、接入层、汇聚层、核心层、出口应用层。其中移动设备层主要是移动终端,包括个人电脑、移动电话等;接入层主要为移动设备层提供无线网络接入,典型设备如无线路由或AP;汇聚层是楼宇或者片区的信息汇聚点,为接入层提供数据汇聚、传输、管理等服务;核心层主要功能是实现骨干网络之间的优化传输;应用层为管理者提供分析与审计等。

1 网络负载数据的采集

SNMP(Simple Network Management Protocol,简单网络管理协议)运行在ISO/OSI参考模型的应用层,目前主流的网络设备都支持SNMP协议。网络技术人员可以使用SNMP对网络设备的运行情况进行监管,通过SNMP反馈的状态事件信息,能及时发现网络中存在的问题并处理。因此为了得到精准的数据,在汇聚设备的启用SNMP协议,实时收集汇聚设备的状态,包括各个端口的上行和下载的数据包数量,从而进行统计计算分析。

接入节点网络负载的采集的包含SNMP数据报文的数据包,在SNMP管理系统中规定了SNMP报文是由管理站和代理这两部分进行管理信息交换。其中SNMP报文格式由公共SNMP首部、get/set首部和trap首部与变量绑定三部分组成。同时将读取的SNMP数据包进行解析,按照网络节点编号为关键值进行存储,构建智慧校园无线网络接入节点不同时间、负载等信息的数据库。

2 基于大数据的网络负载建模与算法研究

为了统计了解各个楼宇、每层接入的网络负载情况,在汇聚的端口进行了实时状态统计,由于学校内主要的网络负载在学生群体、教学实验区域和图书馆区域,本次数据主要针对这三部分区域网络负载进行采集,并分别计算各个栋楼宇的网络上行和下行的数据包数据进行统计分析。

2.1 校园无线网络负载建模与分析算法设计

为了更好说明智慧校园无线网络负载特性,以及简化模型,提出如下假设:

(1)整个无线网络的主体拓扑结构相对不变;

(2)智慧校园无线网络中的用户数是不变的;

(3)在特定时间条件下,每个用户只容许接入一个无线设备;

(4)在一定的时间范围内,用户的空间位置相对固定;

(5)无线网络中的接入节点可容许接入数是有上限要求;

(6)在特定时刻用户能容许上传或上传数据;

(7)无线网络中的楼宇数是固定的。

基于上述提出的假设,下面提出与智慧校园无线网络相关的定义与模型。

记C智慧校园无线网络,于是可以建立加入C的楼宇集合:

其中b↔C表示楼宇b属于网络C。不失一般性,设学校无线网络中内有m栋楼宇,于是无线网络楼宇集合可以表示为B={b1,b2,…,bm}。

假设所有楼宇的层数相同,部署接入节点个数相同,可以建立某楼宇bi的接入节点集合:

设某个特定的时间范围内T(T∈[tstart,tend]),接入节点需要上传的数据量与下载数据量随时间之间的函数关系分别为q(t),p(t),于是可以得到该特定事件范围内接入节点需要上传与下载总的数据量:

定义1:(接入节点平均负载,Access Points Aver⁃age Load)对于某时间T(T∈[tstart,tend])接入节点平均负载(LAP)即为上传数据量(QAP)与下载数据量(PAP)的总和与时间的比值。其计算方法:

假设总用户在时间T内通过AP需要上传与下载数据量是恒定的,即总用户上传与现在的带宽恒定。不妨记为BWQ,BWP,于是公式(4)可以进一步转化为:

定理1:如果每个用户的上传与下载带宽恒定且相同,则接入节点平均负载与接入人数成正比。

证明:AP节点接入的总用户数按照上传和下载可以表示为:

其中Nq,Np为上传用户总连接数。

因为每个用户的上传与下载带宽恒定且相同,不失一般性,记为bw。于是用户在时间T内通过AP需要的带宽可以表示为:

将公式(7)代入公式(5)可以得到:

将公式(6)代入公式(8)得到:

证毕。

根据定义1和上述描述,可以得到楼宇在热定时间的平均负载。

定义2:(楼宇平均负载,Network Building Average Load)对于某时间 T(T∈[tstart,tend])楼宇平均负载(LB)即为上传数据量(QB与下载数据量(PB)的总和与时间的比值。其计算方法:

上述对接入节点与楼宇的平均负载进行了建模,下面针对AP负载大数据数学描述。假设所有的AP负载大数据为BD={bd1,bd2,…,bdf}其中任意一条数据可以描述为:

其中APID,nAP,bAP,trecord,bwAP分别表示AP的编号、接入用户数、属于楼宇编号、时间、带宽开销。

2.2 不同时间维度无线网络负载特性计算

为了统计每个接入节点、楼宇在不同时间片段(K)的网络负载,根据实际分析时间片可以分为三种情况:

结合上述分析,为了减少数据检索过程数据的搜索的次数,基于禁忌搜索算法提出如下算法,具体步骤如下:

Step1:根据用户需求输入需要分析网络负载的接入节点与楼宇编号,同时输入统计时间需求T;

Step2:根据公式(12)计算得到,时间片段的大小,并将分析时间区间T划分为多个片段;

Step3:循环逐条读取大数据BD

Step4:判断信息是否为禁忌表信息,如果是返回第三步,如果不是进行下一步操作;

Step5:判断无线网络负载数据bdi是否输入接入节点ID一直,如果不一致跳转第三步;如果相同进行下一步;

Step6:将当前无线网络节点信息中的负载信息,相对应的存入时间片段内;

Step7:根据bdi相对应的楼宇信息,判断是否为目标楼宇接入节点的网络负载信息,如果是则进行下一步,如果不是跳转到第9步;

Step8:将相应的网络负载计算存入对应目标楼宇的网络负载信息集合中

Step9:按照公式(9)等公式计算目标接入节点的网络负载;同时将该信息存在禁忌表中;

Step10:当大数据BD数据读取完毕后,输出目标时间段中目标楼宇与接入节点的网络负载信息。

2.3 空间维度无线网络负载特性计算

在学校里,每栋功能楼宇相对比较独立,学校会设置不同的区域,如学生公寓、实验教学、图书馆等楼宇。因此将校园中无线网络楼宇分为多个子区,同时基于接入节点网络信息,对接入节点按照楼宇进行分类。接入节点ap与楼宇b之间的函数关系aij(api,bj)的表示:

于是根据公式(13),以接入节点为行,楼宇为列构建其隶属关系矩阵:

为得到特定时刻t智慧校园的无线网络的负载特性,首先将时刻t进行分辨率细化,在[t-δ,t+δ]即视为时刻t;然后结合网络实施的框架,以楼宇为目标,通过大数据统计所有楼宇在时刻t的无线网络负载。根据公式(13)和公式(14)可知设计如表1的空间维度无线网络负载特性算法。

表1 空间维度无线网络负载特性算法

3 基于目标校园时空特征数据下的无线网络负载实验

3.1 基于特定时间网络流量实验结果分析

网络流量采集设备通过定时对设备进行流量数据进行采集,然后计算出一定时间的平均流量,形成网络设备节点流量情况。本文为了更好地展现实验结果,分别通过按天、周和年进行分析对比。通过流量图形化界面展示的节点网络中指定端口的带宽和网络线路负载情况,有利于网络管理人员通过查看各个指定的关键节点的流量和负载使用情况,便于对节点作出相应的预警机制。为此为了分析和验证结果,采集了目标学校一年的网络用户数据包,用于实验。

图1-图3分别是通过数据采样并进行数据可视化处理得出某关键节点流量情况,并按天、周、年的流量数据做了可视化展示,其中绿色区域为下行负载,蓝色线下区域代表是上行负载情况。根据按天和周流量图不难看出此关键节点每天网络负载都出现高峰期与低谷期,其中网络高峰期集中在 12:00-24:00,且 12:00-14:00 和 17:30-20:00 以及 21:30-24:00 为全天网络负载最高峰,而凌晨00:00-08:00为全天网络负载相对低,尤其是凌晨3:00-07:00网络为全天最低。根据经验,一所学校网络主要负载在学生宿舍出口区域,根据流量的情况可以估算在宿舍区域上网用户数量。从负载流量图可以看出网络负载高峰期为学生集中使用网络的时间段,从周统计总负载流量看出周一至周五的每天有网络负载三个高峰期,出现高峰期主因学生下课在宿舍使用网络,而周末也类似,但只有一个高峰期与低谷期,主要由于学生在周末白天和晚上均无需上课,所以白天和晚上用网都处于平缓的高峰期。

图1 按天统计总负载流量

图2 按周统计总负载流量

根据按年的流量负载图,可以看出有两个明显的低谷期,分别为7月下旬-8月底和1月下旬-3月初,根据学校的惯例都可以判断出此两个时间段为学生放寒暑假,学生基本离校,用网人数固然很低。但细心留意不难发现,1月下旬-3月初流量基本为0,而7月下旬-8月底尚有小量流量,通过分析得出暑假期间尚有部分学生留校工作和学习,而寒假基本都回家过年了。另外在10月初也有一个明显的低谷期,这正是学校放国庆长假,学生大多放假外出或离校,网络负载自然下降。

根据上述的网络负载流量情况说明和分析,进一步验证网络具有特定的时间性。

3.2 基于空间特征的无线网络负载的实验分析

为了验证无线网络负载具有空间特性,通过采集目标学校同一天不同区域的大量数据进行流量负载进行分析验证。为了说明空间区域特性,本文通过对教学实验区域、图书馆、学生宿舍三个区域进行对比分析。

图4 目标学校教学实验区域一天流量图

图5 目标学校图书馆区域一天流量图

图6 目标学校某栋学生宿舍一天流量图

图4-图6为目标学校三个区域的负载情况,颜色的深浅代表当前时间的网络负载情况,绿色代表当前节点负载轻,红色代表当前节点负载重。从图可以看出随时间的变化网络负载变化,且三个区域在同一个时间段,负载情况发生不一致的变化,根据三区域的对比分析得到:

(1)每天22:00至次日7点教学实验区域以及图书馆已经停止对外服务,此时教学实验区域和图书馆网络负载最低;

(2)学生去图书馆网络比去实验教学区域使用网络要早,意味着不少学在7:30前到达图书馆,而8:00后学生才开始上课并使用网络。

(3)明显看出当教学和图书馆高峰期时,学生宿舍网络使用迎来小低谷,而学生宿舍网络高峰期间,在教学实验和图书馆却是低谷期,学生使用网络有明显的时间与空间特性。

(4)学生离开教学实验区或图书馆等公共区域基本一般会回宿舍区域继续网络,一般学生会在晚上24:00开始就寝,网络负载所需带宽开始下降。

(5)一般上午早起的学生会去图书馆或去上课,若上午没课安排,一般会稍微晚起些,为此宿舍区域上午06:00-09:00的网络负载不高且上升比较缓慢。

图7 目标校园区域上午10-12点网络负载热力图

针对目标学校的无线网络负载情况进一步分析说明校园无线网络具有空间特性,为此对目标学校的某天上午 10:00-12:00 以及晚上 21:00-23:00 这两个时间段进行数据分析得出,在上午10:00-12:00时间段,从图7的热力图看出,教学试验区网络负载相对于图书馆和学生宿舍区域重,而图书馆区域也比学生宿舍区域重,学生宿舍区域相对负载比较轻。而反之在晚上21:00-23:00,从图8热力图看出,学生宿舍区域为网络负载最重,图书馆相对较轻,而教学试验区域网络负载为最轻。

从热力和流量图结果,给网络技术人员或网络管理人员作为对不同区域不同时间网络负载情况进行网络均衡调整提供有力的参考价值。

4 结语

本文针对智慧校园无线网络负载的时空特性,以学校五层网络框架结构为基础条件,结合SNMP协议设计了无线网络负载的大数据采集方法。通过大数据的分析,得出了目标校园无线网络负载实际存在的时空特性,并进行相关的数学描述,为下一步实验的建模提供了重要的依据。

图8 目标校园区域晚上21-23点网络负载热力图

猜你喜欢

学生宿舍楼宇无线网络
基于无线网络的高速公路电缆防盗报警系统设计
莫里永学生宿舍
——贯穿建筑的连续上升走廊
基于物联网的智能楼宇顶层架构设计
通信生产楼宇建设项目造价问题分析
时间触发卫星无线网络同步仿真研究
聚类分析和神经网络的无线网络流量预测研究
上海市静安区党组织实现全覆盖
楼宇党建“鄞领计划”发布
吉田寮:亚洲最破的学生宿舍
无线网络安全漏洞及防范策略