APP下载

基于运营商网络的大带宽违规分析检测研究

2019-09-02汪襄南胡学良中讯邮电咨询设计院有限公司北京100048

邮电设计技术 2019年8期
关键词:赋值IP地址数据包

田 园,汪襄南,胡学良(中讯邮电咨询设计院有限公司,北京100048)

1 研究背景及意义

互联网和信息技术的发展在经济和生活的各个领域正在迅速普及,其地位日益重要,整个社会对网络的依赖程度越来越大。与此同时,也产生了各种各样的问题。网络带宽的违规私接日益猖獗。这种不正当市场竞争不仅严重损害各大运营商的利益,而且不法分子还可能利用私接宽带发送垃圾邮件、搭建不良信息网站、甚至从事网络违法活动,给网络安全监控及治理带来了不便和难题。能否通过监控分析用户流量数据,自行发现违规行为,从源头上扼制违规私接的发生,已成为各大运营商关注的重点。

2 大带宽违规

IDC机房正常业务模式为宽带用户通过公网请求访问IDC机房内的服务器业务,IDC服务器给予应答,具体如图1所示。

所谓大带宽违规,则是宽带用户通过某IDC机房出网访问互联网上其他资源,IDC机房内某用户将带宽引出,为其他宽带小区提供转租。

下面以北京联通和某省联通、某省电信IDC机房为例,讲解大带宽违规私接时宽带用户访问互联网数据包流向。私接方通过某省电信为用户做接入服务,以某省电信到某省联通,再到北京联通建立VPN通道,使得某省电信接入用户的访问互联网流量实际通过北京联通IDC机房作为网络出口,帮助了某省电信宽带市场的发展,影响当地联通宽带及楼宇专线等业务发展,具体如图2所示。

图1 IDC机房正常业务模式图

图2 大带宽违规示意图

3 大带宽违规的分析及检测

3.1 数据获取的实现

实现大带宽违规私接的分析检测,需获取数据中心的全部网络流量,并在此基础上,利用深度数据包和大数据技术,进行流量的分析和检测。

网络流量数据可以通过数据分流提取和代码植入等方式获取。

代码植入方式是在数据中心所有客户端网页中嵌入代码,以监测访问客户网络的流量情况,然后将网站访问情况反馈至分析系统。数据分流提取方式是在运营商的数据中心网络出口部署数据分流提取监测设备,并将分流提取出的流量送至分析系统处理。鉴于运营商网络的数据中心出口带宽较大,客户众多,数据分流提取方式更为可行。

3.2 大带宽违规的分析方法

3.2.1 IDC机房向外访问流量

在不考虑IDC机房存在CDN服务器的情况下,传统IDC业务模式为终端用户通过公网请求访问IDC机房内的服务器业务,不会存在IDC机房的服务器向外网请求访问业务的情况。如存在大量从IDC机房内部服务器发出的向外访问的请求,则怀疑此IDC用户流量具有公众业务流量的特征,认为存在违规嫌疑(见图3)。

图3 IDC机房异常向外访问流量图

3.2.2 VPN流量及VPN流量成分

如果发现某IDC机房用户VPN隧道的流量较多,且VPN隧道流量中存在大量其他运营商的IP地址,或者IP地址所产生的流量非常大,这都是非正常VPN业务,可以认为存在违规嫌疑(见图4)。

图4 VPN隧道流量示意图

3.2.3 向外访问的特殊应用

一般而言,IDC用户业务模式相对统一。如某IDC用户业务为传统Web网站服务,则其服务器发出的流量多为Http流量;又如某IDC用户业务为视频服务,则其服务器发出的流量协议多为P2P协议。如果IDC机房内某用户向外访问的流量中,应用协议类型较多,且多为QQ、微信、购物、游戏等应用,则认为其具有终端用户的访问特征,存在违规嫌疑(见图5)。

图5 向外访问流量成分图

3.3 大带宽违规的检测手段

首先对机房向外访问流量、机房向外访问HTTP⁃GET数量、VPN疑似流量占比、异常应用统计等4个维度进行统计分析,分别加权打分;然后根据分值,对疑似私接IP进行整体汇总排名与审核。

3.3.1 机房外访问流量排名

“机房外访问流量”即为IDC机房内的服务器,主动向机房外部、公网上的站点发起的访问流量。大带宽违规检测的手段之一是针对此类流量进行排名、展示。可基于对应服务器IP(即其业务IP),进行外访流量统计与TOP100排名,前30个IP赋值疑似度60%,后70个IP赋值疑似度40%,如果发现有非本运营商的IP,其疑似度赋值直接提升至80%。

3.3.2 机房外访HTTPGET数据包数量排名

“机房外访HTTPGET数据包数量”即为IDC机房内的服务器主动向机房外部、公网上的站点发起的HTTPGET访问数据包总量。可基于对应服务器IP(即其业务IP),进行外访HTTPGET数据包数量统计与TOP100排名,前30个IP赋值疑似度60%,后70个赋值疑似度40%,如果发现有非本运营商的IP计入,其疑似度直接提升至80%。

3.3.3 VPN疑似流量占比排名

基于服务器业务IP,考查VPN流量在总流量中的占比,占比高于96%的,计入VPN疑似流量占比TOP100。VPN占比的计算公式如下。

VPN占比=VPN总流量/(进总流量+出总流量)

计入VPN疑似流量占比TOP100的IP,赋值疑似度75%,如果发现有非本运营商的IP计入,疑似度直接提升至85%。因VPN涉及到内外两层IP地址,外层IP用来判断本运营商的合法性,内层IP地址用来判断其他运营商IP归属,2种归属信息均需展示。

3.3.4 异常应用统计排名

通过识别分析IDC机房内某个服务器的业务IP流量中的QQ账号、邮件账号和UA数量,找出“1个IP承载多个应用账号标识”的IP信息,按照应用标识数量(如QQ账号、UA数量等),进行TOP100排名、展示。计入TOP100的IP,赋值疑似度75%,如果发现有非本运营商的IP计入,疑似度直接提升至85%。某些IP可能涉及到内外两层IP地址,这种情况下,内层IP地址需按照是否归属于其他运营商进行判断,外层IP地址需按照是否是本运营商的合法IP进行判断,2种归属信息均需展示。

3.3.5 疑似IP汇总审核

前述的4个分析维度,疑似度在60%以上的IP均列入疑似IP汇总表,按疑似度做TOP50排名。若有IP在几个维度之间交叉出现的,每交叉出现一次,对比取其最高的疑似度值,并在此基础上增加5%的疑似度,将结果纳入汇总表。最终,对疑似违规私接的IP地址疑似度重新排名,排名越靠前,违规的疑似度越大。

4 结束语

本文通过利用DPI及大数据技术,引入大带宽违规私接的监测模型,深度分析客户流量特征,辅助判断客户是否存在疑似违规接入的行为。大带宽违规私接的识别,为规范市场,治理客户业务提供了直观的技术支撑手段。

猜你喜欢

赋值IP地址数据包
二维隐蔽时间信道构建的研究*
民用飞机飞行模拟机数据包试飞任务优化结合方法研究
铁路远动系统几种组网方式IP地址的申请和设置
C#串口高效可靠的接收方案设计
强赋值幺半群上的加权Mealy机与加权Moore机的关系*
算法框图问题中的易错点
公安网络中IP地址智能管理的研究与思考
利用赋值法解决抽象函数相关问题オ
《IP地址及其管理》教学设计
学生为什么“懂而不会”