APP下载

NFV下自适应诊断策略的运用

2019-01-10云龙,阳志明

移动通信 2019年12期

【摘  要】NFV技术降低了运营商组网的成本,实现了网络的快速弹性部署,但同时也带来了诸多问题。为了解决网元分层解耦之后故障定位和故障修复变得复杂,NFV网络运维难度增加的问题,提出了一种自适应回环诊断算法。该算法基于自适应诊断策略,针对各类多网元网络进行故障诊断的特性,利用MANO的集中管控,实现对VNF层故障的高效诊断。该算法理论上能达到100%的诊断效率,并且无论系统中有多少个VNFC发生故障都能准确进行定位。

【关键词】NFV;MANO;VNF;自适应诊断;回环诊断算法

doi:10.3969/j.issn.1006-1010.2019.12.016      中图分类号:TN929.5

文献标志码:A      文章编号:1006-1010(2019)12-0084-05

引用格式:云龙,阳志明. NFV下自适应诊断策略的运用[J]. 移动通信, 2019,43(12): 84-88.

Application of Adaptive Diagnosis Strategy in NFV

YUN Long, YANG Zhiming

(China Telecom Intelligent Network and Terminal Research Institute., Guangzhou 510630, China)

[Abstract] NFV technology reduces the cost of operator networking and enables a rapid and flexible network deployment, while it also brings some challenges. Since the hierarchical decoupling of network elements complicates fault location and repair and increases the difficulty of NFV network operation and maintenance, an adaptive loopback diagnostic algorithm is proposed to solve these problems. The proposed algorithm is based on an adaptive diagnosis strategy, and performs fault diagnosis for various types of multi-element networks, and an efficient diagnosis of VNF layer faults is achieved using the centralized management of MANO. The algorithm theoretically reaches 100% diagnostic efficiency, and accurately locates faults no matter how many VNFC exists in the system.

[Key words]NFV; MANO; VNF; adaptive diagnosis; loopback diagnostic algorithm

0   引言

在傳统的通信网络中,每一类服务都由特定的专有服务器的专用设备承载,并通过专有的通信链路进行通信。随着业务种类的持续增加,现网累积了大量的专有设备,这就给运营商的运维带来了极大的不便。

为解决专有网络业务增长带来的诸多问题,实现新业务的快速部署,达到网络的高度自动化和动态配置,同时降低企业的支出和运营成本,NFV技术应运而生。NFV通过使用基于行业标准的X86服务器、交换机、存储设备等通用硬件,取代专有设备,利用虚拟化技术实现网络功能的承载[1]。ETSI提出的NFV架构[2]已成为业界认可的事实标准(如图1)。NFV架构可从纵向解构为:基础设施层、虚拟网络层和运营支撑层;从横向可解构为:业务网络域和管理编排域(MANO, Management and Orchestration)。NFV通过MANO能够为系统提供可管理、可控制、可运营的服务环境[3]。MANO的本质是实现VNF以及NS(Network Service,网络服务)的自动化部署、弹性调度及高效运维管理[4]。

图1    ETSI提出的NFV框架

NFV的引进使得运营商的网络部署成本降低,并能快速适应网络需求的变化,但网元分层解耦后的故障定位问题增加了运维的复杂性,在一定程度上对NFV的应用前景产生了影响[5]。

系统级故障诊断作为一种针对多处理器系统的故障处理方法,为NFV的故障处理提供了一种新的解决方案。随着业务的扩展,NFV系统的规模也会越来越大,进行系统级诊断也变得非常有必要。

1   系统级故障诊断的相关概念

系统级故障诊断其研究的是如何根据已有的症状推出系统的故障节点的位置。根据已有症状找出系统的故障模式的这一过程就被称之为“诊断”。

(1)系统级故障诊断[6]。基本思想是让系统中的处理机相互测试,产生一组测试结果,随后对该测试结果进行分析,最终找出故障设备。这种方法不需要使用专门的测试设备,仅依靠系统内的处理机和通信链路进行,在不增加系统额外成本的情况下就可以实现系统的快速自诊断。

(2)自适应测试策略[7]。这是系统级故障的一种具体诊断方法。它是指每次只选择执行部分测试,然后根据这些部分测试的结果进行诊断。该种策略运用“集中控制,分散处理”的思想,允许分时分块地对系统进行测试,对于系统中已安排的测试,可以先执行某些测试,根据得到的诊断结果动态地安排后面的测试,利用已确定节点测试未确定节点,直到系统中所有故障节点都被检测出来。

(3)PMC模型及其相关约定。为了更加方便地研究多机系统,一般将具体的拓扑网络抽象为图,实际网络中的通信链路抽象为测试边,网络中的各类硬件设备抽象为节点。系统中所有测试结果的集合称为症状。在一个系统中,节点的状态分为故障和非故障两种,任意两个节点之间的测试结果用0和1来表示,当测试节点ai测试被测试节点aj为故障时用1表示;反之,ai测试aj为非故障时用0表示,因此,一个系统的症状即为一串0和1相间的序列。测试结点正常的时候,测试结果是可靠的;而当测试结点故障时,测试结果是不可靠的。表1给出了PMC模型具体的诊断规则[8]:

表1    PMC模型的诊断规则

测试节点状态 被测试节点状态 测试结果

非故障 非故障

故障 0

1

故障 非故障

故障 0或1

0或1

(4)分治回环诊断算法[8]。这是一种自适应的诊断算法,其主要思想为将整个系统划分为多个包含回测边的01序列,对每个01序列进行诊断得出故障节点位置,然后修复故障节点,最终将所有故障节点诊断出来。

2   自适应测试策略在NFV故障诊断中的

应用

2.1  NFV对故障管理的影响分析

网络NFV化之后,对软硬件进行了分层解耦,引入了更多的厂商,这就使得系统内可能发生故障的点更多。发生故障时,故障的定位以及责任划定也更为复杂。在故障处理方面,NFV网元相较于传统的网元有很大不同,传统网元设备都是软硬件一体化,当发生故障时,只需定位到具体的物理设备进行排查即可。而在NFV下,NFVI层、虚拟化层、应用软件层、业务逻辑层都会发生故障[9]。因此,如何对故障进行定位和修复成为NFV系统是否可靠的关键。文献[9]给出了一种NFV故障关联及故障自愈方案,对NFV下的故障处理采用“逐层关联、分类管理”的办法,对物理资源、虚拟资源、虚拟网元、网络服务进行垂直式的逐层关联,对资源故障和业务故障进行分类管理,为NFV场景下的故障定位和处理提供了很好的指引。

根据NFV的技术原理,一个虚拟业务网络可以包含多个VNF和VL(不同VNF之间的虚拟连接),一个VNF可以划分为一组VNFC(Virtualised Network Function Component,虚拟化网络功能模块的内部组件)和VL(某个VNF内的虚拟连接)。这些VNFC和VL构成了一个巨大的网络拓扑结构。

将VNF解构为VNFC,网络功能细化为更小的功能,这样能提供更灵活的应用,更快的响应,发生故障时能更加精确地定位故障位置。

目前,NFV下网络单元有动态扩缩容的场景,但大多数情况下网络保持稳定,也就是说,网络在搭建完成之后,网络拓扑结构基本不变,这就符合了系统级诊断的要求。

2.2  系统级诊断在NFV下运用的可行性

自适应诊断的策略能够屏蔽不同设备间的性能差异,只要求这些物理或者虚拟网元具备相应计算功能即可。同时自适应诊断策略的容错性很高,也就是说当系统中同时出现多处故障时,利用自适应诊断的相应方法仍能正确地确定故障位置。

系统级诊断要求网络中的节点都有产生和接收信号的能力,在实际的电信网络中,无论是物理设备还是虚拟网元都能产生和接收相应的测试信号并且处理这些信号,这就给系统级诊断的相关方法在电信网络中应用提供了基础。

运营商发展NFV最重要的目标是基于通用设备,利用虚拟化的技术实现传统电信设备的功能。NFV的虚拟网络层直接与网络业务相关,可将物理网元映射为VNF,在逻辑上实现IMS、EPC等网元的功能,利用VNF在基础设施层提供的服务是NFV的主要运营目标,这意味着VNF左右着网络虚拟化的前景。在云计算时代,网络功能升级是由软件来实现的,对硬件的依赖度很低,而像微服务、容器、Devops这些新技术的赋能对象应该是VNF,可见VNF在整个NFV中的重要性。

NFV架构下实现自动化运维的关键环节就是VNF生命周期管理,这也是MANO的核心支撑要求。MANO在进行VNF的部署时,根据系统实际的需求以及基础硬件设施的性能进行自动化编排,实现VNF的实例化、扩缩容、查询、转发、终结、自愈等功能。当VNF发生故障时,MANO能够依据自适应诊断的相关策略确认故障位置,对故障进行修复。大致步骤是OSS/MANO进行集约管理,根据网络拓扑结构,提前安排好测试方向和测试轮回。按照一定的自适应诊断算法诊断出故障位置,修复一部分故障,然后再次安排一轮自适应诊断,修复一部分故障,如此反复,最终修复系统中所有故障。

上文提到了网元功能分层解耦让故障处理变得复杂,要涉及到故障关联、责任划分、组织结构调整等问题。同时,由于VNF在NFV中的重要性,因此本文只从宏观上针对VNF层面的故障进行诊断。解决好VNF层的故障,在很大程度上解决了NFV下最大的故障处理问题。

系统级诊断策略的实现需要系统中的节点能产生并处理测试信息,同时要求有相关模块对整个系统进行测试规划、整体结果分析等。在NFV中,VNF具有相当的计算能力,能处理系统分配的测试信号;MANO进行中央控制,完成整个系统的测试序列划分,对诊断症状进行分析,对故障节点进行修复。可见NFV自身的特性满足了系统级诊断策略实施的条件。

系統级故障诊断能屏蔽各网元和链路之间的信息处理方式,只从宏观层面上关注各节点之间是否产生测试,不关注测试是如何产生的,当处理机之间有性能功能方面的差异时也不会影响整体的测试结果[10]。尽管VNF中各VNFC有功能和性能差异,系统级故障诊断策略仍适用。

2.3  分治回环诊断算法对VNF层的诊断