APP下载

5G核心网云网一体化运维

2021-09-10张雪

电信科学 2021年8期
关键词:网元核心网虚拟化

张雪

(中国电信股份有限公司研究院,北京 102209)

1 引言

2020年全球大多数主流运营商已转向5G独立组网架构,并开始了5G独立组网架构的商用部署[1]。5G 网络 3 种典型的场景为:增强型移动宽带(enhanced mobile broadband,eMBB)、低时延高可靠通信(ultra-reliable and low latency communication,uRLLC)和大连接物联网(massive machine type communication,mMTC)。传统的专用硬件难以适应网络和业务发展的需求,采用网络功能虚拟化(network function virtualization,NFV)技术进行5G核心网的部署,能够实现5G业务的快速部署、资源的灵活调用、故障的快速隔离和自愈,对5G网络特性发挥起到了重要的作用[2]。同时网络功能虚拟化技术的使用带来一些运营维护的难点,例如软硬件的一体化监控和告警关联、网元和网络功能虚拟化基础设施(network function virtualized infrastructure,NFVI)的兼容性以及维护团队职责的协同问题,这些难点都将是运营商在5G核心网运营维护过程中需要解决的问题。

2 5G核心网的虚拟化部署方案

与4G核心网架构不同,5G核心网引入服务化架构(service based architecture,SBA)进行设计。5G核心网的SBA借鉴了软件开发领域成熟的面向服务的架构(service-oriented architecture,SOA)和微服务架构(micro-service architecture,MSA)的综合优势,提出了面向服务的总线架构,将传统的以网元和信令传输为基础的网络架构转变为以服务和应用程序接口(application programming interface,API)为主的服务架构,其主要架构如图1所示[3]。此架构实现了网络功能的灵活组合,能够支撑业务的敏捷提供和能力开放。

图1 5G核心网服务化架构

延续 4G核心网业务平面与控制平面完全分离的理念,5G核心网将网络功能(服务或网元)分为控制面功能和用户面功能。其中将用于数据转发用户面功能(user plane function,UPF)进行下沉,实现UPF靠近用户侧进行部署,可以有效避免长距离网络传输时延,提升用户体验。控制面功能的网元采用集中式部署或分布式部署方式,采用服务总线的方式连接,各网元功能根据不同的功能统一接入服务总线,实现基于通用网络访问接口进行远程访问。5G核心网主要的网元功能定义见表1。

表1 5G核心网网元功能定义

基于SBA的5G核心网对各网元功能的重新梳理,使整个网络架构更加灵活,业务部署更加敏捷,同时SBA使NFV的优势得以充分发挥。NFV技术将传统的CT业务部署到通用物理硬件虚拟化所形成的虚拟云平台,实现软硬件解耦的一种技术。NFV技术的应用不但避免了设备对专用硬件的依赖,减少运营商的CAPEX,同时,资源的灵活获取,可能帮助运营商进行网络切片的构建,满足不同业务的需求,使宽带、连接、安全性等特性在不同切片中体现出差异,在不同的场景发挥作用。在 NFV 技术的支持下,网络的软件、硬件得以分离,这使得网络资源的配置和部署更为灵活,对进一步发挥5G系统的独特优势起到了重要的作用。

当前业界NFV架构主要采用欧洲电信标准协会(European Telecommunications Standards Institute,ETSI)为NFV制定的参考架构,如图2所示。NFV架构分为3层:基础设施层、虚拟网络层和运营支撑层。

图2 ETSI NFV参考架构

(1)基础设施层

基础设施层为 VNF提供部署、管理和执行环境,并实现对硬件资源和虚拟资源的管理和监控,主要包括NFVI和虚拟基础设施管理(VIM)两部分,NFVI包括硬件资源层、虚拟化层及虚拟资源层,实现对虚拟网络层业务网元的承载;VIM 实现对NFVI资源的管理、编排和调度等功能。

(2)虚拟网络层

基于底层云化基础设施实现业务能力,主要包括VNF、EMS及VNF管理系统(VNFM),VNF基于NFVI虚拟资源部署业务网元;EMS是VNF业务网络管理系统,提供网元管理功能;VNFM是VNF管理系统,主要负责VNF生命周期管理。

(3)运营支撑层

实现对业务的编排、运维与管理,主要包括OSS(operation support system)/BSS(business support system)和NFVO(network functions virtualisation orchestrator)。OSS/BSS是业务网络支撑系统,实现与NFVO的交互,共同完成维护与管理功能。NFVO主要负责跨VIM的NFVI资源编排及网络业务的生命周期管理和编排,并负责NSD(network service descriptor)的生成与解析。

另外,参照ETSI NFV架构,NFVO、VNFM与VIM合称NFV管理和编排(management and orchestration,MANO),负责提供可管、可控、可运营的服务环境,使基础资源可以便捷地提供给应用。

除了基于NFV的架构外,5G核心网具有控制面和用户面彻底分离的特性,这种特性使用户面网元UPF可灵活下沉,分布式部署于更靠近用户和数据源的边缘节点,最大程度降低网络时延,提升5G业务体验。NFV架构使业务上线更加敏捷,可提升运营商与互联网巨头之间的竞争力,而分布式架构可以使5G网络广泛注入算力,让运营商提供的业务更丰富,用户的感知体验更优。当前中国三大运营商 5G核心网的虚拟化部署已经进入商用阶段,但是,对NFV网络的运营维护系统和方案还处在探索阶段,现阶段有必要对虚拟化的5G核心网运营维护方案进行梳理,结合运营商4G网络的运维经验,在运维技术、流程和组织架构方面保障5G核心网的网络安全、稳定,发挥5G业务特性。

3 虚拟化的5G核心网运营维护

当前5G核心网的新架构,能够满足5G新业务的需求,同时也能降低设备采购成本,但却给5G核心网的运营维护工作带来很多困难和挑战。5G时代的核心网运维复杂度和工作量将呈几何级数上升,运维工作朝着集约化、智能化、自动化的方向发展,运营维护系统和运营维护的组织架构都进行相应的变革,以适应网络新架构。

3.1 虚拟化的5G核心网运营维护的难点

5G核心网的虚拟化和分布式架构,将会给运营维护工作带来如下挑战。

· 5G核心网从枢纽机房迁至DC(data center)机房,基站与5G核心网间流量跨机房、跨专业,组网结构更加复杂,涉及的厂商、软硬件模块、接口众多,参数配置、联调测试、故障定界都需要多专业、多厂商配合,运维复杂度大幅提升。且随着网络规模不断扩大,故障点相比传统网络提升数倍,故障也容易迅速扩散。

· 网络切片、UPF下沉等场景的引入使核心网网络管理对象增多,变更操作更加频繁。未来的边缘节点可能有成千上万,甚至几十万个广泛分布于网络中的各个位置,维护难度和工作量都将大幅增加。

· 分层解耦的架构使资源管理更加复杂,且各层、各网元告警上报方式不一致,造成故障告警信息的处理难度更加复杂,同时跨层告警需要进行关联,以便快速地定位故障并进行相应处理。

· 5G 将赋能千行百业,政企(2B)业务对网络的性能、稳定性的需求比个人(2C)业务更高,同时对网络的SLA更加苛刻,虚拟化的 5G核心网必须保障网络的高稳定性和高可靠性。

5G核心网新网络架构和新业务需求对运营维护提出了新的挑战,需要适应这些挑战设计全新的智能化、集约化、融合化的5G核心网运营维护系统。

3.2 5G核心网的云网一体化运营维护系统

5G核心网的运营维护系统需要提供统一的5G核心网网络运维服务能力和网络综合保障功能,需要支持自动化运维、智能根因分析、跨层一体化运维、网络故障和性能管理、策略和安全管理,实现全网统一监控、全网统一管理。运营维护系统还要支持对5G新业务的管理能力,实现5G 核心网切片的全生命周期(设计、部署、闭环保障等)管理能力,实现5G 2B业务的统一策略能力,实现MEC(multi-access edge computing)管理等能力。

3.2.1 5G核心网的运营维护系统架构

5G核心网是具有虚拟化、云网融合、云边协同特质的网络系统,适应这种网络架构,运营维护系统应具有微服务化、云化、智能化、集约化的特点。微服务化使用“平台+应用”的架构,依托统一的数据平台和能力,构建5G核心网运维应用;IT云化即运营维护系统开发和部署技术架构采用IT化的架构,部署在云端;由于5G核心网的操作维护工作量大,引入大数据、AI,推进运维的自动化和智能化,能够降低维护难度,同时节约维护成本;集约化设计尤其重要,为了提升运维管理的效率,适应5G业务互联网化、全网统一、快速加载、一点开通的特征,应建立全网统一集约的5G核心网运营维护系统,一级系统供集团和省公司的运维人员分权分域使用。

运营维护系统统一纳管集团、省以及地市边缘5G核心网网元,包括集团、省层面5G核心网所有网元、地市以及园区下沉UPF等。实现统一平台、统一视图、统一管理以及统一调度,资源实现统一管理、业务实现统一发放、网络能力实现统一开放。同时,通过运营维护集约系统协同省和集团两级运维体系,进行跨省故障协同,云网边协同故障定位,多级运维人员协同进行故障处理。

5G核心网云网一体运营系统既要面向内部运维人员,也要面向其他系统和业务开放能力,还要面向外部客户。面向运维人员需要让集团/省/地市等各级运维人员能够利用运营系统,更加方便高效地处理日常运维工作,例如网元新建、割接、故障处理、巡检等;面向其他系统,要开放针对5G核心网的诊断、感知、测试等能力,同时支撑切片、MEC等5G新业务;面向客户要提供对5G产品的在线订购能力,对客户业务的可视化能力和管理能力等。

基于5G核心网特点和运维工作的需要,梳理基本运维需求功能,其主要包括网络监控管理、业务支撑、用户预诊断,同时根据5G核心网的特点和运维难点,增加了网元自动化管理、云网统管、云网一体化支撑、切片保障和 MEC协同等能力,后续针对网络自动驾驶,考虑引入决策智能、操作智能等模块。5G核心网一体化运营系统的总体架构如图3所示,系统通过数据共享平台进行实时数据采集,通过能力共享平台对网元进行控制指令下发,通过该运营调度系统获取告警数据,通过AI中心获取AI几何能力,通过数据湖获取话单等静态数据,5G核心网运营维护系统完成5G核心网网络运维服务能力的封装,实现5G 核心网的全生命周期管理能力。

图3 5G核心网云网一体运营系统架构

3.2.2 5G核心网运营维护系统重要功能

针对5G核心网运营维护系统的目标和定位,设计了5G核心网运维系统的功能模块,7项功能模块细分成33项功能清单,请各省公司5G核心网运维人员针对33项功能清单进行需求重要性进行打分。通过对省公司调研结果进行汇总分析如图4所示,发现运维人员对网络监控、业务保障的需求最高,在网络监控中需求重要性最高的是告警管理和故障诊断。

图4 5G核心网云网一体化运营系统功能优先级调研结果

5G核心网的告警管理和故障诊断同时是运营技术中的重点和难点。由于5G核心网的虚拟化架构,与4G核心网的运营维护不同,5G核心网的运营维护系统要形成硬件层、虚拟层、业务网元层相互关联的跨层资源管理能力,建立跨层可控可管的网络保障能力,实现跨层网络告警关联、故障定位和故障快速处理。

资源跨层关联即通过挖掘网元跨层间资源的相互关联关系,并利用拓扑关系进行展开,形成3层资源拓扑透视模型,为现网日常运营及维护中业务层、资源层、硬件层的告警发现、告警定位以及告警收敛提供有效的参考依据,实现从应用层一点切入即可关联发现虚拟层及硬件层的准确关联关系和具体定位信息。包括计算、存储、网络资源的关联,以下以计算资源的关联为例说明资源关联的过程。

基于计算资源定义的逻辑并结合 5G核心网现网部署的特性,首先构建资源结构的设想,网元层主要包括 5G核心网关键网元,如 AMF、SMF、UPF等。向下映射到虚拟层的虚拟机及其信息,包括虚拟机 ID、虚拟机名称、IP地址、MAC端口地址等,完成虚拟网络虚拟机内部资源的拓展。并从这些信息中提取关联项,映射虚拟机与宿主机间的关联关系,同时挖掘宿主机的属性及字段信息,包括主机名称、主机IP地址完成主机到服务器间的位置关联。通过EMS/NFVO的北向接口导出网络资源静态表,获取容器所在的虚拟机唯一识别码(UUID),再依据UUID查询虚拟机信息、主机信息、服务器设备列表,将查询获得的服务器设备列表,通过主机ID实现与物理服务器 SN序列号的匹配关联,完成从容器→虚拟机→主机→物理服务器的计算资源查询以及拓扑关系关联。

跨层告警关联和故障定位是5G核心网运营维护系统必须具备的重要功能。5G核心网采用NFV架构后,告警的层次增加,告警数量激增,底层告警隐藏在由它引发的多层衍生告警中,很难分析告警的根原因,需要对各层之间的告警信息进行关联,进一步实现跨层故障诊断。基于人工智能的方法对告警数据进行压缩十分必要,对告警数据进行压缩的关键是挖掘告警之间的有效关联规则,然后利用规则对告警数据进行压缩。告警关联规则挖掘首先对告警数据进行预处理,然后根据事件的发生时间、位置、原因等信息生成事件列表,从事件列表中挖掘关联规则,并在规则中提取规则泛化模式,最后使用泛化模式和关联规则对告警数据进行压缩。

5G核心网云网一体运营系统引入面向业务和网络的跨层告警关联、智能预警和辅助决策,使用AI算法对业务量、异常事件、KPI等实时数据进行分析,可以先于客户发现故障,及时预警并定位故障,及时处理问题。根据5G核心网运营系统上线半年来系统承接相关告警、监控、故障处理等功能,并通过AI稽核等功能,发现局数据配置隐患3 000余个,业务配置错误超万个,这些故障均及时进行了处理,增强了客户满意度,提升了5G客户体验。

3.3 虚拟化的5G核心网运营维护组织架构

5G新业务和新网络架构,不仅需要运营维护系统具有全新特性,也应对组织架构和工作模式进行相应的变革。5G核心网网络及业务维护涉及多专业,除核心网专业外,需IP专业、云计算等专业深度协同,建设跨专业、跨地域的核心网云网一体化运维团队,负责 5G核心网云网一体化运营维护。5G核心网云网一体化运维团队负责5G核心网的维护和管理工作,通过5G核心网的运营维护系统对5G核心网的网元层、虚拟化层和对应的硬件实现跨层一体化告警关联和资源一体化管理。

虚拟化的 5G核心网是电信技术和云计算技术的融合,因此对运维人员的要求也要具备 CT和IT融合的技能。对网络功能虚拟化要有深刻的理解和认知,具备对虚拟化网元进行全生命周期管理的能力;对云数据中心的基础设施具备维护能力,能够在 NFVI出现告警时,对虚拟层或硬件层进行修复;对核心网的业务逻辑有深刻的理解和认知,在业务出现告警时能够对告警原因进行相应的判断,及时进行故障的处理。因此对于5G核心网一体化运营维护的人员的能力要求是CT、IT和DT能力的多维度融合,需要对现有人员进行培训,使运营维护人员具备云网一体融合运维能力。

4 结束语

5G核心网新的架构和部署模式,为运营维护工作带来了挑战,同时也为运营维护的智慧化、自动化带来了新的机遇。伴随着网络云原生技术的发展,网络的NFV化进程会逐步推进,业务将更加灵活,网络能力更加开放,运营维护也会向网络自动驾驶方向演进。结合大数据、AI等新技术,构建合理的运营维护系统,多专业运营维护人员协同合作,建立云网一体化运维体系,必能有效地提升5G核心网的运营维护效率,使5G核心网网络安全、稳定、高性能地为5G用户提供优质的服务。

猜你喜欢

网元核心网虚拟化
GSM-R核心网升级改造方案
基于OpenStack虚拟化网络管理平台的设计与实现
一种全网时钟同步管理方法
对基于Docker的虚拟化技术的几点探讨
5G移动通信核心网关键技术
H3C CAS 云计算管理平台上虚拟化安全防护的实现
核心网云化技术的分析
VoLTE核心网建设方案
存储虚拟化还有优势吗?
Java EE平台在综合网元管理系统中的应用研究