APP下载

基于开放光传送网络的域间故障定位技术研究与实践

2022-08-01刘昊霍晓莉胡骞丁一

电信科学 2022年7期
关键词:远端管控定位

刘昊,霍晓莉,胡骞,丁一

(中国电信股份有限公司研究院,北京 102209)

0 引言

过去,光通信设备的网络管控系统相对独立,设备厂商需要同时提供基础网络设备和相配套的管控系统及服务。然而,从网络运维的视角来看,这种单一的网络管理模式存在数据不透明、故障定位效率低、业务恢复不及时等问题。日益增长的流量需求导致网络设备增多且组网环境愈发复杂,上述问题更加显著,给网络运维带来了巨大挑战。

随着通信技术迈入数字化时代,软件定义网络(software 2efine2 network,SDN)技术[1]的出现打破了传统的网络设备管理模式。构建开放的光网络生态圈不仅仅是口号,正在深刻影响着整个光通信产业。目前,基于SDN的网络设备控制器已经从IP网络发展到光传送网,传送SDN技术成为了光网络管控领域的热门研究课题[2]。按照规范性的南向与北向应用程序接口(application programming interface,API),将业务平面和控制平面进行分离,基于传送网控制器最终实现异厂商设备统一管控。这种统一管控的模式能够化繁为简,对所有厂商的设备资源、性能和告警等关键项综合呈现,有助于快速识别网络风险和定位故障;而对于运维人员来说,也降低了操作复杂度。

虽然传送网控制器的应用已经能提高定位网络故障的能力,但其只对相同管理域内的设备提供服务,而对于实际组网环境中的边缘节点之间则存在故障定位能力不足的问题。例如,交换机/路由器与传输设备之间的部分,两类设备隶属不同的专业领域,目前很难形成有效的协同,当这种域间网络发生故障后难以做到快速定位。针对上述问题,本文首先介绍了一种开放的光传送网络架构,随后基于该架构提出一些域间光网络故障定位技术并加以实践,包括网络连接关系的获取、远端光模块管控、性能管理和故障根因分析等,最后总结故障定位技术并对未来新技术进行展望。

1 开放的光传送网络架构

光传送网络的开放性旨在为用户提供开放的网络编排能力,终端用户通过定义统一的数据模型和标准接口,实现对底层不同厂商传输设备的综合管控。接入型光传送网络(optical transport network,OTN)统一管控系统[2]和盒式波分控制器[3]是两个具有代表性的应用实例。接入型OTN设备统一管控系统架构如图1所示,与中国通信标准化协会(China Communications Stan2ar2s Association,CCSA)制定的控制器层间接口技术标准相似,接入型OTN设备也制定了北向接口企业标准,在设定的相同管理域内能够对不同厂商的局端OTN以及接入型OTN设备进行统一管控[4-6]。盒式波分设备的统一管控系统架构如图2所示,它能够同时管理不同厂商的电层设备和光层设备,有助于实现电层设备和光层设备解耦。两者均采用标准网络配置协议(network configuration protocol,NETCONF)和另一代的新模型(yet another next generation,YANG),从而具备对物理层OTN设备和波分复用(wavelength 2ivision multiplexing,WDM)设备的综合管控能力。

从物理连纤来看,接入型OTN设备主要部署于运营商接入机房或客户机房,与客户设备直接相连[5]。而面向城域应用的盒式波分电层设备客户侧端口与数据设备(如交换机、路由器等)相连,它们分属不同的管理域。这些直接对接客户设备和跨专业设备互联的位置相对比较特殊,属于管控的“真空”地带,在出现故障的时候往往需要多个专业领域的运维人员共同排查,难以保障故障恢复的时效性。因此,为了提高故障定位效率,本文考虑将现有的传送网管控范围延展到远端相连接的设备,进而使其具备对域间故障定位的能力。

2 域间故障定位技术

光传送网络域间故障定位技术主要用于边缘接入节点,电层设备的客户侧端口连接到远端客户设备端口或其他专业设备(如交换机/路由器)端口,利用传输设备的综合管控系统或控制器分析诊断远端光模块故障或者域间光路故障。故障定位基本思路是当管控系统或控制器监测到某一客户侧端口产生告警后,首先找到与之相连接的对端网络设备位置,再通过具体的告警信息进一步判断故障位置和根因。

2.1 网络连接关系获取

确定网络连接关系是故障定位的基础,多数情况下域间光缆中断造成业务信号丢失时,无法对其所承载的每条业务快速找到连接关系,也就不能及时发现远端设备位置。

目前,获取网络连接关系的方法已有较为成熟的标准可以参考。对于以太网类型的客户业务,电气电子工程师学会(Institute of Electrical an2 Electronics Engineers,IEEE)发布了链路层发现协议(link layer 2iscovery protocol,LLDP)[7],其中定义了多种帧结构和数据格式,用户能够通过扩展不同类型/长度/值(type/length/value,TLV)将设备、端口、光模块等物理位置信息封装到数据单元,通过以太网二层传输协议实现信息共享。而国际电信联盟电信标准化部门(International Telecommunications Union Telecommunications Stan2ar2ization Sector,ITU-T)[8-9]明确了OTN类型业务的邻居发现协议,重用OTN帧结构,使OTN设备能够完成光网络同层网元节点间的邻居发现。

2.2 远端光模块管控

域间网络设备的连接关系找到后,也就相当于找到了光模块之间的连接关系。光模块作为携带业务的载体,在光传送网络中扮演着重要角色。通常情况下,本地传送综合网管能够监控本端的光模块信息,却不能获取远端光模块的数据。对于任意一条光路的监控和故障诊断,都需要提供端到端的信息。一种可行的远端光模块管控方案是使用调顶技术,将光模块信息通过调顶信号进行传递[10]。具体来说,在光模块内部生成低频小幅度调制信号与高速业务信号叠加,形成混合信号后通过光纤随路传输。对端收到信号后分离出调顶信号,解析光模块数据。如今调顶技术已经在N×25 Gbit/s前传半有源系统中得到应用,其中N为波分复用系统的通道数[11-13],更高速率和复杂调制码型的调顶技术有待进一步探索。

本文研究了多通道100 Gbit/s光模块调顶技术,并制定了相应的调顶信号传输协议,包括调制速率、编码方式、帧结构以及帧传输方式等。对于多通道光模块,明确选择一个子通道作为调顶信号传输通道,能够有效降低模块功耗与成本。如何保证调顶信号不会对原始业务信号造成影响是重点考虑的问题,对光模块电路设计要求较高。因为调顶信号对于业务信号而言是噪声,接收机接收的光功率越低,调顶信号对业务信号的干扰越大。调顶信号对接收灵敏度的影响如图3所示,分别显示了两支100GE-LR4光模块在有、无调顶信号时的误码率与接收光功率变化曲线,测试结果表明调顶信号会对光模块的接收灵敏度造成影响,后续可考虑电路优化设计或者重新设置接收灵敏度指标。

图3 调顶信号对接收灵敏度的影响

调顶技术使得远端光模块的基本信息和数字诊断监控(2igital 2iagnostic monitoring,DDM)数据以光信号的形式发送,保存在本地光模块指定寄存器中,本地网管再通过管理接口获取这些寄存器数据。同时,本地网管也能通过本地光模块向远端光模块发送一些基本操作指令(如开启/关闭激光器、环回等)以辅助进行故障定位。

2.3 性能实时监控

在开放的光传送网络管控系统平台上,引入遥测(telemetry)技术能够实现对监控数据的秒级上报[14]。考虑到光模块使用量大,在现网应用中失效率也较高,实时监控光模块的DDM数据有助于及时发现问题。过去传输网管性能监控的最短周期为15 min,无法感知瞬态变化,模块性能劣化无法提前识别。而实时监控能够在模块早期出现异常时及时预警,防止后期真正出现故障时再耗费大量时间进行定位。为了更加精确地定位光模块故障,引入激光器偏置电流波动和发送光功率波动两个参数,波动范围过大表明光模块出现异常。

对于telemetry订阅实时功能的使用,按需订阅被认为是一种切实可靠的方式,以规避由数据采集量过大导致服务器宕机的风险。

2.4 故障根因分析

当网络因为发生故障造成业务中断或丢包时,找到故障根因是确保业务快速恢复的重要手段。域间网络的故障根因分析基于本地综合管控系统进行,将上报的告警和实时采集的数据相结合(含远端光模块告警和数据),对有关告警进行主次排序,最终筛选出根告警作为故障根因。通常情况下在根告警消失后,其他有关告警将自动消除。

域间网络的根告警可以总结为光路故障和光模块故障两类。为了更直接地反馈光路故障,网管增加了双向的链路中断告警,监测调顶信号的状态以实现告警产生或消失。光模块故障除了通过分析常规性能越限告警外,还引入了激光器偏置电流和发送光功率波动告警。

2.5 应用实践

本文开发了一套传输网络运行质量分析原型系统,并基于该系统对域间网络故障定位技术进行了实验验证。开放的光传送网络管控系统架构如图4所示,说明了整个网络的管控系统架构,原型系统包括针对域间网络故障定位技术所开发的性能管理模块和故障根因分析两个核心模块,与底层传输设备通过南向引擎交互。南向引擎服务于主业务系统,它包括标准NETCONF处理模块、远程过程调用(remote proce2ure call,RPC)扩展接口处理模块、安全外壳(secure shell,SSH)协议底层连接控制模块等核心模块,并以一种基于超文本传输协议(hypertext transfer protocol,HTTP)且具有更简洁的开发风格的RESTful内部接口提供管理设备的能力并实时转发来自设备的告警和通知。

图4 开放的光传送网络管控系统架构

光传送网域间故障定位实验环境如图5所示,两支具备调顶功能的100GE-LR4光模块分别插在传输设备电层板卡的客户侧端口和一台支持LLDP功能的客户交换机,光模块使用短纤互联。Web门户能够获取交换机的位置信息和端口信息,也能查看远端光模块的实时数据。在光模块之间的光纤断开后,网管上报链路中断的根告警。受限于光模块数量,无法进行复杂的组网,但初步验证了本文介绍的域间故障定位技术的可行性。

图5 光传送网域间故障定位实验环境

3 结束语

本文阐述了不同专业设备管控系统难以协同带来的域间网络故障定位困难的痛点,提出了基于开放光传送网络综合管控系统下的域间故障定位技术方案,并最终在原型系统上得到了验证。

如今“云网融合”正推动运营商向数字化转型。全光网2.0技术白皮书提出“运营智慧化”的发展愿景[15]。随着传输、接入、数据等网络基础设施逐渐云化部署,基于SDN的控制器和管控系统深耕于各专业领域的设备之上,全网资源有望实现协同编排和数据共享,届时域间网络故障定位难的问题将得到解决。最后,相信未来人工智能和机器学习等前沿技术都将助力光传送网络向智慧化运营演进。

猜你喜欢

远端管控定位
改良Henry入路治疗桡骨远端AO B型骨折的疗效分析
经皮钢板内固定治疗胫骨远端骨折37例
老年桡骨远端骨折经手法复位小夹板外固定治疗疗效探讨
内侧楔骨远端倾斜与拇外翻关系的相关性
施工现场的信息技术与成本管控
全程管控在机电工程设备安装的实施
少儿智能定位鞋服成新宠
把握新定位、新要求 推动人大工作创新发展
难与易
广电总局出台“最严”整顿电视盒子管控收紧