APP下载

电力数据通信网网络侧边缘设备故障分析与处理

2017-09-08孟亚宁

山西电力 2017年4期
关键词:路由表通信网路由器

谷 良,孟亚宁

(国网山西省电力公司信通公司,山西 太原 030001)

电力数据通信网网络侧边缘设备故障分析与处理

谷 良,孟亚宁

(国网山西省电力公司信通公司,山西 太原 030001)

通过分析电力数据通信网的常见故障,研究并总结出了一套高效的故障排查及解决方法。该方法按照网络设备的组网层次分别从内部路由协议、外部路由协议、标签转换协议方面入手,分别进行说明,适用于目前使用较为广泛的思科和华为厂家生产的高端路由器。

数据网;标签转换;故障处理

0 引言

电力数据通信网是支撑公司信息、管理、监控等业务稳定运行的综合型网络平台,是保障电力安全生产的重要辅助工具。S公司电力数据通信网自投入运行以来就采用全网网络侧边缘设备PE(provider edge) 的结构,组网设备涉及思科、华为、华三等多个品牌,其上承载了近20种不同的业务,具有覆盖范围广、网络结构复杂、业务种类多的特点。下面将以该公司所在省典型的网络架构为基础,从内部路由协议、外部路由协议等方面分别阐述相关的故障与处理。

1 故障处理一般流程

数据通信网逻辑结构由上到下一般为多标签转发MPLS(multi-protocol label switching) 邻居、边界网关协议 BGP(border gateway protocol) 邻居、内部网关协议IGP(internal gateway protocol)邻居、点对点协议 PPP(point to point protocol)邻居,产生故障的影响关系与之相反,分别为PPP故障影响IGP、BGP和MPLS邻居关系的建立,IGP故障影响BGP和MPLS邻居关系的建立,BGP故障影响MPLS邻居关系的建立[1]。另外,结合各层逻辑结构不同的难易程度,故障查找与处理一般遵循先内后外的顺序。

2 IGP常见故障及处理方法

内部路由协议是运行在物理层链路层之上,实现小区域范围网络设备互联互通的功能。目前省内 IGP仅采用中间系统到中间系统 IS-IS(intermediate system to intermediate system) 和开放式最短路径优先OSPF(open shortest path first) 2种协议实现域内的互联与互通。另外,由于BGP邻居关系是建立在传输控制协议面向连接的TCP(transmission control protocol) 之上的,也就是说如果要建立BGP邻居关系,如果两个连接没有实际的物理链路,就需要IGP来提供路由[2],因此必须先确认IGP路由是否正确。

2.1 IS-IS常见故障及处理方法

IS-IS故障按照部署位置可以划分为接口故障和协议故障两个部分,排查故障按照从协议到接口的顺序层层深入,具体步骤如下。

2.1.1 查看IS-IS路由表信息

排查IS-IS故障,首先需要查看对应的路由表信息,如图1所示。对核心P2操作后发现没有相应的路由条目,此类问题多为全局下的IS-IS协议存在问题,此问题多为全局配置模式下,没有正确的指定IS-IS层次或ISIS协议地址存在问题。需要检查并配置正确的网络层次,本例中骨干区域内全部为level-2,因此在全局模式及接口下均需要指定对应的层次类型。正确的配置如图2所示。

图1 IS-IS故障展示图

图2 IS-IS全局配置

2.1.2 查看接口下配置信息

对于指定设备,如图3所示,可以指定设备的环回地址查看路由信息,确认与该设备是否建立了邻居关系。此处需要注意的是目前IS-IS仅支持点到点网络和广播网络,正确的接口配置如图4所示。

图3 IS-IS邻居关系图

图4 接口IS-IS配置

2.2 OSPF常见故障及处理方法

OSPF故障按照部署位置也可以划分为接口故障和协议故障,同IS-IS,按照从全局协议到局部接口的顺序排查,具体步骤如下。

2.2.1 查看OSPF路由表信息

OSPF路由表中能够看到除直连以外的OSPF路由信息,如图5所示,其中包含更新源接口,建立时间等内容,如果存在单独的路由条目状态为LOADING,则需要查找相应的宣告地址是否正确,接口配置是否正确。

图5 OSPF邻居路由表

2.2.2 查看接口下配置信息

为缩短OSPF协议收敛时间,本例中指定参与OSPF组织的设备接口类型统一为点对点,如图6所示,另外对于环回地址和互联地址,只宣告相应的网段,精确路由条目。OSPF通过互相交换链路状态计算路径,因此需要合理的划分区域,降低OSPF计复杂程度,缩短路由收敛时间。正确的OSPF配置如图7所示。

图6 OSPF非点对点故障

图7 全局和接口下OSPF配置

3 BGP常见故障及处理方法

本例中64600域与19746域采用背靠背方式进行对接,所有路由器都运行MPLS协议,都需要与各自的核心路由器建立BGP-vpnv4邻居传递业务路由。因此首先要确认故障路由器是否与核心路由器间建立了稳定的BGP邻居关系,其次是确认域内能否正常互访,最后排查跨域的互通。

BGP协议主要维护3张表[3],因此相关的故障与处理也都基于这3张表完成,分别为邻居表、转发表和路由表,对应如图8所示的命令。如邻居表中的数据发生异常,则直接查看异常路由器的BGP配置、IGP邻居等是否正常;如转发表中的数据发生异常,则需要确定该路由没有最优的原因,多为管理距离值异常导致[4]。

图8 BGP三类表查看命令

为保障多业务间的逻辑隔离,需要引入MPLS-VPN进行组网,对于站端PE来说,每一个业务都维护各自独立的路由表。排查BGP故障,重点查看BGP-vpnv4是否正确建立,图9所示分别为正确的邻居关系及错误的邻居关系。如果邻居关系错误,则首先需要确定IGP路由表中是否存在正确的路由信息,或者通过PING的方式确定该设备环回地址的状态是否正常,如果不正常需要查看OSPF或ISIS路由状态;如果正常则需要查看BGP配置,在BGP下,首先要启用全局BGP邻居,默认只会启用BGP-ipv4邻居,在公司的应用场景中,需要启用BGP-vpnv4邻居来传递业务路由。因此需要查看BGP-vpnv4路由表,确定是否存在正常的BGP-vpnv4邻居[5]。

图9 邻居关系状态图

4 MPLS邻居关系

BGP-vpnv4邻居建立起来后,需要启用业务路由转发实例VRF(virtual routing forwarding)。通过给不同的业务路由添加标签进行路由转发,通过命令sh mpls ldp neighbor来查看与该设备建立邻居关系的路由器是否正确。如果不正确则需要查看全局下、接口下是否都启用了MPLS,全局下的MPLS邻居类别要相同,本例中全部采用LDP类型。在MPLS邻居关系建立正常的基础上,需要针对不同的业务启用相应的VRF实例,并配置独立的路由标识RD(route-distinguisher) 号,最后将相应的接口在BGP中进行重分布。

5 结束语

公司数据通信网路由器的稳定运行是各类业务正常动作的基础,电力数据通信网PE设备故障分析与处理从路由协议的角度出发,介绍了近些年运行维护过程中发生的典型故障及相应的处理方法,以上处理方法已经在实际运行环境中得到了多次验证,在故障定位、解决方面取得了良好的效果。

[1] 王立军,吴建平,徐格.解决策略冲突导致BGP路由发散的自适应机制 [J].软件学报,2008,19(6):1465-1472.

[2] 王伟明,董黎刚,诸葛斌.开放可重构路由器协议标准及软件架构技术方案探讨 [J].信息工程大学学报,2009,10 (1):7-11.

[3] 庞玲.边界路由器BGP协议的脆弱性 [J].计算机系统应用,2013,22(1):157-161.

[4] 丁雄,谢鲲.基于多径路由负载均衡的动态源路由协议 [J].计算机系统应用,2010,27(6):2249-2253.

[5] 吉萌,余少华,詹翊春.双冗余结构路由器故障恢复模型与方案研究 [J].通信学报,2006,27(6):21-28.

Fault Analysis and Treatment of Network Side Equipment in Electric Power Data Communication Network

GU Liang,MENG Yaning
(State Grid Shanxi Electric Power Corporation Information and Telecommunication Company, Taiyuan,Shanxi030001,China)

By analyzing the common faults of power data communication network,a set of efficient troubleshooting methods and solutions are studied and summarized.This method is demonstrated in terms ofinternal routingprotocol,external routingprotocol and label conversion protocol respectively,according to the networking level of the network equipment.It is suitable for the high-end routers which are widelyused bymanufacturers ofCiscoand Huawei.

data network;label switching;fault treatment

TN915.853

B

1671-0320(2017)04-0057-03

2017-04-11,

2017-05-23

谷 良(1987),男,山西朔州人,2013年毕业于中国科学技术大学软件工程专业,硕士,工程师,从事数据通信广域网运维管理工作;

孟亚宁(1982),女,山西大同人,2005年毕业于太原理工大学通信工程专业,高级工程师,从事数据通信广域网运维管理工作。

猜你喜欢

路由表通信网路由器
买千兆路由器看接口参数
维持生命
路由器每天都要关
路由器每天都要关
基于OSPF特殊区域和LSA的教学设计与实践
研究路由表的查找过程
基于SDN-MEC配用电通信网任务迁移策略
GSM-R通信网多径干扰解决案例
PTN在电力通信网中的工程应用
电力通信网引入ASON技术探讨