APP下载

智能变电站网络交换机在线监测设计与实现

2014-11-22陆玉军

电力工程技术 2014年2期
关键词:交换机端口通讯

徐 勇,陆玉军,张 雷

(1.宿迁供电公司,江苏宿迁 223800;2.江苏方天电力技术有限公司,江苏南京 211102)

通信技术是变电站自动化系统信息传输的基础,所采用的技术必须满足变电站内通讯网络传输时间的要求。在以IEC 61850 标准为基础实现的智能变电站中,过程层通讯网络传输采样值SV 报文和通用变电站事件GOOSE 报文信息关系到二次设备的正确采集、处理及控制输出,影响到一次设备的正确动作和安全运行,信息传输的可靠性、实时性和安全性要求非常高[1]。

根据前述要求,在网络交换机应用方面,往往优先采用性能优越、高可靠性的品牌工业交换机,因是网络核心设备,其可靠性将影响到与网络交换机连接的多个保护设备正常运行,部分现场甚至不惜重金大量采用。在当前应用中,由于缺少交换机及网络性能的在线监测手段,无法及时获知交换机内部状态、接口通讯、网络流量等实时信息,难以发现交换机和网络的异常征兆、无法预估交换机何时会出现故障而影响系统运行安全。虽由交换机或网络故障引起的保护误动或拒动的情况不多,但从获知的智能变电站内交换机和网络异常事件看,开展交换机性能及网络实时监测将有助于帮助发现运行中的潜在缺陷,并及时采取正确地处理措施。针对异常进行改进,达到优化设计、改善性能、减少冗余、简化配置的目标。

1 变电站交换机使用与管理现状

1.1 交换机的设备配置

为保证过程层信息传输的实时性、可靠性、安全性,在智能变电站内一般是将站控层和过程层分网传输。并且在过程层网络设备的选用上,只考虑工业级、高性能的可网管交换机,而普通的交换机因为不能实现网管的配置应用,即使在智能变电站的站控层中也很少有应用。目前应用较多的交换机品牌有HIRSCHMANN(赫斯曼)、RuggedCom(罗杰康)、MOXA(摩莎)等。

变电站网络在设计中一般采用双网、或双网双套、或冗余交换机配置,当一个网络出现故障时,依靠另一网络的投入保证网络的可靠运行。

1.2 交换机的管理方式

(1)串口管理:通过串口线,主机与交换机提供的菜单控制台界面或命令行界面进行交互操作。

(2)Web 管理:在主机浏览器中输入交换机管理IP 访问,但部分网管交换机不支持Web 管理。

(3)网管软件管理:通过局域网,利用主机上安装的网管软件访问交换机。网管软件有通用型和厂家为自身产品定制的专用型网管软件,如赫斯曼公司的Hivision、思科公司的Cisco works、华为3Com的IMC等软件均为专用型。

1.3 交换机的管理现状

一般按网络规模、设备配置和数据传输要求,采用报文过滤、环网冗余技术配置交换机;运行中根据网络或交换机设备是否有异常,检查设备状态或调取故障信息分析;缺陷处理或网络设备校验时,使用工具软件查看内部状态信息或针对故障查找设备内部缺陷[2]。

2 变电站交换机网络管理分析

目前的网络管理方法是一种被动的管理策略,往往等缺陷暴露后才能发现问题,易对系统运行造成不利的影响。本文提出采用一种主动的管理方法即实现对交换机运行状态、网络通讯流量等信息的采集,建立对交换机的在线监测,通过对数据的分析处理,判定是否存在网络异常或故障、分析定位故障发生的设备节点或导致缺陷的缘由,及时提醒监控运行维护人员采取主动处理措施的管理方式,防范因设备瘫痪或网络缺陷而引起的事故。

2.1 监测对象

根据ISO/IEC 7498-4 中的定义,网络管理的功能主要分故障管理、计费管理、配置管理、性能管理、安全管理5个方面。而变电站交换机网络管理从网络性能监测、交换机状态监测角度采集信息,通过分析处理,实时获取交换机和网络性能的状态,侧重性能管理、故障管理。例如通过对通讯数据处理可获得:带宽占用率高、流量突变、通讯异常等信息。

(1)网络性能监测的信息:交换机端口通讯连接状态、输入输出流量、带宽占用率、输入丢包率、输入错误率,输出丢包率、输出错误率。

(2)交换机性能监测信息:CPU 负荷率、内存利用率、内部模块自检状态、电源工作状态、工作温度、交换机风扇状态,交换机重启(故障或失电引起)及其他自定义异常事件。

2.2 采集信息

上述需要监测的信息位于交换机信息库MIB 中,通过仔细分析MIB的数据存储结构,发现变电站交换机性能监测的信息主要分布在:端口通讯变量、系统信息变量、内部状态变量、及故障异常变量等部分[3]。

(1)端口通讯信息。位于交换机MIB库的Interfaces 子节点下ifTable的表对象中,对象标识OID为1.3.6.1.2.1.2,这部分包含:端口一般信息,如标记ifIndex、描述ifDescr、类型ifType、速率ifSpeed;端口状态信息,如端口管理状态up 或down,端口工作状态linkup 或linkdown;端口流量信息,如输入和输出流量的累计数据。

(2)系统信息。位于交换机MIB 库中的System子节点下,OID为1.3.6.1.2.1.1,这部分含有:交换机描述、交换机ID、交换机上电时间等信息。如根据上电时间可发现交换机是否有宕机或失电现象。

(3)内部状态信息。位于MIB 库中的private.enterprises 子节点下,OID为1.3.6.1.4.1,这部分为厂家私有MIB 信息,需要关注的部分内部信息有:交换机系统时间、程序版本、电源状态,交换机温度、CPU 负荷率、风扇工作状态等信息。由于是设备的内部专有信息,需通过厂商的技术资料才能进行解读。

(4)trap 事件信息。交换机的故障异常信息一般通过trap 命令由网管交换机主动发给管理主机,SNMPv1 协议中描述部分故障异常信息:交换机重启、端口通讯中断与恢复、及交换机自定义故障异常事件。

2.3 通讯数据处理

前述端口通讯信息为统计数据,需要处理才可以获得网络性能的指标信息。如通过2 次轮询的数据除以轮询间隔时间,则可得到一段时间的流量信息[4,5]。与网络通讯相关的统计指标有:

(1)端口流量。以2 次采集的输入/ 出字节数之差反映一段时间内端口流量:

式(1—3)中:ΔBin为2 次输入字节数差值;ΔBout为2 次输出字节数差值;ΔT为采集间隔时间。

(2)端口带宽占用率。以端口速率和流量获得一段时间带宽占用率:

式(4)中:Spt为端口速率。

(3)端口通讯包数。反应一段时间内的数据包数:

式(5)中:ΔPin,ΔPiu,ΔPinu为输入包数、输入单播包数、输入非单播包数,同样可获得输出包数。

(4)端口错误率。反应一段时间内的数据包的出错率:

式(6)中:ΔEin为输入错误包,同样可获得输出错误率。

(5)端口丢包率。反应一段时间内的数据包的丢包率:

式(7)中:ΔDin为输入丢包数,同样可获得输出丢包率。

2.4 交换机信息处理

根据采集的交换机信息及设定的异常阈值处理,判断硬件设备的异常,如电源异常、温度高异常、CPU利用率、内存占用率高异常等指标信息均是交换机设备异常的反映。

(1)获取时间信息。采集获取交换机的上电时间是自上电后运行至当前时间的累计,不能直观反应上电时刻,可通过下式获得:

式(8)中:Tup为上电时间;Tdev为交换机时间;Tsec为交换机上电的秒数。

交换机端口变位时间是相对系统启动时间的10 ms 数据,通过下式获得端口连断时间:

式(9)中:Tpt为端口连/断时间;Tlc为端口变位时间。

如交换机时间与当前时间相差较大,则应以当前时间做依据,否则无法准确获知端口变位时刻。

2.5 信息处理及告警上传

整站交换机的监测信息量已不少,如不筛选信息来上传,过多的告警将使运行人员判别处理困难,难以区分真实的异常。应用采集到的数据进一步处理,以设备告警信息、设定阈值越限来判定是否产生网络异常或故障、通过分析定位故障发生的环节,以状态信息或告警事件向管理人员或变电站监控系统发送,提醒运行人员采取主动的处理措施。由交换机在线监测系统(或监控软件)筛选处理后需上传的信息如表1 所示。

表1 交换机监控上传信息

3 变电站交换机监测管理设计

变电站实际使用中的交换机由不同厂家、端口数量不一、多个不同架构的网络组成,站内统一监测需能实现上述全部设备的状态监视,同时含能够对采集数据分析处理、事件或日志查询等网络管理应用需要,建立的变电站交换机网络管理系统具备以下功能模块:交换机配置管理、通讯采集、数据处理、状态和数据监视、告警事件、日志或数据查询等模块,如图1 所示。

图1 交换机监测功能模块

(1)交换机配置管理模块。针对满足不同交换机类型、不同厂家、不同接口数量、不同接口设备、不同网络结构的交换机进行配置管理的需要,建立交换机统一配置管理模块,主要实现交换机类型管理、交换机所在网络管理、交换机通讯信息采集管理、接口数量及不同接口设备的属性管理、实现不同交换机MIB 对象信息管理,特别是交换机厂家私有变量信息的管理。

(2)SNMP通讯模块。交换机的信息均通过SNMP轮询和trap 事件采集获得,通讯采集时需兼顾多台设备的同时通讯及阻塞等问题,因此需为每台受监控的交换机建立“轮询+trap”的独立线程管理,使交换机的采集通讯相互独立,互不影响,保证了信息采集的实时性。实现方法是启动交换机通讯采集时创建线程,停止采集时关闭创建的线程。

(3)采集数据处理模块。根据采集的交换机系统信息、端口流量数据、内部状态信息进行处理,获得与网络通讯相关的统计指标、与交换机设备异常相关的事件告警、超限告警信息,输出可直接观测和便于理解的信息。

(4)数据图形显示模块。将交换机的采集数据、处理后的数据、告警信息事件分类进行显示,以数据及表格、状态图、趋势图、告警事件等方式进行展示。

(5)状态数据输出模块。对处理后的交换机及端口信息,建立监控信息上传表,实现告警数据上传,便于实现监控统一管理。支持以IEC61850MMS 或IEC104 协议输出。输出的每台交换机状态信息数据可查询、可监视。

(6)告警输出模块。对所有的操作、通讯事件提供带时标的详细告警信息,并按类别、分窗口显示,告警事件按建立的日志文件可实现多条事件的自动实现存储,可控制存储文件大小、和控制日志文件保存的天数。输出的告警事件文件可方便查看。告警事件支持选中清除。

4 变电站交换机在线监测实现

4.1 变电站交换机监测系统介绍

根据前述交换机监测分析设计,基于VS2005 开发套件开发了以SNMP 通讯协议实现信息采集、支持多个厂家、不同型号交换机设备、可实现变电站内多台交换机的同时网管在线监测软件。根据变电站交换机在线监测的需要,为交换机监测配备了专用的变电站网络在线监测设备,监测设备具有丰富的网络接口和强大的功能,支持多路以太网和光纤的接入,可实现变电站内多个不同网络的同时接入监测,避免了不同网络的级联。监测的交换机数量和网络均可通过配置实现,监测软件可适用于任意规模的变电站交换机的在线监测,具有通用性。

鉴于变电站内监控设备的丰富及另安装专用监测设备的麻烦,本监测程序也可运行于基于Windows 平台的变电站监控后台,或网络报文记录分析装置中。也可作为一个网络状态的检查分析工具,在现场用调试笔记本进行交换机实时状态信息的检查维护。

程序采用多线程防阻塞的设计方案,为每台交换机创建独有的“SNMP 轮询+SNMPtrap”通讯线程,控制交换机MIB 信息数据采集,避免了单台交换机管理通讯中断引起的阻塞问题,保证了数据采集、程序处理的实时性和准确性,同时监控上传信息的通讯也采用独立的线程进行管理。程序采用多文档框架窗口设计,每台交换机画面由单独子框架窗口管理,子框架视图采用多画面分类显示采集信息、处理信息、告警状态、输出信号,并依据告警信息类型实现分类管理和综合存储,方便查看。支持交换机接口界面的自适应布置,可实现显示界面的端口布局与实际设备一致。

4.2 变电站交换机监测应用

本项目在苏北某110 kV 智能变电站现场实现了交换机的监测接入,共有站控层3 台和过程层2 台交换机在运行中实现了监测。现场1 台过程层交换机的连接监测的端口数据、流量等变化状态信息如图2、图3 所示。

图2 某一时刻交换机端口数据

图3 交换机监测的端口流量

图2 中显示交换机自上电运行以来16个端口各自的接收(Rx)和发送(Tx)数据字节数,纵坐标为兆字节数(MB),横坐标为端口标记。

图3 显示在监测的1000 s时间内的流量结果,端口1的平均输入流量为5.3 kB、输出流量为2.0 kB、端口总流量<8 kB,带宽占用率为0.06%(<0.1%)。

通过现场的实际监测,发现现场运行的交换机存在以下问题:

(1)交换机运行时间较短,且多台交换机上电时间一致,判断为设备在运行中曾发生过失电,可能存在直流电源异常,或误操作。

(2)根据监测端口的上电时间信息,获知个别端口连接设备存在通讯中断现象,需进一步排查。

(3)个别交换机的时间不准确,需进行对时。

交换机端口通讯及内部状态监测显示站控层交换机和过程层GOOSE 交换机的端口数据流量均较小,交换机性能显示正常,变电站的交换机设置和配置未发现缺陷。

5 结束语

尽管目前变电站内采用的交换机可靠性高、出现异常的概率低,但无法彻底避免存在的运行风险,通过本项目的开展可以初步掌握变电站网络交换机运行中存在的问题,为今后改进网络设计、提高网络性能、规避网络风险提供一种有益的工具。

[1]高 翔.数字化变电站应用技术[M].北京:中国电力出版社,2008:93-100.

[2]张小飞.智能变电站网络应用及测试技术研究[J].江苏电机工程,2012,31(4):34-38.

[3]杜 凯.基于SNMP的网络性能监测系统的实现[J].计算机与数字工程,2007,35(2):96-100.

[4]汪升泉.基于SNMP的网络性能数据异常检测技术研究[D].哈尔滨:哈尔滨工程大学硕士学位论文,2008.

[5]毛 卉.基于SNMP的网络性能监测系统设计[J].湖北电力,2011,35(2):28-30.

猜你喜欢

交换机端口通讯
《茶叶通讯》简介
《茶叶通讯》简介
通讯报道
一种端口故障的解决方案
基于地铁交换机电源设计思考
修复损坏的交换机NOS
端口阻塞与优先级
使用链路聚合进行交换机互联
系统网络端口安全防护
通讯简史