APP下载

热控DCS控制系统状态检修方法的探讨和应用

2022-11-26华能威海发电有限责任公司吴建国马东森于信波常晓杰王少君北京必可测科技股份有限公司罗小龙郑雪琴

电力设备管理 2022年15期
关键词:故障诊断状态监测

华能威海发电有限责任公司 吴建国 马东森 于信波 薛 松 杨 春 陈 湘 常晓杰 王少君 北京必可测科技股份有限公司 罗小龙 郑雪琴

通过对DCS 控制系统的质量码信息进行深入研究,当出现质量码状态异常时,寻找与系统各部件之间的关联关系,从而分析得出可能存在的问题根源,问题扩大前进行人为干预,可有效避免DCS 控制系统的突发故障。同时结合历史故障记录、投运寿命等信息对DCS 控制系统进行综合的健康度评价,实现预防性检修更换。

1 现有技术及本文所研究的主要内容

目前,DCS 主控单元通常以两个主控单元双冗余配对使用,主从控制单元通过网络联接实现数据同步。其电源系统采用冗余供电,配置2~4块电源模块,除电源模块同时损坏的极端情况外,其中任意一个模块故障均不影响主控单元的正常运行。当其中一个控制单元故障时,看守检测电路将禁用主控的I/O 接口,并将故障告知副控。随后副控接管I/O 总线控制,开始执行过程控制应用程序。整体过程为自动无扰切换,保证DCS 系统I/O 柜的正常运转。同时发出故障报警,提醒热控人员处理。

主控状态监测主要依赖于系统内部的状态监测,提供给用户实时状态:主控、副控、离线、故障等,并以质量码方式呈现具体报警内容。DCS 系统的日常维护则主要以定期工作为主,通过检修期的定期切换试验,线路紧固检查,日常巡检状态检查、电子温湿度控制等方式,保证主控单元的正常。

本文针对当前存在问题,通过对状态质量码的深度解析,将系统状态代码转化为易于普通用户使用的语言。使得用户在控制器出现异常变化初期,即可清晰直观获取相关信息,并融合各类DCS 历史故障案例及专业技术人员维护经验,整合各类故障现象,形成系统化故障诊断模型,第一时间为用户提供故障原因分析及处理建议,提升故障处理的及时性准确率。同时结合外部综合因素,如环境温湿度、投用寿命、电源状态、盘柜状态、历史故障信息等对DCS 系统进行综合状态诊断。因此,开展DCS 系统状态监测诊断能减少系统故障造成的突发事件,实现系统故障及隐患的提前感知与报警,自动诊断故障隐患点,进而有效提升发电机组运行可靠性、安全性。热控设备实施状态检修的意义主要表现在以下方面:

设备状态深度解析。通过对主控单元状态质量码的深度解析及综合整合研判,将系统状态代码转化为易于普通用户识别和使用的语言,使得用户可清晰直观获取相关状态信息。在控制器出现异常变化初期,即可根据质量码状态发现早期异常,并为用户提供异常生成原因及处理建议;专家故障诊断。将DCS 厂家知识库、历史故障案例及专业技术人员维护经验,以故障模型方式融入诊断系统,形成系统化故障诊断模型,第一时间为用户提供故障原因分析及处理建议,提升故障处理的及时性准确率。

系统内部综合诊断。采集DCS 系统其他部件状态信息如电源、网络、接口卡、I/O 卡件、盘柜等,寻找与主控单元相互间关联规律,充分整合离散式报警信息,形成全方位多角度综合研判算法。通过分散的信息数据呈现集中的状态预警;系统外部综合诊断。结合外部综合因素,如环境温湿度、投用寿命、历史故障信息、定期/巡检工作记录、检修记录等,对DCS 主控单元进行综合状态诊断,进行健康状态评价及库存寿命评估。为用户进行状态检修、预防性维护更换,提供实际数据和理论依据。

2 基于质量码解析的故障诊断和健康评估方案

DCS 控制系统功能强大、结构复杂,通过单一的诊断方法无法全面监测状态信息,进而进行准确的状态诊断及智能预警,须通过多方位特征状态信息对其进行综合性的状态诊断评估。本方案从故障诊断和健康状态评估两个维度对主控单元开展研究。

2.1 故障诊断

DCS 系统内部对主控单元及各部分有着较为全面的监测方式,能发现系统存在的绝大部分异常并提供报警给用户。但一般以“报警”“故障”或“离线”等较为笼统的汇总式报警信息呈现出来,用户很难通过报警全面了解系统出现问题的具体原因,需人员进入软件内部进行查询。查询方式及获得的信息专业性极强,普通的电厂热控维护人员不易理解,造成问题处理的迟滞[1]。本文通过对DCS 系统质量码信息的深入解析和分析整合,结合DCS 各部件、各工艺参数之间的关联关系,对DCS 系统的状态形成更加全面、直观的故障监测诊断方法。包括建立数据库、质量码解析、建立模型及状态监测诊断四个步骤,以下就每个步骤展开论述:

2.1.1 建立数据库

建立数据库作为整体诊断系统的信息源,明确每一个DCS 部件的唯一点名及其对应的信息,内容主要包含设备点名、点描述、盘柜号、型号规格、投用日期、序列号等信息,以设备台帐形式导入软件系统中,采用设备点名检索,匹配相关信息。

2.1.2 质量码解析

在DCS 系统当中,针对每个站点(包含主控单元、工程师站、操作员站、历史站等)、模块卡件、网络节点及I/O 点等状态,通常使用质量码来表达其不同状态及导致该状态的可能原因。例如艾默生公司的Ovition 系统支持四种质量状态:GOOD(正常)、FAIR(强制)、POOR(算法状态)、BAD(故障)。

每种状态指出点的操作和运算条件。某种质量状态的点可能有多个原因,这些原因存储在状态字(如1W2W 字段)的数据位中。可能的质量原因包括点值被保持、硬件出错、点振荡、传感器标定、扫描被停止、数据链路故障、工程值限值、接地故障、电源消失等。这些信息可呈现出当前点位的状态及原因,为进一步故障诊断提供了准确可靠的基础信息。通过对这些信息的筛取、组合、分析,形成综合故障诊断模型,对所监测设备实现全面性、前瞻性、综合性的智能预警诊断。

质量码解析方法为:参照《DCS 系统记录类型参考手册》整理质量码信息清单,根据DCS 故障手册定义质量码信息含义及应用场景。通过与DCS 控制系统建立通讯对接,通常以OPC 通讯方式实现系统联通。通过检索数据库点名实现数据对接,然后根据站点状态字段编号及数据位编号,提取到相应的质量码信息。按照点名——字段编号——位编号的检索顺序,提取到对应的点的质量码信息。例如获取#1盘柜#1主控的当前控制模式信息:首先在数据库中查询到点名为“DROP1”,字段FB、位编号4为“真”时,表示当前状态为主控模式。

其中一部分质量码信息可直接用于主控单元状态显示及预警,如“控制模式”、“备用模式”、“网络超时”、“主副控不匹配”等,这些信息可直观呈现出主控单元的当前状态,用户收到报警信息后可第一时间做出判断和处理,因此无需二次处理,质量码状态为真时可直接进行报警。

另一部分质量码如“离线模式”、“检测到此站发生故障”、“站处于报警状态”、“检测到无效控制回路页”等,这些信息发出时用户无法根据信息直接得知系统存在的问题,需同时与其他信息进行综合研判解析,进行二次诊断后生成状态预警信息。例如“检测到此站发生故障”,需同步检索当前站点所含电源状态、网络状态、主控状态、IOIC 卡状态,I/O 卡件状态,及其他发生变化的质量码信息。根据不同状态异动确定此站发生故障的原因,从而为用户提供直观的综合故障信息。例如同步检测到IOIC 卡状态异常,则可研判为“IOIC 卡状态异常导致站点故障报警”。

2.1.3 模型建立

质量码获取到后,如何判断当前状态是否正常,因此模型的建立是确定设备是否异常的关键步骤,通过分别建立主控单元正常模型与故障模型,建立主控正常与故障的判断基准。

建立正常模型:通过正常模型的建立,可为系统建立一套正常运行及正常停运状态下的基准值,包含状态开关量点、正常运行区间值、正常或停运状态时各设备的状态信息。当状态偏离此模型时视为设备存在异常;建立故障模型。参考《防止电力生产事故的二十五项重点要求》、《GBT 35731-2017火力发电厂分散控制系统运行维护与试验技术规程》、《火电厂热控系统可靠性配置与事故预控》、DCS 故障案例、专家经验等相关主控单元案例,建立主控单元异常故障诊断模型。

建立趋势模型。主控单元的负荷率总应维持到一个合理范围内,当负荷率突然变化超出范围时,代表主控运算量过多,容易发生主控死机等故障。产生原因主要有两方面:一类是现场设备的实际操作量和变化量突然增多,此类造成的负荷率短时突升属于正常情况,可排除主控异常风险,但长时负荷率居高不下则代表主控长期运算量加大、存在故障风险,此时应对负荷率重点监测,必要时应调整主控所带设备数量;另一类是主控本身或关联部件存在异常,造成的负荷率突升,此类是重要需重点监测和解决的风险。因此根据负荷率与主控部件的关联关系建立相应的趋势模型。

采集主控单元负荷率,显示负荷率实时及历史趋势。通过对负荷率趋势的监测,可对主控负荷异常突升、频繁大幅波动、长期高于标准区间或历史区间等非正常负荷变化进行监测,从另一维度开展对主控单元的诊断预警。

2.1.4 状态监测诊断

通过以上数据库建立、质量码解析、正常与故障模型建立后,所有诊断算法模型均置入到系统中,在系统内部建立故障诊断知识库,故障诊断条件满足时,根据算法模型发出预警或报警;实现主控单元实时状态监测和预警。

2.2 健康状态评估

主控单元除上述实时状态监测诊断外,其他非实时性设备信息,如历史故障记录、同批次设备信息、投用寿命时长、环境温湿度等,也对主控单元的使用寿命产生影响,因此应结合上述信息对主控单元进行综合健康状态评估,为状态检修策略提供数据依据。健康状态评估与故障诊断从两个维度同步进行,形成完整的监测诊断评价体系[2]。

历史故障记录:按每个盘柜中所包含的部件建立存储数据库,每次主控单元发生故障时,将故障信息存储到数据库中,形成历史故障信息记录表。如:当IOIC 卡编号0001设备发生故障时,平台通过网络通信的方式会读取到该设备存储在数据栈的故障信息,并将该故障信息存储到数据库中,同时通过该设备的KKS 编号等标识信息以及根据配置的周期时间,在数据库中查找该设备在周期内发生过的历史故障信息,通过故障编号进行比对,当在历史故障信息表中匹配到了相同的故障编号,就可判定在周期内再次发生了同类故障系统自动记录故障时间、故障内容,并将故障原因存储至对应部件的存储数据库,健康状态评估为“存在重复故障,建议择机检查处理”,建议检修期进行更换或重点处理。

同批次设备关注:与上述方法类似,通过事先建立的设备台帐数据库,将设备投运时间存入数据库。当任一故障发生时,调取设备台帐中投用寿命同月份主控单元,同批次主控列入关注清单;一定周期内同批次其他主控单元出再次出现该故障,同批次主控显示报警,健康状态评估为“同批次设备存在重复故障,建议择机检查处理”,建议检修期进行更换或重点处理。

超寿命评估:调取“设备台帐”投运时间,自动匹换算为小时单位,投运寿命大于87600h 或最早批次主控列入关注清单;任一故障在最早批次主控单元发生,推送全部同批次主控单元清单,列入重点关注清单;该故障在最早批次主控单元重复发生,输出超寿命报警。健康状态评估为“设备超寿命运行且出现过故障,建议择机检查处理”,同时推送至检修管理模块,检修前60天推送状态检修设备名细,建议检修期进行更换或重点处理。

综上,此状态监测方法可扩展至DCS 各部件,将DCS 系统内部的信息加以识别和分析研究,不仅可实时监测到各部件的状态,通过综合的研判机理,对健康度及可用寿命进行评估,更可将难以直观识别的质量码信息进行可视化转换,变成易于热控检修人员理解的状态信息。对对DCS 控制系统进行有效的监测和故障预防,有着积极和实用的辅助作用。

猜你喜欢

故障诊断状态监测
基于包络解调原理的低转速滚动轴承故障诊断
特色“三四五六”返贫监测帮扶做实做细
状态联想
数控机床电气系统的故障诊断与维修
生命的另一种状态
基于量子万有引力搜索的SVM自驾故障诊断
网络安全监测数据分析——2015年12月
网络安全监测数据分析——2015年11月
坚持是成功前的状态
不穿戴也能监测睡眠