APP下载

D-S证据下的高铁信号系统异构数据融合*

2022-03-23牛宏侠陈光武司涌波佘一鸣

传感器与微系统 2022年3期
关键词:信号系统异构证据

任 超, 牛宏侠, 陈光武, 司涌波, 佘一鸣

(1.兰州交通大学,甘肃 兰州 730070; 2.甘肃省高原交通信息工程及控制重点实验室,甘肃 兰州 730070;3.轨道交通运行控制与运维甘肃省国际科技合作基地,甘肃 兰州 730070)

0 引 言

当前我国高速铁路正处于快速发展时期,建设新型智能运维管理模式是近年来我国高铁发展的主要方向之一[1,2]。高铁信号系统作为高速铁路的大脑和神经中枢,智能化运维管理模式在其上的应用可以有效提升高速铁路的安全性和高效性。

高铁信号系统智能运维体系总体分为三个部分:数据汇聚与融合、数据服务和数据应用[3]。当前高铁信号系统设备监测数据存在数据类型多、耦合度不同、语义不一致等特征问题,无法建立信号系统数据之间的关联关系,因此,迫切需要对现有铁路基础设备信号系统数据进行统一的融合管理,深入挖掘其数据价值,建设数据平台,为后续智能服务提供数据基础。因此,如何构建高铁信号系统数据融合服务平台成为亟需待解决的问题。

目前,国内外的学者对多源异构数据融合的研究开展了有效探索,其研究成果主要有:文献[4]验证了数据加权融合算法具备无需验证信息且融合精度比较高的优点;文献[5]运用了一种基于蝙蝠算法优化加权的D-S证据融合算法,提高了监测精确度和全局决策的快速性;文献[6]提出结合D-S证据理论与不精确概率理论的故障诊断方法,并验证了该方法在信息融合系统下决策诊断效率得到明显改进;文献[7]从特征选择和参数优化相结合的思路,采用反馈型D-S证据理论来解决在高速列车多通道数据融合出现的问题;文献[8]对高速铁路信号系统大数据的规范化做了相关研究;文献[9]针对高铁信号系统智能维护决策中的数据信息多源异构性问题,运用本体融合算法,对比经典闭包算法降低了计算复杂度和时间复杂度,算法运行时间也远低于经典闭包算法,并且提出了一种高铁信号系统异构数据融合和智能决策的统一框架,并验证了其维护决策的准确性和有效性。

上述研究表明,在高铁信号系统领域,运用多源异构信息融合技术和方法,实现多源异构数据的融合互补,形成一致性和综合性维护数据,能对后续智能维护决策提供数据保障。本文提出一种新的高铁信号异构数据融合框架设计方案,对底层数据利用本体思想和D-S证据理论方法进行特征融合以减少数据间冗余,提高数据精度,优化决策效率,并通过对某段高铁信号系统监测数据的处理验证本文提出的框架和算法的可行性。

1 高铁信号系统异构数据融合架构设计

目前,对高速铁路信号系统有关多源异构数据融合和智能维护决策框架整体设计还没有统一的标准,文献[9]作为当前数据融合在高铁信号系统的典型研究,指出分布式数据库在设计初期未考虑数据融合,致使局部的本地数据库资源存在类名和属性命名冲突、底层数据融合机制不明确、数据冗余程度高、利用率低下等问题。本文提出一种新的高铁信号系统多源异构数据融合智能决策框架如图1所示,增加了底层数据融合机制,在数据逻辑层和决策层之间设立数据融合层,通过抽取各局部设备数据库信息特征属性,形成关系映射表,融合各特征属性,从而提升智能决策的性能。

图1 高铁信号系统多源异构数据融合框架

高铁信号系统多源异构数据融合智能决策架构分为4个层次。

最底层0层为物理层,表示各个不同电务段、车站、分局等基础设备的实际的物理数据库,存储各设备设施的监控信息、设备出厂信息、维护信息和日志记录等信息。

第1层为数据逻辑层,通过构建的分布式数据库存储各设备设施信息数据。首先按照概念、属性映射关系建立局部数据库,为后续分布式数据库检索、查询提供数据支撑。然后根据各设备所需存储的数据信息属性建立数据表,各局部设备数据库本体遵循关系数据库模型即:D=(L,P,F,A)四元组模式,其中,L为名称集合,A为属性集合,P为主键,F为外健。

第2层为数据融合层。局部数据库建立之后,抽取各设备信息组成新的关系映射表,从而进行特征属性融合。按照抽取的各设备数据特征属性数据,即:[设备编号,设备名,时间,设备运行状态,…],在融合过程中,不断根据需求增添特征属性到映射表,完善设备特征决策属性知识库以提升设备运行状态识别精度。

第3层为智能决策层,是整个框架的顶层。通过数据逻辑层提取各设备数据信息,在融合层将各设备数据特征完成融合,融合后的数据作为训练样本交付智能决策层,采用机器学习方法形成高铁信号系统故障识别模型,完成智能决策。

2 高铁信号系统异构数据融合方法

根据高铁信号系统多源异构数据融合框架设计方案,在数据融合层中融合各设备间信息特征属性。在满足时空匹配条件下,通过融合特征知识库与D-S证据理论的对应关系,运用互补型结构方法,提升智能决策置信度。

D-S证据理论是将证据集划分称两个或两个以上的不相关部分,利用它们对识别框架独立进行判断,然后用组合规则将其组合起来,并结合信度函数和证据间的支持度原则进行修正,有效提升算法可行性。

2.1 D-S证据理论

D-S证据理论,由Dempster A P[10]提出,Shafer G[11]进一步改进发展而来,其核心是Dempster合成规则。本文采用D-S证据理论方法,并对此方法进行改进,为决策分析提供理论支持。

定义1基本概率分配

存在一个假设空间Χ(辨识框架),包含N个完备且互不相容假设命题元素AN,元素个数N的集合有2N互斥的子集,记为2Χ,m函数:2Χ∈[0,1],若满足下列条件

则称m函数为Χ上的基本概率分配(bastic probablity assignment,BPA)或mass函数。

定义2证据组合规则

设m1,m2,…,mn为n个独立证据的基本概率值,组合公式采用正交和运算计算得出即m=m1⊕m2⊕…⊕mn,则

(1)

(2)

式中K∈[0,1]为归一化系数(冲突系数),反映的是证据间的冲突程度,即当K→1时,证据间冲突性逐渐提高,当K→0时,证据间冲突性逐渐降低。

2.2 D-S证据理论分析

证据理论并不是在任意场合均适用,当外界环境因素使得证据源出现问题时,则会引发证据间冲突,从而产生与事实不符的结论,即“Zadeh悖论”。因此,在组合高冲突的证据时,需要做出一定的修正来确保达到更好的融合结果。

定义3Pignistic概率

在识别框架X={X(1),X(2),X(3),…,X(n)}下的单个子集均独立并满足

(3)

则称BetPmi(Xj)为基本信任分配下的Pignistic概率。

修正方法通常引入相似度函数和相似度矩阵来表明证据间的相似程度,式(4)表示的是两个证据量间的相似度,多个证据的相似度由式(5)表示更为直观。

相似度函数

(4)

相似度矩阵

(5)

D-S证据理论规则中,多个条件需要进行信度分配来解决不确定性问题,提升结果准确度。证据信任度(CrdPm)描述的是其他证据对本证据的支持程度,支持度越大,与其他证据的变化趋势就越相近,即本证据就越可靠,在融合过程中不需要对其进行修正。而证据虚假度(Fal)则表明虚假度越高,证据间冲突越大,融合前证据应进行修正以减少其在融合过程中的影响[12]。

对于n个证据源中每个证据体的信任度计算公式如式(6),将各个证据体的信任度组合起来就是信任度向量,如式(7)

(6)

CrdPm=[CrdPm1,CrdPm2,…,CrdPmn]

(7)

由式(3)可知,在同一识别框架下,存在多个证据的证据源的冲突系数k0,如式(8)所示,当去除一部分证据源之后,冲突系数调整为kj,如式(9)所示

(8)

(9)

从上式(8)、式(9)可得,0≤kj≤k0≤1,因此定义虚假度如式(10)

(10)

证据融合过程中,将证据焦元权重分配修正,以减少证据间冲突对融合结果的影响,修正后的权重表示如式(11)所示

τi=1+CrdPmi-Fal(mi)

(11)

归一化处理后可得式(12)

(12)

2.3 异构数据特征融合过程分析

首先对实验过程的数据预先进行数据清洗,各设备数据对应各相关属性,去除非关键影响属性,保留主属性,冗余数据特性描述归一化,构建设备数据记录库,对各设备数据特征设定知识库边界,完善设备状态间冗余特征描述,融合成新的设备数据特征映射表,初步完成数据特征融合,提高数据质量,提升数据融合效率。

数据融合过程具体步骤如下:

步骤1 从信号系统各设备监测数据库中抽取各设备监测数据信息表,并提取各设备的特征,完成数据预清洗,完成局部数据库基础映射表。

步骤2 将局部信息数据特征提取形成特征数据知识库,尤其是对各设备故障文档描述中抽取的记录信息要完整表示,各特征属性排序计数表示。

步骤3 将n个特征属性证据运用式(3)转为基本概率,根据式(5)~式(12)完成各证据特征间的相似度、信任度和虚假度。

步骤4 将步骤3中求解得到的信任度和虚假度完成排序,并对高冲突证据加权平均。

步骤5 根据D-S证据理论合成规则完成各特征属性融合。

步骤6 将步骤5完成的融合结果进行测试训练,对于故障识别准确率达到90 %以上的可完成后续故障测试模型构建,对于不达标准的返回步骤2进一步抽取新特征属性,扩大特征知识库集,完成数据特征融合。

具体融合算法执行流程图如图2所示。

图2 算法执行流程图

以CTC设备监测数据为例,CTC设备的主属性数据包含:始终端信号、区间方向、区间信号及灯位显示状态、区间轨道电路占用情况、接口状态和站名编号等,各主属性通过数据规则转换表,将数据属性特征规则化表示后转录入数据库中,选定的主属性特征录入到特征知识库中,而后根据D-S证据理论完成后续数据融合。表1为CTC设备数据部分数据规则转换规则。

表1 数据规则转换表(部分)

3 实验与结果

根据前述的异构数据特征融合方法,对某段高铁信号系统各设备多源异构信息数据库中数据集预先进行清洗,选取了该信号系统中具有代表性的7类设备数据,清洗过后的设备有效数据量如下:CTC设备、道岔、信号机、电源屏、轨道电路、计算机联锁、车载设备分别为78,218,121,65,327,196,58。合计1 063条数据,通过效数据集进行实验分析,验证本文方法的可行性。

在实验过程中对1 063条有效数据集随机选取80 %的数据进行参数学习训练,20 %的数据用来测试故障诊断的准确率。采用故障分级思想,通过研究归纳总结,将目前高铁信号系统故障决策预警分为三级,即:第一级故障为故障所发生的位置或者大致范围,第二级故障为产生故障的具体原因,第三级故障为故障的可维护措施预警。

图3给出了文献[9]本体融合算法和本文D-S理论融合算法的计算时间比较结果。

图3 运行时间对比

如图3所示,在数据集数在不超过700的情况下,本文D-S理论融合算法的计算时间要少于本体融合算法的算法;当节点数在700以上逐步增加时,数据集间冲突增加,融合成本提升,计算时间较比本体融合算法方法略有延长,平均延长时间不超过4 ms。本文方法对于一级~三级故障的平均准确率均高于本体融合算法的方法,如表2所示。尤其是对第三级故障的准确率而言,由于增加了底层数据的融合机制,使得数据细粒度更为准确,三级故障的平均准确率提升了5.6 %,验证了本文方法的有效性。

表2 故障诊断测试准确率对比 %

4 结束语

针对高铁信号系统的多源异构数据信息特征,本文构建了新的高铁信号系统多源异构数据融合架构,确保多源异构数据之间的形成知识共享和重用,并通过D-S证据理论的过滤,确保底层数据质量的提升并形成有效的规则组合,缩小规则间冲突。实验验证结果表明:对于一定规模数据集,D-S证据理论下的数据融合方法有良好的适用性和可扩展性,将信息数据最大程度的利用化,在算法实时性和故障诊断准确率方面提升了顶层智能决策性能。

猜你喜欢

信号系统异构证据
ETC拓展应用场景下的多源异构交易系统
离散异构线性多智能体系统的输出一致性
试论同课异构之“同”与“异”
地铁信号系统车站施工工艺研究
浅谈无锡地铁信号系统人机界面的应用与研究
地铁信号系统的维护方法与维修技术探析
凝聚与铺张——孙绍振教授《以丑、呆为美》两岸同课异构教学观摩后记
手上的证据
家庭暴力证据搜集指南
手上的证据