APP下载

基于人工智能的铁路机务数据信息集成平台设计

2023-11-09单俊强李海涛邢国栋张虎

微型电脑应用 2023年10期
关键词:机务数据仓库报文

单俊强, 李海涛, 邢国栋, 张虎*

(1.国能包神铁路集团有限责任公司机务分公司,内蒙古,鄂尔多斯 017000;2.安徽安为科技有限公司,安徽,合肥 230000)

0 引言

对于铁路机务数据信息来说,其间具有较强的关联性,通过数据挖掘和集成分析可以直接地呈现机务信息的规律性[1-2]。依据铁路机务数据中包含的关键信息,以历史数据为依托,做出更加符合铁路机务开展的决策,从而保证车辆运行、司乘人员行为的稳定性。其中,数据信息集成共享是最为基础的环节之一,而现有的集成平台显然难以发挥更好的应用效果。

文献[3]结合复变函数设计数据库模块和多源数据查询模块,完成了混合型大数据集成系统的设计。然而,经过验证可知该系统集成效率较低。文献[4]融合物联网技术和云计算技术,强化了铁路机务数据信息分析能力,支撑铁路信息化集成建设。但是,系统数据查询响应时间较长。文献[5]结合多种集成硬件实现数据整合与共享,为铁路智能化调度提供了依据。但是,该集成系统的应用时效性较差。

为了解决以往相关研究的应用不足之处,本文提出将人工智能技术中的IFB树结构融入到铁路机务数据信息集成平台建设过程中,构建优化后的数据查询模型,达到缩短数据查询时间、提高数据信息集成效率的目的。

1 基于人工智能的铁路机务数据信息集成平台硬件设计

1.1 信号处理器设计

信号处理器是数据信息集成的关键硬件,以TMS320 F2812芯片为核心,深入分析芯片的引脚和串行通信方式,结合哈佛总线架构[6],建立信号处理器基础架。TMS320 F2812芯片具体结构如图1所示。

图1 TMS320F2812芯片结构示意图

根据图1可以看出,以TMS320F2812芯片为基础设计的信号处理器,主要包括Flash内存、快速模数转换器、增强的CAN模块、多通道缓冲串口等4个关键部分。

1.2 稳压电源设计

电源模块作为数据信息集成平台的动力保障硬件,是影响平台运行稳定性的关键。根据铁路实际环境,设置幅值为5.0 V、3.6 V的电源,再结合集成稳压电路LM2576T-5.0,完成稳压电源的设计。其中,采用包含3 A输出电流的稳压器,依托于集成稳压开关电路中包含的自我保护电路,增加少量的外部元件,设置具有稳定高效特点的稳压电路。

2 基于人工智能的铁路机务数据信息集成平台软件设计

2.1 建立铁路机务数据仓库

考虑到数据信息集成平台设计的主要目的是共享各方面的铁路机务数据信息,辅助管理者建立决策方案[7]。数据仓库的建立需要以提供高级决策支持功能为基础,再针对细节数据统计要求设计低级别查询功能。基于上述集成内容,采用三级模式构建铁路机务数据信息整合模型,通过汇总数据层、数据操作层、数据整合层完成总体设计。具体的设计思想如图2所示。

图2 数据仓库示意图

根据图2可知,高粒度数据存储是建立铁路决策的最后环节。依托于指标体系,从多元化铁路机务信息中提取出数据仓库主体所需的数据信息。除此之外,为了降低数据增量的计算复杂度,提出面向业务主体的数据简单聚集模式,围绕决策主题实现高粒度数据存储,作为信息集成平台的运行基础。

考虑到铁路机务数据信息具有多元性[8],在数据仓库中除了运用信号处理器进行数据初步处理,再融合以元数据驱动为基础的双向映射策略,深入分析机务数据信息的映射规则公式,依托于解析出的参数信息转换数据形式。为了便于数据信息集成平台的数据采集与数据共享管理,应用双向映射模式,针对源数据库和目标数据库建立正向映射、逆向映射关系。首先,定义源数据模型和目标数据模型如下:

A={Q(x,y,z)}

(1)

B={C(f,g),D(e,r)}

(2)

式(1)~式(2)中,A表示源数据模型,B表示目标数据模型,Q、C、D表示3个铁路机务源数据信息,x、y、z表示数据Q的3个属性,f、g表示数据C的2个属性,e、r表示数据D的2个属性。

铁路机务数据信息的正向映射指的是由源数据模型向目标数据模型的映射,可以将其表示为

α=(A,B,φ)

(3)

式(3)中,α表示正向映射,φ表示正向映射规则。其中:

φ={Q(x,y,z)→C(f、g)∧D(e、r)}

(4)

逆向映射指的是正向映射关系的逆操作,也就是将目标数据转换为元数据形式,具体表达形式如下:

α-1=(B,A,φ)

(5)

式(5)中,α-1表示逆向映射,φ表示逆向映射规则,其中:

φ={C(f、g)→Q(x,y),D(e、r)→Q(y,z)}

(6)

2.2 设计分布式数据采集技术

数据仓库的设计为数据信息采集提供了基础条件,提出链路数据采集模式[9],设计分布式数据采集技术。采用适当的工具采集通信网络的状态数据,将链路信息进行初步转换,再结合分布式结构和管理域原理,完成分布式数据采集[10]。首先,按照铁路机务数据的地域、组织等,将其划分为多个域,针对每个域设置一个管理者,通过采集每个域管理者提供的信息,完成整体机务数据信息的采集。分布式采集管理模型的具体形式如图3所示。

图3 分布式采集管理模型

图3所示的分布式管理模型主要采用对等式结构,将铁路机务数据采集任务分配到每个域管理者头上。从域首节点开始运行数据采集技术,将域内其他节点设置为监控主机节点,通过每个域的首节点与其他域首节点的交互,进行域间链路的数据采集。考虑到铁路机务数据的类型较多,可以将分布式数据采集链路设置为有线链路、无线链路2种形式,采用以太网建立有线链路,并提出相应的链路指标测量方法,明确当前数据采集链路带宽,结合实际数据采集环境改进非对称链路带宽,提高机务数据采集精度。采用RI-TAW-PATHCHAR方法测量链路带宽,应用ICMP echo报文得出测量分组的报文循环时间为

(7)

式(7)中,R表示报文循环时间,m表示节点,q表示排队延迟,s表示测量分组的长度,u表示链路带宽,t表示节点对测量分组的处理时间,l表示传播延迟。为了对式(7)进行简化计算,设置响应报文为ICMP超时报文,计算报文延迟时间为

(8)

式(8)中,i表示链路段落,η表示响应报文延迟时间。根据报文延迟时间可推导出上行链路带宽:

(9)

式(9)中,k表示线性函数ηm(s)的斜率。将响应报文设置为ICMP reply报文时,可将报文循环延迟时间表示为

(10)

式(10)中,η′表示ICMP reply报文延迟时间,结合式(9)和式(10),可以推导出:

(11)

2.3 构建人工智能数据查询模型

以IFB树结构为基础,对于上述建立的数据查询搜索空间,采用单值查询模式构建人工智能数据查询模型。具体的IFB树示意图如图4所示。

图(a) 差值查询

根据图4可知,数据查询过程中所有的叶子节点均在同一层结构中,且其中包含铁路机务数据的所有关键字信息,可以向目标人员提供所需的数据信息,实现铁路机务数据信息集成共享。

3 平台测试

针对铁路机务数据的集成共享管理,提出以人工智能为核心的集成平台设计。按照研究内容完成平台建设后,为了验证平台应用性能,以神朔铁路为例,进行平台测试。

3.1 测试环境分析

神朔铁路位于陕西省境内,长达270 km,途经19个主要停靠站点,每个站点都有大量的装车行为,神朔铁路的机务段负责全线运输的机车牵引、检修,其包含十余个子系统,每个子系统在常年应用过程中,均积累了大量数据,难以实现子系统之间跨区域的数据共享,呈现出“信息孤岛”现象。

3.2 开发数据仓库

结合神朔铁路的货运发送特征,提取出铁路机务数据分析主题,建立数据仓库整合主题。深入分析数据整合主题纬度,将其划分为静态、动态与目标维度3部分,如表1所示。根据表1构建铁路机务数据集成平台运行的基础样本。

表1 铁路机务数据特征分析主题维度分析表

3.3 平台性能分析

神朔铁路建立集成平台后,进行为期2周的平台应用测试,其中前两天主要为了观察系统运行的稳定性。明确铁路机务数据信息集成平台可以顺利运行后,获取数据集成平台运行显示界面,如图5所示。

图(a) 日车公里

根据图5可知,应用本文提出的集成平台运行后,可以直观地表现出铁路机务数据的变化总体变化状态,表明了以人工智能技术为基础建立的数据集成平台具有可行性。

为了更加直观地体现出设计平台的优势,以数据查询时间为评估指标,根据平台测试结果得出如表2所示的数据查询时间统计表。

表2 数据查询时间统计表

根据表2可知,随着机务数据条数的增长,集成平台的数据查询时间也在不断增长,从最初的0.56 s增长至4.98 s。

通过计算可知,本文提出的数据集成平台的平均查询时间为0.18 s,有效缩短了集成平台的数据查询时间,提高了机务数据集成共享效率。

4 总结

为了实现铁路机务数据的集成管理,避免出现信息“孤岛现象”,本文以人工智能技术为基础,设计新的数据集成平台。测试表明,所提出的集成平台有效缩短了数据查询时间,提高了系统的时效性,为机车调度指挥提供了支持。

猜你喜欢

机务数据仓库报文
基于J1939 协议多包报文的时序研究及应用
机务联系电路设计实例分析
CTCS-2级报文数据管理需求分析和实现
机务管理模式下提高货车列尾装置作业效率的研究与实践
浅析反驳类报文要点
基于数据仓库的住房城乡建设信息系统整合研究
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
机务检修质量管理研究
ATS与列车通信报文分析