APP下载

时频系统故障预测

2022-07-18王玲玲

天文研究与技术 2022年4期
关键词:氢原子时频状态

王玲玲,苟 伟

(1. 中国科学院上海天文台,上海 200030;2. 上海市空间导航与定位技术重点实验室,上海 200030)

时频系统为甚长基线干涉测量站提供稳定可靠的时间标准,输出信号的质量直接影响观测质量。时频系统包括氢原子钟和其他时间比对设备,氢原子钟作为其中最关键的设备,是一种高精度的频率标准,但由于微波谐振腔输出频率易受外界环境因素干扰,所以性能也容易受外界环境影响。针对整个时频系统状态和性能变化的研究目前主要集中在环境变化对氢原子钟性能的影响,为此,国内外的学者都做了若干工作[1-4]。研究结果表明,在环境控制较差的情况下,氢原子钟的频率稳定度显著下降。因此,对于环境状态的有效控制是确保氢原子钟乃至整个时频系统可靠运行的前提。

另一方面,作为用户,针对氢原子钟的运行,除了提高设备本身的可靠性之外,对发生故障的预测是减少故障发生及尽早处理的有效方法。因为氢原子钟的运行是一个动态过程,伴随复杂的物理和化学状态变化,其中一些变化最终导致氢原子钟性能指标变化甚至故障发生,观察和分析这种变化之间的关系有助于实现故障预测。这首先需要对设备状态进行监视,然后通过对相关数据进行分析处理,得出预测模型,从而达到精准预测设备状态的目的。

1 数据收集

故障预测是一门多学科综合信息处理技术,是故障诊断技术的一种拓展和延伸[5],是在设备正常工作的前提下,利用历史数据和相关技术,结合当前状态对可能发生的故障趋势进行预测的一个过程[6]。预测方法大致可以分为3类:基于模型、基于数据驱动和基于统计可靠性[5]。中国VLBI网建立已有十多年的历史,运行至今积累了大量的数据,具有进行相关研究的数据基础。本文选用基于数据驱动的故障预测技术进行研究。该技术近年来广受重视并快速发展,成为重要研究热点[7]。

甚长基线干涉测量站时频系统的主要设备包括氢原子钟、分频钟/台站钟、时间间隔计数器、切换器、倍频器、频率/脉冲分配器、全球定位系统/北斗导航系统时间服务器等,另外还有提供周边服务的设备,包括不间断电源(Uninterruptible Power Supply, UPS)、恒温恒湿空调、室内数字温度计、室外气象站等。根据 《实用型氢原子钟技术说明书》,甚长基线干涉测量站使用的主动型氢原子钟提供类似小型钟的状态监控系统[8],用户可以通过串口采集数据,利用数据分析钟的状态,其他设备的数据采集同样可以通过设备自带的串口或网络通信协议接口并配合对应的采集软件完成,也可以根据需要通过专用串口/网口转换设备将接口转换后采集,数据采集频率根据需求设定。

时频系统的监测数据包括氢原子钟内部各参数的状态、钟差、钟房环境温湿度、外部环境温湿度、气压、风向风速等,不同的数据来自不同的设备,比如氢钟状态来自氢钟,钟房温湿度来自钟房温湿度计等。这些数据为预测模型的研究提供了第一手资料,使得研究具有可行性。经过多年建设及持续维护和改造,各时频系统中运行过或正在运行的设备众多,其中,氢原子钟的型号包括MHM2010,VCH-1003M,SHOM-3,SHOM-4和SHOM-A等多种,具体的设备编号也有所变动。数据存储的内容和格式有不同程度的差异,而且存储方式及数据格式不完全相同,有的以数据库的形式存储,有的以文件存储,想要进行数据分析,第一步工作是对数据进行整理,建成时频系统数据仓库。

2 数据整理

典型的基于数据驱动的故障预测方法有人工神经网络、模糊系统和其他的计算智能方法[5]。本文采用一种基于数据挖掘思想的预测算法展开研究。

时频系统的主要设备如前所述,经过业务分析,时频系统数据仓库的实体联系图如图1。

接下来,根据数据仓库建设的步骤,分别进行逻辑建模和物理建模,逻辑模型如图2,部分数据表设计如表1~表6。

表2 钟差数据

表3 氢钟运行状态

表4 室外环境

表5 室内环境

表6 系统运行状态

图2 时频数据仓库的逻辑模型图

由于数据的多样性和复杂性,我们首先需要对数据进行整理,整理的步骤包括数据清洗及数据格式转换等。数据清洗即剔除原始数据中的错误数据和无效数据,经格式转换后统一入库。

时频系统的数据记录有数据库、文本文件两种形式,清洗的过程中需要注意时间格式有北京时间和世界时的区别,为后续统一关系,这里全部换算成统一的世界时。台站的设备时有更换,有型号升级或同型号更换,这些信息有的完整,有的错误,有的缺失,缺失的补空,错误的需要修正。数据记录有混合,即同样的数据表格里,可能混合了不同时期、不同型号或编号的设备数据,这种情况需要根据当时的日志文件对数据进行拆分及重新补录。另外,由于源数据量较大,为方便测试,本文对数据进行了均匀缩减抽样。

3 数据分析

由于在所有数据中,能够最直观反映时频系统状态的是氢原子钟的状态数据,所以本文以SHOM-4型氢原子钟为例,重点分析有关氢原子钟的状态数据及当时的环境温度数据。根据氢原子钟技术说明书,钟的常规状态参数有32个,除去1个备用及8个隔离放大器的数据,其他均可以实时反映运行状态。图3是2019年编号为88#的氢钟状态及当时的环境温度信息,其中纵坐标表示各参数的数值。

图3 2019年数据(部分数据有缺失)

氢钟的这些状态参数可以根据物理模块分为电源、恒温、离子泵、接收机、隔离放大器等几部分,其中接收机中频信号的数值代表钟信号,若小于1.5则表示钟输出信号消失,属于严重故障,本文重点对该参数进行分析。在对数据进行细化之后,根据氢钟技术手册,结合以往的经验,可以得到11个参数与中频信号密切相关,具体如图4。因为数据值相差比较大,为了让读者看得更清晰,我们把数据分成两幅图显示,上半部分显示OSCI的值,下半部分显示另外10个参数值。进一步细化可以看到更多细节,比如从图5两个数据曲线形状判断,两者有很强的相关性,可以说,曲线的弯曲方向大致相反,也就是温度升高时OVN1和OVN2值下降,温度下降时OVN1和OVN2值升高,即OVN1,OVN2和温度数据相关度最高,这是因为OVN1和OVN2是钟恒温部分中外炉位置电压值,直接受环境温度变化的影响。

图4 部分相关参数状态

图5 外炉电压与温度数据关系

4 故障预测模型

4.1 几种挖掘算法的比较

信息化社会之下,日益增长的各类数据隐含着大量价值,数据挖掘技术是为了满足获取此价值的要求,从大量随机数据中提取有用信息和知识的技术。在数据挖掘技术发展的过程中,大量算法应运而生,但同时各有各的局限,多种算法融合是解决具体事务的发展趋势[9]。本文以2019年数据为例,采用几种典型算法分别进行分析处理,并比较其性能。

根据每种算法在传统上的应用,结合特定场景,本文选择决策树、聚类、关联和时序等算法进行测试研究。其中各算法的有关参数可以调整,比如在决策树模型中,我们可以看到各参数的依赖关系网络(图6),选择中频信号节点,显示所有链接,IFL与OVN1,OVN2,FLUX,DIO及温度数据有关,而调整到显示较强链接,与DIO的关系链断开。关联算法中多个参数由于是连续数据而被忽略,而时序算法需要连续的数据,不允许出现空白,因为测试中选定的数据有缺失,所以需要指定用来填充空白的方法,这样可以使用前面的值、平均值或特定的常量。由各挖掘算法创建的挖掘模型如图7。

图6 参数间依赖关系网络

我们可以使用提升图对各算法模型的准确性进行查看,如图8,蓝色线为理想模型,图中x轴表示用于比较预测的测试数据集的百分比,y轴表示准确预测的百分比。因此,理想线是一条对角线,用于显示在50%的数据中,模型准确预测50%的事例(即预计的最大值)。由图8可知,各模型都接近理想模型,其中,决策树模型表现最优。

图8 各模型挖掘准确性提升图

然而,我们仔细查看预测结果时发现,虽然绝大部分值预测成功,但是数据中实际存在的一个异常值并没有成功预测,即图9中鼠标选中的数值0.38,因为小于1.5,所以是实际的异常值,但是这个值3个模型都没有预测到,可能原因是该异常值在15 130个数据中只出现了一次,即测试数据不够典型,在实际预测中的效果不好。时序算法中的测试存在同样的问题,所以接下来的测试对数据进行重新选择。

图9 各模型的分类矩阵

4.2 模型优化及预测

新的测试数据选自2013年编号43#氢钟,其中,中频信号的数据如图10,可以看出期间发生了多次信号消失现象,本文摘取这段数据进行模型构建展示。

图10 2013年43号钟的中频信号数据

这次模型测试中,聚类模型的分数高过决策树,达到0.88(图11),所以选用该模型对测试数据的后半段进行预测,将预测数据中的预测值IFL置空(NULL)。从预测分类矩阵(图12)可以看出,对于预测值IFL,其各类数据的预测结果都比较均匀,与实际数据相符,结果中预测到值为0.06(故障值)的数据15条,与实际数据的14条非常接近,预测概率从0.51提高到0.857,准确率也很高。由此可知,此模型故障预测成功。

图11 各模型准确性提升图

图12 聚类模型分类矩阵

本文同时对时序算法进行了测试。时序算法用于预测一系列连续数据点的未来值,要求必须包含时间键,而本文的数据正是以时间序列采集的,符合要求。实际的预测结果如图13,可以看到左侧实线是实际值,右侧虚线是预测值,比对实际数据,即从图10中可以看到3月19日5:17:10之后附近的数据确实是在3左右,由此可知预测部分非常准确。然而,重新选择预测开始点,预测结果如图14,并不能令人满意,因为数据的周期性不明显,因此使用的时序算法并不是最理想。这有待于后续继续分析研究。

图13 聚类模型预测结果

图14 时序模型预测结果

5 总 结

本文针对时频系统故障预测进行了一些方法探索,利用数据挖掘技术对历史数据进行分析和测试。从测试结果可知,结合设备本身状态数据及运行环境数据可以分析预测设备状态趋势,从而对可能发生的故障进行预警。

分析的难点在于算法的选择和设计,模型构建过程是算法不断优化的过程。本文测试得知聚类模型可以很好地进行预测,后续可以通过更多的数据进行验证,同时下一步需将此预测模型集成到时频系统软件,从而实现系统实时故障预测。

另外,分析所用的预测模型需要有大量原始数据进行训练,用于训练的数据越多越能覆盖所有可能,模型越准确越健壮,然而如何在有限的算力下高效处理这些数据成为难题,后续有必要进行专门研究。

猜你喜欢

氢原子时频状态
高聚焦时频分析算法研究
状态联想
基于稀疏时频分解的空中目标微动特征分析
生命的另一种状态
索末菲量子化条件及其在周期性运动中的应用
对氢原子能量吸收的再认识お
坚持是成功前的状态
基于时频分析的逆合成孔径雷达成像技术
一种基于时频分析的欠定盲源分离算法
氢原子能级跃迁问题分类探讨