APP下载

基于数据挖掘技术的医疗设备故障监测与识别方法的探讨与研究

2020-08-27

中国医疗设备 2020年8期
关键词:约简粗糙集呼吸机

淮安市第二人民医院 设备科,江苏 淮安 223002

引言

随着科学技术的发展,现代化机械设备不断出现在人们的生活和工作中。近年来,医疗装备新技术发展迅猛,大量智能化、高精度化、高速化的新型医疗装备(如B超、CT、MRI等)涌入医院,已成为二、三级医院必备的产品[1-4]。医疗设备种类多、数量大,如何对庞杂的医疗设备进行管理、维修已经成为医学技术人员研究的重点和难点[5-6]。一方面,医疗设备,特别是大型医疗设备,一般是由电子元件、电路、机械、水路以及光路组成,具有庞杂而繁琐的结构和功能,为医疗设备故障的监测和排查提出了巨大的挑战;另一方面,医院制定的预防性维护、定期巡查等制度在庞大的医疗设备数字面前往往是有形无实,预防性维护难以起到预防的效果。此外,医学技术人员技能水平难以实现对医疗装备技术的同步提升,对于新型医疗设备的故障盘查,往往会使医学技术人员捉襟见肘。基于此,本文旨在提出一种基于数据挖掘技术的粗糙神经网络模型,为医疗设备故障监测和识别提供一种参考方法。

1 数据挖掘技术原理

1.1 粗糙集理论

粗糙集理论是由波兰科学家Z.Pawlak提出的,用于处理不完整的或者具有模糊关系的数据集,并可从已有的一系列数据中挖掘出各模糊数据集中的互作用,从中发现隐含的知识,揭示潜在的规律[7-8]。粗糙集理论的核心是有关知识、集合的划分、近似集合等概念,粗糙集理论作为一种处理不精确、不一致、不完整等各种不完备信息的有效工具,通过对发掘各类不一致、不精准数据集进行提取整理,通过运算实现有用信息的提取,以及对未知事物的预测[9]。在自然界中,大部分事物呈现的信息都是不完整和模糊的,对于这些信息,无法用常规方法进行描述其内部逻辑,所以也就不能正确地处理[10]。在粗糙集中使用信息表来描述论域中的数据集合,例如呼吸机供氧浓度高低是否会影响呼吸治疗,粗糙集使用信息表描述如表1所示。

表1 呼吸机粗糙集信息表

表1中,“供氧浓度”是该粗糙集的条件属性(Condition Attribute),“是否影响呼吸治疗”是粗糙集的决策属性(Decision Attribute)。粗糙集理论其原则就是要使用隐含的条件属性(供氧浓度),来寻找决策规律(是否影响呼吸治疗)。

1.2 粗糙集约简理论

粗糙集的约简过程是保持粗糙集中初等范畴的情况下,消除粗糙集中的冗余数据。该过程为降维过程,仅保留真正有用的数据,即粗糙集的“核”。通常一个粗糙集的约简集不是唯一的,因此,我们期望得到最小决策条件属性的粗糙约简集。然而,当所研究的事物结构增加时,最小粗糙约简集的计算过程将急剧增加。目前,使用最多的方法是启发式搜索法,主要包括基于属性重要性的约简算法、基于区分矩阵和逻辑运算的约简算法、基于属性频率函数启发的约简算法等[11-14]。由于医疗设备故障因素约简过程受限于软件、硬件、结构、环境以及设备固有条件等知识库,在实际操作中粗糙集约简过程受经验、经济支出等主客观因素影响,本文使用基于属性重要性的约简算法对粗糙集进行简约。

1.3 BP神经网络

BP(Back Propagation)网络,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无须事前揭示描述这种映射关系的数学方程。BP网络的学习过程由信息正向传播和误差逆向传播两个过程组成,输入层神经元负责接受外界输入信息并传递给中间层神经元,中间层神经元是内部信息处理层,负责信息变换和计算,可设计成单隐藏层或多隐藏层结构,最后一层隐藏层将信息传递给网络输出层,完成一次信息正向传递,即完成一次网络学习。当实际输出和期望输出不符时,进入误差反向传递阶段,周而复始的信息正向传递和误差逆向传递最终形成一个稳定的、可移植的、具有一定鲁棒性的自主学习网络[15]。目前,BP网络已经被广泛应用于信号处理、模式识别及人工智能等领域。

1.4 粗糙神经网络

粗糙集理论一般用来处理量化数据、模糊关系等问题,但粗糙集理论在推广能力和容错能力方面却略显不足。而无监督BP神经网络具有较强的容错能力和推广能力,以及较强的自组织能力,但却不能择优选择模型输入组合等特点[16]。将粗糙集理论结合BP神经网络模型,将具有一定的理论性和实用性。目前,有两种利用粗糙集约简简化神经网络的方法。

(1)利用粗糙集约简简化神经网络输入维数。神经网络的结构受输入网络的数据维数影响很大,同时数据的维数也影响到决策规则的数目及网络的计算量,甚至影响到神经网络的收敛。因此,适当地利用粗糙约简集降低作为输入神经网络系统的数据维数可以更好地实现网络系统。

(2)利用粗糙约简简化神经网络规则数。在实际应用中,规则数过多会导致系统不能收敛、网络的训练时间长或训练误差大等缺点,因此利用粗糙集约简神经网络的决策规则数,可以减小网络的计算量,加快网络的收敛速度[17]。本文使用前者搭建粗糙神经网络模型,粗糙神经网络方法流程图如图1所示。

图1 粗糙神经网络方法流程图

2 模型的搭建与结果分析

呼吸机是临床治疗中必不可少的生命支持类设备,使用过程中呼吸机故障可能会对患者造成不可挽回的后果,因此本文使用呼吸机为研究对象进行实验平台的搭建,对其进行数据采集、故障分析、模型搭建,最终实现呼吸机故障智能预警功能。

2.1 数据采集

选取我院2017年10月至2019年5月的呼吸机故障报警,进行分类、整合后,采集故障呼吸机环境因素数据、电气因素数据以及气路数据因素。

(1)环境数据采集。呼吸机使用过程中内外环境因素可能是导致呼吸机故障的间接原因,环境因素数据采集主要针对呼吸机关键部件,包括电源模块、空氧混合模块(电子阀式及宝石阀式)、机箱内部温湿度数据的采集。温湿度采集采用YC1001温湿度采集模块进行采集,该模块可同时采集32路独立温度和湿度。

(2)电气因素采集。呼吸机使用过程中关键部件的供电情况的变化是呼吸机故障反应的最直接因素,电气因素采集主要针对呼吸机总负载电压、负载电流、涡轮/压缩机输入电压和电流、空氧混合模块电压/电流及呼出/吸入阀输入电压/电流等。电气因素使用16路JY-DAM1600AC模块进行采集。

(3)气路因素采集。呼吸机气体供应包括氧气和空气,负反馈式气体监测方式可使得呼吸机供气功能处于稳定状态,气体问题是导致呼吸机故障的间接因素。气体因素采集主要针对呼吸机输入气体的压力、浓度以及湿度,空氧混合气输入端气体压力,内部流量监测模块气体压力,吸入、呼出阀气体压力等。气体因素使用LORA、YC1001模块进行采集。

2.2 模型的搭建

实验模型的搭建包括数据的约简过程、神经网络模型的搭建、输出模式的设计等。对2017年10月至2019年5月期间我院呼吸机故障模式进行分析,选取故障频次较高的3种故障模式为研究对象,总故障数150台次,其中呼吸机潮气量异常68台次,氧浓度异常34台次,气密性异常48台次。随机将总故障数按6:4分为网络训练集和网络测试集。对每次故障分别进行故障因素采集,通过粗糙集约简过程,将粗糙集降维至8因素,分别为电源模块湿度、总负载电流、涡轮/压缩机输入电流、空氧模块温度、阀电压、气源压力、气源湿度、气源浓度。

本文使用采集的数据搭建8输入3输出的四层BP网络,实验模型搭建如图2所示。对降维后的8种故障因素进行量化,并作为BP网络输入层;各层神经元之间是全连接的,层内无连接,隐藏层各神经元节点采用Sigmoid函数作为激励函数;将3种故障模式作为输出层。利用MATLAB神经网络工具箱可以方便地完成BP神经网络的创建工作,具体步骤为:① 使用net=feedforwardnet(hidden Sizes,train Fcn)创建向前神经网络,使用LM(Levenberg-Marquadt)算法作为训练权值的算法;② 设置网络参数,网络最大迭代次数设置为1000次,训练最大失败次数设置为5,目标误差设置为0.001;③ 训练BP网络,使用90台次故障模式作为训练集对BP网络进行训练,网络训练过程使用[net,TR]=train(net, INPUT, OUTPUT)完成;④ 测试BP网络,使用60台次“已知”故障模式作为测试集对BP网络进行测试,网络测试过程使用T=net(Test)完成。

2.3 评价指标

本文使用灵敏度(Sensitivity,Se)、特异性(Specificity,Sp)、准确率(Accuracy,Acc)作为评价指标,不同于二分类评价指标,定义灵敏度、特异性、准确率如式(1):

其中,max为故障模式分类总数,本文max=3;TP(True Positive)为真比例,真实类别为正例,预测类别为正例;FP(False Positive)为假正例,真实类别为负例,预测类别为正例;FN(False Negative)为假负例,真实类别为正例,预测类别为负例;TN(True Negative)为真负例,真实类别为负例,预测类别为负例。

2.4 实验结果

随机使用90台次呼吸机故障作为训练集对神经网络进行训练,其中训练集包含潮气量异常41台次,氧浓度异常22台次,气密性异常27台次。神经网络训练迭代次数选择1000次,经训练后,BP神经网络识别故障模式灵敏度、特异性以及准确率分别为87.8%、85.6%、91.1%。使用训练后的BP神经网络对60台次呼吸机故障进行测试,测试集包含潮气量异常27台次,氧浓度异常12台次,气密性异常21台次。测试结果显示,呼吸机故障模式灵敏度、特异性以及准确率分别为75.0%、83.3%、85.0%。呼吸机故障模式识别结果,见表2。

图2 实验模型搭建

表2 呼吸机故障模式识别结果[n (%)]

3 讨论

2011年,卫生部关于印发《三级综合医院评审标准(2011年版)》以来,各级医院严格根据《标准》制定和开展了医疗器械临床使用安全控制与风险管理工作,建立医疗器械临床使用安全事件监测与报告制度,定期对医疗器械使用安全情况进行巡查和考核[18]。然而由于人员配备不足、设备分散、设备种类杂、数量多等特点,在实际工作中,医学技术人员很难对各类设备使用情况进行详尽把控。

数据挖掘技术是从庞杂无需的数据中挖掘出数据之间的特殊关系,粗糙神经网络模型是数据挖掘技术的主要算法,它既保留了粗糙集理论量处理数据的优点,同时还保留了神经网络算法的鲁棒性、自适应性以及高容错率,两者的完美结合,可以提高数据挖掘的准确率[19]。本文使用粗糙神经网络算法对医疗设备故障模式与其对应的故障因素进行分析,本文采集故障呼吸机的环境因素数据、电气因素数据及气路数据因素,并使用粗糙约简理论对各因素进行降维处理,最终建立8输入3输出的粗糙神经网络模型。结果显示,粗糙神经网络算法训练具有较高的灵敏度、特异性和准确率,使用训练后的粗糙神经网络对测试集进行预测,呼吸机故障模式灵敏度、特异性以及准确率分别为75.0%、83.3%、85.0%。

综上所述,本文使用数据挖掘技术探讨医疗设备故障模式与设备使用环境因素、电气因素及气路因素的潜在关系,建立粗糙神经网络模型对采集的故障因素数据进行训练和测试。通过挖掘故障模式与故障因素的潜在关系,设备故障模式能够较好地识别,可为医疗设备故障监测与识别提供一种参考方法。

猜你喜欢

约简粗糙集呼吸机
粗糙集与包络分析下舰船运行数据聚类算法
PB840呼吸机维修技巧与实例
全生命周期下呼吸机质量控制
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
呼吸机日常养护结合护理干预对降低呼吸机相关性肺炎的作用
探讨风险管理在呼吸机维护与维修中的应用
基于Pawlak粗糙集模型的集合运算关系
基于0-1规划的最小属性约简算法
多粒度犹豫模糊粗糙集*
直觉模糊序决策系统的部分一致约简*