APP下载

基于集成支持向量机的医疗设备风险评估研究与应用*

2019-07-31陆阳杨林戴剑峰王菁菁王雪元

生物医学工程研究 2019年2期
关键词:分类器样本医疗

陆阳,杨林,戴剑峰,王菁菁,王雪元

(苏州大学附属第一医院医学工程处,苏州215006)

1 引 言

安全性和有效性是医疗设备应用于临床的前提和基础。声、光、电、机械等多学科技术在医疗中的广泛应用,提高诊疗水平的同时也带来了潜在的风险。对风险进行评估、预警和控制是现代医院医学工程部门的重要职责[1-2]。

医疗设备使用风险的精确评估作为全生命周期设备管理的重要内容,越来越受到重视[3]。钱正瑛等[4]运用层次分析法将质控数据、专家意见和管理部门的评价指标综合起来,实现了定性和定量评估相结合。Stine等[5]关注设备使用过程中的网络风险问题,提出了一种医疗设备网络风险评分体系,运用基于STRIDE模型的安全问卷得到设备的风险评分。Silva[6]、Custódio[7]等重点研究了人与设备之间的互动关系,从人因工程方面应用认知可靠性与错误分析方法(cognitive reliability and error analysis method,CREAM)评价操作人员的失误率,以此作为可靠性评估的补充。Lin等[8]运用失效模式和效应分析法(failure modes and effects analysis,FMEA),建立基于风险的优先排序框架,并采用模糊理论将专家经验转化为量化信息,提高了评估准确率。

传统的研究多为定性评价,依赖于专家意见,且未考虑因素之间的交互作用。近年来在信息、金融等领域广泛应用的支持向量机能够将历史数据、专家经验及多种不确定的信息综合起来,对小样本、高维非线性数据精确拟合,具有很强的泛化能力[9-10]。医疗设备风险因素复杂多样,SVM采用近似算法来降低计算的时间及空间复杂度,为了进一步提高评估精度,本研究引入AdaBoost用于基学习器的训练。AdaBoost可以优化精度较低的弱学习算法,训练出高精度的强学习算法,在训练中增加错分样本的权值,使迭代更多地关注错分项[11-12]。

2 算法原理

2.1 SVM[9-10]

SVM是利用结构风险最小化原理求解最优分类超平面来得到高准确率的分类器,见图1。令数据集为样本总数,xi∈Rp⊂R,xi是p维向量,yi∈{-1,1} 为类标。在分类中找到最小误差的分类器f(x)=sgn(wTx+b)作为超平面,为了找到最优分类器,需要对yi(<w,xi>+b)≥ 1-ξi(ξi≥ 0,i=1,2,…,N)以及进 行二次规划。式中,用正规化参数C平衡分类器在数据集D中的时间复杂度与分类准确率,通过对偶函数求解二次规划问题。用相应核函数替代上述公式中的内积,将线性问题转换成非线性。

图1 线性可分的最优分类超平面Fig 1 Optimal classification surface

2.2 AdaBoost[11-12]

AdaBoost的自适应性表现在被前一个基分类器错分的样本在后续迭代中会被加强,加权后的样本再次训练基分类器。同时,每次迭代会引入新的弱分类器,直至达到预先设定的最小错分率或迭代次数。算法流程:数据集T={(x1,y1),(x2,y2),…(xn,yn)},xn表示训练样本数;yi∈{-1,}1,i=1,2,…,n;作为弱分类器在样本x上的结果输出。最终通过从训练数据中学习弱分类器或基分类器,得到强分类器:

2.3 构建集成算法

用SVM生成一系列依赖于上一次训练结果的基学习器,将AdaBoost用于基学习器的训练中,通过前一次的错分率优化样本的概率分布,通过单个基分类器加权建立评估模型:

(1)设N个初始学习样本集xi为样本向量,xj是分类结果,初始样本权重wi=1/N,i=1,2,…,N。设AdaBoost最大迭代次数T。

(2)利用支持向理机对加权训练集进行训练,得到第t(t=1,2,…,T)次的评估模型gt。

(4)设定基分类器权重αt =(ln((1-εt)/εt))/2,调 整 训 练 样 本 权 重wt+1(i)=,式中Ct是归一化因子,返回步骤(2)进行迭代。得到分类模型

3 风险评估建模

3.1 指标体系

采用德尔菲法结合相关性分析和鉴别力分析[14]确定评估指标,根据专家对重要性的打分,利用比例分配法计算三级指标权重,再经过加权得到一、二级指标权重。根据代表性和权威性原则,选取18位副高及以上职称、从事设备管理或医院管理8年以上的专家,其中来自三级医院的占77.8%(14/18),从事医学工程专业技术的占66.7%(12/18),其余主要从事医院管理或临床医疗。

收集相关文献、论著等[14-15],从设备、环境、人因、管理4个方面对指标进行归类,根据客观、完整和可操作原则整理初步指标。通过相关性分析和鉴别力分析,得到5对指标的相关系数大于0.6,2个指标的变差系数小于0.1,对上述12个指标进行精简。经两轮专家咨询、调整,对专家的积极系数、和谐系数进行分析,最终意见趋于一致,重要性和必要性的W均值均大于0.5。形成由4个一级指标、12个二级指标、43个三级指标构成的指标体系,见表1。

表1 风险评价指标及权重Table 1 Risk evaluation index and weight

续表1

3.2 仿真试验

设置5个风险等级作为输出:非常低 M1、低M2、中M3、高M4和非常高M5。对某医疗设备历史数据进行收集,组织专家对风险因素进行评估,获得共20组数据作为样本集。为了避免样本量不足可能产生一定的误差,影响模型的泛化能力,本研究采用N折交叉验证对模型进行训练和测试[16]。训练样本见表2,测试样本见表3。在Matlab7.0中进行仿真试验,并与其他算法作对比。

表2 训练样本Table 2 Training sample

3.3 结果分析

经过20次试验,平均结果见图2。训练样本中AdaBoost集成SVM分类正确率比单纯SVM、BP神经网络、模糊SVM分别高9.34%、14.67%、3.34%;测试样本中分别高11.00%、15.00%、6.00%。本研究模型的评估正确率明显高于传统方法,显示了该模型在风险评估中的优势。

表3 测试样本Table 3 Test sample

图2 评估正确率比较Fig 2 Evaluation accuracy comparison

4 模型的应用

4.1 选取评估对象

选取本院(三级甲等)ICU在用呼吸机作为评估对象。呼吸机属于急救和生命支持设备,主要用于治疗呼吸衰竭等危重患者,与患者长时间直接接触,具有用时急、分布广、风险高的特点[17]。设备自身性能、操作人员水平、日常管理维护等都决定着呼吸机的使用能否安全有效。

4.2 评估方法及结果

邀请3名专家对ICU在用的20台呼吸机进行现场评分。运用评估模型对其使用风险因素进行综合评估,N折交叉测试模型性能。评估正确率达到了95.00%,比单纯SVM算法高10.00%,比BP神经网络高13.00%,比模糊集成SVM算法高7.00%。AdaBoost集成SVM在评估呼吸机使用风险中体现出优势,可以综合多种影响因素得出更精确的评估结果。

4.3 应用效果

对风险的精确评估可以指导预防性维护计划的制定,能够有效降低不良事件发生率、降低维修成本、提高设备使用率。近年来,本院加强了对医疗设备的信息化管理和有针对性的预防性维护,风险评估模型的应用进一步提高了医工部门的工作效率,临床满意度也在不断提高:2017年同比提高9%,2018年一、二季度同比提高了12%,真正做到持续改进有成效。

5 讨论

影响医疗设备使用风险的因素很多,本研究将德尔菲法与相关性分析、鉴别力分析与相结合,确保了指标体系的客观、完整和可操作。风险因素的复杂性要求评估方法的综合性。SVM的处理样本量少、信息高维非线性、避免陷入局部最优等优势在医疗设备风险评估中得到了很好的应用;AdaBoost应用到基分类器的训练进行一步提高了评估精度;N折交叉测试,验证了模型的性能。医疗设备的信息化、智能化管理是降低使用风险的有效手段,如何运用信息化、智能化实现可视化管理,同时实现风险的自动预警是下一步的研究重点。

猜你喜欢

分类器样本医疗
用样本估计总体复习点拨
推动医改的“直销样本”
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
随机微分方程的样本Lyapunov二次型估计
京张医疗联合的成功之路
我们怎样理解医疗创新
村企共赢的样本
医疗扶贫至关重要
基于层次化分类器的遥感图像飞机目标检测