APP下载

天津市参保急性心肌梗死患者住院费用分析及病例组合初探*

2015-01-27付晓萌刘媛媛刘晓倩李长平

中国卫生统计 2015年3期
关键词:住院费用决策树数据挖掘

付晓萌 刘媛媛 刘晓倩 龚 卉 崔 壮 李长平 马 骏

天津医科大学公共卫生学院卫生统计学系(300070)

天津市参保急性心肌梗死患者住院费用分析及病例组合初探*

付晓萌 刘媛媛 刘晓倩 龚 卉 崔 壮 李长平△马 骏

天津医科大学公共卫生学院卫生统计学系(300070)

目的 分析影响天津市参保急性心肌梗死患者住院费用的因素指标,探索其病例组合方式及费用模式,为建立适合我国国情的DRGs研究提供统计学参考。方法 采用多重线性回归分析筛选影响因素,利用数据挖掘中的决策树方法建立模型并将患者归组分类。结果 是否手术、医院类别、住院天数为主要影响因素,并以此作为分割节点建立8种病例组合方式及相应的费用标准。结论 数据挖掘是一种从海量数据中提取有效信息的过程,应用于DRGs研究具备自身优势。两种方法证实影响AMI患者住院费用的因素及重要程度一致,是否手术为最主要的疾病诊断分割节点。通过得出的AMI患者费用控制上限可协助医疗保险机构及医院发现可疑病例,做好预警工作,完善社会医疗保险体系。

急性心肌梗死 数据挖掘 决策树 DRGs

2011年,我国城市居民因急性心肌梗死(acute myocardial infarction,AMI)导致的疾病别死亡率已达47.36(1/10万)[1],给患者带来了严重经济负担。目前,针对AMI的研究多为探讨其危险因素和描述费用构成[2],鉴于国内目前还未有文献报道对AMI患者病例组合方案的研究,本文旨在以天津市参保AMI患者为依据,在筛选其影响指标基础上,采用数据挖掘技术对本市AMI的病例组合情况进行初探,探索其预付费制度,为适合我国国情的DRGs研究提供参考。

对象与方法

1.资料来源

2.统计学方法

(1) 影响因素筛选

根据相关文献研究及专业知识,以数据库基本情况为依据,制定出可能影响AMI患者费用负担的因素,采用多重线性回归模型逐步回归方法筛选真正影响AMI患者医疗费用的因素。影响指标及赋值如表1所示。

(2) 数据挖掘—决策树(CART算法)

将多重线性回归筛选出有意义的影响因素作为输入变量,以AMI患者合计医疗发生费用作为输出变量,采用CART算法构建AMI患者的决策树型结构。其中80%样本(5172人次)作为训练集,20%样本(1295人次)作为测试集,种子数随机默认为1234567,建立交互模式决策树模型。针对AMI患者医疗费用负担影响因素分析采用软件SPSS 17.0实现,应用 Clementine 12.0进行决策树模型构建与修剪。

结 果

1.统计描述结果

(1) 一般人口学描述

天津市参保AMI患者男性多于女性,2008-2010年总患病人数逐年增长,到2011年有下降的趋势。四年间,就诊于三级医院的参保AMI患者呈现增加态势,到2011年达到86.99%,如表2所示。

(2) 参保人员费用描述

2008-2011年,天津市AMI患者总住院医疗费用以医用材料费、药品费、治疗费和检查费用构成为主,总费用不断增加,医用材料费逐年增长,其余费用构成四年间有不同程度降低或小幅波动。

2.多重线性回归分析

经多重线性回归分析,除发病部位(P>0.05),其他因素均为天津市参保AMI患者医疗费用的影响因素,其中是否手术(β′=0.401),医院类别(β′=0.225),住院天数(β′=0.223)为影响我市AMI患者住院医疗费用的主要因素,其他影响因素的重要程度较小。如表3所示。

3.决策树模型构建AMI患者的病例组合

(1) 病例分组拟合结果

采用CART算法得出的回归树结果表明,影响天津市AMI患者住院费用因素按相对重要程度排序依次为是否手术(0.649),医院类别(0.222),住院天数(0.078)和年龄(0.045),其他指标影响效果甚微,与多重线性回归结果吻合。将前四位影响因素纳入模型分组,根据回归树树状结果,最终总结出8种病例组合方式,组合结果如表4所示。

(2) 费用上线控制

由病例组合衍生出相应的费用标准可以预知参保人员费用上线,以P75+1.5Q作为费用上线控制标准[3],超过该组合控制标准视为可疑病例,共计151例,总超额费用共计10579418.33元,占总发生费用6.87%,具体费用标准如表5所示。

(3) 模型评估

通过多重线性回归和回归树决策分析均证明影响AMI患者住院医疗费用的因素为是否手术、医院类别及住院天数,且重要程度次序一致,表明通过多重线性回归分析纳入模型构建的因素作为回归树模型中的分段节点构建决策分类合理。

采用CART分类回归树进行模型评价,可从模型收益方面进行评估。根据软件构建的决策树得出节点14、13、11、9测试集、验证集的指数收益分别为223.49%,196.14;159.19,165.77;145.52,129.92;102.00,89.19,绝大部分超过1,说明模型的收益较好[4]。

讨 论

1.AMI患者基本情况与费用构成

天津市参保AMI患者绝大部分选择就诊于三级医院,一、二级医院总和病例数不及三级医院1/4,说明我市高级别医院的医疗资源得到了患者认可与信任,但另一方面提示我市医疗资源合理化配置、医院管理工作有待进一步规划与调整,使病情较轻的患者分流至低级别医院,减轻大医院就诊压力,从而减轻患者看病“难”负担。

从费用构成可知,AMI患者总费用中医用材料费比重占到50%以上,且居高不下,可能与AMI病情本身的严重程度有关,患者需经皮冠状动脉介入治疗及支架植入术[5]缓解病痛,在治疗过程中易发生主观选择倾向性或医生不合理诱导,偏向选择价格高于国产支架的进口支架,使患者总体医疗费用升高,提示应加大对医疗器械的价格管控,严格控制进销差率,使患者避免承担持续性看病“贵”难题。

2.病例组合分析

已被国际公认的DRGs(diagnosis related groups)是以病人特征、住院特征和住院期间接受的治疗措施为基础的一种病例分类方案[6],在国内被译为“疾病诊断相关分类”。我国对DRGs相关研究还处在探索阶段,而数据挖掘技术能较好地识别隐藏于数据中的规律,从海量医疗信息资源中挖掘出有助于疾病诊断与治疗具有其自身优势。本次研究采用的CART是经典决策树算法中的一种,它对输入、输出变量的类型要求更宽松,建立的二叉树相对多叉树更为灵活[7],表现形式更为直观。

本研究以数据库实际情况纳入了包括患者、疾病特征情况及外部因素在内的可能影响指标,符合国际关于DRGs的基本思想[8]。表4呈现的组合方式侧重对病例情况的描述,不同组合下的患者所接受的治疗、医疗需求以及医疗支出高度相关。这种将某一方面相同特征的病例归为一组作为一种病例组合的方法,一方面是为便于医疗机构对患者进行管理,提高工作效率;另一方面是为我国医疗付费方式实现预付制建立基础,根据医疗资源消耗强度一致的各病例组合,从而可以对医院进行合理的费用补偿并制定统一的支付标准。通过本次研究发现,是否手术首先被选入模型作为分组节点,说明手术与非手术患者的住院费用发生情况差别较为明显,更容易划分,影响手术患者和非手术患者费用差别的因素分别为住院天数和医院类别,在今后诊疗过程中可以手术为基础条件将患者分型,进而根据患者实际情况将其分配至各组合,完成疾病诊断相关分类。

病例组合最直观体现是协助医疗保险机构和医院提供适宜的费用标准,表5依据病人特征的各种组合,按照预先设定好的治疗方式、住院天数、医院等级等因素,根据统一标准向医院偿付病人的住院费用,这样与患者实际发生的费用无直接关联,从而有效防止了医疗机构为片面追求利润而出现提供“过度医疗”的行为。其次根据合理的费用范围,将医疗费用的上限值作为控制标准,有助于医疗卫生机构及时发现可疑病例,进而深入审查是否发生不合理费用,避免诱导医疗需求发生,建立符合各地情况的DRGs体系,有助于医疗保险机构做好预警机制,从根本上减轻患者日益突显的“看病贵”难题。

本研究仅以天津市AMI患者为依据,试图初步探寻符合该市人口特征以及发病特点的分类标准,在后期更为完善的数据资料情况下,期望进一步研究AMI患者住院费用的相关因素和分类标准,为我国整体建立符合国情的DRGs预付制付费模式提供参考,为卫生资源管理者提供科学依据。

致谢:衷心感谢导师马骏教授在论文撰写期间给予我的悉心指导和鼓励,马老师富于创新的思维方式、严谨的工作作风和谦和的处世态度是我毕生学习的目标。感谢天津医科大学流行病与卫生统计学系李长平老师和崔壮老师在研究阶段的无私帮助,感谢师兄师姐和师弟师妹及同学在本次研究过程中给予的精诚协作和支持,感谢父母给予我生活上无微不至的关怀,谢谢大家!

[1]中华人民共和国卫生部.2012中国卫生统计年鉴.北京:中国协和医科大学出版社,2012:270-278.

[2]于丽华.急性心肌梗死患者住院费用影响因素分析.现代预防医学,2006,33(7):1084-1088.

[3]高子厚,万崇华,蔡乐,等.按DRGs组合方式制定消化系统疾病患者住院费用的研究.中国卫生统计,2006,23 (4):323-325.

[4]薛薇主编.Clementine数据挖掘方法及应用.北京:电子工业出版社,2012:148-170.

[5]Joynt KE,Blumenthal DM,Orav EJ,et al.Association of Public Reporting for Percutaneous Coronary Intervention with Utilization and Outcomes among Medicare beneficiaries with Acute Myocardial Infarction.JAMA,2012,308(14):1460-1468.

[6]Edwards N,Honemann D,Burley D,et al.Refinement of medicare diagnosis-related groups to incorporate a measure of severity.Health Care Financ Revive,1994,16(2):45.

[7]李长平.Logistic回归、决策树和神经网络在预测2型糖尿病并发末梢神经病变中的性能比较.中国博士学位论文全文数据库.中国人民解放军军事医学科学院,2009:40-41.

[8]王晓京,朱士俊.医疗费用支付方式的比较.中华医院管理杂志,2006,22(7):481-483.

(责任编辑:郭海强)

Preliminary Exploration of Hospitalization Expense and Case Mix in Acute Myocardial Infarction Patients of Tianjin

Fu Xiaomeng,Liu Yuanyuan,Liu Xiaoqian,et al

(Department of Health Statistics,Public Health College,Tianjin Medical University(300070),Tianjin)

Objective To analyze the influencing factors of insured inpatients with acute myocardial infarction in Tianjin,and then explore the case mix model and charge pattern in order to establish Diagnosis Related Groups (DRGs) suited to China′s national conditions and provide statistical reference.Methods Adopt multinomial linear regression to screen the factors influencing hospitalization expenses,establishing the case mix model and decision tree were used to generate diagnosis related groups.Results The major influential factors were surgery or not,hospital′s level and length of stay.There are 8 case mix and cost standard from decision tree.Conclusion Data mining is a process of extracting effective information from huge amounts of data,applied in DRGs research has its own advantages.Two methods confirm that the influence factors and significance of AMI inpatient′s expense are the same,the uppermost splitting node is surgery or not in case mix model.The upper limit of medical charge can assist medical institutions in finding suspicious cases,early warning,and perfecting the social medical insurance system.

AMI;Data mining;Decision tree;Diagnosis related groups (DRGs)

国家自然科学基金(71373175);教育部人文社会科学研究项目(11YJCZH080)

△通信作者:李长平,E-mail:lichangping@tijmu.edu.cn

猜你喜欢

住院费用决策树数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
新生儿肺炎患者(日龄<1 天)住院费用及影响因素
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
我国脑卒中患者住院费用及影响因素研究
决策树和随机森林方法在管理决策中的应用
软件工程领域中的异常数据挖掘算法
决策树多元分类模型预测森林植被覆盖
桑植 卫生院住院费用全报销
基于决策树的出租车乘客出行目的识别