APP下载

ARIMA模型对妊娠期糖尿病住院人数的预测

2020-01-01戴琼侯洁夏剑清王晏芹徐丹刘建琼陈凤黄大健张祥陈晓红

中国社会医学杂志 2019年6期
关键词:参数估计季节性内科

戴琼,侯洁,夏剑清,王晏芹,徐丹,刘建琼,陈凤,黄大健,张祥,陈晓红

妊娠期糖尿病(gestational diabetes mellitus,GDM)是指妊娠期首次发生或首次发现的糖尿病,其中包括妊娠前已存在糖耐量异常但未被发现的病例[1]。由于GDM不仅使孕产妇流产、早产、羊水过多、妊娠期高血压疾病等诸多并发症和不良后果增加,而且对母亲妊娠期糖尿病婴儿(infants of diabetes mothers,IDM)的生命质量也产生一系列近、远期的影响[2]。由于胰岛素选择应遵循个体化方案且用量随孕周数逐渐增加,为保障药物治疗的安全性、合理性以及帮助提高患者依从性,湖北省妇幼保健院对需启动药物治疗特别是初次使用胰岛素治疗GDM患者收入成人内科。本研究利用2013年1月1日—2017年12月31日该院成人内科每月GDM住院患者数据,通过自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)预测GDM住院人数,为制定GDM和IDM健康管理工作提供依据。

1 资料与方法

1.1 资料来源

选取湖北省妇幼保健院成人内科2013年1月1日—2017年12月31日所有GDM住院患者信息,由病案室审核,信息科导出数据按月汇总。

1.2 ARIMA模型的原理

ARIMA模型作为一种时间序列分析方法,可以将引起疾病发生、发展的多种影响因素综合效应蕴含在时间变量中,通过对序列的趋势变化、周期变化和随机干扰综合考虑后,借助统计模型进行量化表达。ARIMA模型弥补了传统回归分析法和传统时间序列分析法的不足,且可以通过反复识别及修改以获得更为满意的模型,是一种实用性强、精确度高的短期预测方法,目前较常用于公共卫生领域疾病发生的预测[3]。

1.2.1 序列的平稳性检验及处理根据2013年1月1日—2017年12月31日湖北省妇幼保健院成人内科每月GDM住院患者人数绘制时间序列图,根据时间序列图、自相关系数函数图(auto correlation function,ACF)和偏自相关函数图(partial auto correlation function,PACF)分析序列的特征和平稳性。对于不平衡序列,采用差分方式进行处理,使之平稳化。

1.2.2 模型识别通过分析序列的ACF和PACF初步确定,通过对多个模型的比较,从中选择出最优模型来作为拟合模型。

1.2.3 模型参数估计对模型进行参数估计,采用最小二乘法估计,对各个未知进行检验,排除其中不显著的参数,从而对模型的结构进行精简。

1.2.4 模型的诊断判断构建的模型是否适合。运用Ljung-Box方法对模型的残差是否为白噪声进行检验,如统计量P>0.05,则可认为该模型的残差序列为白噪声序列,则所选择的ARIMA模型认为是合适的,可被用于预测。采用标准化的贝叶斯信息准则(bayesian information criterions,BIC)来判断ARIMA模型的拟合优度,从中挑选出最优模型,BIC越小时,模型的拟合程度则越好。

1.2.5 模型的预测以该院2013年1月1日-2017年12月31日成人内科每月GDM住院患者人数为原始时间序列建立模型。利用所建模型对2018年1-12月医院GDM住院患者人数进行预测。

1.3 统计分析

利用Excel 2007和SPSS 23.0对所获得数据进行统计分析,构建ARIMA模型及预测。

2 结果

2.1 妊娠期糖尿病住院人数情况

2013-2017年该院GDM住院人数由2013年126人上升到2017年445人,呈现逐年增加趋势。除2013年1月、2月、4月和7月GDM住院人数少于10人外,2013—2016年5月,每月GDM住院人数均在11~20人之间,2016年6月以后GDM住院人数每月逐步上升,最高达到每月58人。见表1。

表1 2013—2017年妊娠期糖尿病住院人数分布 n

2.2 ARIMA模型的建立

2.2.1 创建平稳序列绘制该院2013年1月1日—2017年12月31日成人内科GDM住院患者人数时间序列图。结果显示,数据从开始总体呈现上升趋势,为非平衡序列,无明显季节性变化。见图1。

图1 2013-2017年妊娠期糖尿病住院人数序列图

对原始时间序列进行一阶非季节性差分后,形成新的序列。结果显示,差分后序列的各观测值均在0值上下波动,呈随机波动特征,数据趋于平稳。见图2。

图2 2013-2017年妊娠期糖尿病住院人数一阶差分和一阶季节性差分序列图

2.2.2 模型识别通过一阶非季节性差分,获得关于数据序列的ACF以及PACF。结果显示,ACF和PACF均呈拖尾衰减,初步认定ARIMA(0,1,1)×(0,1,1)12、ARIMA(0,1,1)×(0,1,2)12、ARIMA(0,1,1)×(1,1,0)12、ARIMA(0,1,1)×(1,1,1)12、ARIMA(0,1,1)×(1,1,2)12、ARIMA(0,1,1)×(2,1,0)12和ARIMA(0,1,1)×(2,1,1)127个模型。对所选7个模型进行构建,经Ljung-BoxQ假设检验,该7个模型均符合建模要求(P>0.05)。见图3。

图3 2013-2017年妊娠期糖尿病住院人数自相关图和偏自相关图

BIC值越小,该模型对数据解释力越强,进一步比较模型的R2及BIC值。结果显示,ARIMA(0,1,1)×(0,1,1)12模型的BIC最小,提示拟合效果较好,作为最优模型。见表2。

对ARIMA(0,1,1)×(0,1,1)12的残差做自相关和偏自相关分析,结果显示,残差序列ACF值和PACF值均落入随机区间内,其差异均无统计学意义,证实残差是白噪声序列,所选模型恰当。

表2 妊娠期糖尿病住院人次各备选ARIMA模型的拟合优度检验

2.2.3 模型参数估计ARIMA(0,1,1)×(0,1,1)12模型参数估计,结果提示,非季节性自回归系数AR1=0.968(t=2.629,P=0.012),非季节移动平均系数MA1=0.600(t=4.553,P<0.001),季节性移动平均系数SMA1=0.899(t=0.867,P=0.391)。表明SARIMA(0,1,1)×(0,1,1)12模型的非季节性回归系数有统计学意义,而季节性回归系数无统计学意义,适合采用无季节性的ARIMA(0,1,1)模型进行建模。见表3。

表3 模型参数估计结果及其相关统计量

2.3 模型的预测

运用建立的ARIMA(0,1,1)×(0,1,1)12模型对2013年1月-2017年12月湖北省妇幼保健院GDM住院患者人数进行拟合。结果显示,2018-2020年GDM住院人数呈上升趋势,2018年实际值动态变化趋势与预测值趋势基本一致。

2018年妊娠期糖尿病住院人数预测显示,2018年每月GDM实际发生率结果均在预测值的95%CI内。显示预测值与实际值非常接近,所有实际值均在拟合值范围内,预测值可对住院人数进行很好的跟踪。见表4。

3 讨论

3.1 ARIMA模型与GDM内科管理

目前,数学模型已经成为了预测工作中的重要手段[4-5],使用ARIMA模型预测GDM住院患者数,不仅有助于医院人员、床位、药品等调配工作,更为医院工作计划和决策提供依据。使卫生资源得到合理配置,改善母婴近、远期临床结局,缓解GDM带来的疾病负担,为制定GDM和IDM健康管理策略提供理论依据。本研究结果提示,ARIMA(0,1,1)×(0,1,1)12模型来预测GDM住院患者人数是可行的。模型参数的确定,主要是通过分析序列的自相关函数ACF和偏自相关函数PACF图,对非平稳的时间序列数据进行平稳化处理,直到处理后的自相关函数和偏自相关函数的数值非显著非零,残差为白噪声[6-7],同时避免过度拟合损失信息[8]。

表4 2018年妊娠期糖尿病住院人数ARIMA(0,1,1)×(0,1,1)12模型预测值

3.2 ARIMA模型适用于GDM住院人数的短期预测

本研究利用案例医院成人内科GDM住院患者数据,通过序列平稳化、模型识别、参数估计及诊断检验等步骤建立了ARIMA模型,研究结果提示,ARIMA(0,1,1)×(0,1,1)12模型适合用于GDM住院人数的短期预测。运用该模型可以发现GDM住院人数的变化规律,及时地对其变化趋势进行预测预警。本研究结果还显示,从2013年开始GDM住院患者数在逐年上升,说明需启动药物治疗GDM人数有所上升,这不仅是医务人员对GDM诊断、治疗和管理水平提高的表现,而且间接反映居民对高血糖导致不良妊娠结局及对孕妇和其子代健康远期影响认知水平的提升。本研究还运用该模型,对2018年GDM住院患者数进行预测,结果提示,2018年GDM住院患者数还将继续逐步上升,由此不仅需要提高对相应医疗资源调配和整合的重视程度(例如,增设内分泌病区、引进相关专业高层次人才、加强健康教育力度等),而且更需加强IDM生长发育监测和管理。虽然预测结果与实际结果存在一定区别,但本研究结果均在95%CI内,且其动态趋势与实际发生率趋势基本一致,表明该模型能较好地拟合GDM长期趋势变动等规律。因此,通过构建模型预测医院2018年GDM住院患者数,医院管理者可根据其预测值提前安排有关工作、合理配置人力、物力资源,实现医院效益最优化。同时,也可结合该院人均住院费用,测算2018年内科住院收入,为医院收入预算作参考。

当然,受模型本身特点和资料可获得性的限制,本研究还存在一定的局限性。首先,ARIMA模型适合做短期预测,不适合做长期预测[9]。其次,该模型拟合时只纳入了时间这一影响因素,预测结果很大程度上受监测资料质量的影响,没有考虑其他变量如社会和自然因素对该疾病的影响,若外界影响因素突然变化,或是有新变量引入,都会对模型的预测结果造成大的影响。因此,在实际应用中,应尽可能地收集时间序列足够长的数据,对已建立的模型采用新的观测值进行验证,并不断加入新的观测值,或者建立适合GDM的微分方程模型[10]及基于个体的离散随机仿真模型[11],以修正或重新拟合更能反映实际情况的GDM预测模型,以期得到最满意的预测效果。

猜你喜欢

参数估计季节性内科
内转科型
急性上消化道出血的内科护理观察
基于新型DFrFT的LFM信号参数估计算法
基于参数组合估计的多元控制图的优化研究
粕类季节性规律:豆粕篇
季节性气候变化对牛疾病的影响及预防分析
PBL嵌合LBL在心血管内科临床教学中的应用研究
呼吸内科治疗慢性咳嗽的临床治疗体会
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
蔬菜价格呈季节性回落