APP下载

广义相加模型在细菌性痢疾预警中的应用*

2012-03-11陶芳芳赵耐青林庆能毛智盛孙晓冬

中国卫生统计 2012年4期
关键词:样条气温气象

陶芳芳 赵耐青 何 懿 林庆能 毛智盛 孙晓冬

细菌性痢疾是常见的法定报告肠道传染病,在上海市甲乙类肠道传染病发病中居首位。上海市细菌性痢疾发病有明显的季节性,一年四季均有发病,夏秋季尤为高发。随着全球气温的变暖,气象因素对肠道传染病的影响已受到越来越多学者的关注〔1-3〕。已有文献证明气温、降雨量等对细菌性痢疾发病影响较大〔4-6〕。

细菌性痢疾是对本市公共卫生影响较大的重点传染病,了解细菌性痢疾的流行趋势,尽早发现其流行隐患及爆发和流行先兆,在疾病爆发前及时提供准确的疾病动态及预警预报,以便采取措施进行预防控制,从而降低发病率和死亡率,达到控制疾病蔓延的目的。

传染病的准确预警依赖于正确地使用预测方法。本研究将气象因素作为细菌性痢疾发病的影响因素,采用非参数广义相加模型(generalized additive model,GAM)建立细菌性痢疾预测模型。GAM是广义线性模型的非参数扩展,适用范围更广,GAM可拟合非参数回归,适用于处理应变量和众多解释变量间过度复杂的非线性关系,近年来在环境流行病学中〔7-9〕的应用越来越多,已被广泛应用于环境污染对人体健康危害的研究〔10〕。

本研究探讨使用此模型进行菌痢发病预测和预警的可行性,为其防控工作提供科学依据。

资料与方法

1.资料

上海市2004年1月1日至2008年12月31日每日细菌性痢疾发病数资料和气象资料分别来源于国家疾病监测信息报告管理系统和上海市气象局城市环境气象中心。气象因素资料主要包括平均气温、最高温度、最低温度、湿度、降水量、风速、气压等。

2.分析方法

(1)模型拟合

本研究中,假定第t天细菌性痢疾日报告病例数Yt近似服从Poisson分布,均数(期望值)为μt,考虑均数μt可能受气温、气压、湿度及发病趋势的影响,而这些因素与均数μt的关联性不是线性关系,因此采用GAM,其连接函数(link function)为对数函数,基本形式如下:

其中Yt是第t天的细菌性痢疾日报告病例数,f1(x1t),f2(x2t),…,fp(xpt)是自然样条函数(natural spline,ns),样条函数本质上是把自变量范围分割成若干个互不重合的区间,在每个区间函数表达式为二阶或三阶多项式(如二阶多项式为抛物线),但要求在两个区间相邻点上的函数曲线是连续和光滑的,x1t,x2t,…,xpt是气温、气压、湿度及发病趋势等协变量。

(2)预测应用

由于模型拟合使用2004年1月1日至2008年12月31日每日报告细菌性痢疾病例数的趋势较平稳,未出现暴发流行,可认为细菌性痢疾发病处于常态。在常态下建立气象因素与细菌性痢疾发病的预测模型是可行的。用选定的模型对细菌性痢疾发病作出预测,利用在不同气象条件下预测值的95%范围的上限值作为预警限。

结 果

1.细菌性痢疾日报告病例数的趋势分析

2004年1月至2008年12月上海市每日细菌性痢疾报告数每年均出现较一致的报告高峰,呈明显的季节性波动。1~4月一直呈低发状态,5月后开始增加,7月份快速上升,到8~9月左右达到最高峰,然后开始下降,到12月回到1月左右水平。

2.模型拟合

经过实际数据的拟合,最后得到下列模型:

表1 模型参数估计结果

表1 中的 ns(temp,3)1,ns(temp,3)2 和 ns(temp,3)3是气温样条函数的三个自然样条基函数,自由度为 3,ns(lns2s8,14)1,ns(lns2s8,14)2,…,ns(lns2s8,14)14是细菌性痢疾日报告病例数的7天滑动和的样条函数的14个自然样条基函数。

选择研究日前1天的温度,引入前8天的病例数,分析过去一周里病例数及气温对细菌性痢疾发病的影响。结合Akaike's信息标准(Akaike's information criterion,AIC)来选择最优模型。模型决定系数 R2=0.9202。

图1 模型估计发病数与实际发病数的散点图

3.预测预警分析

用模型对2009年1月~12月上海市细菌性痢疾每日报告数进行计算,结果显示预测值与实际值较吻合,预测的动态趋势与实际情况基本一致,模型的拟合效果较好。采用本模型来预测细菌性痢疾发病水平是可行的。拟合及预测的具体结果见图2。同时根据预测数据的可信限,可以判断实际发病情况是否在正常范围波动〔11〕,如果实际病例数在预测值95%范围内波动,表明细菌性痢疾疫情基本稳定,如果超出模型预测值95%范围的上限,表明当日细菌性痢疾疫情已不同于以往规律,如果连续两天实际值均超出预测值95%范围的上限,则发出提示性预警。图2可以看到2009年1月1日至12月31日上海市细菌性痢疾日发病数基本上在95%范围内,因此本研究采用基于预测值的预警策略是可行的。

图2 2009年1月1日至2009年12月31日上海市细菌性痢疾日报告病例数拟合及预测结果

讨 论

细菌性痢疾的发病率受自然因素、社会因素、气象因素以及病原学特点等影响〔12〕,且存在明显的季节差异,利用传统的时间序列模型并不合适。本研究以广义相加模型为基本统计模型,运用时间序列格式的资料,尽可能地控制混杂因素的影响。模型中应用趋势样条函数控制了时间的长期趋势影响,对于可能存在的星期效应,模型中以哑元变量的形式进行控制,在此基础上拟合温度、湿度与细菌性痢疾发病的二次函数关系。根据拟合模型回归系数的检验结果发现,由于引入前8天的细菌性痢疾发病数作为自变量,而这些自变量与当前的气温和湿度都有关联,以致湿度的效应在模型中的检验无统计学意义,因此在模型中剔除湿度指标。最后模型拟合了气温与细菌性痢疾发病的关系,可根据气温和前8天细菌性痢疾发病水平预测发病数。

广义相加模型适用于多种分布资料的分析,模型中既可以包括参数拟合部分也可包括非参数拟合部分,甚至可以全部是非参数拟合,模型的构建灵活,并不拘泥于某一种形式的函数。当解释变量的个数较多或反应量与解释变量之间的关系不明确,反应变量的分布不易判定或不符合所要求的分布时均可考虑用广义相加模型。

预测预警研究是一项很复杂的研究,除了传染病的影响因素较复杂外,预测预警分析的统计方法也有较高要求。本文所建立的细菌性痢疾预测模型只纳入了气温因素,分析了日均气温对细菌性痢疾发病的影响,但是影响细菌性痢疾发病和流行的因素还有很多,现阶段我们也开展了相应的监测,收集了大量的监测资料,包括症状监测、病原学监测等,由于监测资料之间缺乏统一性,无法纳入数学模型,在以后的工作中,将进一步深入研究。

1.Akari T,Michio Y,Taiichi H,et al.Climate impact on seasonal patterns of diarrhea diseases in Tropical area.www.hyarc.nagoya-u.ac.jp/game/6thconf/html/abs.html/pdfs/T6AT09Aug04093113.pdf.

2.Hayashi T.Impact of meteorological elements on diarrhea diseases in Bangladesh.Preprints.Meteor.Soc,2004,86:257.

3.郑能雄,林云钦,郑高,等.福州市主要传染病与气象因素关系的研究.中国公共卫生管理,2004,20:343-346.

4.孙培源,张德山,韦懿芸,等.北京市海淀区细菌性痢疾与气象因素的关系.首都公共卫生,2008,2(3):100-103.

5.黄成钢,金如锋,邱宏,等.我国某地区痢疾发病率与气象因素的关系及其预测模型.现代预防医学,2009,36(7):1207-1210.

6.廖洪秀,张强,杜长慧,等.主成分回归分析在细菌性痢疾与气象因素关系中的应用.现代预防医学,2009,36(5):813-815.

7.董英,赵耐青,汤克军,等.广义相加模型在气温健康效应研究中的应用.中国卫生统计,2008,25(2):144-146.

8.Simon N,Wooda,Nicole H,et al.GAMs with integrated model selection using gernalized regression splines and applications to environmental modeling.Ecological Modelling,2002,(157):1572177.

9.Laurent F,Alain LT,Isabelle B,et al.Difference in the relation between daily mortality and air pollution among elderly and all-ages populations in south western France.Environmental Research,2004(94):249-253.

10.余松林,彭晓武.广义加性模型配合时间序列资料时消除残差自相关性的一种方法.中国卫生统计,2010,27(5):450-454.

11.张文增,冀国强,史继新,等.ARIMA模型在细菌性痢疾预测预警中的应用.中国卫生统计,2009,26(6):636-639.

12.施侣元,李立明,叶冬青,等.流行病学.第5版.北京:人民卫生出版社,2003:464-465.

猜你喜欢

样条气温气象
基于FY-3D和FY-4A的气温时空融合
气象树
《内蒙古气象》征稿简则
深冬气温多变 蔬菜管理要随机应变
对流-扩散方程数值解的四次B样条方法
大国气象
三次参数样条在机床高速高精加工中的应用
美丽的气象奇观
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于节点最优分布B样条的火箭弹开舱点时间估算方法