APP下载

基于Statistical Process Control风险等级判定及神经网络模型构建珠海市传染病指数

2022-03-16周伴群戴晓捷尹锡玲李德云肖峻峰

中国当代医药 2022年5期
关键词:口病珠海市感染性

周伴群 戴晓捷 尹锡玲 李德云 肖峻峰

广东省珠海市疾病预防控制中心公共卫生与健康研究所,广东珠海 519000

把复杂的监测数据转换为浅显易懂的风险等级模式,并附以针对性的防控建议,不仅有效地宣传了健康知识,而且对促进市民健康行为有巨大的公共卫生意义。目前部分地区已经开展了指数预警预报等有益的探索,开发了直接服务于公众的公共卫生产品,如深圳市流感指数[1]、登革热风险指数[2]和传染病指数[3]等,以及其他一些地区对流感、其他感染性腹泻和手足口病等传染病进行了预警研究[4-6]等。但开发综合多个指标的综合指数研究较少。本研究旨在利用统计过程控制(Statistical Process Control,SPC)及长短时记忆神经网络模型(long and short-term memory network model,LSTM)等方法构建传染病指数,目的在于向公众反馈主要传染病风险动态的变化过程,提高公众健康意识、同时便于决策部门发现薄弱环节,开展风险管理。

1 资料与方法

1.1 一般资料

病例比例数据来源于流感监测信息系统;手足口病及其他感染性腹泻数据来源于传染病报告管理信息系统;数据涵盖时间为2014—2018年1~14 周。 布雷图指数监测数据来源于蚊媒密度现场快速评估,数据涵盖2014—2018年1~14 周。 常住人口数来源于2016年免疫规划年报表(全市1954 553 人口)。

1.2 方法

传染病指数综合评价方法采用熵权法计算评估指标权重。熵权法的基本思路是根据指标变异性的大小来确定客观权重。 若某个指标的信息熵越小,表明指标值的变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。

1.3 观察指标及评价标准

1.3.1 观察指标 以典型性、重要性及敏感性为依据共筛选4 项评估指标。 流感样病例比例(%)(X1);手足口病发病率(/10 万)(X2);其他感染性腹泻发病率(/10 万)(X3);布雷图指数(X4)。

1.3.2 评价标准 SPC 是利用统计技术对过程中的各个阶段进行控制, 从而达到改进与保证质量的目的。SPC 强调以全过程的预防为主,不仅能将数值以曲线形式表示出来,以观其变异之趋势,而且能显示变异系属于机遇性或非机遇性,区分变差的特殊原因和普通原因,以指示某种现象是否正常,而采取适当之措施。利用移动极差图将全市2014~2017年以周次为时间计量单位的流感样病例比例、手足口病及其他感染性腹泻发病率的统计过程控制的控制下限(lower control limit,LCL)、中线和控制上限(upper control limit,UCL)划分风险等级。 其中质量控制图的中线、LCL 和UCL分别为,LCL=-md3б,UCL=R+md3б,其中,Ri=|xi-xi-1|,m 为控制误报可能性的乘数(通常设为3)。

布雷图指数风险等级判定标准参考:在5 及以下,则属于安全范围;如果该指数高于5、10 或者20,则认为处于不同风险范围。

1.3.3 构建传染病指数 对照指标分级标准判定风险等级及分数,根据指标权重计算传染病指数[1 分(安全);2 分(较安全);3 分(低风险);4 分(高风险)]。 传染病指数=ROUND(权重系数1×流感样病例比例指数+权重系数2×手足口病风险指数+权重系数3×其他感染性腹泻风险指数+权重系数4×布雷图指数风险指数)。

1.4 统计学方法

1.4.1 长短时记忆神经网络模型预测 LSTM 神经网络属于循环神经网络的一种演变,能够学习长期的依赖关系,并将长时间的信息记忆作为默认值。LSTM 神经网络通过三个门的结构控制传输状态,记住需要长时间记忆的,忘记不重要的信息,分别为输入门、遗忘门和输出门(图1)。 LSTM 已经在多个领域有了多种应用[7],例如,基于LSTM 可以翻译语言、进行图像及文本分析、气象预测、疾病预测等[8-9]。

图1 LSTM 基本结构图

LSTM 神经网络的模型训练包括模型前向传播和误差反向传播两个过程,前向计算过程如下:

其中,ft、it、ot分别为遗忘门、输入门、输出门;ct为t 时刻的细胞状态;为输入的候选状态;ht为t 时刻的隐藏状态;Wf、Uf、Wi、Ui、Wa、Wo、Uo和bf、bi、ba、bo分别为权重系数和偏置量;б 为对应的激活函数;xt为当前时刻的输入。

LSTM 循环神经网络训练过程采用时间反向传播算法计算各神经元输出值与真实值的误差项,包括按时间和网络层级2 个传播方向,根据误差项计算每个权重的梯度,应用梯度优化算法。 模型的评价指标根据均方误差(mean squared error,MSE)和均方根误差(root mean squared error,RMSE):

其中,yi为实际值,预测值。

1.4.2 ARIMA 模型预测方法 布雷图指数数据量较小,则采用时间序列自回归移动平均模型(autoregressive integrated moving average model,ARIMA)进行预测。

将数据标准化后,70%作为训练集, 其余作为测试集。 以52 周的数据作为预测下一步所需要的时间步。以2014—2018年1~14 周手足口病发病率、其他感染性腹泻发病率、 流感样病例比例数据预测2018年15~19 周情况。 以2014—2018年1~14 周布雷图指数预测2018年15~19 周情况。

2 结果

2.1 风险评估指标分级标准

以周次为时间计量单位的传染病风险评估指标分级参考标准详见表1。

表1 风险评估指标分级参考标准

2.2 评估指标权重

传染病指数=ROUND(0.33 流感样病例比例指数+0.47 手足口病风险指数+0.10 其他感染性腹泻风险指数+0.10 布雷图指数风险指数)。

2.3 建立模型并预测

2.3.1 手足口病模型 珠海市手足口病发病率LSTM模型中,测试集MSE 为9.044 1,RMSE 为3.007 3,训练集MSE 为1.181 2,RMSE 为1.086 8。 模型在训练集和测试集均表现良好,没有出现过拟合现象。 运用LSTM 模型对珠海市手足口病发病率2018年15~19周数据进行预测,见表2、图2(封四)。

表2 2014—2018年1~14 周预测15~19 周珠海市手足口病发病率预测值与实际值

2.3.2 其他感染性腹泻模型 珠海市其他感染性腹泻发病率LSTM 模型中, 测试集MSE 为5.280 6,RMSE为2.298 0,训练集MSE 为9.403 8,RMSE 为3.066 6。运用LSTM 模型对珠海市其他感染性腹泻发病率2018年15~19 周数据进行预测,模型在训练集和测试集均表现良好, 没有出现过拟合现象, 见表3、图3(封四)。

表3 2014—2018年1~14 周预测15~19 周珠海市其他感染性腹泻预测值与实际值

2.3.3 流感样病例比例模型 珠海市流感样病例比例(%)LSTM 模型中, 测试集MSE 为0.160 5,RMSE 为0.400 6,训练集MSE 为0.370 3,RMSE 为0.608 6。运用LSTM 模型对珠海市流感样病例比例2018年15~19周数据进行预测,模型在训练集和测试集均表现良好,没有出现过拟合现象,见表4、图4(封四)。

表4 2014—2018年1~14 周预测15~19 周珠海市流感样病例比例预测值与实际值

2.3.4 布雷图指数ARIMA 模型 采用ARIMA 模型对珠海市布雷图指数的时间序列进行预测,预测值与实际值趋势基本相符(表5)。

表5 2014—2018年1~14 周预测15~19 周珠海市布雷图指数预测值与实际值

2.4 预测结果

对照风险评估指标分级标准判定风险并分别赋值(1~4),根据指标权重公式计算相应指数,与实际值进行对比预测一致率为96.0%(表6)。

表6 风险等级预测与实际值对比

3 讨论

预测传染病在一定地区和时间是否出现流行及流行速度、规模,以便有针对性地采取防疫措施,控制流行,减少发病与死亡,是贯彻预防为主的一项重要工作。有研究应用移动百分位数法进行传染病预警阈值筛选,对5 种传染病开展基于某市本地疫情的预警研究,使传染病预警系统的应用更高效更灵活[10]。 深圳市设计了以流感指数为代表的四类重点传染病指数,该指数体系的建立让复杂的监测数据有效转化为简单易懂的风险等级,不仅有效地宣传普及了健康知识,而且促进和培养了市民的健康行为,具有明显的社会和经济效益[11]。 北京市应用流感样病例数、流感病毒核酸检测阳性率和流感聚集性疫情数资料,经标准化处理整合为综合指数, 结合移动流行区间法(moving epidemic method,MEM) 估计流行阈值和分级强度阈值, 并应用交叉验证法评价预警效果或计算每周流感综合指数并划分评价等级[12-13]。 对有上升趋势可能引起暴发流行的急性传染病的预测, 在高发前做出预测分析和预报, 便于提出针对性预防对策的建议和具体防制措施。 将健康风险转换为易于理解的数值,易于为群众所接受。 利用综合评价指数评估, 将专业性和复杂性的指标值转变成易于理解的综合性指数,便于向决策者和公众进行定期发布,预测结果的形式易于为决策者或群众所接受, 可及时、有效地传递给公众当前及短期健康风险的信息,并为及时制定健康促进计划提供可行性思路, 对于提高政府及公众意识、促进“全民共建共享大健康”具有积极意义。

有研究通过病毒学监测、 气候和空气污染等数据,运用LSTM 模型预测流感趋势[14-15]。 Zhu 等[16]设计了一种多通道LSTM 神经网络用于预测中国广州的实时流感样疾病发病率(ILI%),并且通过将模型与不同的神经网络结构和其他最新方法进行比较来评估模型的性能,认为该模型具有较强的竞争力。 既往有研究在百分位数法划分风险等级的基础上,通过熵权法和ARIMA 模型来计算传染病指数[17]。 但Chae 等[18]预测传染性疾病时发现LSTM 的预测表现比ARIMA模型更优。 本研究利用LSTM 模型等方法构建传染病指数, 构建的传染病指数模型对流感样病例比例、手足口病发病率、其他感染性腹泻发病率和伊蚊密度指数各项指标预测效果良好,模型在训练集和测试集中均表现良好,没有出现过拟合现象,预测值与实际值趋势基本相符,尤其是模型对指标的近期水平预测效果较好,研究显示构建预测模型可行。 预测值与实际值进行对比预测一致率为96.0%,提示存在实际应用价值。

研究报告中以典型性、 重要性及敏感性为依据,仅筛选了流感、手足口病、其他感染性腹泻和布雷图指数共4 项评估指标,在指标的选取方面存在一定局限性。由于传染病种类多样,影响面广,影响因子复杂多变,不同地区致病因子与居民健康的暴露反应关系并不完全相同,有必要选择更多有代表性的指标对疾病风险作出预测评估。 综合指数由于评价的目的、对象、指标性质与数量的不同,其评价模型具有多样性,难以找到较为理想与公认的一般表达形式。报告中构建的传染病指数仅从时间、地区特征进行预测,由于不同的人群、 不同的环境接触传染源的机会不尽相同,传染病的发病情况也不同,如年龄、性别、职业等人群特征都是影响传染病的发生发展的重要因素。因此,报告中构建的模型是否能够完全真实反映传染病流行,还有待进一步的探讨。 但是在现有的常规监测条件下,通过利用常规的监测数据,每周对外发布传染病指数, 同时做好传染病的流行的预报预警工作,是一种值得探索的思路。

猜你喜欢

口病珠海市感染性
2010—2019年宝鸡市手足口病流行特征及时空聚集分析
去甲肾上腺素联合山莨菪碱治疗感染性休克的疗效观察
机械振动辅助排痰在新生儿感染性肺炎中的应用效果
All about Me
《思考心电图之177》
昆明市妇幼保健院2014~2018年门急诊手足口病的病原构成变化
珠海市检察院依法对卢子跃案提起公诉
赚钱
峨山县手足口病流行病学特征及防控措施
多巴胺、去甲肾上腺素对于重症感染性休克患者血乳酸清除率及死亡率的影响