APP下载

基于灰色权重马尔可夫链工伤事故预测

2021-01-10张昌爽

化工设计通讯 2020年12期
关键词:马尔可夫步长工伤

张昌爽

(重庆大学资源与安全学院,重庆 400044)

工伤事故灰色预测模型展现工伤事故时间状态序列数据及其相应变化总体波动趋势。建立灰色马尔可夫预测模型,用马尔可夫预测法确定未来状态转移规律,马尔可夫灰色预测具备显著优势。马尔可夫链为状态可列、时间齐次马尔可夫过程[1-3]。

1 灰色权重马尔可夫链预测步骤

1.1 状态划分

由有序聚类法构造工伤人数分级标准,构建马尔可夫链状态指标值分级空间,确定各时段指标所对应状态[4-6]。变量x1,x2,x3归类为{xi,…,xj},j≥i,定义均值向量:

式中,D(i,j)为量化变量段内部各变量间的差异值,以径向值{xi,…,xj}(j≥i)进行确定;径向量数值越小,表示区间向量差异越小,彼此越接近。

将n个变量序列分为K类,分类误差函数如下:

式中,k未知分类数,计算k=1,2,…,n所有最佳分割。

误差函数e[P(n,k)]通过线性规划,对应最优分类标准通过在min{e[P(n,k)]}中得以确定,确定分类数K变化趋势,作出误差函数e[P(n,k)]与K的关系图,函数曲线拐点对应的K值为最优分类数。

1.2 确定状态转移概率矩阵

转移概率以{x1,x2,…,xn}定义马尔可夫链指标序列,包含m个状态,指标值序列从状态i经过1步转移到达状态j的频数以fij表示,i,j∈E,转移步长是1个时间单位,2个甚至m个时间单位。

式中,fij为转移频数矩阵(fij)组成单元,转移频数矩阵的第i行第j列元素fij除以对应各行的单元值总和所得,表示为Pij,i,j∈E。

1.3 马氏性检验

用χ2统计量检验离散型序列随机变量。M表示随机变量指标值序列存在的演变状态,fij为指标值序列{x1,x2,…,xn}从状态i经过1步转移到达状态j的频数值,i,j∈E。

式中,p.j为边际概率,转移频数矩阵第j列之和除以矩阵所有行和列总和。

当n的基数足够大,统计量验证指标:

式中,pij为转移概率。

在显著性水平a,服从自由度(m-1)2的χ2分布,查表得分位点的客观数值,计算后得研究指标统计量χ2值。若,则xi符合马氏性检验标准,否则该数据序列不适用于马尔可夫链来预测。

1.4 各阶自相关系数计算

自相关系数rk,k∈e;rk为第k阶(滞时为k季度)自相关系数;xl为第l 季度工伤人数;x季度平均受伤人数均值;n季度平均受伤人数序列长度。

式中,rk为各阶自相关系数。

规范各阶自相关系数,即:

式中,wk步长马尔可夫链权重;m预测最大阶数。

以状态特征值法、线性插值法予以推断,将预测数据加入原矩阵序列之中,重复上述步骤。

式中,μ为状态特征值。

其中,i≤μ<i+1,β>0为状态调整因子,状态区间下限为,上限为,预测指标值通过上下限两类算法,结果一致。

式中,x为指标预测值;k=0,状态值增加与指标值一致;否则,k=1。

非零向量πj={π1,π2,…,πE},使得πjPij=πj,其中Pij为状态转移概率矩阵,有πj={π1,π2,…,πE}为马尔可夫链平稳分布,处于平稳状态。当存在m>0,pm中诸元素皆非负非零,则p为正规概率矩阵。

2 模型应用

以2010年1季度至2019年第二季度共38季度工伤人数预测2019年3季度的受伤人数,将2019年3季度实际预测数据加入序列模型中,预测2019年4季度受伤人数,并与社保局实际备案的工伤人数对比,验证预测效果。

2.1 分级准则确定状态

用有序聚类法将序列分5个人数区间比较,工伤人数等级标准以1~5表示,状态依次由低到高(见表1)。

表1 工伤人数状态划分表

2.2 马氏性检验

2010年1 季度至2019年第4季度共40个季度某企业工伤事故人数序列作马氏性检验。每季度工伤人数频数转移矩阵(fij)5×5、步长为1的1步转移概率矩阵(pij)5×5如下:

由(fij)5×5及(pij)5×5得边际概率、统计量χ2值(见表2、表3):

表2 边际概率

表3 统计量χ2计算表

计算χ2为54.5556,在显著性水平a=0.05下,查表得分位点由于因此工伤人数序列满足马氏性检验。

2.3 马尔可夫链权重确定

2010 年1 季度至2019 年第二季度共38 季度工伤数据,受伤人数序列各阶自相关系数为:r1=0.8633,r2=0.6697,r3=0.4693,r4=0.2874,r5=0.0665。自相关系数归一平均化,作为各滞时马尔可夫链权重:w1=0.3664,w2=0.2842,w3=0.1992,w4=0.1220,w5=0.0282。

2.4 不同步长转移概率矩阵

根据2010年1季度至2019年第二季度共38个季度工伤数据,马尔可夫工伤序列统计得不同滞时转移概率矩阵:

2.5 创建预测表

以2018年第二季度至2019年第二季度共5个季度工伤人数、状态转移概率矩阵对2019年第三季度工伤人数进行预测分析(见表4)。

表4 2019年第3季度工伤事故人数预测表

2019 年第三季度实际工伤人数为24 人/季度,由表可知,max(pi,i∈E)=0.5776,i=3,即预测2021年第三季度工伤人数状态为3,工伤人数x满足:26≤x<39,预测数值与实际受伤人数相近,预测有效。取调整因子β=1,得状态特征值μ=3.131。下限法得2019年第三季度工伤人数预测值:

x=+此值与实际相对误差仅有1.25%,以2010年第1季度至2019年第3季度共39个季度工伤人数序列预测2019年第4季度的工伤状态,得各阶自相关系数、各步长马尔可夫链权重(见表5)。

表5 2010.1-2019.3季度序列各阶自相关系数及权重

2010年第一季度至2019年第3季度共39个季度工伤事故受伤人数,不同步长(滞时)转移概率矩阵:

以2018年3季度至2019年第3季度共5个季度工伤人数预测2019年第4季度的工伤人数,预测见表6。

表6 2019.4季度工伤事故人数预测

2019 年 第4 季 度 实 际 工 伤 人 数 为22 人/ 季 度,max(pi,i∈E)=0.4248,i=2,即预测2019年第4季度工伤人数状态为2,受伤人数x满足:13≤x<26,预测结果与实际情况完全一致,预测有效。

取调整因子β=0.95,状态特征值μ=2.0231。下限法得2019年第4季度人工伤预测值:

此值与实际相对误差仅有1.36%

2.6 不同步长马尔可夫链特征分析

此链状态关联互通,对任意i,j∈E,i←→j,(i≠j),非周期,故为不可约正常返链。设平稳分布为(πj,j∈E):以步长为2的转移概率矩阵p(2),平稳分布、极限分布、各状态重现期见表7。

表7 平稳分布、极限分布及各状态复现期

状态j的复现期为Tj,其对应概率pj=1/Tj=πj。各状态的复现期为T1=19.2678(季度),T2=3.8536(季度),T3=2.7525(季度),T4=5.6721(季度),T5=6.2696(季度)。在中长期预测中,企业工伤人数为状态3的概率最大,平均每2.7525季度重现,复现概率为0.3633;其次复现的为状态2,每3.8536季度复现1次,概率为0.2595;复现概率最低的为状态1为0.0519,复现期19.2678季度。

3 结论

1)加权马尔可夫模型状态的复现期T1=19.2678(季度),T2=3.8536(季度),T3=2.7525(季度),T4=5.6721(季度),T5=6.2696(季度)。长期预测中,企业工伤人数状态3的概率最大,平均每2.7525季度重现,复现概率0.3633;其次复现的为状态2,每3.8536季度复现1次,概率为0.2595;复现概率最低的为状态1,为0.0519,复现期19.2678季度。

2)实际应用价值在于以某城市温室气体排放序列来预测未来温室气体年排放状况,以某国家煤炭资源消耗量序列来预测未来煤炭年消耗状况等。

猜你喜欢

马尔可夫步长工伤
中心差商公式变步长算法的计算终止条件
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
一种改进的变步长LMS自适应滤波算法
面向电力系统的继电保护故障建模研究
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
陪客户喝酒后死亡是否算工伤
基于马尔科夫算法对预测窗户状态模型的研究
早退途中出车祸 不予认定工伤
公司烧饭农妇意外坠亡是否认定工伤