APP下载

用灰色预测模型对2022年世界100m跑成绩的预测与分析

2022-08-27陈波

文体用品与科技 2022年17期
关键词:间隔均值灰色

陈波

(北京化工大学体育部 北京 100029)

1、研究对象与研究方法

1.1、研究对象

2001-2019年世界100m项目室外年终排名第1名、第2名、第3名和第8名的成绩。成绩来自国际田联官网成绩统计 (结束于2019月12月)(国际田联网,2019),不包括超风速成绩和被取消的成绩。

1.2、研究方法

(1)文献资料法。

通过查阅与时间序列分析、灰色模型相关的著作,为2022年的成绩预测提供理论支撑和方法参考。

(2)预测方法。

灰色预测的核心体系是灰色模型 (GM),GM系列模型是灰色预测理论的基本模型,GM(1,1)模型(EGM)为均值模型、由于EGM通过对一次累加数据进行均值变换,大大提高信息不确定性系统模拟精度。而且100m跑成绩序列为非指数增长序列,又是非近似齐次指数序列,故将采用EGM模型对2022年100m跑成绩进行预测,可以提高其预测精度。根据100m成绩的周期性态势,同时采用按周期间隔分解的EGM模型进行预测,即改进的按周期间隔分解的灰色均值GM(1,1)预测模型。

2、2022年世界男子、女子100m跑成绩预测及结果分析

通过分析2001-2019年世界男子女子100m项目的发展态势。并在数据态势分析的基础上采用灰色均值GM(1,1)预测法、改进的按周期间隔分解的灰色均值GM(1,1)预测模型预测法对2022年世界男女100m成绩进行预测。

2.1、灰色均值 GM(1,1)模型(EGM)

对原始序列 x(0)=(x(0)(1),x(0)(2),...,x(0)(n)),我们称为序列的级比,当级比都落在可容覆盖内,EGM模型可以用于预测。一般地,设发展系数为α,当,GM(1,1)模型有意义。为预测世界男子女子100m前3名和第8名成绩,需要先对原始(2001-2018年)序列进行检验。检验结果如表1所:

表1 原始序列可行条件检验(2001-2018年序列)

根据EGM模型理论,将确定的模型系数和2019年预测结果列于下表:

表2 2019年EGM灰色预测结果(基于2001-2018年成绩序列)

另对2001-2019年序列进行分析 (序列级比均在可容范围内),预测2022年成绩,见表3:

表3 2022年EGM灰色预测结果(基于2001-2019年成绩序列)

通常,预测值的相对误差时ε(k)<0.2,可以认为模型达到一般要求;若ε(k)<0.1,则认为模型达到较高的要求。显然对预测值进行相对误差检验都能满足ε(k)<0.1的条件,且发展系数都满足的条件,但对100m成绩预测来说ε(k)=0.1时预测误差约1s,即便模型通过相对误差检验,也不一定得到理想的模型。通常1%的相对误差意味着约0.1s的预测误差,短跑成绩预测问题对模型有更高的精度要求,就表2中2019年的预测结果来看,5个序列的预测结果相对误差大于1%,即虽然EGM模型拟合出了2001-2018年成绩的趋势增长,但预测准确度并不高。

灰色均值GM(1,1)预测模型虽然对不具有典型的分布规律数据的预测有较高精度。但用来预测100m成绩时,也较好地拟合出一系列平稳增长的序列,但由于100m成绩数据总体上呈波动上升趋势,模型拟合序列与真实的成绩波动情况相差较大,平均相对误差较大,预测效果也不一定理想,或许不宜直接使用EGM模型直接进行100m跑长期预测。

2.2、按周期间隔分解的EGM模型

由态势分析可知世界100m跑成绩序列具有奥运周期性的特点,100m项目成绩在奥运年一般可以达到或接近周期内的峰值。结合灰色系列模型适合短序列预测的特点,将数据划分成5个周期,取各个周期的第一/二/三/四年份的数据点成一序列,得到男、女子各个名次4个对应年共32条序列,再对短时序进行EGM建模。改进后,构造的新时序各数据点之间间隔4年,EGM模型可以分别地对各周期第一/二/三/四年成绩序列的变化趋势进行描述,拟合出奥运年和非奥运年各自的增长趋势并进行预测。

图1为世界男子按周期分解的100m成绩的折线统计图,各周期第二年成绩有比较平缓,各周期第三年成绩序列的增长趋势更为明显。奥运年(见图1(d))及奥运年后一年(图1(a))的成绩波动较其他两年更为明显,2016年和2017年成绩相比前一个周期明显下降。

图1 世界男子100m各周期对应年成绩

记划分所得的各对应年份男子成绩序列为 p(M)、q(M)、r(M)、t(M),与原始序列相比,新序列变化规律更为明显,对每一个序列都建立EGM模型进行预测,结果如下表所示。

表4 世界男子100m成绩周期间隔分解序列的EGM预测结果

其中,序列p(M),q(M)的预测模型使用 2001-2013年和 2002-2014年的序列对2017年和2018年成绩进行预测。

通过EGM模型预测2019年男子成绩第1、2、3、8名的平均相对误差分别为 0.612%、0.603%、0.542%、0.455%(见表2)。 对 p(M)、q(M)、r(M)、t(M)中相应名次的平均相对误差做均值计算,得到该方法下模型拟合出的第1、2、3、8成绩序列平均相对误差,依次为0.38%、0.26%、0.23%、0.21%,显然EGM模型对按周期间隔分解后短序列的拟合效果更贴近实际。

按周期间隔分解的灰色预测方法对第2、3、8名成绩的平均相对误差(依次为 0.26%、0.23%、0.21%)均明显小于第1 名的(0.38%),这是因为第1名序列数值变化幅度更大,故而拟合出来的预测值偏差更大。对比 p(M)、q(M)、r(M)、t(M)四类序列的预测结果,各周期第二、第三年对应的八条序列EGM模型拟合效果更好,平均相对误差大多小于0.1%,可以认为各周期第二年、第三年在5个周期内呈平稳增长趋势;p(M)序列的预测平均相对误差最大,主要是因为2009年总体竞赛水平达到顶峰,使得周期第一年的序列p(M)呈现先升后降的趋势并且与前后4年对应成绩差幅较大,故而EGM的拟合效果相对较差。

按照同样的方法对世界女子成绩同做周期间隔分解处理,划分所得的序列依次记为 p(w)、q(w)、r(w)、t(w),预测结果列于表5。

表5 世界女子100m成绩周期间隔分解序列的EGM预测结果

从图2的a、b、c、d中可以看出,女子成绩在奥运年平稳增长。序列因2009年成绩的影响有一个幅度较大的波动。女子各周期第2、3年的序列也呈现出较对平稳的增长趋势,结果如下表所示。

图2 世界女子100m各周期对应年成绩

对奥运年和非奥运年4类序列的4个名次的平均相对误差进行均值统计,与男子成绩预测结果特征相似,该方法各名次的预测平均相对误差(依次为 0.33%、0.24%、0.23%、0.12%)均小于对各名次原始序列进行建模预测的平均相对误差 (0.463%、0.447%、0.391%、0.329%)。该模型下,第1名序列平均相对误差相比第2、3、8名的更大,并且对比4类序列,p(w)序列的预测相对误差也更大。

男子、女子项目100m成绩在周期内4年各自的特点都比较相似,第1名成绩序列波动幅度更大,平均相对误差大于第2、3、8名序列的平均相对误差,奥运年后第一年的序列(p(M)、p(W))因男女项目均在2009年达到最好水平,序列存在一个大幅波动,拟合模型平均相对误差大。

由图1、图2中可以看出男子成绩在奥运年总体呈上升趋势,而女子奥运年成绩明显持续增长;奥运年后一年男女项目因2009年异常值的存在,波动较大;与奥运年后一年相比,男女成绩均在奥运年后第二年、第三年表现出较为平稳的增长。对比表4、表5,男子项目各周期第二年q(M)序列和女子项目各周期第四年t(M)的稳定增长趋势明显,对4个名次的平均相对误差求均值,作为q(M)、t(W)的平均相对误差,结果为0.05%、0.07%,EGM模型有效描述了成绩序列的增长趋势。

总体来看,基于按周期间隔分解后对应年成绩序列呈现出更为平稳的增长趋势这一分析结果和灰色系列模型更适合中短期预测这一特点,构造短时序再进行EGM建模的方法显著减小了平均相对误差,拟合模型更符合实际。

3、预测结果分析

将对2022年100m成绩的预测结果预列于表6。

表6 2022年预测结果

EGM模型和按周期间隔分解的EGM模型的预测区间是通过在预测值上加上偏差均值的95%双侧置信区间得到的结果。各组偏差均通过Shapiro-Wilk检验 (当样本容量大于5000时,以Kolmog orov-Smirnov检验p值为准),检验p值大于0.05即认为服从正态分布,偏差的方差未知,偏差均值的区间估计应选用双侧置信区间,使预测偏差以95%的置信水平落入区间内,并基于预测值给出最终预测区间。现将预测值的置信区间列于表7。

表7 2022年预测结果区间

(1)EGM模型因田径成绩波动多不适合对较长100m成绩序列进行预测;按周期间隔分解的EGM预测模型因序列短、各对应年特征明显增长平稳,预测效果相对好,能有效减少平均相对误差;

(2)EGM模型描述的是长期增长趋势,EGM给出的预测结果还是一个值得参考的结果。按周期间隔分解的EGM模型中t(W)序列平均相对误差小(0.07%),女子项目奥运年成绩具有近似指数增长特点,可以期待女子项目第1名在2022奥运年达到10.65s的水平;

(3)根据预测结果,男子项目2022年为弱下降年、女子项目2022年为弱上升年。

4、结论

(1)根据态势分析中上升趋势会接连2-3年出现且女子接连上升的年份与男子的相同或仅提前或滞后一年的特点,因男子项目在2017-2019年接连上升且女子项目在2018-2019年呈上升趋势,女子项目可能将在2022年继续上升达到周期内的峰值;

(2)女子项目在奥运年呈现比较稳定的增长趋势,由按周期间隔分解的EGM模型预测结果,可以推断女子第1、2、3、8名的成绩在2022年中有望达到10.65s、10.68s、10.69s和10.74s的水平;

(3)根据预测结果,男子项目EGM模型预测成绩最快,男子第1、2、3、8 年的成绩有望达到 9.74s、9.79s、9.81s 和 9.85s。 但2022年的男子100m成绩更可能呈弱下降趋势,除EGM模型外的几个模型中,按整个奥运周期的趋势,周期间隔分解的EGM模型比较合理,根据其预测结果可推断第1、2、3、8名的成绩更可能在9.82、9.84、9.88、9.90的水平。 此外,若男子成绩在 2019-2022年继续上升,则EGM模型预测结果更具参考意义。

猜你喜欢

间隔均值灰色
浅灰色的小猪
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
间隔之谜
浅谈均值不等式的应用
均值不等式的小应用
灰色时代
她、它的灰色时髦观
感觉
上楼梯的学问