APP下载

Mahalanobis距离判别法在天气预测方面的应用研究

2014-06-12

通化师范学院学报 2014年10期
关键词:判别函数协方差温差

田 兵

(包头师范学院 《阴山学刊》编辑部,内蒙古 包头 014030)

判别分析是统计学中一个非常重要的概念.它是判别样品所属类型的一种统计方法.它的基本思想是在各组已知样品观测数据的基础上,确定一个判别函数,构造一个判别准则,根据已有的判别准则,对待测定类型的新样品进行比较归类.常用的判别方法有 Mahalanobis判别法、Bayes判别法、Fisher判别法和逐步判别法.

Mahalanobis距离判别分析法是判别分析中最常用一种方法.Mahalanobis距离判别分析法是根据观测到的样本的若干数量特征对新获得的样本进行归类、识别,判别其所属类型的一种统计分析方法.该方法的主要思想是比较样本到各个总体的Mahalanobis距离,然后将其判给Mahalanobis距离最近的那个总体.目前,该方法已经被广泛的应用到经济学、社会学、医学、心理学、生物学、地质学等诸多领域.本文主要探讨的是Mahalanobis距离判别法在天气预测方面的应用.

1 天气数据

据以往经验,今天与昨天的温度差X和今天的压温差(气压与温度之差)Y是预报明天下雨与否的两个重要因素.现有一批已收集的天气数据如表1所示.今测得今天与明天的温度差、压温差分别为x1=8.1,x2=2.0(待测样本x),那么明天是否会下雨?

表1 湿度差与压温差数据

其中雨天与非雨天这两类总体(分别用H和I表示)均有m=2个指标(湿度差和压温差),各有n=10个样本观测数据,另外有一个待测样本x.

2 Mahalanobis距离判别法

根据Mahalanobis距离判别法的数学思想,首先计算出两类总体(雨天和非雨天)的均值,然后计算这两类总体的协方差阵,之后计算出待测样本x与两类总体(雨天和非雨天)的距离,最后比较这两个距离的大小进而得出结论.

2.1 分别计算两类总体的均值

可以得到雨天数据的均值为μ1,非雨天数据的均值为μ2,其中

2.2 分别计算两类总体的协方差阵

雨天与非雨天的协方差阵分别为∑1,∑2,通过计算可以得到

不难看出∑1≠∑2.即:雨天和非雨天数据的协方差阵不相等.

2.3 计算待测样本与两类总体的Mahalanobis距离

在统计分析与计算中,考虑到随机变量方差的信息,定义一种新距离:Mahalanobis距离.其定义如下:设x与y是从均值为μ,协方差阵为∑的总体X中抽取的两个样本,则总体X内两点x与y的Mahalanobis距离定义为

定义样本x与总体X的Mahalanobis距离为

根据Mahalanobis距离的定义,可以得到待测样本x与雨天(H)和非雨天(I)总体的Mahalanobis距离平方分别为

2.4 通过判别函数得出结论

要判断待明天是否会下雨,就是判断测样本x属于总体H还是I.需要计算x到雨天H和非雨天I的Mahalanobis距离的平方d2(x,H)与d2(x,I).然后进行比较,如果

d2(x,H)≤d2(x,I)

则判定样本x是属于总体H,即明天下雨;如果

d2(x,H)>d2(x,I)

则判定样本x是来自总体I,即明天不下雨.这样我们可以得到如下判别函数:

ω(x)=d2(x,H)-d2(x,I)

称ω(x)为两总体H与I的距离判别函数.

R1={x|ω(x)≥0};
R2={x|ω(x)<0},

则R1和R2为两总体的距离判别准则.

通过比较发现

ω(x)=
d2(x,H)-d2(x,I)=-11.37813<0,

所以判断测样本x属于总体H,可以得出结论明天会下雨.

3 总结

对于已有的10个雨天和非雨天的湿度差和压温差数据,运用多元统计中的Mahalanobis距离判别法得到了判别待测样本属于雨天还是非雨天的判别函数,经过具体计算得出待测样本属于雨天这样的结论.通过上述过程证明Mahalanobis距离判别法在天气预测中具有计算简单, 结论明确,具有较高可信度的特点.

参考文献:

[1]髙惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[2]赵东方.数学模型与计算[M].北京:科学出版社,2007.

[3]戴明强.数学模型及其应用[M].北京:科学出版社,2007.

[4]薛 毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007.

[5]李建军.常用判别分类方法分析[J].西安科技大学学报,2007(3).

[6]陶然.有关距离判别理论方法的补充和讨论[J].统计与信息论坛,2007(4).

[7]王静,夏结来,叶冬青.判别分析法在医学应用中的进展[J].数理统计与管理,2008(2).

[8]翟明娟.距离判别分析及其评价[J].长治学院学报,2012(4).

[9]潘劲松.距离判别分析的应用[J].统计与决策,2012(12).

[10]翟明娟.距离判别分析及其评价[J].长治学院学报,2012(4).

猜你喜欢

判别函数协方差温差
Fisher判别法在个人信用风险评估中的应用
北方冬季养猪当心“四差”
游乐设施事故与危险量化判别函数的构建
温差“催甜”等
高效秩-μ更新自动协方差矩阵自适应演化策略
低级热温差发电器的开发应用研究
探究上市公司财务预警的数学模型
用于检验散斑协方差矩阵估计性能的白化度评价方法
二维随机变量边缘分布函数的教学探索
制造业上市公司财务预警研究