APP下载

二项分布一致性检验问题研究

2021-03-10张志辉

系统仿真技术 2021年4期
关键词:实弹射击二项分布假设检验

张志辉

(91404单位,河北 秦皇岛 066001)

在导弹命中等成败型试验过程中,为节省兵力弹药,减少成本,往往采用实弹射击、半实物仿真、数字仿真等多种手段分别进行试验。试验后,各种手段获得试验结果往往差异较大,如何判断哪些样本集可用、哪些不可用,一直困扰着决策者。本文从数理统计的方法入手,检验各手段获得的成败型样本集是否可用。

1 两个正态总体均值的假设检验

各手段获得的试验结果可信度是不一致的,实弹射击试验考核全面,更接近实战,相对于其他手段可信度最高。因此,可以采纳作为参考标准。而其他手段,或多或少采用了一些模拟手段,低于实弹射击试验的可信度,这些手段获得的样本是否可用的问题,就归结为这些手段获得的样本集是否与实弹射击试验样本集来自同一分布[1-3]。

参数假设检验方法是一种检验两个样本集是否来自同一分布的有效手段[4-6]。在精度等类型试验中,因其满足正态分布,可以直接采用数理统计中正态总体的参数假设检验方法来评判[7-12]。下面简要介绍其中的两个正态总体均值的假设检验。

假设H0:μ1=μ2;H1:μ1≠μ2。

拒绝区域为W={|u|≥uα2}[1]。其中uα2可查询标准正态分布表直接获得。

但成败型试验,单个样本满足0-1分布,多次试验的成功数量满足二项分布,是离散型分布[1],无现成的方法可用于评判。下面根据两个正态总体均值的假设检验思路,研究二项分布的假设检验方法。

2 两个二项分布成功概率的假设检验

设采用试验手段一获得成功数量X,其服从二项分布,记为X~B(m,p1),其概率[1]为

设采用试验手段二获得成功数量Y,其服从二项分布,记为Y~B(n,p2),其概率为

下面采用假设检验方法,检验成败型试验两种手段获得的样本集是否来自同一分布,即是检验p1和p2是否相同。

假设检验方法的基本原理就是利用小概率事件不应当发生,若发生则拒绝假设H0。假设检验最根本的目标是找到拒绝区域。因此,对于二项分布这样的离散分布,需要找到小概率区域(或称为小概率事件集),且该小概率事件集中所有事件发生的概率和为显著性水平α。

两种手段相互独立,若p1=p2=p,则X、Y同时发生的事件(x,y)概率[1]为

当假设检验对象为连续分布时,其拒绝区域的特点为区间分布大,概率密度低,拒绝区域内发生概率为α。二项分布为离散性分布时,无法同连续分布一样拥有概率密度函数,从而找到拒绝区域。但二项分布事件的总数是有限的,每个事件发生的概率是已知的(可通过式(3)进行计算),因此可以较容易地把区间分布广、概率密度低的小概率事件集寻找到。

对于离散型分布,找到拒绝区域的方法,就是把所有可能事件按照一定方法进行排序,取其中一部分作为拒绝事件集,该拒绝事件集必须满足区间分布广、概率密度低等特点。

首先极易想到的方案1:按照事件发生概率从大到小进行排序,把小于p0所有事件作为拒绝事件集,且这些事件累计概率为α。但使用过程中发现,该方案拒绝事件集中包含相似度极高的事件,如(0,0),显然不符合基本认知。因此,方案1不可行,排序方案还必须考虑到相似度问题。

方案2:模仿正态分布均值的检验方法,构造检验统计量Z,即

其中,Z越小,相似度越大。

事件按照Z值从小到大进行排序。为了直观地显示,计算间隔为0.05时所有事件的概率累计,当m=100,n=10,p=0.6时,其累计概率(类似概率密度)分布如图1所示。

从图1可以看出,拒绝区域必然选择相似度低、累计概率小、区域分布大的右侧。取拒绝区域为Z≥zα,如图1中阴影部分。

图1 m=100,n=10,p=0.6,间隔为0.05时的累计概率分布情况Fig.1 The cumulative probability distribution when the interval is 0.05,m=100,n=10,p=0.6

其中P{Z≥zα}=α,zα是与m、n、α、p有关的变量。m、n是试验前设计的样本量,是已知的;α为显著性水平,一般取0.1;但p为单个样本成功的概率,是未知的。当然想构造一个更加合适的统计量,使得拒绝区域与p无关。但实际情况是,无论构建什么样的检验统计量,其仅仅能决定各事件的排序位置,而各事件发生概率(依然是用式(3)计算)与p直接相关,即统计量一旦确定,则各事件排序位置就已确定。改变p值,则改变了各事件的发生概率,zα必然随之变化移动。因此,无论构建什么样的检验统计量,拒绝事件集必然与p有关。综上所述,方案2是较优的选项。

采用上述方法计算时,p为不确定量,需要事先做假设,一般采用设计值或专家打分方式获得。当m、n存在公倍数时,会出现多个事件的Z值相同情况,此时,该多个事件应当同时拒绝或同时不拒绝。

3 应用实例

某一导弹试验中,采用仿真的方式X获得10个样本,采用实弹射击Y获得3个样本。其中假设p=0.9。

利用Excel软件,枚举所有可能事件,用式(3)计算各事件的发生概率,同时用式(4)计算各事件的统计量Z值。对各事件按照Z值从大到小进行排序,计算所有事件前面的概率累计值(含该事件)。

α取0.1,查看Excel中概率累计值,其大于α对应的zα为0.36,因此Z≥0.36时,事件被拒绝,即该事件及前面所有事件为拒绝事件,拒绝事件集为(4~10,0),(7~10,1),(0~3,2),(0~6,3)等22个事件。可以看出,差异较大的事件均在拒绝事件集中,与日常认知相符。

若试验结果恰好属于上述拒绝事件集,则认为仿真方式与实弹射击不满足同一分布,即仿真试验肯定存在问题,获得试验样本不具备任何参考价值,应当检查完善仿真模型,重新设计试验。

4 结 论

在成败类实际试验中,在不同的研制阶段,能获得多个试验结果,在同一个研制阶段,采用不同的手段也能获得多个试验结果,各试验结果有时存在较大差异,一般都有基本的认知,与可信度最高的试验结果差异越大,越不能使用,但具体如何界定存在困难。本文根据正态分布总体的参数假设检验方法,充分考虑相似度要求,构造了恰当的检验统计量,找到了拒绝事件集,有效地解决了两个二项分布总体是否来自同一分布的判断问题,为是否使用该试验结果的决策提供了界定标准。该方法可推广运用于所有发生概率已知的离散分布试验中。

猜你喜欢

实弹射击二项分布假设检验
二项分布与超几何分布的区别与联系
实弹射击励精兵
深度剖析超几何分布和二项分布
概率与统计(1)——二项分布与超几何分布
假设检验结果的对立性分析
陆军防空兵实弹射击
美军在雪地实弹射击M249轻机枪
二项分布参数的E-Bayes估计及其应用
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验