APP下载

浅析条件概率的认识与实践

2021-11-20朱盛陈春焦

数学学习与研究 2021年30期
关键词:样本空间概率

朱盛 陈春焦

【摘要】 根据条件概率与概率两个概念的比较,指出条件概率也是概率,从而说明概率所具有的性质对条件概率也成立.文中总结了与条件概率相关的三大重要公式,并给出计算条件概率的方法,最后运用相关性质解决现实生活中的具体问题.

【关键词】 样本空间;概率;条件概率

【基金项目】河南省高等学校精品在线开放课程项目,河南省研究生教育改革与质量提升工程项目“研究生教育优质课程”(No:hnyjs2017kc09),河南理工大学研究生教育教学改革基金项目“融入课程思政的应用统计教学改革”(No:2020YJ02).

一、引言

“概率论与数理统计”是高等院校多个学科本科专业的必修课程之一,也是相关专业硕士研究生入学考试的一门必考科目,更是本科学生運用随机思维模式解决本专业相关问题的实用课程[1].它在自然科学、社会科学、工程技术、工农业生产领域中得到了越来越广泛的应用.作为一门应用数学学科,“概率论与数理统计”具有高度的抽象性、严密的逻辑性、广泛的应用性,并且具有更独特的思维方法[2].条件概率是“概率论与数理统计”课程中的一个重要概念.本文给出条件概率与概率两个概念的定义,并对其作出比较,指出条件概率也是概率,从而进一步说明概率所具有的性质对条件概率也成立,最后运用该性质解决实际问题.

二、条件概率与概率的定义与比较

定义1设E是随机实验,S是它的样本空间.对于E中每一个事件A赋予一个实数,记为P(A),称为A的概率,如果集合函数P(·)满足下列条件[3]:

(1)非负性:对于每个事件A,有P(A)≥0;

(2)规范性:对于必然事件S,有P(S)=1;

(3)可列可加性:设A1,A2,…是两两互不相容的事件,则

P(∪∞i=1Ai)=∑∞i=1P(Ai).

定义2设A,B是两个事件,且P(A)>0,则称P(B|A)=P(BA)[]P(A)为在事件A发生的条件下事件B发生的概率[3].

定理1条件概率也是概率[3].

证明设E是随机实验,S是它的样本空间.条件概率P(·|A)是集合函数,对于E中每一个事件B,都有实数P(B|A)与之对应.

(1)非负性:对于每个事件B,显然有P(B|A)≥0;

(2)规范性:对于必然事件S,有P(S|A)=P(SA)[]P(A)=1;

(3)可列可加性:设A1,A2,…是两两互不相容的事件,则

P(∪∞i=1Ai|A)=P{(∪∞i=1Ai)A}P(A)=P{∪∞i=1(Ai∩A)}P(A).

由于Ai∩A,i=1,2,…两两互不相容,故

P(∪∞i=1Ai|A)=∑∞i=1P(AiA)P(A)=∑∞i=1P(AiA)P(A)

=∑∞i=1P(Ai|A).

综上可知,条件概率P(·|A)满足概率定义的条件,因此条件概率也是概率.

三、条件概率的性质

由定理1可知,条件概率也是概率,因此概率具有的性质,条件概率也具有.这与“白马是马”一样,白马一定具有马所具有的生活习性和生理特征.我们知道概率有很多性质,比如:有限可加性、加法公式、减法公式等.根据定理1可知,条件概率也应该具有概率的相应性质.在我们的教材中已经给出条件概率的有限可加性、加法公式和减法公式了.下面我们通过几个定理来进一步说明如何将概率的性质类推到条件概率上.

定理2[4]设A1,A2,…,An是样本空间S中的一组事件,则

P(∪ni=1Ai)≤∑1≤i1≤nP(Ai1)-∑2≤i1≤nP(A1Ai1).

定理3[4]设A1,A2,…,An是样本空间S中的一组事件,则

∑1≤i1≤nP(Ai1)-∑1≤i1

≤P(∪ni=1Ai).

定理2与定理3的证明见文献[4].

上面两个定理可以认为是概率的两个性质,由于条件概率也是概率,故条件概率也有类似的性质.

定理4设A1,A2,…,An是样本空间S中的一组事件,则对于样本空间S中的任一事件A,若P(A)>0,则

P(∪ni=1Ai|A)≤∑1≤i1≤nP(Ai1|A)-∑2≤i1≤nP(A1Ai1|A).

证明取Bi=AiA,根据定理2可得

P(∪ni=1AiA)≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A),

于是,

P(∪ni=1Ai|A)=P(∪ni=1AiA)P(A)

≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A)P(A)

≤∑1≤i1≤nP(Ai1A)P(A)-∑2≤i1≤nP(A1Ai1A)P(A)

≤∑1≤i1≤nP(AiA)-∑2≤i1≤nP(A1Ai1|A).

定理5设A1,A2,…,An是样本空间S中的一组事件,则对于样本空间S中的任一事件A,若P(A)>0,则

∑1≤i1≤nP(Ai1|A)-∑1≤i1

∑2≤i1

定理5的证明与定理4类似.

四、条件概率相关的三大公式

在本节,我们主要探讨与条件概率相关的三大重要公式,分别是:乘法公式,全概率公式,贝叶斯公式.该三大公式在相关的“概率论与数理统计”教材中均有阐述,本文主要讨论乘法公式,全概率公式以及贝叶斯公式之间的关系,通过比较说明不同公式在实际应用中的运用场景.为便于相关分析的阐述,我们在下面先总结一下相关的结论[3].

设A,B是两个事件,且P(A)>0,则P(AB)=P(A)·P(B|A),该等式称为概率的乘法公式.类似地,若P(B)>0,则P(AB)=P(B)P(A|B),该等式也称为概率的乘法公式.乘法公式可推广到有限多个事件的情形,比如,若A1,A2,…,An是样本空间S中的一组事件,且P(A1A2…An)>0,则

P(A1A2…An)=P(A1)P(A2|A1)…P(AnA1A2…An).

设B1,B2,…,Bn是一组完备事件组,且P(Bi)>0,则对于任意事件A,有P(A)=∑ni=1P(Bi)P(ABi).另外,若P(A)>0,则

P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj).

以上两个公式分别称为全概率公式和贝叶斯公式.关于乘法公式、全概率公式与贝叶斯公式的进一步分析以及相关性质,有兴趣的读者可进一步阅读参考文献[2][3].

下面,我们重点阐述乘法公式、全概率公式以及贝叶斯公式之间的联系.从数学史的角度来说,它们的产生顺序是不同的.首先有乘法公式的定义,在乘法公式的基础上获得全概率公式,然后进一步推导出贝叶斯公式.这样的关系也体现在各个公式的证明中,比如,在证明全概率公式时需要用到乘法公式,而在证明贝叶斯公式时需要用到全概率公式.乘法公式通常应用于求积事件的概率;全概率公式通常应用于已知某事件在完备事件组下的条件概率,求该事件的概率;而贝叶斯公式主要用于解决条件概率问题.在区分何时用全概率公式、何时用贝叶斯公式时,我们可采用以下判别方法:“由因求果”用全概率公式,而“执果求因”用贝叶斯公式.所谓“由因求果”指的是,经过一系列的原因,最后求结果的概率;“执果求因”意味着已知结果,求由某个原因造成该结果的概率.我们可以用一个具体的例子来分析一下.

某数据调查公司调研得出,投保的汽车司机按性格可分为三类,分别是性格谨慎、性格温和以及性格急躁三类人群,我们分别将其称为第一类投保人,第二类投保人以及第三类投保人.经统计发现,三类人群的比例分别为30%,40%,30%.已知第一类投保人在保险合同期内发生事故的概率为0.03,第二类投保人在保险合同期内发生事故的概率为0.04,第三类投保人相应的事故概率为0.02.现从所有投保人中任意选择一位,(1)此人在保险合同期内发生事故的概率是多少?(2)如果某投保人在保险合同期内发生事故,则此人来自第三类投保人的概率是多少?解决这个问题,我们首先可以将相关事件用数学符号表示出来.设事件“此人在保险合同期内发生事故”为A,Bi(i=1,2,3)表示此人为第i类投保人.于是前面所提的问题可转化成如下形式:问题(1)实质上指的是求事件A发生的概率P(A);问题(2)可转化为求条件概率P(B3|A).我们首先考虑问题(1),投保人的性格类型不同使得他们在保险合同期内发生事故的概率各不相同,不同类型的投保人占总投保人群的比例也不同.基于这样的原因,我们需要探讨随机选择一名投保者,此人在保险合同期内发生事故的概率.“在保险合同期内发生事故”是一种结果,所以问题(1)实质上是“由因求果”的问题.“由因求果”用全概率公式,故问题(1)可用全概率公式解决,即

P(A)=∑3i=1P(Bi)P(ABi).

由已知条件,可知P(B1)=0.3,P(B2)=0.4,P(B3)=0.3,P(AB1)=0.03,P(AB2)=0.04,P(AB3)=0.02.将上述条件代入全概率公式可得事件A的概率,即

P(A)=0.3×0.03+0.4×0.04+0.3×0.02=0.031.

接下来,我们来探讨问题(2),在这一问题中,我们已经知道了结果,即某投保人在保险合同期内发生事故,求在这种条件下,该投保人是第三类投保人,也就是急躁型投保人的概率.显然,这是一个已知结果求原因的概率,即“执果求因”,所以我们可以运用贝叶斯公式来求解问题(2).由贝叶斯公式,可得

P(B3|A)=P(AB3)P(B3)∑3j=1P(Bj)P(ABj)=631.

我们通过上面的例子给大家介绍了如何运用全概率公式,以及如何运用贝叶斯公式.这两个公式可用来解决很多现实生活中的实际问题.

五、计算条件概率的方法

在本节,我们主要介绍计算条件概率的方法.在学习“概率论与数理统计”的过程中,条件概率是一个重要的知识点.对于从事随机现象方面问题研究的科研工作者来说,这一概念是最基本的知识.那么,如何计算条件概率呢?在這里,我们介绍以下三种方法.

(一)利用条件概率定义

根据定义2,设A,B是两个事件,且P(A)>0,则称P(B|A)=P(BA)[]P(A)为在事件A发生的条件下事件B发生的概率.若求条件概率P(B|A),可先求出A,B积事件发生的概率,然后再算出事件A发生的概率,最后计算两者的比值即可.这一方法通常适用于求解较为简单的问题.下面给出一个简单的例题.

某桥梁在设计过程中执行如下标准:使用寿命达到80年的概率为0.95,使用寿命达到100年的概率为0.82.假设该桥梁施工时严格按照设计标准执行,现已知该桥梁已经使用了80年,试求该桥梁在未来的20年内损毁的概率.

设A为事件“该桥梁使用寿命达到80年”,B表示事件“该桥梁使用寿命达到100年”.于是,P(A)=0.95,P(B)=0.82.根据题意可知,该题可转化为求条件概率P(B-|A).由条件概率的性质,可知P(B-|A)=1-P(B|A).再根据条件概率的定义可得

P(B-|A)=1-P(AB)P(A)=1395.

(二)利用乘法公式求解

我们知道,当P(A)>0,P(B)>0时,以下两个乘法公式均满足:

P(AB)=P(A)P(B|A),

P(AB)=P(B)P(A|B).

于是,若求解条件概率P(B|A),可利用上述两个条件概率公式,即P(A)P(B|A)=P(B)P(A|B),则

P(B|A)=P(B)P(A|B)P(A).

利用这一等式,先求出P(A),P(B),P(A|B),然后即可计算获得P(B|A).

(三)利用贝叶斯公式求解

在前文中,我们已经总结分析了贝叶斯公式.设B1,B2,…,Bn是一组完备事件组,对于任意事件A,若P(A)>0,P(Bi)>0,则

P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj).

上述公式可用于解决较为复杂的条件概率问题.利用这一公式时,可先根据题意计算P(A|Bi),P(Bi),i=1,2,…,n,然后代入贝叶斯公式即可计算获得P(Bi|A).

六、生活中的条件概率

综上,我们给出了条件概率的定义,比较分析了条件概率与概率的关系,并总结了与条件概率密切相关的三大公式.在本节中,我们将从现实生活中遇到的实际问题出发阐述条件概率的现实应用.

(一)新冠病毒试剂实验中的条件概率

2020年新冠疫情在全球暴发.由于快速有力的防控措施,我国疫情得到有效控制.在疫情防控过程中,我国的科学家们也在积极研发应对新冠病毒的疫苗.要判断新型冠状病毒检测试剂是否有效,通常需要做如下两类实验:

(1)对新冠肺炎病人的实验.通过这个实验对新冠肺炎病人进行检测,得出呈阳性的概率.

(2)对未患有新冠肺炎病人的实验.通过这个实验对非新冠肺炎病人进行检测,得出呈阴性的概率.

基于这些实验的结果,分析某人经过该新型冠状病毒检测试剂的检测能否正确判断其是否患有新冠肺炎.前述实验实际上是对条件概率的统计实验.比如,若我们设A=“某人患有新冠肺炎”,B=“某人做此实验结果为阳性”,则对新冠肺炎病人的实验,检测后呈阳性的概率可写成P(B|A).另外,对非新冠肺炎病人的实验,检测后呈阴性的概率可写成P(B-|A-).

(二)蒙提霍尔问题

蒙提霍尔问题源于美国一档游戏节目,选手面对三扇关闭的门,在每扇门后有不同等级的奖品.奖品分别是汽车和山羊,其中一扇门后面是汽车,而另外两扇门后面是山羊.主持人知道门后的奖品情况.当选手选择一扇门后,先不打开.主持人打开另外两扇门中后面藏有山羊的那扇门.然后,选手被询问是否要变更之前的选择.这意味着,此时选手有机会从剩下两扇关闭的门中任选一扇作为最终选择的结果.在这样的游戏中,请问该选手是否应该变更自己的选择,或者说换一扇门是否会提高其获得汽车的概率呢[5].

这个问题,实际上也是个条件概率的问题.我们将三扇门编上序号,分别将其称为1号门,2号门,3号门.假设选手第一次选择时选择1号门,而主持人打开3号门.我们记“主持人打开3号门”的事件为事件A.事件Bi= “第i号门后是汽车,i=1,2,3”.要判断换一扇门是否能提高其获得汽车的概率.我们可把这两扇门后有汽车的概率算出来.需要注意的是,这个概率是有条件的,因为主持人已经打开了3号门.显然,在主持人打开了3号门的条件下,汽车在1号门后的概率为P(B1|A);在主持人打开3号门的条件下,汽车在2号门后的概率为P(B2|A).根据贝叶斯公式,能得到P(B1|A)=1[]3以及P(B2|A)=2[]3.在这里,我们忽略了具体的计算.通过比较,我们发现P(B2|A)>P(B1|A),故换一扇门可以提高其获得汽车的概率.

(三)工业流水线中的条件概率问题

某工厂有三条流水线,各自独立生产相同的产品,比如节能灯.生产出来的节能灯都放在工厂的仓库中,并向不同地区的销售商发售.根据之前的统计,这三条流水线生产的节能灯合格率是不同的,分别是0.98,0.99,0.97.现某人购买了该工厂生产的节能灯,发现是次品,请问该次品来自哪一条流水线.在这个问题中,我们可以记A为“节能灯是次品”,Bi=“该节能灯是第i条流水线所生产的,i=1,2,3”.于是,在某人购买的节能灯是次品的条件下,该次品来自第1条流水线的概率可写为P(B1|A).显然这也是个条件概率问题.要计算这一条件概率需要用到贝叶斯公式.实际上,在求解有关条件概率的实际问题时,经常使用贝叶斯公式.

类似这样的例子,生活中还有很多.火箭发射时,如发射失败,就需要探讨是由某部件导致的概率;在信号传输过程中,原信息为A,求经过传输后接收方收到的是信号B的概率等.因此,只要我们认真观察,就会在生活中发现很多关于条件概率的例子.

七、总结

本文首先给出了概率和条件概率的定义.通过对两者进行比较分析发现,条件概率也是概率.基于这一结论可知,概率所具有的性质,条件概率也都具有.文中总结了与条件概率密切相关的三大公式,通过例题进一步阐述条件概率的性质.最后,本文结合新冠病毒试剂实验中的条件概率、蒙提霍尔问题,以及工业流水线中的条件概率问题,进一步说明了生活中的条件概率问题无处不在.

【参考文献】

[1]徐雅静,段清堂,汪远征.概率论与数理统计[M].北京:科学出版社,2009.

[2]河南理工大學概率论与数理统计教研组.概率论与数理统计[M].北京:高等教育出版社,2013.

[3]盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].北京:高等教育出版社,2008.

[4]林正炎,白志东.概率不等式[M].北京:科学出版社,2006.

猜你喜欢

样本空间概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
浅谈高校古典概率的教学
古典概型中一道易错题的思考
全概率公式的教学方法研究