APP下载

对概率定义的再认识

2014-04-08梁盛楠宋立新

衡水学院学报 2014年4期
关键词:公理化概率论贝叶斯

梁盛楠,宋立新

(吉林师范大学 数学学院,吉林 四平 136000)

0 引言

在概率论中,深刻理解概率的定义是学好这门课程的关键所在.许多学者对概率的定义进行了详细的说明,但都侧重于对某一种定义的具体研究.而本文主要对概率六种定义进行整体分析,说明其关联性及各自特点,对概率的定义进行深入的研究.

1 对六种定义的整体认识

自有人类活动以来,概率的思想就隐含在人们的日常行为之中.比如狩猎者在狩猎时就会不自觉地考虑射中这个动物的可能性有多大.正是根据人们类似的思维活动,概率的描述性定义应运而生.概率论的早期研究大约在16—17 世纪之间,在16 世纪中叶,由帕斯卡和费马对赌博中赌金的“公平”分配和计算问题而产生古典概率思想,进而产生概率的古典定义.18 世纪概率论发展很快,几乎初等概率的全部内容都在这个期间形成.1777年,蒲丰发表了《或然性算术试验》,首先提出并且解决了现在称为著名的“蒲丰投针问题”,开始了几何概率的早期研究,形成概率的几何定义.一直到19 世纪后半叶,概率的频率方法深入人心,称为概率的统计定义.同时期主观概率也具有一定的影响性,称为概率的主观定义.概率定义之多,让人们想要寻求一种能够统一概率定义的方法.直到20 世纪初,概率公理化体系的建立完成了这一壮举.公理化体系是概率论发展史上的一个里程碑,有了它以后概率论得到了很快的发展,故又称之为概率的公理化定义.

对于最初的描述性定义和发展较完备的公理化定义,两者都是一般定义,但这却是认识上的飞越.这是由简单到复杂,由粗糙到精细,由低级到高级的不断认识过程.但这两种定义并不能直接求得概率值.公理化定义作为一个数学平台,让人们在此基础上进行演绎,得到系统的概率论知识体系.要想求出概率,还需根据古典定义、几何定义、统计定义、主观定义这四种寻求概率的方法.根据罗伯特·约翰逊和帕特里夏·库贝的观点[1],其中古典定义和几何定义是从理论上及模型本身的对称性上获得概率的方法,而统计定义和主观定义分别是从经验上和主观上获得概率的方法.根据不同场合、背景及事件切入点的差异进而选择不同的寻求概率的方法.需要指出的是,这六种定义具有整体性,他们之间并无矛盾,是互补的.

从教学上看,向学生们由浅入深,由特殊到一般的介绍概率这六种定义,不但符合概率发展的历史进程,而且也符合人类的认识规律.

2 六种定义各自的特点

概率的描述性定义简单、直观,根据定义的语言表述就能使学生建立感性认识,知道概率为何物:它是指随机事件发生的可能性大小的数值.随机事件的发生具有偶然性,但随机事件发生的可能性有大小之分,并且通常来说,人们对此可能性的大小用百分比进行度量.而这个定义的局限性也在于此,它未给出这个可能性具体的取值范围,我们可以说这个事件发生的可能性在1到10之间,也可以说它在1到100之间.它只给人们直观的认识,便于理解,但并未给出具体计算概率的方法.

概率的古典定义是概率论历史上最先开始研究的情形,它简单、直观,不需要做试验,通过古典概型的“对称性”给出具体计算概率的公式.“等可能性”或“机会均等”是古典概率思想产生或研究的重要前提.但其局限性也隐藏在其中,对于这个计算方法有两个严格的限制条件,即样本点个数有限和等可能性.而在实际生活中,我们遇到的问题往往并不具备这样的前提条件,它不适用于更一般的场合.

概率的几何定义提供了某种特殊类型的随机试验:试验的一切可能结果是无限的且等可能的情形.蒲丰投针问题及由其引出的狭义蒲丰短针、狭义蒲丰长针、广义蒲丰问题及弯针问题等,本质上都是应用几何定义来解决.而由这些问题也产生出一种研究方法,称为随机模拟法或蒙特卡罗法[2]25.不过其局限性仍是我们上面所提到的试验结果的等可能性.从某种意义上讲,几何定义是对古典定义的深化.

概率统计定义的提出是由频率认识概率的过程.它类似于描述性定义,其优点就是便于人们直观理解,由试验事实说话,频率就是事件发生的可能性,用试验的方式记录下事件发生的次数,由它提供一个具体数值,并且在试验重复次数较大时可用频率给出概率的一个近似值,这是该方法最有价值的地方.但其局限性是:在现实世界里,人们无法把一个试验无限次地重复下去,因此要精确获得频率的稳定值是困难的.

根据贝叶斯学派的观点,概率的主观定义是指人们根据自己的生活经历的积累对该事件发生可能性所给出的信念[3].根据已经发生的事件来预测未来事件发生的可能性.贝叶斯理论假设,如果事件的结果不确定,那么量化它的唯一方法就是事件的发生概率.如果过去试验中事件的出现率已知,那么根据数学方法可以计算出未来试验中事件出现的概率[4].其局限性就是人为色彩较浓,比较依赖于先验信息,颇有“先入为主”之感,与概率的客观存在性有些矛盾.

概率的公理化定义既概括了前几种概率定义中的共同特性,又避免了各自的局限性,针对范围更广,无论什么随机现象只要满足定义中的三条公理,即可称之为概率.它刻画了概率的本质.有学者认为概率的公理化体系不能作为概率的定义[5],认为面积、体积、质量、热量等都满足公理化体系,但都不是概率.这种观点有些片面性.概率的公理化定义并不是单独使用的,它有其应用的前提条件,必须在事件域的基础上给出,而面积等都不在这个基础之上.然而公理化定义并没有告诉人们如何计算概率,我们之前介绍的几种概率定义可称之为在特定场合下确定概率的方法,易于计算.

3 对概率统计定义的认识

概率史上封·米塞斯的频率定义[6]对概率的研究曾具有深远影响.正如定义表达式所反映的那样,当试验次数 n 足够多时,用事件发生的频数μ 去刻画概率.然而根据数学分析中的极限语言当∀n>N时有或其对立事件是“必定”不会发生的.然而在随机现象中,“ n=μ ”也是可能发生的,此时从而事件就有可能发生.故封·米塞斯给出的频率定义是有偏差的,应该说明的是当实验次数足够多时,频率与概率间有大偏差的概率很小,是依概率收敛:这一问题大数定律给予了清晰的解释[2]210,这便是概率的统计定义.

下面我们来分析一下概率统计定义所运用的思想.该定义给出了一条通过频率来认识概率的路线,那么该路线遵循什么原理呢?首先,我们承认一个事件的概率是客观存在的,与试验者主体无关.而根据辩证唯物主义的思想,对于客观存在的事物,我们要通过实践、认识、再实践、再认识的过程,去寻求事物发展的内在规律性.我们需要透过现象看本质,而这里的事件发生的频率就是表象,要透过频率这一表象去认识概率这一事物的本质,这就是通过频率来认识概率这条路线所遵循的原理.比如投掷一枚均匀的硬币,我们通过大量的重复试验,发现出现字数一面的频率稳定在1/2左右,这就是频率所带来的表象.而事实上,投掷一枚均匀的硬币出现数字一面的概率就是 P ( A) =1/2,此1/2是与认识主体无关的,是客观存在的,固定的,具有必然性.这就说明了频率与概率的关系是偶然性与必然性的对立统一,是现象与本质的对立统一.

4 对主观概率的认识

统计学中有两大经典学派,即频率学派和贝叶斯学派.概率的主观定义就是由贝叶斯学派提出的.两学派之间关于概率的产生有着截然不同的观点.费歇尔和杰弗里斯分别是两种学派的代表人物.费歇尔认为科学家只能在现有数据上做推断,他认为贝叶斯方法本质上是不科学的,因为先验概率的选择十分武断,会带有个人的偏见.相反,杰弗里斯认为,科学研究中,虽然概率推算应反映科学家之间的普遍共识,但很显然,个人的专长和经验,应是科学理论形成过程中的必要组成部分.在1932—1934年间,两人都发表一系列文章,在反驳对方观点的同时也为自己的方法辩护.通过这种交流方式,双方都重新审视了自己的概率理论[7].

概率的主观定义又是遵循什么思想呢?有的观点认为它是唯心主义产物,是人们单纯的主观臆想.但根据主观定义的描述,它是根据“生活经历的积累”而对事件发生的可能性做出推断,虽然它不需要做大量的统计或复杂计算,但也绝非人们的随意捏造.主观定义实际上遵循着认识的主体与客体相统一的规律.研究者要知道某一事件发生的概率,那么事件的概率作为客体,即认识的对象,是客观存在的.而研究者作为认识的主体,通过生活经历的不断积累,不断提高认识水平,来完成对客体的不断认识的过程,从而达到了认识的主体与客体的协调统一,使概率的主观定义具有合理性.

5 小结

以上简单说明了概率六种定义之间的关系及各自特点,同时也根据辩证唯物主义的观点对某些定义进行更深层次的认识.希望使读者更好地理解概率定义之间的关系,对概率定义进行再认识.

[1]约翰逊,库贝.基础统计学[M].屠俊如,洪再吉,译.北京:科学出版社,2003:222.

[2]茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.

[3]茆诗松.贝叶斯统计[M].北京:中国统计出版社,1999:5.

[4]赵晓芬.评贝叶斯方法对概率逻辑的继承和发展[J].安徽警官职业学院学报,2011(4):98-100.

[5]吴诚鸥,吴令云.关于概率的定义及产生方法[J].高等数学研究,2013(2):7-9.

[6]格列坚科.概率论教程[M].丁寿田,译.北京:高等教育出版社,1956:19.

[7]孙建州.解释概率[D].天津:天津财经大学理工学院,2012:3-5.

猜你喜欢

公理化概率论贝叶斯
论经济学中的公理化方法
浅谈《概率论与数理统计》课程的教学改革
对外汉语教学中的数学方法
基于贝叶斯估计的轨道占用识别方法
基于互信息的贝叶斯网络结构学习
基于独立公理的离散制造系统精益设计公理化映射研究
一种基于贝叶斯压缩感知的说话人识别方法
多模态公理化系统的可分离性研究
论《概率论与数理统计》教学改革与学生应用能力的培养
IIRCT下负二项分布参数多变点的贝叶斯估计