APP下载

基于狄氏先验分布的机电产品主要失效模式贝叶斯分析

2012-02-22谭源源张春华陈循

兵工学报 2012年2期
关键词:后验样本量先验

谭源源,张春华,陈循

(国防科学技术大学 机电工程与自动化学院,湖南 长沙410073)

0 引言

复杂机电产品通常存在多种失效模式,但各失效模式对产品可靠性的影响程度是不同的,而失效发生概率高的失效模式(即主要失效模式)的影响程度最大,因此主要失效模式分析在产品可靠性设计、试验中扮演着非常关键的角色。例如:在产品设计阶段,主要失效模式分析可以找出产品薄弱环节并进行相应改进,是失效模式影响分析(FMEA)的核心内容之一[1];在对产品进行加速试验方案设计时,也需要分析主要失效模式,逐步缩小失效机理的分析范围,进而准确选定加速试验的应力[2]。

目前常用的主要失效模式分析方法可分为定性分析和定量分析。定性分析主要根据专家经验、类似产品情况等信息,分析产品潜在的失效模式,并分析哪些是主要失效模式。由于定性分析容易受到主观意愿的影响,分析精度有限,因此通常在失效数据匮乏的情况下(如产品设计阶段)采用。而当获取到产品的失效数据之后,可以采用定量分析方法进行主要失效模式分析,以提高分析精度。目前定量分析主要为频率分析方法[2-4],即分析失效数据中各失效模式的失效个数占总失效数的比例,发生频率较高的失效模式即为主要失效模式。但是,由于频率分析的理论基础是大数定理,因此在数据样本量较少时并不是最优的定量分析方法。

针对这一问题,本文提出了基于Dirichlet 先验分布的Bayes 方法,适用于在小样本量场合找出机电产品的主要失效模式。最后通过Monte Carlo 仿真分析和应用算例验证方法的有效性。

1 主要失效模式定量分析的问题描述

设某产品共有M 种失效模式,编号分别为1,…,M.设失效模式d(d∈{1,…,M})导致产品失效的概率(即发生概率)为pd,则pd∈(0,1),1.参数可表示p=(p1,…,pM).

假设对n 个产品的失效数据进行收集,由失效模式d(d∈{1,…,M})引起产品失效的个数为rd,则rd∈[0,n]且为非负的整数,数据可表示现根据数据进行分析,得到各失效模式发生概率(p1,…,pM)的估计值进而根据巴雷特原理确定整机的主要失效模式[5],即按发生概率由大到小进行排列,累积发生概率0~80%的失效模式,归类为主要失效模式。例如,设失效模式1、2、3 的发生概率分别为30%、10%和60%,则主要失效模式为失效模式1 和失效模式3.

2 基于Dirichlet 先验分布的Bayes 分析方法

在小样本量的情况下,目前常用的频率分析方法精度很低,而Bayes 方法由于可以结合专家经验、类似产品情况等多源信息,显然更为适用。

2.1 Dirichlet 先验分布

为了能产生性质优良的先验分布,需要对参数p 做适当变换,令

显然可以得到:

例如,假设某产品有4 种失效模式,发生概率分别为:p1=0.3,p2=0.1,p3=0.4,p4=0.2,则U0=1,U1=0.7,U2=0.6,U3=0.2,U4=0.

(1)式称为顺序约束形式。对于此类形式,Mazzuchi 等[6]提出可以采用Dirichlet 分布来描述先验分布,即(U|Ip)服从顺序Dirichlet 分布

式中,c 和g=(g1,…,gM)为先验分布参数。

由Dirichlet 分布的性质可知,其各个边缘分布均为Beta 分布,即

顺序Dirichlet 分布实际上是一个多元Beta 分布,进一步由Beta 分布的性质可知

由(2)式和(6)式可以看出,参数gd实际上为根据先验信息Ip得到的pd估计值(^pd|Ip).参数c反映了技术人员对这些参数gd的确信程度,c 值大(小)则得到的先验标准差小(大),从而说明对估计值的确信程度高(低)。

2.2 后验分布

失效数据r 的似然函数为

(7)式可化为

根据先验分布和似然函数,由Bayes 定理可知,(U1,…,UM-1)后验分布的核为

式中,I0= Ip∪r 为先验信息和失效数据的累积信息。

2.3 基于Gibbs 抽样的后验估计值计算

对于联合后验分布(9)式,很难采用数值积分的方法得到每个Ud的后验统计。因此,这里采用Gibbs 抽样方法计算后验统计(|I0),进而求出pd的后验估计值(|I0).

Gibbs 抽样[7]是一种应用最广泛的MCMC 方法。它的基本思想是:从满条件分布中迭代的进行抽样,当迭代次数足够大时,就可以得到来自联合后验分布的样本,进而也得到了来自边缘分布的样本。

对于联合后验分布(9)式,若给定U(-d)={Uv|v≠d,v=0,1,…,M},则π(U|I0)仅为Ud的函数,此时称π(Ud|U(-d);I0)为Ud的满条件分布。Gibbs 抽样过程如下:

设U(0)=(U(0)0,…,U(0)M),其中,U(0)d,d =0,1,…,M 为任一初值。注意到U0≡1,UM≡0,因此在迭代过程中均保持不变。

Gibbs 抽样的关键在于如何从各个满条件分布抽样。实际应用中满条件分布往往不是标准分布函数,对其抽样存在一定困难,可采用标准取舍抽样[8]得到满条件分布抽样值,其步骤大致如下

步骤1 令d=1,…,M-1,分别从先验分布的满条件分布π(Ud|U(-d);Ip)中随机抽样Ud,其中

即其服从(Ud+1,Ud-1)上的Beta 分布,通过变量替换

(11)式Beta(·,·)为(0,1)上标准Beta 分布,直接抽样得到Ad,由(13)式反推得到Ud抽样值

步骤2 产生(0,1)区间均匀分布的随机数Unif.

步骤3 计算比率

步骤4 若Unif≤Ratio 则认为抽样值Ud来自满条件后验分布并接受;否则拒绝该抽样值,并重复以上步骤重新进行抽样。

通过以上方法进行迭代,假设从U(0)出发,Markov 链通过s(s <l)次迭代后,可以认为各个时刻的U(l)的边缘分布都是平稳分布π(U|I0),则称抽样收敛了。之前的s 次迭代值因未收敛而应将其舍弃,而采用后面的l-s 个成熟数据进行估计

由以上Gibbs 抽样过程可以看出,判断抽样过程何时收敛是一个重要的问题。本文主要采用以下方法:每隔一定迭代次数计算一次(^Ud|I0),观测是否已经收敛,当(^Ud|I0)稳定后,可认为Gibbs 抽样收敛了。

3 Monte Carlo 仿真分析

Monte Carlo 仿真分析的目的在于对频率分析和本文的Bayes 分析方法进行对比,分析这两种方法的优劣及其适用场合。

设某机电产品共有4 种失效模式,其发生频率真值p =(0.3,0.1,0.4,0.2).按发生频率真值采用Monte Carlo 仿真方法产生失效数据,方法如下:产生n 个(0,1)之间的均匀随机数,则失效数据r1,r2,r3,r4分别为随机数数值在(0,0.3]、(0.3,0.4]、(0.4,0.8]、(0.8,1)区间的个数。n 取5、30、100,分别属于样本量较小、适中和较大的场合;仿真次数NMC=200.根据仿真方案得出仿真数据,并利用上述2 种方法进行分析,得出各失效模式的发生概率估计值为对Bayes 方法作敏感性分析,先验分布参数取值分为8 种情况:a)~h),g和c 的取值如表1所示。设参数g 的累计绝对误差则σ|a)=σ|b)=0,σ|c)=σ|d)=0.2,σ|e)=σ|f)=0.4,σ|g)=σ|h)=0.6,σ 越小,先验信息越准确。

采用NMC次累计绝对误差的均值

作为分析精度评价标准。显然,σMC越小估计值越准确,分析精度越高;反之越低。

表1 仿真分析结果Tab.1 Analysis results of Monte Carlo simulation

对表1的仿真结果进行分析:

1)敏感性分析。Bayes 方法的分析精度不仅与样本量有关,而且与先验分布参数的取值有关,即对先验分布参数具有一定的敏感性。

2)有效性分析。在样本量较小场合(如n=5),Bayes 方法由于可以结合有用的先验信息进行分析,其分析精度比频率分析更高,表明了方法的有效性。

4 算例

设某型机电产品的潜在失效模式有4 种,编号分别为1~4.为对该产品进行加速贮存试验,首先需要进行主要失效模式分析,以便针对主要失效模式开展试验方案设计。

用于主要失效模式定量分析的失效数据r =(2,1,2,0),是由本文第3 节的仿真方案产生的仿真数据。即4 种失效模式的发生频率真值p =(0.3,0.1,0.4,0.2),真值对应的主要失效模式为失效模式1、3、4.

分别采用频率分析方法和本文的Bayes 方法进行主要失效模式分析。其中,Bayes 分析的先验分布参数则取3 000~10 000 次的Gibbs 抽样数据计算后验均值图1所示为U1的先验边缘分布π(U1|Ip)(均值和后验边缘分布π(U1|I0)(均值图2所示为U1后验边缘分布的抽样值。

图1 U1 的先验边缘分布和后验边缘分布Fig.1 Gibbs Sampling of marginal posterior distribution of U1

图2 U1 后验边缘分布的抽样值Fig.2 Marginal prior and posterior distributions of U1

分析结果如表2所示。由于失效数据r 属于小样本量场合,若采用频率分析方法,得到的主要失效模式为失效模式1、3,漏掉了失效模式4.按第3 节的分析结论,在样本量较小场合宜采用Bayes 方法进行分析,从而确定该产品的主要失效模式为失效模式1、3、4,这与真值对应的主要失效模式一致。

5 结论

本文提出了分析机电产品主要失效模式的Bayes 方法,通过Dirichlet 先验分布有效结合专家经验、类似产品情况等信息。Monte Carlo 仿真对比分析和算例结果表明:相对于目前常用的频率分析方法,Bayes 方法由于可以扩大信息量,在失效数据样本量较小场合更为适用。在实际应用当中应当根据样本量的充足程度,选择合适的分析方法。

表2 算例仿真数据和各失效模式发生概率分析结果Tab.2 Simulation data and analysis results on occur probability of each failure mode in example

References)

[1] Peter L,Kosuke I.Global failure modes and effects analysis:a planning tool for global product development[C]∥Proceedings of International Design Engineering Technical Conference.California:FMEA,2005:1-10.

[2] 李久祥.整机加速贮存寿命试验研究[J].质量与可靠性,2004,(4):14-17.LI Jiu-xiang.Research on accelerated storage life testing of the whole assembly[J].Quantity and Reliability,2004,(4):14-17.(in Chinese)

[3] 贺国芳.可靠性数据的收集与分析[M].北京:国防工业出版社,1995.HE Guo-fang.Collection and analysis of reliability data[M].Beijing:National Defense Industry Press,1995.(in Chinese)

[4] 于捷,贾亚洲.数控车床故障模式影响与致命性分析[J].哈尔滨工业大学学报,2005,37(12):1725-1727.YU Jie,JIA Ya-zhou.Failure mode effect and criticality analysis on certain serial CNC lathes[J].Journal of Harbin Institute of Technology,2005,37(12):1725-1727.(in Chinese)

[5] 林震,李宪珊,姜同敏,等.整机产品加速贮存寿命试验研究思路探讨[J].环境与可靠性,2006,(4):38-41.LIN Zhen,LI Xian-shan,JIANG Tong-min,et al.Discussion on accelerated storage life testing of assembly-level products[J].Environment and Reliability,2006,(4):38-41.(in Chinese)

[6] Mazzuchi T A,Soyer R.A bayes attribute reliability growth model[C]∥Proceedings of Annual Reliability and Maintainability Symposium.Orlando:1991:322-325.

[7] 茆诗松,王静龙,濮晓龙.高等数理统计(第二版)[M].北京:高等教育出版社,2006.MAO Shi-song,WANG Jing-long,PU Xiao-long.Advanced mathematical statistics (2nd edition)[M].Beijing:High Education Press,2006.(in Chinese)

[8] Smith A F,Gelfand A E.Bayesian statistics without tears:a sampling-resampling perspective[J].The American Statistician,1992,(46):84-88.

猜你喜欢

后验样本量先验
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
样本量与东方蜜蜂微卫星DNA遗传多样性参数稳定性的关系
BOP2试验设计方法的先验敏感性分析研究*
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
医学研究中样本量的选择
一类传输问题的自适应FEM-BEM方法
定数截尾样本下威布尔分布参数 ,γ,η 的贝叶斯估计
一种考虑先验信息可靠性的新算法
一种基于最大后验框架的聚类分析多基线干涉SAR高度重建算法
先验的风