APP下载

两参数拉普拉斯BS 疲劳寿命分布的统计分析

2020-12-07徐晓岭顾蓓青王蓉华

浙江大学学报(理学版) 2020年6期
关键词:样本容量置信水平拉普拉斯

徐晓岭,顾蓓青*,王蓉华

(1.上海对外经贸大学 统计与信息学院,上海 201620;2.上海师范大学 数理学院,上海 200234)

设T服从两参数Birnbaum-Saunders 疲劳寿命分布BS(α,β),其分布函数与密度函数分别为

其中,α>0,为形状参数,β>0,为刻度参数(或尺度参数),φ(x)和Φ(x)分别为标准正态分布的密度函数和分布函数,即

BIRNBAUM 等[1]在研究主因裂纹扩展导致材料失效过程中得到了两参数BS 疲劳寿命分布,此分布较威布尔分布、对数正态分布等常用的寿命分布更适合描述由疲劳引起失效的产品的寿命规律,已成为可靠性工程中的常用分布之一。值得指出的是,国内学者杨德滋等[2]在混凝土重复荷载作用下,通过求解Fokker-Planck 方程得到的疲劳寿命服从两参数BS 疲劳寿命分布,分析了混凝土抗拉疲劳寿命试验资料,并认为两参数BS 疲劳寿命分布较对数正态分布更接近实际数据。关于两参数BS 疲劳寿命分布的研究已有很多[3-19]。

随着研究的深入,两参数BS 疲劳寿命分布被进一步推广为广义BS 疲劳寿命分布。如文献[20-23]中均涉及广义BS 疲劳寿命分布,并将原有的两参数BS 疲劳寿命分布所涉及的标准正态分布N(0,1)改为标准拉普拉斯分布L(1),即两参数拉普拉斯BS 疲劳寿命分布。文献[23]较为详细地研究了两参数拉普拉斯BS 疲劳寿命分布,给出了其数字特征,研究了其密度函数、失效率函数的图像特征及参数的极大似然估计,证明了极大似然估计是唯一存在的。下文将说明其证明过程中存在错误。

1 两参数拉普拉斯BS 疲劳寿命分布的极大似然估计

设非负随机变量T的分布函数

则称T服从两参数拉普拉斯BS 疲劳寿命分布,记为T~LBS(α,β),其中α>0,为形状参数,β>0,为刻度参数。

易见,其密度函数

另外,两参数拉普拉斯BS 疲劳寿命分布LBS(α,β)的密度函数在t=β处的二阶导数不存在。事实上,易见

综上所述,文献[23]引理5.1 中的β0不是唯一的,也可能不存在。

例 1给定样本容量n,参数真值取α=1,β=1,通过Monte-Carlo 模拟产生3组容量为n的样本数据,如表1 所示。

表1 模拟产生的3 组样本数据Table 1 The simulation sample data of three groups

图1 第1 组样本数据的gj()图像Fig.1 Image of gj()for the first sample data

图2 第2 组样本数据的gj()图像Fig.2 Image of gj()for the second sample data

图3 第3 组样本数据的gj()图像Fig.3 Image of gj()for the third sample data

于是,可认为LBS(α,β)分布参数的极大似然估计的唯一性有待进一步研究。

2 两参数拉普拉斯BS 疲劳寿命分布的参数点估计

2.1 参数的矩估计(方法1)

设总体T~LBS(α,β),T1,T2,…,Tn为来自总体T的容量为n的简单随机样本。由文献[23]知,

E(T)=β(α2+1),D(T)=β2α2(11α2+2)。由矩估计思想,建立方程:

取样本容量n=5,10,…,50,参数真 值α=0.25,0.50,…,2.00,β=1,通 过10 000 次Monte-Carlo 模拟,得 到满足a≥11 的次数,见 表2,从 表2可以看出:(i)绝大多数样本数据满足a<11;(ii)固定α,β,随样本容量n的增加,满足a<11 的次数呈减少趋势;(iii)固定n,β,随α的增加,满足a<11 的次数呈减少趋势。

表2 10 000 次模拟中满足a ≥11 的次数Table 2 The number that satisfies a ≥11 in 10 000 simulations

2.2 参数的矩估计(方法2)

2.3 参数的逆矩估计(方法3)

2.4 参数的分位数估计(方法4)

2.5 对数矩估计(方法5)

引理1[24]设X1,X2,…,Xn是来自总体X的容量为n的简单随机样本,记E(X)=μ,D(X)=σ2<+∞,该总体X的四阶中心矩v4=E(X-EX)4有限,若函数h(x)的四阶导数存在且有界,则有

虽然由引理2 知方程(2)有唯一正实根,但考虑方程(2)是含有积分且运算复杂的超越方程,不适合工程应用。在此仍采用极大似然估计的结果,即取相应α的估计为

2.6 参数点估计方法的模拟比较

取样本容量n=5,10,…,20,参数真 值α=0.25,0.50,…,1.50,β=1,通过1 000 次Monte-Carlo 模拟,计算5 种点估计方法的均值及均方误差,结果见表3,从表3 可以看出:(ⅰ)5 种方法的点估计精度均随样本容量的增加而增高;(ⅱ)综合比较5种方法的均值与均方误差,其中对数矩估计方法的优势较明显,特别是当参数α较大时。

3 两参数拉普拉斯BS 疲劳寿命分布的参数的近似区间估计

3.1 参数β 的近似区间估计

3.1.1 基于文献[25]中方法的参数β的近似区间估计

设总体T~LBS(α,β),T1,T2,…,Tn为来自总体T的容量为n的简单随机样本,其次序统计量记为T(1)≤T(2)≤…≤T(n)。

即G(β) 为枢轴量,其分布与参数无关。通过Monte-Carlo 模拟,计算得到G(β)的上侧分位数,并由文献[25]知,G(β)对β严格单 调递减。对G(β)做恒等变换:

给定置信水平1-γ,记G(β) 分布的上侧分位数 分别为ωγ/2,ω1-γ/2,若满足,则参数β的置信水平为1-γ的区间估计为[β1,β2],其中β1是G(β)=ωγ/2的根,β2是G(β)=ω1-γ/2的根。

给定显著性水平γ=0.10,0.05,取样本容量n=5,10,…,30,参数α=0.25,0.50,…,1.50,β=1,通过10 000 次Monte-Carlo 模拟,满足ω1-γ/2>的次数分别记为k1,k2和k,结果见表4,从表4 可以看出,k值很小,即利用枢轴量G(β)求参数β的区间估计在实际中并不可行,利用文献[25]中的方法不大可能求得参数β的近似区间估计。值得一提的是,针对两参数BS(α,β)分布,文献[26]也指出相同的问题。

3.1.2 基于两参数拉普拉斯分布L(μ,α)的近似方法的参数β的近似区间估计

表4 在10 000 次模拟中满足的次数Table 4 The number that satisfiesin 10 000 simulations

表4 在10 000 次模拟中满足的次数Table 4 The number that satisfiesin 10 000 simulations

即X=lnT,可将其近似地看作两参数拉普拉斯分布L(μ,α)。

设总体T~LBS(α,β),T1,T2,…,Tn为来自总体T的容量为n的简单随机样本,其次序统计量记为T(1)≤T(2)≤…≤T(n)。令

则可将X1,X2,…,Xn近似地 看作来 自总体X~L(μ,α)的容量为n的简单随机样本,其次序统计量记为X(1)≤X(2)≤…≤X(n)。令

则可将Y1,Y2,…,Yn近似地看作来自标准拉普拉斯总体Y~L(0,1)的容量为n的简单随机样本,从小到大排序,记为Y(1)≤Y(2)≤…≤Y(n)。

于是,可将H(μ)看作仅含参数μ的枢轴量。通过Monte-Carlo 模拟,计算得到H(μ)的上侧分位数。注意到H(μ)为μ的严格单调增函数,且

给定显著性水平γ,枢轴量H(μ)的上侧1-γ/2,γ/2 的分位数分别记为H1-γ/2和Hγ/2,易见参数μ的置信水平为1-γ的近似区间估计为

于是,可将H(μ)看作仅含参数μ的枢轴量。通过Monte-Carlo 模拟,计算得到H(μ)的上侧分位数。注意到H(μ)为μ的严格单调增函数,且

给定显著性水平γ,枢轴量H(μ)的上侧1-γ/2,γ/2 分位数分别记为H1-γ/2和Hγ/2,易见参数μ的置信水平为1-γ的近似区间估计为

进而,参数β的置信水平为1-γ的近似区间估计为

给定置信水平0.90,取样本容量n=10,15,…,30,参数真 值α=0.25,0.50,…,1.50,β=1,通过1 000 次Monte-Carlo 模拟,计算参数β的近似区间估计的平均下限、平均上限、平均长度及近似区间估计包含α的次数(k1),结果见表5,从表5 可以看出:(ⅰ)固定α,区间估计的长度随n的增加而减小,即n越大,区间估计越精确;(ⅱ)k1均在900 以上。

表5 利用两参数拉普拉斯分布求得到参数β,α 的近似区间估计Table 5 Approximate interval estimations of parameters β,α by two-parameter Laplace distribution

3.2 参数α 的近似区间估计

3.2.1 基于两参数拉普拉斯分布L(μ,α)近似方法的参数α的近似区间估计

类似于3.1.2 节中参数β的近似区间估计方法,构造以下仅含参数α的枢轴量:

即可将T(α)看作仅含参数α的枢轴量。通过Monte-Carlo模拟,计算得到枢轴量T(α)的上侧分位数。

给定显著性水平γ,枢轴量T(α) 的上侧1-γ/2,γ/2 分位数分别记为T1-γ/2和Tγ/2,易得参数α的置信水平为1-γ的近似区间估计为

给定置信水平0.90,取样本容量n=10,15,…,30,参数真 值α=0.25,0.50,…,1.50,β=1,通 过1 000 次Monte-Carlo 模拟,计算α的近似区间估计的平均下限、平均上限、平均长度,以及近似区间估计包含α的次数(k2),结果见表5,从表5 可以看出:(ⅰ)固定α,区间估计的长度随n的增加而减小,即n愈大,区间估计愈精确;(ⅱ)当α较小时,k2均在900以上,而当α较大时(从模拟结果看,α>1),k2未达到900,此时,置信水平未达到0.90。

3.2.2 基于参数的参数α的近似区间估计

表6 基于参数的参数α 的近似区间估计Table 6 Approximate interval estimation of parameter α based on parameter

表6 基于参数的参数α 的近似区间估计Table 6 Approximate interval estimation of parameter α based on parameter

给定置信水平0.90,取样本容量n=10,15,…,30,参数真值α=0.25,0.50,…,1.50,β=1,通过1 000次Monte-Carlo 模拟,计算α的近似区间估计的平均下限、平均上限、平均长度,以及近似区间估计包含α的次数(k),结果见表6,从表6 可以看出:(ⅰ)固定α,区间估计的长度随n的增加而减小,即n越大,区间估计越精确;(ⅱ)k均在900 以上。

比较表5 和表6,发现基于参数的参数α的近似区间估计方法更优,不仅近似区间估计包含α的次数均达到900 以上,而且所得近似区间估计的平均长度较小。

猜你喜欢

样本容量置信水平拉普拉斯
对拉普拉斯变换的教学理解
基于拉普拉斯机制的随机游走知识发现系统的优化研究
采用无核密度仪检测压实度的样本容量确定方法
产品控制与市场风险之间的相互作用研究
广义积分与拉普拉斯变换的相关研究
单因子方差分析法在卷烟均匀性检验中的研究与应用
蒙特卡罗模拟在计量经济学中的应用
分层抽样技术在课堂满意度调查中的应用研究
用VaR方法分析中国A股市场的风险
基于超拉普拉斯分布的磁化率重建算法