对数正态分布参数的最优区间估计及应用
2022-12-22陈修素王君琦
朱 海,陈修素,王君琦
(重庆工商大学 数学与统计学院,重庆 南岸 400067)
1 引言
正态分布作为数理统计中最重要的分布之一,其广泛的应用性使它成为众多学者研究的目标,其衍生出的对数正态分布也在统计学中占有一席之地,被应用于生物、金融、医疗等多个领域.多年来,不断有学者就对数正态分布的区间估计及应用作出了一些研究,黄超[1]计算出了对数正态分布参数的矩估计、极大似然估计和贝叶斯估计,并讨论了参数的区间估计;韩峰等人[2]针对产品抗辐射能力服从对数正态分布、实验样本数据为成败型实验数据的情形,运用Bayes方法给出了在给定置信度下产品平均抗辐射能力置信下限的计算方法;李秀珍[3]利用Fisher的信仰推断方法,给出了对数正态总体分布位置参数的信仰水平为1-α的信仰区间估计.本文在前面学者的研究基础上,研究了对数正态分布中尺度参数的最短区间估计问题.
2 预备知识
2.1 正态分布与对数正态分布定义
定义1 若随机变量X的概率密度函数为:
(1)
则称随机变量X服从均值为μ、方差为σ2的正态分布,记为X~N(μ,σ2).特别地,当μ=0,σ=1时,该分布称为标准正态分布.正态分布(又称高斯分布)是一种使用最为广泛的对称分布,图像关于直线x=μ对称,故μ又称为位置参数;σ为标准差,反映的是数据变量的离散程度,图像上可以决定图形的高矮胖瘦,故而称为形状参数,又或叫尺度参数.
定义2 若随机变量X取对数后服从正态分布,即存在Y=lnX~N(μ,σ2),则称随机变量X服从对数正态分布.根据定义1,可推出其概率密度为
(2)
2.2 正态分布与对数正态分布的比较
由上述定义可知,正态分布和对数正态分布非常相似,一个是随机变量本身服从正态分布,一个是随机变量取对数后服从正态分布,对数正态分布相当于正态分布经指数变换后得到,故对数正态分布有效区间为(0,+∞);另外,对数正态分布不再是对称分布,且总是右偏分布,其分布均值和方差均发生了变化.下面列举一些这两种分布的数字特征和常用统计量:
①对正态分布的总体X有:
②对数正态分布的总体X有:
3 对数正态分布参数σ2的区间估计和最短区间估计
众所周知,对数正态分布是常见的一种右偏分布,由于它的非对称性,平时所求的同等置信区间并不是最短区间,下面就针对对数正态分布的一种情形进行讨论.
μ未知时求σ2的置信区间:
(3)
求解可得σ2的1-α等尾置信区间为:
(4)
(5)
在讨论最短置信区间之前,我们先引入几个引理:
引理2[6]若f(x)为单峰连续密度函数,设其支撑区间为(a,b),x0∈(a,b)为极大值点,由极大值点定义可知,当x
引理3[6]在引理2成立的条件下,若x1
引理4(介值定理[7]) 设f(x)为[a,b]上的连续函数,如f(m)为f(x)的最小值,f(n)为f(x)的最大值,对满足f(m)<μ 以下讨论对数正态分布的未知参数σ2的最短置信区间问题: (6) 现考虑引入a、b,使得 3.精读。精读,就是潜心地读,反复地读。常言说得好:读书百遍,其义自见。精读的目的是从读中获得情感体验和创造性的理解,教师要引导学生学会抓住文章中的重点句、段进行朗读体会。 (7) (8) 其中f(x,n-1)为χ2(n-1)的概率密度函数,为: (9) 下面应用拉格朗日乘数法求解上述问题(8)的条件最值: 首先,建立拉格朗日函数为: 令L(a,b,λ)对a,b,λ求一阶偏导数令其等于0,可得其驻点,即: 化简得: (10) (11) 联立(10)、(11)可求得的解A(a*,b*),即是所要求的驻点. 下面证明A点的存在性和唯一性: (12) 对f(x,n-1)求一阶导数,得: (13) 令上式(13)等于0,得x**=n-3;同时可得当x∈(0,n-3)时,f′>0,函数单调递增,当x∈(n-3,+∞)时,f′<0,函数单调递减,故x**也为函数的最大值点,即有: (14)