APP下载

连续性抽样中最优样本轮换率的确定

2015-02-18叶桂芳

统计与决策 2015年10期
关键词:估计量连续性总体

叶桂芳

(暨南大学 经济学院,广州 510632)

0 引言

在实际社会经济中,为了研究社会经济现象随时间的动态变化趋势,传统的一次性调查已不能满足人们对统计信息的有效需求。为了能够及时反映调查总体的变化和发展,取而代之的是连续性抽样调查,比如美国的现时人口调查、加拿大的劳动力调查、我国的城市住户和农村住户调查等。作为使用最为广泛的样本轮换抽样方法,几乎可适用于所有的长期连续性抽样调查。在连续性样本轮换的抽样调查研究中有两个问题居于中心地位:一个是样本轮换率的确定;另一个是样本轮换模式下估计量的构造。由于影响样本轮换率的因素很多,如调查的目的、调查总体的变化速度、被调查者的心里接受程度、调查费用、调查精度等等。国内外学者在舍弃不可量化的影响因素后,对样本轮换率问题进行了大量的研究。

样本轮换的构想,最早是由美国统计学家杰R.J.Jessen(1942)在收集农场调查数据时提出的。W.G.Cochran(1985)归纳总结了前人的研究结果,讨论了在不考虑影响样本轮换率的一些不可量化的因素下,分别对考虑调查费用和不考虑调查费用的简单随机抽样下的样本轮换率进行了研究。A.R.Sen(1973)利用前期和现期样本拼配部分的辅助信息构造合适的估计量,冯士雍,邹国华(1996)不仅利用前期和现期样本拼配部分的辅助信息还考虑拼配样本以外的样本单元的辅助信息对Sen提出的估计量进行了改进。G.N.Singh(2001)利用现期的辅助信息和前期的样本信息提出两阶段连续性抽样下的估计量,2003年拓展到多阶段连续性抽样下的估计量,充分利用前期辅助信息进一步提高了估计精度。徐国祥,王芳(2011)从调查总体的特征出发,讨论了分层抽样下的最优样本轮换率和轮换效果问题,从实证角度对上海市城镇住房空置率抽样调查数据进行分析。本文在前人研究的基础上,依据连续性抽样中相邻两期样本单元之间的相关性和研究变量的辅助信息构造使得均方误差最小的指数形式的回归组合估计量,在保证估计精度的前提下求得最优样本轮换率,尽可能的节约调查成本,最后通过设定模型参数产生一系列模拟数据进行数值分析。

1 连续两期样本下最优样本轮换率的确定

1.1 回归组合估计量的构造

Cov(y0m,y1m):研究变量y0(y1)中拼配样本的协方差;

Cov(y0,y1):研究变量 y0(y1)的总体协方差;

ρy0y1,ρy1z,ρy0z:表示各研究变量、辅助变量之间的相关系数。

本文的目的在于利用前期的样本信息和总体的辅助信息构造一个合适的估计量并计算出使得现期均方误差最小的样本轮换率 μ 。由Bahl,S.and Tuteja,R.K.(1991)的理论知当研究变量与辅助变量的相关性未知或较低时,利用总体单元的辅助信息对非拼配样本构造如下指数形式的比率估计量比其他形式的估计量更精确:

1.2 回归组合估计量的均方误差

2 数值分析

为了对比该抽样估计方法的有效性,现通过设定模拟参数得出一系列模拟数据进行理论验证。假设总体单位N=5000,样本容量 n=1000,ρy0y1,ρy0z,ρy1z可分别取0.5,0.7,0.9。由R语言编程可得表1:

表1

为了比较样本量的多少对估计效果的影响,另外取N=5000,n=500 ,ρy0y1,ρy0z,ρy1z分别取0.5,0.7,0.9。得到表2:

表2

由表1知前后期研究变量的相关性ρy0y1越大,样本轮换率就越小,这与实际是相符的,即前后期相关性较大时可减少样本轮换的数量,充分利用辅助信息的相关性,减少调查对象;当现期研究变量与辅助变量的相关性ρy1z越大时,样本轮换率越小,而相对有效性E1,E2的值却越大,这也是与实际情况相符合的,即辅助信息的应用可在保证估计精度的前提下减少样本轮换的数量达到节约成本的目的。

从两表中还可看出当相邻两期的研究指标相关性较高且辅助变量选择合适时,最大的样本轮换率为0.5096,意味着只要轮换约50%的样本就可以较精确地估计出总体的均值。所以不管是从成本节约还是从精度要求角度看,该方法可以大大减轻基层数据调查的负担,有着广泛的应用前景。

本文假定各研究变量之间的相关性均大于0.5,此时有比较好的估计效果,当相关性较小时,此时样本轮换率会很大。

3 结论

根据本文的理论和模拟数据分析,对连续性抽样调查进行部分样本轮换,由于样本存在老化现象,新样本的加入可消除此类问题。同时文章根据相邻两期的相关性,利用前期保留下来的样本信息和与前后期总体相关的辅助信息,构造指数形式的回归组合估计量,以最优化方法求得最优样本轮换率和最优权重系数,使得估计量的均方误差最小,无论对于保证估计量的精度还是对于节约调查成本,都是一个不错的选择。

最后应该指出的是本文还可以在此基础上进行更加深入的研究。可以研究连续两个以上不同时间的抽样估计问题,充分利用前期的样本信息,还可考虑添加多个辅助变量进一步提高抽样估计的精度。本文仅采用模拟数据进行分析,可进一步采用实际生活中抽样数据进行理论验证和应用。

[1]Jessen R J.Statistical Investigation of a Farm Survey for Obtaining Farm Facts[J].Iowa Agricultural Station Research Bulletin,1942,(3).

[2]Patterson H D.Sampling on Successive Occasions with Partial Replacement of Units[J].Journal of the Royal Statistical Society,1950,(2).

[3]科克伦.抽样技术[M].北京:中国统计出版社,1985.

[4]Wolter K M.Composite Estimation in Finite Populations[J].Journal of the American Statistical Association,1979,(4).

[5]Sen A R.Successive Sampling with two Auxiliary Variables[J].Sankhya Ser.1971,(33).

[6]SinghV K,Singh.G N Chain-type Regression Estimators with two Auxiliary Variables Under Double Sampling Scheme[J].Metron,1991,(49).

[7]Singh G N,Singh V K On the Use of Auxiliary Information in Successive Sampling[J].Indian Soc.Agric.Stat,2001,54(1).

[8]Biradar R S,Singh.H P Successive Sampling Using Auxiliary Information on both Occasions[J].Calcutta Stat.Assoc.Bull,2001,51(23).

[9]Singh G N,Priyanka K On the use of Auxiliary Information in Search of Good Rotation Patterns on Successive Occasions[J].Bull.Stat.Econ,2007,1(7).

[10]Singh G N,Karna J P.Search of Efficient Rotation Patterns in Presence of Auxiliary Information in Successive Sampling Over two Occasions[J].StatTransition New Ser,2009,10(1).

[11]Singh G N,Prasad S.Some Estimators of Population Mean in two-occasion Rotation Patterns[J].Modeling Simulation Techniques Enterprises,2010,12(1).

[12]冯士雍,邹国华.有辅助信息可利用时的样本轮换方法[J].统计研究,1996,(3).

[13]马树才,杨旭东.分层部分样本轮换抽样下的混合估计[J].辽宁大学学报(自然科学版),1997,24(3).

[14]徐国祥,王芳.连续性抽样调查中的样本轮换研究[J].统计研究,2011(5).

[15]Ball S,Tuteja R K.Ratio and Product Type Exponential Estimator[J].Information and Optimization Science,1991,12.

[16]Singh G N,Homa F.Effective Rotation Patterns in Successive Sampling over two Occasions[J].Journal of statistical theory and practice,2012,(7).

[17]Sukhatme P V,Sukhatme B V,Ashok C.Sampling theory of Surveys with Applications[M].3rd ed.Ames,IA,Iowa State University Press,1984.

猜你喜欢

估计量连续性总体
含单调约束的广义回归估计量
受扰动长记忆随机场的BNLP回归估计
最小二乘估计量优于工具变量估计量的一个充分条件
用样本估计总体复习点拨
2020年秋粮收购总体进度快于上年
非连续性实用类文本阅读解题技巧例谈
外汇市场运行有望延续总体平稳发展趋势
小学中段非连续性文本阅读教学初探
直击高考中的用样本估计总体
浅谈估计量的优良性标准