多目标变量调查的小域的稳健估计量研究

2011-11-01吕萍

统计与决策 2011年7期

关键词：权数估计量变量

吕萍

（北京大学中国社会科学调查中心，北京100871）

多目标变量调查的小域的稳健估计量研究

吕萍

（北京大学中国社会科学调查中心，北京100871）

大型的抽样调查不仅是多目标的复杂调查，而且在估计总体目标变量的基础上还需要对其中的一些域的目标变量进行估计，所以小域估计和多目标估计问题一直是抽样调查的热点问题。文章主要利用模型校准权数的方法，解决小域中的多目标估计问题，并得到小域的多个目标变量的稳健估计量。

小域估计；多目标调查；模型校准权数；稳健估计量

0 引言

小域估计[1]是当今抽样调查的热点的问题之一，许多大型的调查都需要在估计总体的目标变量的同时，对相应的域的目标变量进行有效的估计。小域指规模很小的域，包括地理上的小域，也包括总体中按照某种属性划分的一个很小的子总体，“小”是指样本量很小，甚至为零，此时无法利用传统的直接估计法对小域的目标变量的进行有效的估计，称为小域估计问题。小域估计的主流发展方向是基于模型的间接估计方法，即基于相邻或相似域的信息借助于辅助模型对小域的目标变量进行估计的方法。这种方法有明确的模型形式，不仅可以处理比较复杂的数据类型，还可以通过样本数据对模型的合理性进行验证。

多目标问题一直是抽样调查的热点问题之一，人们总是希望用一套样本数据满足不同目标变量的估计要求，也称为多主题或多指标抽样，即用一套样本数据同时估计两个或是两个以上的目标变量的抽样调查方法。由于在抽样设计中各个调查变量的样本分布是不同的，多个变量的联合分布很难确定，这大大增加了抽样设计的难度。解决多目标问题的方法主要有四种：

第一种方法体现在抽样方式的选择上，即如何选择一种有效的抽样方法得到样本数据，使各个目标的抽样误差都能达到最小。

第二种方法体现在抽样设计方法的选择上。抽样设计有多种方法，主要有随机化抽样方法，包含多目标分层抽样方法、多目标平衡抽样方法、多目标比率与回归估计方法、多目标双重抽样方法、多目标双重事后分层抽样方法、成本条件下的多目标复合抽样法以及多变量与规模成比例的抽样方法（MPPS）；模型抽样方法；模型辅助抽样方法。

第三种方法体现在样本容量的确定上，样本量的大小既涉及到抽样估计的精度，又涉及到调查的费用，在多目标抽样设计中各个目标的抽样误差的大小可能不同，选择合适的样本量是十分重要的。

第四种方法是估计量的选择。即在没有比较好的抽样方法并且经费有限的情况下，选择合适的估计方法尽可能地提高估计量的精度。

多目标问题也是小域估计中普遍存在的问题。本文拟从估计量选择的角度对小域估计中的多目标问题进行研究，并用基于模型校准权数的小域估计方法得到小域的多个目标变量的稳健估计量。

传统的小域估计方法是基于混合模型的模型依赖的估计方法，它的目标估计量依赖于模型的假定，当模型的假定不成立，估计是有偏的，甚至是无效的。在实际调查中，由于抽样设计和实际调查过程的复杂性，总体模型和样本模型往往是不一致的，用样本数据得到的目标变量的估计量是有偏的。针对这个问题，Chambers提出了利用模型校准权数[3][4]的方法，这种方法可以有效地防止模型假定错误和样本选择过程产生的偏差，得到小域的目标变量的稳健估计量[5]。

1 多目标变量调查的小域的稳健估计量

设一个多目标的抽样调查，有k个目标变量是Y=(Y1，Y2，…，Yk)T，调查总体中包含m个小域，设每个目标变量Yk满足线性混合模型[1]

Yk=Xβk+zTuk+ek

其中辅助变量是X=(X1T，x2T，…，xmT)T；设计变量是Z=diag(Zj，1≤j≤J)；域随机变量是uk=(uk1，uk2，…，ukm)T；ek=(ek1，ek2，…，ekm)T；Var(uki)=∑ki；Var(eki)=σki2INi；INi是Ni阶的单位矩阵。则Yk的协方差矩阵为Var(Yk)=σki2INi+Zki∑kiZkiT。首先按照样本单元和非样本单元拆分为：