APP下载

缺失纵向数据下半参数回归模型的CC估计法

2016-02-20刘新乐

安阳师范学院学报 2016年5期
关键词:样本容量估计量理工大学

刘新乐

(河南理工大学 数学与信息科学学院,河南 焦作 454000)



缺失纵向数据下半参数回归模型的CC估计法

刘新乐

(河南理工大学 数学与信息科学学院,河南 焦作 454000)

缺失纵向数据;半参数回归模型;CC方法;相合性;渐近正态性

1 引言

近年来,纵向数据模型成为统计学的热点课题之一,Diggle,etal.[1]系统地研究了纵向数据的线性模型和广义线性模型.Hsiao[2]和Baltagi[3]讨论了纵向数据在经济学中的应用;Detter&Munk[7],Martinussen&Scheike[11],[12]讨论了纵向数据的非参数回归模型,考虑纵向数据下半参数回归模型

i=1,2,…n,j=1,2,…mi

(1)

2 基于CC方法下二阶段估计方法的参数估计

令α=E(g(tij)),εij=g(tij)-α+eij,i≥1,j≥1,则模型(1)可变化为:

i=1,2,…n,j=1,2,…mi

i=1,2,…n, j=1,2,…mi

则再利用CC方法时α和β的最小二乘估计为:

故定义在CC方法下g(t)的最终估计为

(2)

i=1,2,…n,j=1,2,…mi

(3)

3 估计量的大样本性质

为了证明估计量的大样本性质,我们做以下准备工作:

3.1 条件

条件C2: g(·)在闭区间[0,1]上满足一阶lipschitz条件;

条件C4: ∑=E[δ{X-E(δX)|Eδ}{X-E(δX)|Eδ}T]是正定阵,且∑∈(0,+∞);

条件C5: {k=kN,N≥1}为正整数列,{vNi,1≤i≤N}为非负实数,且满足:

(5)supN{kmax1

条件C6: (1)Eg2(t)<∞;

3.2 引理

引理2:若条件C1和条件C5成立,则对1≤j≤p有

证明 可结合文献[4]中引理4计算可得,在此不作具体论述.

引理4:设条件4和条件5成立,则对任何1≤j≤p有

3.3 结论(定理的具体证明过程略)

定理1:若条件C3、条件C4、条件C5和条件C6成立,则

定理2: 如果条件C1—条件C5成立,

4 数据模拟结果及分析

缺失概率、样本个数与估计量精度的关系如下表所示:

缺失概率个体数n βBias^(^β)SD^(^β)MSE^(^β)p=0.45401.52280.02280.08470.0077801.52450.02450.06280.0045p=0.25401.52420.02420.06200.0044801.52330.02330.05020.0031

当缺失概率p=0.25、样本容量为40时,函数g(t)=cos(2πt)的拟合图形为:

当缺失概率p=0.25、样本容量为80时,函数g(t)=cos(2πt)的拟合图形为:

从上表可以看出,样本容量越大所得到的偏差就越小,数据缺失越少,真值与估计值之间的偏差也越小,由此,我们可以看出这个方法去估计参数和非参数函数是可行的.

[1]Diggle P.J.,Liang K.Y.and Zegger S.L. Analysis of longitudinal data.Oxford University press.Newyerk.1994.

[2]Hsiao.C.. Analysis of panal data. Czmbridge University press . 1986.

[3]Baltagi,B.H..Econometric analtsis of panal data. England. John Wiley and Sons.1995.

[4]洪圣岩.一类半参数回归模型的估计理论[J].中国数学,A,1991,21(12):1258-1272.

[5]高集体,陈希孺,赵林城.部分线性模型中估计的渐近正态性[J].数学学报,1994,37(2): 256-268.

[6]高集体,洪圣岩,梁华.部分线性模型中估计的收敛速度[J].数学学报,1995,38 (5): 658 -669.

[7]Detter & Munk.Testing heterosccdasticity in nonparamentic regression J-Roy.Statist. Soc.Ser.B.1998,60:693~708.

[8]赵林城,白志东.非参数回归函数最近邻估计的强相合性[J].中国科学A辑,1984,14(5):387-393.

[9]刘妍.缺失数据情形半参数回归模型的二阶段估计[D].广西师范大学,2009.

[10]曾林蕊,朱仲义,茆诗松.半参数广义线性模型的影响分析与异常点的检验[J].高校应用数学学报(A辑),2004,19(3):323-332.

[11]Martinussen and Scheike.A nonparametric dynamic additive regression model for longitudinal data.the Annals of Statistics,2000.28:1000~1025.

[12]Martinussen and Scheike.sampling adjusted analysis of dynamic additive regression model for longitudinal data.Scandinavian Journal of statistics,2001.28:303~323.

[责任编辑:张怀涛]

The CC Method of the Semi-parametric Regression Model Under the Missing Longitudinal Data

LIU Xin-le

(School of Mathematics and Information Science, Henan Polytechnic University, Jiaozuo 454000,China)

The issues of the missing data model and the longitudinal data model have been one of the hotspots of the statistics,but the study of the model of missing longitudinal data is very few.The semi-parametric regression model of missing longitudinal data is proposed in this thesis and the solutions is given: For missing longitudinal data, all items will be deleted in this thesis which contains lossing data using the CC method, and only remaining “full” sample. By the second stage estination method for statistical inference, the ultimate estimates of parametric and nonparametric vector are got by using the two stages estimate. And the asymptotic normal properties of these estimators is proved. And the data simulation shows that the estimation method is feasible.

Missing longitudinal data; Semiparametric regression model; Complete Case; Consistency;Asymptotic Normality

2016-07-26

河南理工大学校青年基金资助项目(72511/082);河南理工大学校示范教师教改专项资助项目(72307/001)

刘新乐(1980-),女,河南平顶山人,讲师,从事数理统计方向研究。

A

1671-5330(2016)05-0071-04

猜你喜欢

样本容量估计量理工大学
昆明理工大学
最小二乘估计量优于工具变量估计量的一个充分条件
采用无核密度仪检测压实度的样本容量确定方法
昆明理工大学
昆明理工大学
浙江理工大学
分层抽样技术在课堂满意度调查中的应用研究
浅谈估计量的优良性标准
多种检测目标下样本容量设计的比较
正态总体方差和标准差的无偏估计