APP下载

矩约束模型的最优矩条件选取方法

2014-05-25王美今汪寿阳

中国管理科学 2014年7期
关键词:内生性高阶偏差

胡 毅,王美今,汪寿阳

(1.中国科学院大学管理学院,北京100190;2.中山大学岭南学院,广东广州 510275;3.中国科学院数学与系统科学研究院,北京 100190)

矩约束模型的最优矩条件选取方法

胡 毅1,王美今2,汪寿阳3

(1.中国科学院大学管理学院,北京100190;2.中山大学岭南学院,广东广州 510275;3.中国科学院数学与系统科学研究院,北京 100190)

大量经济、金融以及企业管理等领域研究对象的行为特征可以通过矩约束模型来刻画。然而,该模型中参数的估计对矩条件的选取非常敏感。如何选取最优的矩条件,进而得到更准确的参数估计和更精确的统计推断,是实证研究面临的重要问题。本文从估计量均方误差(MSE)最小的角度,研究了一般矩约束模型两步有效广义矩(GMM)估计的最优矩条件选取方法。首先,利用迭代的方法,推导出两步有效GMM估计的高阶MSE,然后通过Nagar分解,求出了两步有效GMM估计量的近似MSE。接着,基于近似MSE表达式,给出了两步有效GMM估计矩条件选取准则的一般理论,即定义了最优的矩条件,提出了两步有效GMM估计的最优矩条件选取准则,并证明了选取准则的渐近有效性。模拟结果表明,本文提出的矩条件选取方法能够很好地改善两步有效GMM估计量的有限样本表现,降低估计量的有效样本偏差。本研究为实证研究中面临的矩条件选择问题提供了理论依据。

矩约束模型;GMM估计;高阶MSE;近似MSE;选取准则

1 引言

矩约束模型被广泛应用于经济、金融以及企业管理等领域的实证研究。例如,经济分析中常用的线性回归模型、金融领域著名的资产定价模型以及企业管理中最优资本结构模型等均可看作为矩约束模型。该模型的参数通常采用广义矩方法(GMM)估计。从Hansen[1]提出GMM以来,该方法逐渐成为计量经济学的基本估计方法。Hansen也因此而获得2013年诺贝尔经济学奖。然而,尽管在相当一般的正则性条件下,GMM有着非常好的渐近性质,但是它的有限样本表现却不尽如人意。同极大似然估计(MLE)一样,GMM没有精确分布,实证中,通常利用GMM估计量的渐近分布来近似其有限样本分布,进而进行推断。然而,大量研究表明,基于这种近似做出的推断的精度比较低,如Hansen和Singleton[2]的消费资产定价模型,Holtz,Newey和Rosen[3]的动态面板模型,Angrist和Krueger[4]自然实验的例子等等。通常,有两个方面的原因会影响GMM估计量的有限样本性质:一是多矩条件(many moments)的应用;二是弱识别矩条件(weak identification moments)的存在。

为了解决上述问题,近年来,GMM估计已经由传统的渐近理论发展到多渐近理论(many asymptotic)、弱渐近理论(weak asymptotic)以及同时考虑多和弱的渐近理论(many weak asymptotic)[5-7]。另一个改善GMM估计量的有限样本的方法是对矩条件进行选取。考虑到矩条件的数目的增多会增大GMM估计量的渐近有效性,但同时也会加大估计量的有限样本偏差。因此可以考虑寻找到一组矩条件,使得估计量的偏差和方差之和最小,也即使得估计量的均方误差(MSE)最小。

Andrews[8]首次提出GMM中基于正交性条件的矩条件选取准则(MSC),并给出了MSC的一致性证明。该文考虑研究者面临着一组矩条件,其中一部分矩条件是正确的,另外一部分矩条件是错误的。MSC的目的就是一致地选出正确的矩条件。

Hall,Inoue,Jana和Shin[9]则是从信息的角度来考虑矩条件的选择。通常认为,总体矩条件包含待估参数的信息,因此,所选取的矩条件应该尽可能的反应估计和推断所需的信息。该文指出,GMM估计量极限分布的熵(entropy)可以用来度量总体矩条件中包含信息的大小。在此基础上,他们提出了基于熵的矩条件选取准则,该准则能一致地选出相关的矩条件,称为相关的矩条件选取准则(RMSC)。和MSC不同的是,RMSC旨在改善参数估计值方差阵的精度。

Donald,Imbens和Newey[10]研究了条件矩约束模型中矩条件的选取,该文将Donald和Newey[11]的研究结论推广到异方差的情形。与Donald和Newey[11]的研究思路类似,该文首先根据条件矩约束模型构建无条件的矩条件,然后对无条件的矩条件进行两步GMM估计,再根据高阶渐近理论对两步GMM估计量进行分解,由分解结果求出估计量的线性组合的近似MSE。实际计算中,最小化该近似MSE的一致估计量可以得到最优的矩条件数目。与Andrews[8]的研究出发点不同,该文是在矩条件外生性满足的条件下,选出最优数目的矩条件来最小化GMM估计量的近似MSE。相比Hall等[9],该文不但考虑了估计量的方差,还考虑了估计量的偏差。但是该文还有以下两点值得改进的地方。第一,和Donald和Newey[11]的选取准则类似,该文的选取准则也依赖于一个未知的向量,但是该未知向量如何确定,文中并没有明述。第二,该文假定了研究者对矩条件的强弱有着先验信息,可以对矩条件的强弱进行排序,但是实证研究中这一假定并不能确保满足。

本文在Donald等[10]研究的基础上,做了如下拓展:第一,研究了一般的矩约束模型下两步有效GMM估计量的高阶展开,相比条件矩约束模型,一般的矩约束模型非线性程度更高,处理更复杂,结论也更一般。第二,选取准则直接通过对估计量的近似MSE求迹构造,因而不依赖于未知向量的选取。第三,不必事先假定矩条件的强弱并进行排序。根据Andrews[8]的思想,利用一个选择向量进行矩条件的选取。

2 模型设定

大量经济和金融模型可用总体矩条件的形式来表示,这种矩条件通常是数据与参数的非线性函数。考虑如下总体矩条件:

其中,z为kz维随机向量,β0为p维系数向量,g(·)为L维的向量,且L≥p。

假定1 β0∈B,B是有界闭集。

假定2 {zi,i=1,2,…,n}是相互独立的随机向量序列。

假定3 (识别条件)E[g(zi,β)]=0当且仅当β=β0。

假定1和3是关于GMM估计的经典假设,是证明GMM估计渐近性质的必要条件。假定2相对于传统的平稳遍历性条件有进一步约束,要求观测值之间相关独立,这主要是为了简化后文选取准则的计算。虽然这里要求了独立性假定,但是没有要求同分布,允许异方差的存在。对于大多数截面数据来说,该假设是合理的。

根据Hansen[1],在假定1-假定3下,一致且服从渐近正态分布。大量模拟研究表明的有限样本表现并不尽如人意,Newey和Smith[12]指出的有限样本偏差会随着矩条件数目的增多而变大。本文接下来通过高阶渐近理论推导出的 MSE,并以此为基础给出GMM估计的矩条件选取方法,进而改善GMM估计的有效样本表现。

3 GMM估计量的高阶MSE与近似MSE

本部分推导GMM估计量高阶MSE的过程借鉴了Ristone,Srivastava和Ullah[13]的研究思路。即利用迭代的方法,逐步将估计量的低阶展开代入估计量的高阶展开,最后求出估计量的高阶展开式,进而求出求高阶MSE。与胡毅和王美今[14]线性IV估计不同的地方在于非线性模型下,GMM估计无法求出显示解,因此其高阶MSE的推导过程与最终表达式更为复杂。为方便后文论述,首先定义一些接下来常用的符号。

为了对GMM估计量进行高阶展开,进一步给出下述针对矩条件的假设条件。

假定4 在β0的某个邻域,gi至少3阶连续可微,且E(‖∇rgi,j‖2)<∞,其中r=0,1,2,3,i =1,2,…,j=1,…,L。

假定5 在β0的某个邻域,‖∇rgi,j(β)-∇rgi,j(β0)‖≤‖β-β0‖Mi,j,其中E(Mi,j)<∞,r=0,1,2,3,j=1,…,L,i=1,2,…。

假定4是矩条件可以进行高阶Taylor展开的必要条件;假定5也是文献中常见的针对矩条件的假设条件,类似假定可见Rilstone等[13]、Donald、Imbens和Newey[15]、Anatolyev[16]、Bao和Ullah[17]以及Donald等[10],其目的是为了控制Taylor展开的余项;假定6是技术假设,该假定可以大大简化高阶展开式,参见Alvarez和Arellano[18]、Donald等[10]以及Okui[19]等;假定7是进一步的识别条件;假定8是高阶展开中常用的一种处理方法,目的是为了控制高阶展开后的余项[15]。

优化问题(2)的一阶条件为:τ1+τ2=3,τ1、τ2为非负整数,j=1,…,L,k= 1,…,p,r=1,…,L,i=1,2…。

本文考虑的模型设定允许矩条件的个数大于参数的个数,即存在过度识别的情形。此时若直接对矩条件进行Taylor展开,对于展开后的式子,一阶项为L×p的矩阵,无法通过求逆获得估计量的表达式。为了解决这一问题,本文采用Newey和Smith[12]的 方 法,定 义 辅 助 向 量=-,上述一阶条件可以等价为:

对于该式,参数的个数与方程的个数均为K。对上式在θ0=(β′0,0′)′处进行二阶Taylor展开,可以得到:

其中,Σ=Φ-1-Φ-1Γ0Ω-1Γ0′Φ-1,Ω= Γ0′Φ-1Γ0,Tβ=Op(L/n),Rβ=op(L2/n3/2),Tλ=Op(ζ(L)L/n),Rλ=。

其中,h=Op(1),=== Op(ζ(L)L/n),Zh=op(L2/n)。

根据定理1的分解,进一步可以得到GMM的高阶MSE表达式。

定理2给出了一般的矩约束模型的高阶MSE表达式,从该式可以看出,该MSE依赖于Ξ,而Ξ又依赖于更为具体的模型设定。求解具体模型的MSE过程可以利用Nagar[21]近似的思想,即对于估计量,若=Z)=R+S+T,且有,则的近似MSE(n倍)可以近似为R+S。

4 矩条件选取准则的构建

采用一个L维的列向量c来选取矩条件,c的取值为0或1,若cj=1,表示gi的j个矩条件被选出,反之,则不被选出。令gi(c)表示选出的矩条件,则|c|=c′c为选出的矩条件个数。定义可行的矩条件选择向量集为C={c|ci=0或1,|c|≥p,c∈RL,j∈N}。根据gi(c)求出的β0的GMM估计量记为,对应的高阶MSE为:

其中,Ω(c)和Ξ(c)分别表示,利用选出的矩条件求得的Ω和Ξ。

AMSE(c)=Ω(c)-1+Ω(c)-1Ξ(c)Ω(c)-1

以AMSE(c)作为模型选取的标准。具体比较时,采用 AMSE(c)的对角线元素和,即tr{AMSE(c)}作为比较对象。定义:

为最优的矩条件选取向量,也称为理论的矩条件选取向量。

AMSE(c)中涉及的变量均为参数的真实值。实际应用中,利用这些参数的一致估计量来代替。定义:

可行的矩条件选取向量由下式给出:

这也即本文提出的矩条件选取准则。

为了证明^c的渐近有效性,进进一步给出如下识别条件。

假定9 (识别条件)c0是唯一存在的。

根据胡毅和王美今[14],可以证明下面定理成立。

定理3 (选取准则的渐近有效性)对于(2)式定义的GMM估计量,若假定1-假定9成立,则当n→∞时:

即由选择准则(13)选出的矩条件在近似MSE的意义下是最优的。

接下来通过Monte Carlo模拟,考察提出的矩条件选取准则的有限样本表现。

5 模拟分析

本节的模拟部分包括三个方面的内容。第一,考察理论的矩条件选取准则的有限样本表现,即考察通过理论矩条件的选取后,对GMM估计量的有限样本表现是否有所改善;第二考察可行的矩条件选取准则的有效样本表现;第三,考察矩条件选取准则本身的有限样本表现。

5.1 模拟设计

模拟设计类似于胡毅和王美今[14],即考虑结构方程同时存在一个内生变量与一个外生变量的情形,但放松了同方差的假定。

DGP设定如下:

其中,Z1i为d3维的外部工具变量,d=d3+1为全部工具变量(矩条件)个数,c为d3维选择向量。

具体模拟时,各个参数的设定分别为:n∈{500,1000},d3=20,γ0=0.1,δ0=0.2。σεv= {0.1,0.5,0.9},σεv可以用来控制模型内生性的强弱,σεv的值越大,模型的内生性问题越严重。第一阶段回归的拟合优度可以用来控制工具变量(矩条件)整体的强弱,根据Hahn和Hausman[21],第一阶段回归的理论拟合优度为,设定∈{0.1,0.3},的值越小,表明所用的工具变量越弱,此时对应的矩条件也越弱。此外,由的表达式,可以看出,π1越大,越大,因此,π1的系数大小可以体现工具变量(矩条件)的重要程度。另外,φ(Z)用来控制模型的异质性,考虑两种函数形式。其一是φ(Z)=,即考虑异方差的情形;其二是φ(Z)=1,模型退化胡毅和王美今[14]考虑的同质的情形。

对于参数π1的设定,令π12=0.05;对于外部工具变量的系数π11,则考虑如下两个模型:

模型A:系数递减

模型B:π11向量前五个元素的值相等,后面元素的值为0。根据的公式,即:

相比较而言,模型B对工具变量(矩条件)的强弱有更好的区分度。最后,模拟重复次数为1000。参数一旦给定,在重复模拟中不再改变。

5.2 模拟结果分析

首先,考察不同参数设定下,β0=(γ0,δ0)′的估计量的有限样本表现。本文采用四种方法估计β0,分别是最小二乘估计(OLS)、利用全部工具变量(矩条件)的两步GMM估计(GMM-all)、利用可行的矩条件选取准则选出的矩条件进行的两步GMM估计(GMM-sel)以及利用真实的矩条件选取向量选出的矩条件进行的两步GMM估计(GMM-opt)。对于每个估计,分别计算其偏差的中位数(Med.Bias)、绝对偏差的中位数(Med.AD)以及四分位数间距(Dec.Rge);前两个指标可以用来刻画估计量的偏差程度,后一个指标刻画估计量分布的变异程度。对比这些估计量,可以考察矩条件的选取准则对GMM估计量的有限样本性质的改善情况。模拟结果见表1。n=1000以及模型B的结论类似,为节省篇幅,结果备索。

表1给出了扰动项异方差时,模型A在样本容量为500下的结果。在模型A的设定下,第一阶段回归模型的外部工具变量的回归系数逐渐递减,意味着由这些工具变量构造的矩条件的重要程度也逐渐减弱。从表1我们可以得到以下结论:(1)几乎在所有设定下,GMM-opt有着最小的偏差与绝对偏差。在模型的内生性问题很弱并不严重的情形,即σεv=0.1时,经过矩条件选取后的GMM估计量与利用全部矩条件的GMM估计量在偏差上并没有明显改善,从后面的选取个数的分析可以看出,此时选取准则基本选出了全部的矩条件,因此GMM-opt与GMM-all的结果很接近。但是值得注意的是,此时GMM-all的表现本身已经较好,从表中可以看出,=0.1时GMM-all的偏差不到内生性问题严重时(σεv=0.5)的十分之一,因此可供改善的空间并不大。当模型的内生性问题变得严重时,选取准则的优势便很明显地体现出来,GMM-opt的偏差只有GMM-all的二分之一或是更少。(2)GMM-sel的偏差与绝对偏差介于GMM-all与GMM-opt之间,且当模型的内生性问题变得严重或是第一阶段回归的拟合优度变大时,GMM-sel的偏差与绝对偏差相对于GMM-all越来越小,且越来越接近GMM-opt的偏差与绝对偏差。这意味着本文提出的可行的矩条件选取准则表现良好,可以有效地减小两步GMM估计量的偏差。(3)从OLS到GMM-opt,四分位数间距Dec.Rge的值有逐渐增大的趋势,验证了选取过程是一个偏差和方差相互权衡的过程。但是GMM-opt与GMM-all相比,Dec.Rge增加的也并不是太多。(4)随着工具变量与内生解释变量的相关性变强,所有估计量的偏差都显著变小;而随着模型内生性问题变得严重,所有估计量的偏差都变大,但相比之下,GMM-opt与GMM-sel的偏差变大幅度要远小于OLS与GMM-all偏差变大的幅度。这进一步体现了本文提出的矩条件选取方法的优势所在。(5)与胡毅和王美今[14]的模拟结果类似,结构方程的外生解释变量的偏差在所有设定情形下均很小,几乎不受内生性问题的影响。

接着考察定理3的表现,也即选取准则本身的有限样本表现。根据定理3,选取准则的渐近有效性要求tr[AMSE]/tr[AMSE(c0)]以概率为1趋于1,有限样本下,该值越趋近于1越好。定义Ratio=tr[AMSE)]/tr[AMSE(c0)],对于给定的参数设定,每次模拟时计算Ratio的值。表2给出了1000次模拟中,Ratio的四分之一分位数(LQ)、中位数(Med)以及四分之三分位数(UQ)。从表3可以看出,在所有设定中,Ratio的Med均非常接近于理论值1,且根据LQ与UQ的值可以看出,Ratio的变异程度很小。这表明本文提出的矩条件选取准则本身的有限样本表现非常良好。

最后,本文还考察了各种参数设定下,1000次模拟中,分别利用矩条件选取准则和最优的矩条件选取向量选出的矩条件个数的中位数(见表3)。结果表明:当模型的内生性问题不严重时,无论是模型A还是模型B,选取准则和最优的矩条件选取向量几乎都选出了全部的矩条件,这与胡毅和王美今[14]IV的情形有所不同。主要原因是模型的内生性并不严重时,增加矩条件的数目并不会使得估计量的偏差变得很大,但是会显著的减小估计量的方差,综合来看,增加矩条件的数目会改善估计量的MSE性质。当模型内生性问题变得严重时,利用矩条件选取准则和最优矩条件选取向量选出的矩条件数目均为全部矩条件的三分之一或是更少,两者的数目也非常接近。这说明了两点:一是在模型存在内生性问题时,矩条件选取的必要性;二是进一步的印证了定理3的结论。从表3的模型B还可以看出,当模型的内生性问题相当严重时(σεv=0.9),利用矩条件选取准则和最优矩条件选取向量均只选出了五个有效的矩条件,这也进一步的表明本文选取方法的有效性。

表1 模型A,n=500,d3=20

表2 Ratio=tr[AMSE(c_hat)]/tr[AMSE(c0)]

表3 选择准则选出矩条件个数的中位数,d3=20

6 结语

本文对一般的矩约束模型的两步GMM估计量进行高阶Taylor展开,进而通过迭代的方法,求出两步GMM估计量的高阶MSE和近似MSE表达式。利用该近似MSE表达式,首先给出了两步GMM估计量矩条件选取的一般方法,并证明了该方法的渐近有效性。然后,通过一个扰动项存在异方差且带有内生解释变量的回归模型,利用Monte Caro模拟考察了各种参数设定下,本文提出的选取准则的有限样本表现。模拟结果表明:提出的最优矩条件选取向量以及可行的矩条件选取准则均可以大幅降低传统的两步GMM估计量的有限样本偏差。这一研究为实证研究中面临的矩条件选取问题提供了理论依据。

本文的矩条件选取准则并不依赖于对矩条件重要程度的排序。实际应用中,当矩条件数目比较少时(少于10个),可以利用枚举法来寻找最优的矩条件选取向量;当矩条件数目较大时,则可以考虑通过模拟退火算法来实现[22]。

[1]Hansen L P.Large sample properties of generalized method of moments estimators[J].Econometrica,1982,50(4):1029-1054.

[2]Hansen L P,Singleton K J.Generalized instrumental variables estimation of nonlinear rational expectations models[J].Econometrica,1982,50:1269-1286.

[3]Holtz-Eakin D,Newey W,Rosen H S.Estimating vector autoregressions with panel data[J].Econometrica,1988,56(6):1371-1395.

[4]Angrist J D,Krueger A B.Does compulsory school attendance affect schooling and earnings?[J].The Quarterly Journal of Economics,1991,106(4):979-1014.

[5]Stock J H,Wright J H.GMM with weak identification[J].Econometrica,2000,68(5):1055-1096.

[6]Han C,Phillips P C B.GMM with many moment conditions[J].Econometrica,2006,74(1):147-192.

[7]Newey W K,Windmeijer F.Generalizedmethod of moments with many weak moment conditions[J].Econometrica,2009,77(3):687-719.

[8]Andrews D.Consistent moment selection procedures for generalized method of moments estimation[J].Econometrica,1999,67(3):543-563.

[9]Hall A R,Inoue A,Jana K,et al.Information in generalized method of moments estimation and entropy-based moment selection[J].Journal of Econometrics,2007,138(2):488-512.

[10]Donald S G,Imbens G W,Newey W K.Choosing instrumental variables in conditional moment restriction models[J].Journal of Econometrics,2009,152(1):28-36.

[11]Donald S G,Newey W K.Choosing the number of instruments[J],Econometrica,2001,69(5):1161-1191.

[12]Newey W K,Smith R J.Higher order properties of GMM and generalized empirical likelihood estimators[J].Econometrica,2004,72(1):219-255.

[13]Rilstone P,Srivastava V K,Ullah A.The second-order bias and mean squared error of nonlinear estimators[J].Journal of Econometrics,1996,75(2):369-395.

[14]胡毅,王美今.IV估计的最优工具变量选取方法[J].数量经济技术经济研究,2011,28(7):122-136.

[15]Donald S G,Imbens G W,Newey W K.Empirical likelihood estimation and consistent tests with conditional moment restrictions[J].Journal of Econometrics,2003,117(1):55-93.

[16]Anatolyev S.GMM,GEL,serial correlation,and asymptotic bias[J].Econometrica,2005,73(3):983-1002.

[17]Bao Yong,Ullah A.The second-order bias and mean squared error of estimators in time-series models[J]. Journal of Econometrics,2007,140(2):650-669.

[18]Alvarez J,Arellano M.The time series and cross-section asymptotics of dynamic panel data estimators[J]. Econometrica,2003,71(4):1121-1159.

[19]Okui R.The optimal choice of moments in dynamic panel data models[J].Journal of Econometrics,2009,151(1):1-16.

[20]Nagar A L.The bias and moment matrix of the general k-class estimators of the parameters in simultaneous equations[J].Econometrica,1959,27:575-595.

[21]Hahn J,Hausman J.A new specification test for the validity of instrumental variables[J].Econometrica,2002,70(1):163-189.

[22]胡毅,王美今.基于模拟退火算法的工具变量选取方法[J].系统工程理论与实践,2014,34(4):892-898.

Choosing the Optimal Moments in Moment Restriction Models

HU Yi1,WANG Mei-jin2,WANG Shou-yang3
(1.School of Management,University of Chinese Academy of Sciences,Beijing 100190,China;2.Lingnan College,Sun Yat-sen University,Guangzhou 510275,China;3.Academy of Mathematics and Systems Science,Chinese Academy of Sciences,Beijing 100190,China)

Many behavior characteristics in the area of economics,finance and business management can be depicted by moment restriction models.Nevertheless,the parameters estimation in these models is sensitive to the selection of moments.How to choose the optimal moments,and then get more accurate parameter estimation and statistical inference is a crucial problem in empirical research.A method is proposed in this paper to select moments for two-step generalized method of moments(GMM)estimators in moment restriction models with many moments.The basic idea of this method is choosing moments such that the MSE of the GMM estimator is smallest.Firstly,iterative techniques are used to derive the higher order mean squared error(MSE)for two-step GMM,and obtain the approximate MSE for the estimators using Nagar decomposition.Then the optimal selection criterion is proposed and the asymptotic efficiency is shown.Monte Carlo simulations indicate that the proposed selection criterion could improve the finite sample properties of two-step GMM,and reduce the finite sample bias of two-step GMM,significantly.This research provides a theoretical basis for selection of moments in empirical studies.

moment restriction models;generalized method of moments;higher order MSE;approximate MSE;selection criterion

F224.0

A

1003-207(2014)07-0026-08

2013-07-16;

2014-02-18

国家自然科学基金资助项目(71301160);中国博士后科学基金资助项目(2012M520420)

胡毅(1985-),男(汉族),湖北荆州人,中国科学院大学管理学院,讲师,研究方向:计量经济学模型及其在经济管理中的应用.

猜你喜欢

内生性高阶偏差
50种认知性偏差
如何走出文章立意偏差的误区
加固轰炸机
基于高阶LADRC的V/STOL飞机悬停/平移模式鲁棒协调解耦控制
高阶思维介入的高中英语阅读教学
三个高阶微分方程的解法研究
高阶非线性惯性波模型的精确孤立波和周期波解
真相
比较优势内生结构变动与政策干预
基于内生性视角的大股东掏空与公司绩效关系研究