APP下载

基于分位数回归方法分析南疆三地州小农户收入的影响因素

2019-12-31王光耀苏武峥罗万云

新疆农业科学 2019年11期
关键词:家庭收入位数南疆

王光耀,苏武峥,罗万云

(1.石河子大学,新疆石河子 832000;2.新疆农业科学院农业经济与科技信息研究所,乌鲁木齐 830091;3.兰州大学经济学院,兰州 730000)

0 引 言

【研究意义】新疆南疆三地州(喀什地区、和田地区和克孜勒苏柯尔克孜自治州)分布着戈壁、沙漠和绿洲,为干旱、半干旱气候,该区域经济落后、资源环境有限、生态环境脆弱。分析南疆三地州小农户家庭收入的影响因素,对提高小农户收入水平有实际意义。【前人研究进展】小农户家庭收入一般涵盖土地经营性收入、畜牧业收入、劳务收入、家庭经营收入、财产性收入、财政转移支付收入等方面内容,庞丽媛等[1]运用面板数据模型分析发现,新疆南疆三地州居民人均收入受到上一期人均收入以及医疗、经济、教育、财政支持等因素的正向影响。宋玉兰等[2]通过分位数回归法分析了新疆南疆三地州农民不同教育水平对其收入的影响,并提出完善连片特困地区教育结构的问题。刘林等[3]使用分位数回归等模型分析了南疆三地州农户收入差距的微观基础,认为人力资本、物质资本和社会资本对该区域农户收入具有不同层次的显著影响。谭灵芝等[4]分析了南疆地区居民代际收入流动性变化的影响因素,认为代际收入具有强烈的代际流动特征,且低收入家庭代际传递固化作用较明显,父代受教育年限、地区经济发展水平等因素对流动性影响显著。严斌剑等[5]分析了我国农村居民收入的流动性,认为农村居民家庭收入呈现波动的下降趋势,段景辉等[6]基于2004年CGSS调查数据,运用分位数回归建模,分析了农村家庭收入的影响因素。姚先国等[7]认为家庭收入不是导致已婚妇女就业参与率下降的主要原因。【本研究切入点】已有的研究文献,主要从代际收入、上一期收入、政策支持、个体或者家庭特征的某些特征分析对家庭收入的影响,但是使用分位数回归模型分析家庭特征综合因素对家庭收入影响的文献尚不多见,研究使用分位数回归的方法分析家庭收入的影响因素。【拟解决的关键问题】通过座谈会、问卷调查、实地调研以及文献检索方法获取数据,采用分位数回归建模方法,以南疆三地州小农户调查数据为研究对象,分析小农户家庭收入的影响因素,为小农户家庭收入提升提供科学依据。

1 材料与方法

1.1 材 料

采用问卷调查、座谈会与实地考察、官方网站文献资料的搜集与整理等方式获得资料与数据。调查时间为2018年6月15~27日和2018年8月13~25日,调查地点为新疆南疆三地州和田地区、喀什地区及克孜勒苏柯尔克孜自治州农村社区,两次调查共获得630份问卷,剔除无效问卷,有效问卷为580份,有效率92.06%,其中和田地区187份,喀什地区235份,克孜勒苏柯尔克孜自治州158份。

1.2 方 法

1.2.1 样本统计

在对调查的数据进行完整性、准确性审核的基础上进行分组、汇总,使之条理化、系统化,并进行统计,其中部分指标的赋值情况如下:性别方面,女=1,男=2;婚姻状况方面,未婚=1,已婚=2,其他=3;学历方面,未上学及小学=1,中学=2,高中(高职)=3,大专、本科=4,研究生及以上=5,通过统计,受访者年龄均值为46.91岁,家庭总人口均值为4.78,家庭耕地面积均值为14.39亩(1亩=667m2)。表1

表1 样本基本统计描述
Table 1 Sample basic statistical description

指标Index性别Gender年龄Age婚姻Marriage学历Education家庭总人口Total family土地面积Land area平均值mean1.165 51746.910 341.981 0342.131 0344.775 86214.393 01中位数P5014722510标准差sd0.371 96811.322 050.206 9241.0298 161.655 50419.946 97方差variance0.138 36128.188 80.042 8181.060 5212.740 694397.881 5变异系数cv0.319 1440.241 3550.104 4530.483 2470.346 641.385 879

(1)

(2)

(3)

所以,中位数回归也被成为“最小绝对离差估计量(LAD)”。显然,它比均值回归(OLS)更不易受到极端值的影响,表现更稳健。根据以上的分析,研究将小农户家庭收入作为被解释变量,将影响小农户家庭收入的因素作为解释变量,建立了以下分位数回归模型:

(4)

参考段景辉等[6]各个指标的计算方法,其中,y表示家庭收入的对数,为各个变量进行参数估计的第 个分位数的系数。

1.2.2 计算公式

家庭收入=家庭年总收入,根据调查数据研究使用的家庭总收入包括:经营性收入、工资收入、财产性收入和转移收入,数据分析时发现存在极端值的情况,为了消除极端值影响,使用家庭收入的对数作为分析变量。

家庭人均耕地面积=家庭耕种的田地总面积∕家庭总人数。

家庭劳动力人数比例=家庭劳动力人数∕家庭总人数,其中,劳动力是指家庭中具有劳动能力且从事生产经营活动的劳动力。

家庭劳动力平均受教育年限=受教育年限的总数∕家庭劳动力总数,其中受教育年限,文盲为0年,小学为6年,初中为9年,高职、高中为12年,大专为15年,本科为16年,研究生为19年。

家庭农业机械化水平=家庭拥有的生产经营活动需要的机械劳动工具和运输工具数量∕家庭总人数。

家庭劳动力平均工作年限=劳动力工作年限总值∕家庭劳动力人数,其中,个人工作年限=(个人实际年龄-受教育年限-6),对于受教育年限很短的,一般是工作年龄定为18岁,即实际年龄减去18年。

1.2.3 核密度表达式

选择核密度估计 中的“局部加权散点光滑估计量”(Locally weighted scatterplot smoothing,简记Lowess)对回归关系进行分析,Lowess估计的优点在于它使用可变带宽(依数据的稠密程度而定),对于极端值更加稳健,而且缓解在两端估计不准的边界问题。

1.3 数据处理

将被解释变量的OLS估计与“10%,25%,50%,75%,90%”的系数估值及标准误进行对比,运用stata14.0软件,对样本数据进行回归估计。

2 结果与分析

2.1 回归估计

模型回归估计较为显著,自变量均不同程度上影响因变量的变化,南疆小农户的家庭收入受到家庭人均耕地面积、家庭劳动力人数比例、劳动力受教育年限、劳动力平均工作年限、家庭农业机械化水平等因素影响,但是影响的程度、方向及分位数大小具有显著差异,需要做逐个分析。进一步验证小农户收入的影响因素,在回归检验的基础上,制作了小农户收入的分位数回归系数的变化趋势图,把分位数回归系数随着分位数的变化情形表现出来。表2,图1

2.2 家庭人均耕地面积对家庭收入的影响

基于OLS回归,在1%的显著水平上对家庭收入具有正相关影响,家庭人均耕地面积的大小一定程度上影响了家庭的总收入。从分位数回归系数来看,人均耕地面积对低收入者群体(10%段位)影响不显著,对于中高位收入者群体(25%、50%、75%和90%段位)影响显著,且均在1%的显著水平上呈正相关影响,对于低收入人群来说,单纯的增加土地的供给量并不能增加其收入,只有家庭收入达到一定的水平之后增加土地供给量才会带来显著的家庭增收;在南疆三地州进行土地经营,只有在土地经营规模达到一定规模之后,高收入农户才有动力增加土地投入,土地经营收入才能产生规模效应。从第一行第二列的小图来看,随着分位数的变化,家庭人均年耕地面积的分位数回归系数呈现先下降后上升的变化,且在20%之后呈现正相关的影响。图1

表2 新疆南疆三地州小农户收入的OLS估计与分位数回归估计
Tab2 The OLS estimation and quantile regression estimation of the household income of small farmers in the three in southern Xinjiang

最小二乘法OLS10%分位数QR_1025%分位数QR_2550%分位数QR_5075%分位数QR_7590%分位数QR_90家庭人均耕地面积Per capita cultivated area0.011 7∗∗∗-0.002 30.012 7∗∗∗0.011 1∗∗∗0.016 5∗∗∗0.022 8∗∗∗-0.002 14-0.006 06-0.002 56-0.002 1-0.002 24-0.002 64家庭劳动力人数比例Proportion of family labor force0.664∗∗0.450.701∗∗0.894∗∗∗0.762∗∗0.302-0.249-0.704-0.297-0.244-0.26-0.307家庭劳动力平均受教育年限Average education years of family labor force0.010 6-0.006 090.0110.036 0∗∗0.039 4∗∗0.029 7-0.018-0.050 9-0.021 5-0.017 6-0.018 8-0.022 2家庭劳动力平均工作年限Average working years of family labor force-0.020 6∗∗∗-0.024 9-0.023 3∗∗-0.015 5∗∗-0.011 8∗-0.014 3∗-0.005 92-0.016 7-0.007 07-0.005 79-0.006 18-0.007 3家庭农业机械化水平Mechanization level of family agriculture0.044 1-0.014 80.026 60.052 50.035 80.123∗∗-0.036 1-0.102-0.043 1-0.035 4-0.037 7-0.044 5常数项cons12.87∗∗∗12.09∗∗∗12.34∗∗∗12.50∗∗∗13.12∗∗∗13.78∗∗∗-0.27-0.763-0.322-0.264-0.282-0.333样本数N580580580580580580

注:括号内为标准误,“*”、“**”、“***”分别表示在10%、5%、1%的显著性水平上显著

图1 新疆南疆三地州小农户收入影响因素的分位数回归系数的变化
Fig.1 The variation of quantile regression coefficient of the influencing factors of the household income of small farmers in the three in southern Xinjiang

2.3 家庭劳动力人数比例对家庭收入的影响

基于OLS回归,在5%的显著水平上对家庭收入呈正向影响,且系数估计值为0.664,家庭劳动力的多少对于家庭收入有显著的正向影响,且回归估值高出其他因素很多,一方面在新疆南疆三地州农业生产还处于粗放式的生产经营模式状态,农户家庭收入还主要依靠增加单位面积上人力投入增加产量进而增加收入,另一方面劳动力人口的增多可以获得更多的土地,有更多的外出务工的比例,也会增加家庭的经营性收入和工资类收入。从分位数回归系数来看,家庭劳动力人数比例随着分位数的增加(10%~90%)其回归系数呈现先升后降的趋势,且家庭劳动力人数比例对介于25%~75%段位的收入家庭影响显著,家庭劳动力人数比例对于低收入家庭和高收入家庭影响相对比较小,而对于中间收入群体影响最大。从第一行第三列显示的小图来看,随着分位数的变化,家庭劳动力人数比例的分位数回归系数呈现先上升后下降的变化。图1

2.4 家庭劳动力平均受教育年限对家庭收入的影响

基于OLS回归,家庭劳动力平均受教育年限对家庭收入影响不显著,从分位数回归估计上看,家庭劳动力平均受教育年限只对中等收入群体(50%和75%两个段位)影响显著,在新疆南疆地区农民的受教育程度对于低收入家庭群体的家庭收入并没有明显的相关性,在新疆南疆三地州,家庭收入方式以田间经营和畜牧经营为主,整体的生产方式还处于粗放式的发展状态,低收入群体由于受教育的程度较低对这种低技术式的生产劳作方式依赖性更强,表现出低收入群体的家庭收入与家庭劳动力平均受教育年限相关关系不显著,而中高收入群体会随着受教育程度的提高一定程度上改变生产方式和劳作方式,表现出中高收入群体与家庭劳动力平均受教育年限有显著正相关关系。图1

2.5 家庭劳动力平均工作年限对家庭收入的影响

基于OLS回归,在1%的显著水平上呈负相关关系,其回归系数为-0.020 6,从分位数回归估计可以看出,家庭劳动力平均工作年限对除10%分位段之外家庭收入群体呈显著负相关影响,研究对该回归关系单独做了分析估计,进一步印证了家庭劳动力平均工作年限对家庭收入的负相关关系。第二行第二列显示的小图来看,随着分位数的变化分位数回归系数呈现先下降后上升的变化,其各个分位数上的值均为负值,此图基本印证了表2的分析趋势。图1,图2

图2 新疆南疆三地州小农户收入与工作年限的Lowess回归
Fig.2 The Lowess of the small farmers income and working experience of rural residents in the three regions in southern Xinjiang

2.6 家庭农业机械化水平对家庭收入的影响

基于OLS回归,家庭农业机械化水平与小农户家庭收入没有显著相关关系。从分位数回归估计上看,家庭农业机械化水平只对高收入群体家庭收入影响显著,该变量对90%分位段收入家庭在5%显著水平上影响显著,回归系数为0.123,即意味着农业机械化水平对中低收入群体影响不显著,只对部分高收入群体有显著影响,南疆三地州小农户收入水平整体不高,投入生产资料的费用不高,相对来说农业机械化使用的成本较高,农业机械化使用效率不高,表现出农业机械化水平对较低收入群体影响不显著,只有生产规模达到较高程度后,随着小农户收入的增加其购买和使用的农用机械性能更优越,生产效率更高,所以对低收入者影响没有高收入者显著;另一方面,家庭农业机械化程度对于高收入群体影响最大,而对于低收入影响不显著,这意味着低收入小农户不是现代机械的最佳受体。

3 讨 论

基于分位数回归,人均耕地面积对于中高位收入者群体影响显著,且均在1%的显著水平上呈正相关影响,基于OLS回归,在1%的显著水平上对家庭收入具有正向影响,说明家庭人均耕地面积的对南疆三地州小农户家庭收入具有正向影响作用,这一结论与李军霞[9]针对甘肃省渭源市农民家庭经营收入的影响因素的分析具有相似性,家庭人均耕地面积是家庭收入的资源禀赋,在短时间内具有稳定性。

家庭劳动力人数比例对南疆三地州小农户家庭收入具有显著正相关影响,尤其是对家庭收入处于中间段水平的家庭影响更明显,且该系数的绝对值高于其他因素对家庭收入影响的回归系数绝对值,说明劳动力数量越多,完成家庭生产经营的效率越高,这一结论与李军霞[9]、李烨[10]研究结论具有相似性,但是具有一定的差异性,该二位学者分析的是劳动力人数对工资性收入和非农收入的影响,研究表明家庭劳动力人数对二者均具有显著正向影响,针对家庭收入的不同分位点所作的估计分析,家庭劳动力数量对家庭收入处于中间段水平的家庭呈显著正向影响。

家庭劳动力受教育年限以及家庭劳动力平均工作年限对家庭收入的影响与王小鹏等[11]的研究结论具有相似性,但分析的场景不同,着重分析在实施退牧还草后劳动力文化程度和工作经验对家庭收入的影响,实施该政策后,农户生计模式发生根本改变,受教育程度对家庭收入呈显著正向影响,工作经验对家庭收入呈显著负向影响,研究调查的对象生计模式一般没有发生根本变化,而劳动力的工作平均年限依然对家庭收入呈现显著负向影响,农户长时间积累的工作经验存在诸多不适应农村生产发展的需要。

家庭农业机械化水平只对高收入群体家庭(90%分位段收入家庭)呈显著正向影响,通过OLS回归表明家庭农业机械化水平与小农户家庭收入没有显著相关关系。这一结论与杨桃等[12]关于内蒙古农民收入影响因素的分析结论具有一定差异性,发现农业机械化水平对农村居民家庭人均纯收入的贡献率非常大,南疆三地州农村农业机械化水平尚低,没有显著影响各个收入水平的家庭收入,只对高收入家庭收入起到显著的正向影响。

4 结 论

4.1 运用分位数回归建模等方法对新疆南疆三地州580份问卷进行了分析,发现了各个影响因素在不同收入层次的家庭中所起的作用大小和方向各不相同。

4.2 基于OLS回归,家庭人均耕地面积对家庭收入在1%的显著水平上呈正相关关系,系数估值为0.011 7,从分位数回归系数来看,人均耕地面积对于中高位收入者群体(25%、50%、75%和90%段位)影响显著,且均在1%的显著水平上呈正向影响,系数估值分别为0.012 7、0.011 1、0.016 5、0.022 8。

4.3 基于OLS回归,家庭劳动力人数比例对家庭收入在5%的显著水平上系数估值为0.664,从分位数回归系数来看,家庭劳动力人数比例对介于25%~75%段位的收入家庭影响显著,在5%的显著水平上系数估值分别为0.701、0.894、0.762。

4.4 基于OLS回归,家庭劳动力平均受教育年限对家庭收入影响不显著,从分位数回归估计上看,家庭劳动力平均受教育年限只对中等收入群体(50%和75%两个段位)影响显著,在5%的显著水平上系数估值分别为0.036 0、0.039 4。

4.5 基于OLS回归,家庭劳动力平均工作年限对家庭收入在1%的显著水平上呈负相关关系,系数估值为-0.020 6,从分位数回归估计可以看出,家庭劳动力平均工作年限对除10%分位段之外家庭收入群体呈显著负向影响,系数估值分别为-0.023 3、-0.015 5、-0.011 8、-0.014 3。

4.6 基于OLS回归,家庭农业机械化水平与小农户家庭收入没有显著相关关系。从分位数回归估计上看,家庭农业机械化水平只对高收入群体家庭影响显著,对90%分位段收入家庭在5%显著水平上影响显著,系数估值为0.123。

4.7 从OLS回归上看,家庭人均年耕地面积,家庭劳动力人数比例对小农户家庭收入呈显著的正向影响,家庭劳动力平均工作年限对小农户家庭收入呈显著的负向影响,从分位数回归估计上看,家庭人均年耕地面积对中高收入小农户家庭收入呈显著正向影响,家庭劳动力人数比例和家庭劳动力平均受教育年限对中等收入小农户家庭收入呈显著正向影响,家庭农业机械化水平对高收入小农户家庭收入呈显著正向影响,家庭劳动力平均工作年限对中高收入小农户家庭收入呈显著负向影响。

猜你喜欢

家庭收入位数南疆
“十三五”渔民家庭收入情况分析及对策研究
南疆木棉红似火
南疆最美是春天
比较小数的大小
《两位数除以一位数笔算除法》教学设计
南疆水城(外一章)
恩格尔系数
恩格尔系数
南疆干部
比大小有窍门