APP下载

基于随机森林法对农户土地流转行为影响因素的分析——以抚州市10县157个村的359户农户有效问卷调查为例

2015-09-26邹力宏

金融与经济 2015年2期
关键词:耕地变量农户

■邹力宏

2014年9月29日,中央全面深化改革领导小组第五次会议强调要在坚持农村土地集体所有的前提下,促使承包权和经营权分离,形成所有权、承包权、经营权三权分置,经营权流转的格局。作为农地流转的主体,农户的行为对农地流转的走向无疑具有重大的影响。从国内外学者对农户理性的研究结果来看,农户行为更多的是一种有限理性,这种理性不仅是追求收入最大化的单一经济理性,而且还包括文化、社会和心理的多种因素在内的多种理性选择的结果。为此,本文也是基于农户是理性的行为者,来分析农户土地流转行为的影响因素。

一、数据来源和研究方法

(一)数据来源与变量

本次调查是在2014年9月对已发生过土地流转的农户进行问卷调查,内容涉及户主基本特征、户主家庭特征、土地流转特征、对土地流转的认知、社会影响因素等五个特征的多个选项。样本涉及抚州市10县50个乡镇178个村370个农户,收回问卷370份,有效问卷359份。变量共有23个,其中,土地流转行为y,为二分类的因变量,取值为“1”代表流入、“0”代表流出;自变量xi中有数据型的也有分类型的自变量,23个变量构成的数据集名tt。具体的定义如下表1。

表1 影响农户土地流转行为的变量情况

(二)数据特征与概要

1.流转农户的基本特征。在本次调查中,359户发生过土地流转农户,耕种面积22452亩,户均耕种62.54亩。其中254户为土地流入户,户均承包耕地11.8亩,耕种面积20992亩,流入土地17996亩;土地流出105户,户均承包耕地25.7亩,耕种面积1459亩,实际流出1184.5亩。基本特征如下:

(1)年龄结构:359户发生过土地流转的农户,25岁以下的有4人,占调查样本的1.10%;26~35岁的占 11.7%;36~45岁的 34.52%;46~55岁的占40.82%;56岁以上占12.0%。流转的农户以在家的中壮年劳力为主,36~55岁的人群占比为75.2%。

(2)知识水平:在359户农户中文盲及半文盲有13人,占比3.6%;小学文化水平占19.8%;初中文化水平占52.4%;高中文化水平及以上占24.2%。说明我国农村主要人力资源的知识水平还不高。

(3)务工经历:有外出务工经历的户主为197人,占总调查人数的54.9%,实际耕种面积10018.3亩,家庭承包耕地3234亩,户均承包耕地16.4亩;其中56户流出耕地8370亩,141户流进耕地788亩。无外出务工经历的户主有162人,占总调查人数的44.93%,实际耕种面积11565.7亩,家庭承包耕地2424.2亩,户均承包耕地14.9亩,其中47户流出耕地483.5亩,115户流入耕地9626.0亩。

2.流转农户家庭特征

(1)耕种面积:当前359户农户总的耕种面积为22452亩,家庭承包耕地5658.9亩,户均实际耕种面积为62.5亩,高于全部调查农户15.8亩的户均家庭承包土地亩数。在流入土地中,最小的为1.0亩,最大的为1317.0亩。在流出土地中,最小的为1.0亩,最大的为130.0亩。

(2)家庭人口:在已发生过流转的359名农户,其家庭人口 3人以下的占 8.22%,3~5人的占62.74%,5人以上的占29.04%。

(3)农业收入:调查样本农户的农业收入占全部家庭收入比重在20%以下的有17.53%,在21%~50%的占21.10%,在51%~80%的占31.23%,在81%以上的占30.14%。

3.农户土地流转特征

(1)流转期限:在359份问卷中,土地流转的时间期限(按约定的时限),3年以内的占55.62%,4~8年期的 27.12%,9~15年的 6.58%,16年以上的为10.68%。

(2)流转合同方式:口头协议的占60.27%,书面协议的占39.73%;土地流转双方是否可以随时中断合同,认可可以随时中断的占42.47%,不可随时中断的占57.53%。

(3)流转对象:在本村的村民间流转的占87.12%,对村外人员流转的占11.23%,对企业(合作社)流转的占1.64%。

(4)主要流转途径:农户完全自发的为67.40%,乡村一级组织或协调的占24.93%;参加农村专业化经济合作组织的占4.66%,其他形式的占3.01%。

(5)主要流转形式:转让的10.14%,转包的18.90%,互换的1.10%,代耕的27.40%,出租的42.19%,其他的0.27%。

(6)流转土地的收益:农户流转土地得到的收益占全部家庭收入10%以下的有20.82%,11%~40%的有31.78%,41%~70%的有20.55%,71%以上的有26.85%。

(7)流转的价格:以每亩/年计算,100元以下的占 21.64%,101~200元的占 44.38%,201~300元的占25.48%,301元以上的占8.49%。

(8)流转付款方式:分年度以现金支付的占59.18%;一次性全部用现金支付的占24.66%;按一定数量的粮食支付的占13.15%;其他方式的2.74%。

(9)转入土地的主要原因:在有多余的劳动力的、给亲戚朋友帮忙、能明显增加收入、满足自己粮食需要、其他原因等五个选项中,对应选择比例分别为 24.11%、10.14%、55.07%、5.21%、2.47%。

(10)不愿意流转土地的原因:不愿意流转并不代表没有流转,有各种因素制约流转;认为收益性差而不愿意转的占42.74%,缺乏便利性的占20.27%,流转对象难找的占26.30%,缺乏法律保障的占19.45%。

4.对土地流转的认知

(1)对土地的态度:农户对土地完全不看重的占4.11%,不看重的占6.85%,一般的占24.93%,看重的占57.53%,完全看重的占6.58%。

(2)对土地产权认识:农户认为土地所有权归国家的占16.16%,归集体的占60.27%,归个人的占23.56%。

(3)对土地法律保护程度的认识:农户认为当前法律对土地的保护选项,认为完全不保护的占1.37%,不保护的占2.19%,一般的占23.01%,保护的占63.56%,完全保护的占9.86%。对农户的土地流转有97.26%农户认为应受法律保护,不应受法律保护只有2.74%。

5.社会影响因素

(1)政府介入程度:农户认为政府完全不介入的占10.68%,不介入的占34.52%,一般性介入的占23.84%,介入的占29.32%,完全介入的占1.64%。

(2)以土地参加农民专业生产合作组织:不参加的占15.07%,参加的占41.64%,无所谓的占43.29%。

(3)土地流转金融的需求:359户土地流转户有贷款余额的为175户,贷款余额为795万元,户均4.54万元;其中因土地流转而有贷款余额的为0。认为土地流转有贷款需求的占37.53%,自身因土地流转需要贷款的占26.58%。以当前农户获得贷款的容易程度来衡量认为土地流转贷款难的占53.42%,不难的有46.58%。

二、土地流转行为的随机森林分析

(一)对变量进行独立性和共线性检验。检验结果表明并非响应变量y与自变量x都是独立的关系。因此,传统的回归中会产生共线性的作用。数据集tt的部分数据样本如下:

y x1 x2 x3 x4 x5 x6 x7 x8 x9 x10x11x12x13x14x15x16x17x18x19x20x21x22 1 1 4 3 2 5.0 19.0 2 4 1 4 268 1 1 1 1 1 2 2 2 1 2 5 2 2 0 3 2 2 68.030.0 2 2 1 2 268 1 1 1 2 1 2 3 2 1 2 4 1 3 1 3 4 2 4.0 36.0 2 4 4 4 358 2 2 1 1 3 2 3 2 1 1 4 1 4 0 3 3 2 50.030.0 3 2 3 1 320 2 2 2 1 2 2 3 2 1 2 0 1 5 0 3 3 1 10.0 5.0 2 1 1 1 248 1 1 2 1 1 2 2 2 1 1 0 2

表2 变量间独立性检验结果

针对此例中的自变量分类变量多的问题,采取随机森林法来处理。主要结果如下:

表3 随机森林对影响农户土地流转行为自变量的重要性指标

(二)自变量对y选择的重要性排序。对影响农户土地流转中的22个因素进行重要性排序(varImpPlot(R F)),得到如图1所示的结果。可以看到不同指标,指示的变量重要性会略有差距,但是差距不会很大。图1中左边为均方误差递减意义下的重要性,右边为精确度递减意义下的重要性。影响因素的重要性排序依次为x7(农业收入占家庭总收入比)、x4(家庭承包土地亩数)、x9(土地流转收入占全部收入比)、x5(土地流转面积)、x16(对土地的态度)、x21(农户贷款余额)等,其重要性的值分别为31.33、30.31、28.12、22.84、11.49、9.20。在影响农户土地流转中,经济因素是最重要的因素。

图1 随机森林对影响农户土地流转行自变量的重要性进行排序图①

(三)基于OOB数据的分类结果。使用命令RF$confusion得到基于OOB数据的分类结果:OOB estimate of error rate:9.19%,见表4。每行表示实际的类别,每列表示随机森林判定的类别,对角线外的表示分类错误。OOB数据的分类结果是每颗树都是由自助法抽样得来,且抽样是有放回的抽样,这样每次都太约有30%~40%的数据没有被抽到,因此它就成了天然的测试集,被称为OOB数据。表4是基于OOB数据得到误差率,这个误差率与做五折交叉验证测试集得到结果的误差率基本一致,但和用全部数据集得到的结果不一样。

表4 随机森林(用于分类时)的混淆矩阵显示农户土地流转行分类误差

(四)各变量对农户土地流转行为影响的分布图。图2、图3、图4是描述局部的一个变量对分类的概率的边际效应。其中,图2、图3是分类变量的影响,图4是连续性变量的影响。在图2中有无外出务工经历(x3)的农户,其影响流入行为的概率,边缘效应是递减的,倾向流出土地;图3中农户贷款的难易(x22)的现实也影响农户土地流转行为,贷款从难变易,边缘效应是递增的,倾向流入土地。数量变量对农户土地流转行为的影响,呈不同的结果,其中家庭耕地越多(x4)越容易流出土地;土地流转价格影响农户土地流转行为有不同的区间,价格低有利于流入土地,价格超出200元/亩有利于流出土地,当价格高于260元/亩时,又有利于流入出地,并随着价格的高企,对农户的土地流入行为更有利。

图2 分类变量对农户土地流转行为的影响(一)

图3 分类变量对农户土地流转行为的影响(二)

图4 数量变量对农户土地流转行为的影响

图5 随机森林的预测误差及其95%的置信区间同所用的分类树数量的关系

(五)随机森林回归的误差。从图5可看出随机森林回归,随着树的数目的增长,随机森林回归的数据集的误差,NMSE相对稳定,所以不存在过拟合的问题。在本例中,用全部数据集tt作为训练集也作为测试集得到的分类结果没有分错的发生。而用五折交叉验证所得到随机森对数据集tt作分类的训练集和测试集的平均误判率分别为0和0.033。

三、主要分析结论

本文对影响农户土地流转行为的因素进行了实证分析,得出如下主要结论:

1.各种的影响因素差异较大。

2.从主要影响因素的重要性排序来看分别为:x7(农业收入占家庭总收入比)、x4(家庭承包土地亩数)、x9(土地流转收入占全部收入比)、x5(土地流转面积)、x16(对土地的态度)、x21(农户贷款余额)等,而且连续变量和分类变量对农户流转行为的影响概率,其边缘效应是不同的,就贷款余额x21来说,随着贷款余额的递增,农户土地流出概率的边际效应也是递增的。贷款难易x22却相反,等等。这让我们能在数量上区别不同类别农户对其土地流转行为的不同反应。这正是我们引导农户进行土地流转要考虑的重要因素。

3.不同地区影响农户进行土地流转行为的因素不同,因此在变量选取时要考虑不同的地区影响,这样才能充分认识影响农户进行土地流转行为的有利因素以及需要重点改善和发展的方面。

[1]李欣海.随机森林模型在分类与回归分析中的应用[J].应用昆虫学报,2013, 50(4):1190~1197.

[2]吴丹,朱玉春.基于随机森林方法的农村公共产品供给能力影响因素分析[J].财贸研究,2012,(2).

[3]吴喜之.复杂数据统计方法——基于R的应用(第二版)[M].中国人民大学出版社,2013.

猜你喜欢

耕地变量农户
自然资源部:加强黑土耕地保护
我国将加快制定耕地保护法
农户存粮,不必大惊小怪
可食用香水玫瑰成农户致富新选择
新增200亿元列入耕地地力保护补贴支出
寻求不变量解决折叠问题
让更多小农户对接电商大市场
抓住不变量解题
耕地种田也能成为风景
农户如何称取和配制小用量固体农药