APP下载

基于岭回归模型的建成区用地规模预测

2020-04-20陈路明李沛鸿

价值工程 2020年9期
关键词:预测

陈路明 李沛鸿

摘要:以福州市2001-2013年建成区用地面积及社会经济发展各类数据为基础,利用岭回归分析对建成区用地规模的预测方程加以参数校正,重新选择变量,并再次建立新的岭回归模型。利用新建立的模型计算出2014-2017年建成区用地规模的预测值,加以验证。研究表明,模型的精度具有一定可靠性,可为福州市建成区用地规划管理提供相关建议。

Abstract: Based on the data of land area and social and economic development of built-up areas in Fuzhou from 2001 to 2013, ridge regression analysis was used to correct the prediction equation of the scale of land use in built-up areas, reselect variables, and establish a new ridge regression model. The newly established model was used to calculate the predicted value of the land use scale of the built-up area from 2014 to 2017 and verify it. The research shows that the accuracy of the model has certain reliability, which can provide relevant suggestions for the planning and management of land use in built-up areas of Fuzhou.

关键词:岭回归;选择变量;预测

Key words: ridge regression;selection variable;prediction

中图分类号:TU984.2                                     文献标识码:A                                  文章编号:1006-4311(2020)09-0232-02

0  引言

隨社会的不断发展,城市建成区也在不断扩张,土地供需的矛盾日益严重。由于城市建成区土地的难以逆转性,为保障土地资源的合理分配及可持续性利用,防止城市的无序扩张与蔓延,对建成区用地规模进行预测具有十分的必要性。普通的最小二乘估计面对多重共线性问题时,预测的结果往往不尽人意,文章发现,使用岭回归分析可以较好的解决此类问题。

1  研究方法

有多重线性回归模型Y=X?茁+?着,则?茁的最小二乘估计为:。其中?茁为待估参数,X为自变量的n×m阶的矩阵,X′为X的转置,X′X为对称m×m方阵,(X′X)-1为X′X的逆矩阵,Y为因变量n×1的向量。m为待估回归系数的个数,n为观测数。当,X′X非满秩或至少有一个特征根接近零时,最小二乘估计模型预测的结果会产生一定偏差,预测结果会不理想。而岭回归可解决此问题,对多重线性回归模型的回归系数估计方法为:。[1]即X′X矩阵主对角线元素上添加非负的因子k,Im为m阶单位矩阵,k>0时,k被称为岭参数。当k取值不同,得到岭估计也不同。当k取零时,就是?茁的最小二乘估计。k取值在,对任意i,有?茁(k)对应的第i个分量?茁i(k)取值为k的函数,将直角坐标系中点■的点的变化轨迹称之为岭迹。相对于最小二乘估计,岭估计就是把X′X变换成了X′X+kIm。X为病态矩阵时,X′X的特征根至少有一个十分趋近于0,X′X+kIm的特征根就变成了其中有一些趋近于0的特征根会被加以改善,由此便解决了原设计阵复共线性的问题。[2]

2  模型的建立

2.1 驱动因素分析

本文通过对福州市2001-2013年的统计年鉴数据进行分析,由可获得性及福州市建成区面积变化的特征,筛选出了农村人口X1(万人)、城镇人口X2(万人)、建成区绿化面积X3(公顷)、第一产业所占比X4(%)、年底实有道路总长X5(公里)、地区生产总值X6(亿元)、年底公路通车里程X7(公里)、年底竣工面积X8(万平方米)共8个与建成区面积Y相关性皆大于0.9的因子构驱动因子的指标体系。

2.2 岭回归模型分析

对数据加以处理,构建岭回归模型,得到8个驱动因子的岭迹图如图1(a)所示。根据岭回归选择变量的标准,剔除掉变量X1、X4、X7和X8,重新构建岭回归模型,得到4个驱动因子的岭迹图如图1(b)所示。

由图1(b)可看出,剔除掉变量X1、X4、X7和X8后,岭回归系数变化幅度明显变小,当岭参数k的值接近0.05的时候,所对应的各个参数已趋于稳定。所以选取k=0.05,得到岭回归方程为:

2.3 预测结果

运用所构建的岭回归模型对2014-2017年福建省建成区用地规模进行预测,将所得的结果与实际值进行比较,具体如表1所示。

3  结论

①由变量城镇人口X2、建成区绿化面积X3、年底实有道路总长X5、地区生产总值X6构建的岭回归模型预测的结果满足精度要求。②虽然对2014-2017年建成区预测的误差都控制在3%以内,但是越往后误差越大,所以建立的岭回归模型只能用于中短期预测。

参考文献:

[1]余长坤,宋文博,等.基于岭回归与灰色耦合模型的建设用地规模预测——以河南省焦作市为例[J].地域研究与开发,2015,34(01):155-159.

[2]贾敏,张永彬,韩子斌.基于岭回归的城市建成区面积预测研究[J].华北理工大学学报(自然科学版),2019,41(04):19-24.

[3]冯浩程,邵俊驰,耿鑫,田玉柱.基于岭回归建模的洛阳市旅游收入统计分析[J].价值工程,2019,38(14):4-6.

作者简介:陈路明(1991-),男,江西赣州人,硕士研究生,主要研究方向为机器学习、城市研究与建模等。

猜你喜欢

预测
无可预测
基于PCC-CNN-GRU的短期风电功率预测
选修2—2期中考试预测卷(A卷)答案与提示
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
不可预测