APP下载

利用大数据提高区域经济预测和决策能力研究

2019-09-10弋微微

商讯·公司金融 2019年20期
关键词:房价大数据

摘要:本文采用Engle-Granger检验来探索南充市房价与以搜索指数为代表的大数据之间的关系。选取了2014年1月至2018年11月的房价数据,并利用相关系数大于0.5的百度指数构建搜索指数,从而对其进行实证检验。结果发现,南充市房价同搜索指数之间存在着协整关系,且其相关系数较大,说明大数据对于中小城市房价具有较强的预测。此外,还比较了不同的搜索指数构造方法,发现以相关系数为权重所构造的搜索指数表现更佳。

关键词:大数据;房价;Engle-Granger检验

一、引言

众所周知,房价是政府宏观经济调控的重要手段,房价的稳定在一定程度上影响到经济的稳增长。因此,国内关于房价的研究文献较多,(刘莉亚和苏毅,2005)采用协整方法测算了上海房价的合理水平,并据此分析了上海房价失调的程度及原因;(张亚丽,2011)利用房地产价格决定模型得出当期实际人均可支配收入、预期收入和预期房地产收益率是房价持续上涨的主要因素的结论;(王文雯等,2014)以省级面板数据研究了人口結构、收入分配和经济政策等变量对房价的影响。综上,关于房价的研究文献大多集中在大中城市,而对于三四线城市的关注较少。然而就在去年,南充作为一座四线小城市突然受到央视财经频道《经济半小时》栏目报道,原因就在于南充的房价不到半年时间从5634元飙升至7285元,涨幅高达29.3%,居于全国的前列。那么,如何来分析和预测小城市房价的变化呢?

2009年,Nature杂志上刊登了一篇利用谷歌搜索日志来即时预测流感趋势的文章,迅速引起了社会对于大数据的关注。近年来,人们不断挖掘大数据背后蕴含的巨大潜力,将其运用于医疗、交通、商业推广等各个领域,甚至形象地将其称为“数字黄金”。而在学术界,大数据对于经济的预测能力也逐渐被放在突出位置。(张谊浩等,2014)发现网络搜索能够用于预测股票市场,从而构造投资组合获得超额收益;(刘涛雄和徐晓飞,2015)通过比较政府统计的结构化数据和网络搜索的非结构化数据,讨论了能否利用互联网搜索预测宏观经济的问题;(王娜,2016)利用百度搜索指数和媒体指数证明大数据可以提高碳排放权预测的准确性。

由于大数据在经济领域具有较好的预测能力,本文尝试探索大数据和房地产的关系,希望能够为中小城市经济预测提供一种思路。

二、搜索指数对房价影响的理论分析

从经济学的角度而言,房屋也是一种商品,那么它的价格必然由其供需所决定。从供给来看,房屋的供给在很大程度上取决于土地的供给,而土地作为一种特殊的商品,是缺乏弹性的。因此,短期来看,房价主要受到房屋需求量的影响。而就房屋需求而言,消费者的需求主要包括投资需求和投机需求。其中,投资需求反映了消费者的刚需,受到经济基本面等因素的影响。而投机需求则取决于房屋的预期收益,如果预期房价收益率大于社会资本的一般收益率,则投机需求增加;反之,则投机需求下降。

网络搜索是一种信息挖掘的手段,在获取信息的同时也记录下投资者的动态。投资者往往不会搜索与其无关或不感兴趣的信息,对于特定关键词的检索实际上反映了投资者的关注和预期。例如,投资者搜索房贷利率,常常预示着该投资者在关注房地产市场,或者表明其有较强的房屋购买意愿。正是基于此,本文认为充分挖掘网络搜索的信息,可以了解投资者的需求,从而预测未来房价的变化。但是,关于二者的影响机制,目前学术界还没有公认的观点,结合资产价格决定理论和行为经济学理论,本文提出如下的理论分析。

如图1所示,网络搜索实际上是投资者情绪和投资者关注的一种反应。当投资者情绪高涨时,对于资产的关注程度必然上涨,从而表现出较高的网络搜索量;而当投资者情绪降低时,说明投资者对资产的兴趣减弱,而投资者关注会伴随降低,从而表现出较少的网络搜索量。根据行为经济学的相关理论,投资者情绪和投资者关注是影响投资者偏好和决策的主要因素,而偏好和决策在一定程度上会引起需求的变化,从而造成价格的波动。具体而言,房地产市场上有投资者和投机者两大购买方。当投资者情绪高涨、关注上升时,购买者常常做出预期未来房地产市场会有超额收益率的判断,从而影响投资者偏好和决策。此时,投资者方表现为购买意愿会更加强烈,等待交易的时机会缩短,愿意付出的成本对价会更多,从而引起投资需求增加;而投机者表现为进入房屋市场的可能性增强,交易数量增多,交易方向多数为买人,从而引起投机需求的增加。因此,房屋市场的总体需求上涨。反之,当投资者情绪低迷、关注下降时,常常意味着预期未来房地产市场收益率下降的可能性增强,从而影响投资者偏好和决策。此时,投资者的购买意愿降低,等待交易的时机会延长,愿意付出的成本对价会减少,从而导致投资需求的降低;而投机者进入市场的可能性下降,交易数量减少,交易方向多为卖出,从而导致投资投机需求的减少。因此,房屋的总体需求下降。根据供求关系理论,短期房地产市场的供给不易变化,房屋需求的增加会导致房价的上涨,而需求的降低会引起房价的下跌。综上所述,利用网络搜索能够预期未来房屋需求的变动,从而预测未来房价的变化。

三、实证检验

(一)数据的来源和变量的选取

1.房屋价格指数P。本文的原始房价数据来源于南充房产信息网,收集的是南充市市区(嘉陵、顺庆、高坪)住宅商品房成交价的月度均值。将此数据和wind数据库中的南充房屋月度基准数据进行比较,发现二者的相关性高达0.98,因此认为该数据准确、可靠。本文选取了2014年1月至2018年11月,共计59个月度数据,并将2014年1月的房屋价格设定为100,将数据进行同比处理得到房屋价格指数。

2.搜索指数的构建。借助国内外已有参考文献的经验,本文以百度指数代表投资者的网络搜索数据。将搜索区域限制在南充地区,利用Python软件爬取了2014年1月至2018年11月期间,与房价有关的14个关键词的百度指数。所选取的关键词都是与房价直接或间接相关的常用词汇,包括房价、买房、买房注意事项、公积金、公积金查询、存款利率、家装、房产税、房贷、房贷利率、房贷计算器、搜房网、装修。为了同房价保持一致,先将得到的周度百度指数转化为月度数据,再按照以下原则对数据进行标准化处理。

其中,SS代表处理后第i个关键词在t时期的百度指数;X代表第i个关键词在t时期的百度指数;n代表所选期间的月份个数。

得到标准化的百度指数后,计算各个关键词与房价之间的相关系数,选取大于0.5的关键词用于构造搜索指数,分别是房价SS(β=0.61)、房产税SS(β=0.51)和房贷计算器SS(β=0.75)。

如表1所示,本文采用了两种方法构造搜索指数,第一种是简单算术平均的方法,第二种是以相关系数进行加权平均的方法。将得到的搜索指数同房价进行相关分析,发现前者的相关系数为0.74,而后者的相关系数为0.76。由于加权得到的搜索指数与房价之间的相关性更高,因此本文选择SS作为搜索指数。

(二)模型设定

在上文中已经通过理论分析了网络搜索跟房地产价格之间可能存在的关系,这里将对其进行实证验证。由于所选择的变量都是非平稳的,不能直接使用经典线性回归模型,所以本文采用Engle-Granger协整检验模型。如果模型结果表明存在着协整关系,则说明变量间存在长期均衡关系,则可以利用其相关关系进行预测。对房地产价格(P)和搜索指数(SS)进行协整检验,具体过程如下。

P=c+aSS(2)

e=P-P(3)

首先建立变量间的线性回归方程(见等式2),然后得到被解释变量真实值和预测值之间的离差数列e(见等式3)。此时,对e进行单位根检验,若结果平稳,则说明变量之间存在协整关系;反之,则说明二者之间不存在协整关系。

(三)实证的结果与分析

1.ADF检验

对变量房价P和搜索指数SS进行单位根检验,得到表2中的结果。原时间序列在1%的显著水平下均不能拒绝原假设,说明原数列非平稳。而它们的一阶差分序列d(P)、d(SS)检验值均明显小于1%水平的临界值(-2.61),说明变量P和SS为一阶单整序列。

2.协整检验

由于房价P和搜索指数SS均为一阶单整序列,为了判定其是否存在线性关系,利用EVIEWS 8软件对其进行Engle-Granger检验,其结果如上图所示。

在表3中,tau统计量的数值为-3.45,根据其求得的概率为4.79%;z统计量的数值为-18.91,其对应的概率为4.64%。说明两个统计量在5%的显著水平下均拒绝原假设,也即是P和SS存在协整关系。

既然房价P和搜索指数SS存在著协整关系,则说明二者具有长期均衡关系,那么可以利用搜索指数来建立房价模型。为了说明二者之间的关系,采用如下回归模型。

其中,调整后的R=0.57,S.E=13.18,F=70,DW=0.59。

根据模型(4)的结果,说明搜索指数对房价存在着正向的影响,且影响程度较高,系数达到0.76。意味着搜索指数每变动1个单位,房价将随之变动0.76个单位。又由于相关系数大于零,说明搜索指数上涨时房价将会上涨,搜索指数下降时房价随之下降。因此,可以利用搜索指数的变化来预测未来房价的变化。

四、结论和启示

通过前面的分析,本文主要得到以下结论。

1.大数据对于中小城市房价具有较强的预测能力。对房屋价格指数和搜索指数进行Engle-Granger检验,发现二者之间存在着协整关系,且其相关系数高达0.76,说明搜索指数对南充房价市场具有较强的预测能力。在一定程度上,这也说明了大数据对于区域经济预测和决策的重要作用。通过查看已有文献,发现关于区域经济的研究多数集中在大中城市,原因就在于中小城市的经济统计数据较难获取,这就阻碍了对于中小城市经济预测的可能性,同时影响了经济决策的制定和执行。随着大数据的出现,改变了中小城市数据难以获取的现状,能为预测和决策提供必要的数据支撑。因此,积极探索大数据对于中小城市区域经济的影响具有重要价值。本文仅仅以南充房地产市场作为大数据运用的一个方面,希望能够借此充分挖掘大数据的潜力。

2.构建搜索指数,以相关系数为权重表现更佳。大数据的特点在于数量多、非结构化、信息冗杂,由于百度搜索引擎是国人常用的浏览器,而百度指数向大众提供免费查询个别关键词网络搜索量的功能。因此,本文选取百度指数来构建搜索指数。但是,与房价有关的关键词很多,本文筛选相关系数大于0.5的关键词进行指数构建,这样在一定程度上对大数据的信息进行过滤。然后,在构建指数的过程中,分别比较了算术平均数和以相关系数为权重的加权平均数的构造方法,结果发现以加权平均数来构造权重的方法得到的搜索指数跟房价的相关性更大。因此,本文建议在利用大数据构建搜索指数时注重相关系数所带来的权重影响。

参考文献:

[1]王娜.基于大数据的碳价预[T].统计研究,2016,33(11):56-62.

[2]秦磊,谢邦昌.谷歌流感趋势的成功与失误[J].统计研究,2016,33(2):107-110.

[3]刘涛雄,徐晓飞.互联网搜索行为能帮助我们预测宏观经济吗?[J].经济研究,2015,50(12):68-83.

作者简介:

弋微微,南充职业技术学院,四川南充。

①基金:2018年南充市社会科学研究“十三五”规划项目,项目编号:NC2018C040。

猜你喜欢

房价大数据
房价上涨对居民消费的影响研究
房价上涨抑制英国出生率:每年少生7000多名婴儿
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
2016房价“涨”声响起
《公积金额度让你瞬间土豪?》