APP下载

大数据在内蒙古经济分析中的应用研究

2018-03-21郭宽厚

北方经济 2018年1期
关键词:结构化机器变量

郭宽厚

经济分析工作引入大数据的意义和作用

大数据时代的到来,对传统经济分析工作提出了机遇和挑战。在经济分析工作中引入大数据,可以解决传统经济分析工作中所遇到的局限,并为经济分析打开另一片广阔的空间。

一是随着信息量的极大拓展和处理信息能力的极大提高,经济分析可以从样本统计时代走向总体普查时代。这一点对经济分析意义重大,因为我们通常关注的经济是比较宏观的,如果能将对整体宏观经济变量的分析建立在尽可能多地关于经济主体行为的信息的基础上,无疑将会极大地提高经济分析的准确性和可信度。

二是大数据时代的信息传播速度有了明显的提高。大数据经济模型可以充分利用数据的实时性,提高分析预测的时效性,为经济预警和政策制定提供快速的资料和依据。同时,通过多元的数据,特别是非统计数据,可以进行碰撞模拟计算,从而较早地对经济形势进行感知。

三是大数据分析技术具有大规模并行处理的优点。适合非结构化数据的处理,为经济分析提供了更加方便高效的数据采集及处理平台,借鉴数据挖掘、机器学习、模式识别等技术,可以丰富分析方法,提高分析准确度。同时,经典计量模型以因果检验为核心,而大数据分析则更重视相关性发掘。在复杂的经济系统中,当因果关系难以准确检验时,我们可以充分利用相关关系解决经济分析问题。

经济分析大数据体系的建立

严格的经济理论和预测判断均需要以详实合理的数据做支撑。进行经济大数据分析,对经济进行综合分析和评价,前提条件是必须围绕整个经济活动建立一个多元的数据体系。从数据来源看,经济数据分为三个层次:

一是经政府统计途径获取的原始抽样和调查数据。依据《中华人民共和国统计法》,政府建立了以周期性普查为基础,以经常性抽样调查为主体,综合运用全面调查、重点调查,并充分运用行政记录等资料的统计调查体系,为经济核算提供了有力的制度保障和丰富的基础数据。

二是经统计分析后的统计指标数据,也就是政府统计部门定期发布的统计月报和统计年鉴数据。一般情况下,最容易接触和获取到的数据是统计指标数据,这也是获得国家和国际认可的数据。

三是通过其它途径获取的拓展经济数据。拓展数据主要针对行业协会、商会掌握的生产环节的行业数据、行业发展报告,以及电商等市场主体产生的数据。

以上三类数据共同构成了经济分析大数据体系,原始抽样和调查数据粒度最细,统计指标数据综合性最强最直观,拓展数据范围最广最实时,最符合大数据特征。三类数据之间可以互为补充、互相验证。

大数据技术在经济分析中的应用

以上介绍了大数据分析的重要作用,并构建了基础的数据体系,在此基础上可以具体开展如下应用:

一是在非数量经济信息的收集整理方面的应用。非数量经济信息主要指文本、图片、视频等信息。从这些素材中挖掘出结构化、数量化的信息,这是一个将非结构化数据转化为结构化数据的艰巨任务,同时也是人理解信息或机器理解信息的过程。例如,假设从互联网抓取到100万条帖子,需要从这些文本数据中挖掘出大众对经济的信心指数,如可分类为乐观、中性、悲观三类。那么最关键的就是要将100万条帖子转换为100万个或乐观、或中性、或悲观的信息,也就是复杂信息简单化。这个过程就是先对文本进行特征抽取,然后在特征抽取信息的基础上建立分类器,最后达到对所有文本数据的分类。简言之,数据挖掘就是大数据时代的统计调查,从纷繁复杂的非数量信息中挖掘出结构化数据。

二是大数据在经济计量分析中的应用。经济计量分析是研究经济的定量方法,要求的输入数据都是结构化、数字型数据。大数据技术在此除了可以解决前述的非数量信息的采集,并转化为结构化数据的问题外,还可以对计量模型的建立、参数估计、模型应用及验证方面给予辅助作用。由于经济现象的复杂性,经济计量模型变量的完整选择通常是不可能的,参数设置和方法估计也很多依靠经验,导致模型计算结果有时会造成很大偏差。因此,首先可以利用大数据相关性分析,去除次要变量,为主要变量选取提供依据。其次,利用大数据快速高效处理数据的优势,对大量的模型进行快速计算,从而为设置合适参数、选择正确估计方法提供快速的验证、修正依据。

三是机器学习技术的应用。大数据正在推动数据分析向机器学习的方向发展,经济数据分析中应用机器学习技术势在必行。简言之,机器学习就是让计算机经过训练,在输入变量和输出变量间建立起某种最佳的匹配关系,所谓训练是指把输入和输出信息都已知的样本输入计算机,然后根据一定的算法由计算机生成由输入变量预测输出变量的方法。机器能够伴随计算、运行次数的增多,通过学习逐步自我提高和改善,使挖掘和处理更为准确。通常的分析模型是人工建立的,通过机器学习可以实现建模自动化,是经济分析的新领域。目前技术还达不到,但相信随着机器学习算法的进步,这个目标是完全可以达到的。

对策建议

为有效应对大数据对经济分析工作提出的机遇和挑战,提升内蒙古各组织的经济分析水平,使分析成果在政府决策、企业经营、大众消费等方面发挥更大作用,政府、智库、企业之间应相互协作,各尽所能,积极参与,营造良好氛围。

一是建立政府、智库、企业等组织之间的相互协作机制。强化政府引导作用,发挥政府汇聚多方资源、整合经济数据的优势,加大政府数据开放共享力度,突出智库部门的需求和应用导向,充分激发企业参与热情和在大数据技术创新和成果转化中的活力。

二是建立经济大数据采集汇聚应用机制。注重顶层设计,建立健全相关法规和标准体系,完善相关制度,形成数据采集、整理、应用、反哺的良性循环机制。强化创新能力,提高创新层次,推动业态创新、模式创新。加强行业自律,完善行業监管,促进数据资源有序流动与规范利用。

三是尽快建设内蒙古宏观经济大数据平台。按照经济大数据体系采集多元化数据资源,建设经济运行调查、宏观经济统计分析、经济指标趋势走向等专题数据库,建立全区层面的基于大数据的宏观决策系统,提供自助式、专题式、交互式智能按需分析技术,提供数据态势分析、预测研判分析、可视化展示等方法,实现对重大经济和社会问题的主题分析、景气预警、实时监测、精准评估和预测模拟。

四是提升各相关组织的大数据分析应用水平。加强政府、科研、智库、企业、高校等组织中数据分析人员的交流培养,提高经济领域大数据分析技术的创新应用,建立普遍适用的动态算法和模型,对研判准确、实时有效的成果进行奖励激励。

(作者单位:内蒙古自治区发展研究中心)

责任编辑:康伟

猜你喜欢

结构化机器变量
机器狗
机器狗
抓住不变量解题
促进知识结构化的主题式复习初探
也谈分离变量
结构化面试方法在研究生复试中的应用
未来机器城
SL(3,3n)和SU(3,3n)的第一Cartan不变量
基于图模型的通用半结构化数据检索
分离变量法:常见的通性通法