APP下载

数据挖掘技术在经济统计中的应用

2017-11-14王晓丽

经营者 2017年6期
关键词:经济统计统计方法数据挖掘

王晓丽

摘 要 我国的社会经济正在快速发展,经济统计可以表现出整个经济的发展状况,为未来的发展和调控给予有效的数据支持。经济统计的数据通常都比较大,而且部分数据可能存在问题,以前的统计只是进行表面的计算,并没有深入分析。而现代经济统计的发展是快速的,本文主要对经济统计方法中数据挖掘技术的优势进行分析,并且概述了其应用情况。

关键词 经济统计 数据挖掘 统计方法

经济统计需要对庞大数据库内的信息进行整理和分析,但是由于数据较多、比较复杂,简单的统计方法没有办法实现全面的数据分析,无法将所有的数据进行准确的分析。数据挖掘技术可以对数据进行深度的整理和分析,提高数据的真实性和质量,还能更加轻易地找出实用性的信息,对相关单位有十分大的意义。

一、数据挖掘技术的概念及功能

数据挖掘(Data Mining),就是从大量复杂的数据信息中挖掘出有利用价值的信息。通常,这些大量的复杂的数据信息都被认为是随机的、模糊的、不完全的、有噪音的,完全没有进行处理的信息。然而经过挖掘之后,这些原本看似没有任何利用价值的信息,就会呈现出一种新颖、有效、潜在有用的状态,最终为人们的生活与生产提供便利。这种信息数据的处理变化过程,就常常被称作数据挖掘。它也可以理解成是在一些观察数据或事实的集合中找正确模式的决策支持过程。数据挖掘是一门涉及面极其广的交叉学科,可以简单地将它认为是经济信息转换的一个过程,同时它还包含了机器学习、模式识别、数据库、数理统计、神经网络、模糊数学等相关技术。

数据挖掘主要功能有:预测模型、分类、数据聚类、数据总结、关联规则发现、依赖关系或依赖模型发现、序列模式发现等。根据数据挖掘技术的作用和特点来看,它具备的优点是:具有自动找出有价值的数据信息的功能;能够处理大量的数据信息;反映数据信息快速有效;能够有效地对数据信息进行分析与评判,描绘过去和未来。

二、经济统计中数据挖掘技术的优势

(一)数据有效性高

数据挖掘技术可以实现对整体数据的深层次加工,而且使用者可以根据自身的要求和目的,在长期积累的数据库中找到有用的数据信息。通常情况下表现为两种形式,一种是对原有的数据库进行有效的管理,另外一种是对现有形成的数据进行实际的分析。分析的方式也有所不同,可以从数据管理的形式出发,在这个过程中对所有的数据进行归类,将原本复杂而又混乱的数据信息进行正确的管理,保证数据统计的安全性和使用数据时的搜索便利性。

(二)较强的综合应用性

数据挖掘技术是一个系统化的工具,可以满足人们对数据的各种需求,由于各个经济部门所管理的领域不同,方式和目的都存在较大的差异,所以对需求的数据形式和方式都会存在差异,需要进行不同的数据处理,这也是数据挖掘技术的优势之一,不仅可以使不同的经济统计部门满足自己的需求,得到自己所需要的信息,而且可以用不同的形式表达统计后的数据,还可以通过对数据的来源和统计方式进行评估,判断是否有足够的正确性。而且这些数据还可以自动进行格式的转换,满足实际的格式要求,可以进行正常的录入,保证经济统计的正常进行。

(三)较强的数据整合性

很多经济统计部门都还在使用传统的方法,收集数据和分析数据都存在一定的局限,不能够触及数据的整体,可能会重复分析一些数据,降低统计的质量和效率。数据挖掘技术可以整合整个统计数据系统,使所有的信息都可以被分析。特别是在一定的宏观数据的基础上,保证各数据的准确性,在整合过后有更加充分的资源。

三、数据挖掘技术在经济统计中的应用

(一)预处理技术

在实行经济数据的统计过程中,最初期的方法就是预处理技术,对所有的数据进行一定的初步处理。数据挖掘技术也是一种分析和整合基础信息的技术,会受到基础信息本身很大的限制,不可能随意对数据信息进行处理。所以在进行全面性的主要过程之前,必须首先对所有的数据信息进行预处理,才能使数据挖掘技术实施得更加完美。具体的预处理应该包括数据中的不准确、不真实的数据,以及不同的数据之间可能存在的较大差异等,这都会对数据分析产生影响。在预处理中实行数据清理就是对有问题的数据进行处理,也包括不同的方法、不同的形式,要结合实际的情况和实际的数据需求选择最合适的处理方法,分析出最高质量的数据。

(二)决策树技术

决策树技术是数据挖掘技术在经济统计中一种十分常见的方法,通过对数据建立合适的决策树,从而可以直接、迅速地反映整个数据的具体分布情况。完成一个全面的决策树通常分两步,首先要根据大致的信息建立一个简单的决策树,并配置一个模型,能够实现简单的输出分析。然后对构建完成的决策树进行完善,对不同的数据进行分类,根据不同数据的特点和状态,从树的根部到枝干,依次输入不同的数据,直到输完所有的数据完成分类后停止。当出现所有的数据都属于同一类或者没有办法进行分类时就要立即停止分类,然后进行下一步的工作。在建立和完善整个决策树的模型后,就要根据使用者实际使用的数据信息和要求对数据进行剪切,将不必要的数据或者无用的信息丢掉,从而再进行數据分析时可以更加快速,可以更加准确地得到所需要的信息,减少因为数据过多而在数据输出时出现问题的可能性,降低其产生的起伏影响。

(三)遗传算法

它是一种根据生物遗传机理和自然选择的随机搜索算法,其主要思路是依据特定的社会问题,然后在指定对象中去采集相关信息,最后通过归整、分析隐含的信息,进而得到结果。经济问题不是固定不变的,相反它是一个不断发展变化的问题,内部的联系千丝万缕,改变其中一项其他的也会相应改变。按照遗传算法的步骤,从源头开始,一步步向下探索,去提取信息数据,对整体进行分析,这样就能把经济问题目标化、具体化、直接化,使得在研究问题时可以更加直观,把隐性的信息表现出来,使得经济统计工作更加直白、简单。

(四)神经网络法

神经网络法是一种高强度模拟人脑加工信息过程的智能现代信息技术。它和人的神经运动过程一样,首先进行数据的输入,然后进行精准的分析,最后输出。其在经济统计过程中得到了实际的应用。神经网络法提供了一种准确的、完整的处理经济统计的过程,使得经济运行模式和人在处理信息的过程很相像,一样实用化、形象化、具体化,使经济过程中各个部分之间能取得更好的联系,从而获得对经济统计问题的处理办法。

四、结语

数据挖掘技术在现代经济统计中占有重要的地位,也是未来统计工作的一种趋势。它可以实现对数据更深的分析处理,提升分析数据的质量,可以帮助决策者做出更好、更稳定的发展决策,带来更大的效益。我们一定要及时更新传统的经济统计方法,扩大数据挖掘技术的使用范围,从而提高统计的效率,减少统计时的成本支出。

(作者单位为汾西矿业集团中兴煤业公司)

参考文献

[1] 王思懿.数据挖掘技术在经济统计中的应用管窥[J].商,2015(18):216.

[2] 崔丹.数据挖掘技术在经济统计中的应用探索[J].财经界,2014(5):149.

[3] 张红军.谈谈数据挖掘技术及其应用[J].广西梧州师范高等专科学校学报,2013 (3):23-25.endprint

猜你喜欢

经济统计统计方法数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
论提高农村经济统计准确性及科学性
汉语词汇研究中的统计方法述评
统计方法的改革与创新分析
基于R的医学大数据挖掘系统研究
统计方法在企业财务分析中的应用
浅谈生态休闲养生经济的统计方法
一本面向中高级读者的数据挖掘好书