APP下载

浅析数据挖掘技术

2018-04-12田春雨

东方教育 2018年4期
关键词:原始数据神经网络数据挖掘

田春雨

随着信息技术的不断发展,人们对数据处理的要求也越来越高。比如利用其预测未来发展趋势或得到其它有价值的信息等。而这些功能对于传统的数据管理系统往往是做不到的。因为一般的数据库管理系统只提供数据的一些简单处理功能,如果想从中发现数据之间存在的内在联系或发现现其规律,对庞大的数据进行处理是极其困难的。由于数据在日常决策中的重要性变得越来越重要,因此人们希望找到一种可以帮助我们处理大量繁杂数据的方法,进而发现有价值的信息最终为决策服务,同时也可减轻人工处理的负担。

数据挖掘(Data Mining)又译为数据开采。即是从大量的、有噪声的、不完全的、模糊的、随机的数据中,提取隐含在其中的而又是潜在有用的信息及知识的过程。也称之为知识发现(KDD),一直以来,对于“知识发现”和“数据挖掘”这两个术语的使用界限一直很模糊,在1996 年召开的KDD 国际会议上,Fayyd 等对这两个术语进行了定义:KDD是从数据中辨别有效的、新颖的、潜在有用的、最终可理解的模式的过程,指的是数据库中知识发现的全过程,而数据挖掘只是 KDD 过程中的一个特定步骤,它一般分为五个阶段:选择目标数据、预处理数据、转化数据、进行数据挖掘以提取模式和关系、解释并评价发现的结构。

数据挖掘主要是利用特定的知识发現算法,进而从数据中发现相关的知识。它只是 KDD 当中的一个步骤,而人们则经常不严格区分数据挖掘和知识发现,将二者混淆使用。一般情况下,在科研领域中称之为 KDD,而在工程领域则称之为数据挖掘。

人们往住把原始数据看作是形成知识的源泉。而原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化,如文本、图形、图像数据,甚至是分布在网络上的异构数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于数据自身的维护。因此,数据挖掘与计算机科学有关,它涉及到数据库、人工智能、数理统计、机器学习、数据可视化技术、模式识别、神经网络、归纳推理、高性能并行等多个领域,因此它是一门交叉型学科,而其研究内容也非常的广泛。

从不同的角度看,数据挖掘技术可分为以下多种分类方法:

(1)根据挖掘的数据库分类数据挖掘根据数据库类型进行分类,包括:关系型( Relational )、事务型(Transactional)、面向对象型(Objected-Oriented)、主动型(Active)、空间型(Spacial)、时间型(Temporal)、文本型(Textual)、对媒体型(Multimedia)等。

(2)根据所采用技术分类数据挖掘基于所采用技术进行分类,可分为:规则归纳、神经网络、决策树、遗传算法、可视化等。

由此可知,数据挖掘的过程是多个步骤相互连接、反复进行人机交互的过程。

猜你喜欢

原始数据神经网络数据挖掘
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
论航空情报原始数据提交与应用
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
对物理实验测量仪器读数的思考
一本面向中高级读者的数据挖掘好书