APP下载

计算机数据挖掘技术的开发及其应用探究

2016-04-29夏天维

决策与信息·下旬刊 2016年3期
关键词:统计数据分析数据挖掘

夏天维

【摘要】在计算机的功能的不断增加,一些统计学理论也融入其中,在这种情况下出现了数据挖掘技术,在使用云计算,云存储的今天。数据挖掘技术不断进步,为人们解决众多问题,在计算机网络中查找筛选出人们想要知道的信息,这就是数据挖掘。本文分析了计算机数据挖掘技术的应用前景,并对相关技术进行介绍。

【关键词】计算机;数据挖掘;统计;数据分析

计算机数据挖掘技术的出现时间较短,但是应用范围扩展特别迅速,这是一项结合计算机技术和统计学,以及最新的云设施的新技术,所以不能把它简单归类在统计技术或计算机技术中。在信息化时代,信息数量在成几何数字增加,但是对于数据的检索却变得十分困难,原有的搜素引擎只能搜索到小部分数据。但是想要更多的数据就要采用数据挖掘的手段。数据搜索采用多个方面的搜素,首先对信息对象的文件属性,特征查找,然后对信息的不同角度进行处理。

1、统计与计算机

1.1传统的非计算机统计法。传统统计方法属于统计学范畴,包括抽样统计,多元数据分析,以及科学预测等。抽样统计就是在统计数据过于庞大,无法对数据进行全部分析,所以合理选取一些数据进行分析,用抽查的数据表现全面数据的基本情况。多元数据分析是应对计算难度大,含有维数和因子的统计数据。科学预测是利用数学和统计的方法对数据进行科学模型建立,然后对模型进行回归分析,然后计算出未来数据发展趋势。

1.2统计数据可视化技术。可视化技术及结合统计和现代办公软件的一项新技术,是利用表格,图表等把数据直观的表现出来,包括饼图,柱状图,散点图等方法,在日常生活中,股票就是最好的一个应用案例,但是高维的信息数据就比较难表现在原有的图表上面,所以这是要进行创新突破的地方。

1.3数据联机处理。这是利用多个计算机同时处理一个问题的方式,通过计算机相互连接,实现多个数据节点的同时分析。由主计算机分配任务,其他计算机响应主机的要求实现数据分割计算和联系统计的目标,由简单到复杂对数据进行分析计算。

1.4决策树。树状图是由一系列规则的划分为建立基础的,用于各种分类与预测。其算法有ID3、C4.5、CART和CHAID等,目前出现的两种新算法SLIQ和SPRINT,可以由非常大的训练集进行决策树归纳,可以处理分类属性和连续性属性。

1.5计算机神经网络。计算机神经网络是统计学参考医学界对人体神经元的研究,采用计算机技术模拟神经网络的产物,计算机神经网络通常分为三层,输入,输出以及处理单元。这种技术能够完成对数据的调整和计算。并能把计算得出的数据进行收纳整理。

1.6遗传算法。结合生物科学的理论基础,根据数据的结合,突变,和选择等一系列过程让计算机有了智能的学习能力,通过适者生存的理论。把优秀合理的数据组合留下,再接着组成新的数据组合,然后一代一代进行数据优化,最终产生最适合的数据组合。上述计算机数据挖掘技术都是早期开发出来的,不少属于粗集方法或模糊集合方法,从开始就将计算机数据挖掘定位为应用型的,以决策服务为导向,可以说由于数据挖掘的出现极大的降低了决策者的知识储备要求,已经有越来越多的公司不断的对数据挖掘技术投入研究。

2、计算机数据挖掘技术的应用

2.1市场营销方面的应用。用户购买货物的情况可以通过信息管理系统以及POS系统的应用,特别是条形码技术的应用,在零售行业的使用更为普遍,由于搜集到的用户数据越来越多,已经达到了人为不可控制的情况,在市场营销过程中,以搜集到的数据对客户的购物行为、习惯进行分析,总结出其中的特征,对于企业的市场营销能力有很大的提高作用,对于企业的市场竞争力有很大的帮助。对于用户数据的分析只有通过更为高效的数据挖掘技术才能准确的分析顾客的购买取向与兴趣,商业决策才能够更加准确,市场营销上的数据挖掘主要可以分为两类,一是数据库营销,二是货篮分析,前者主要通过交互式查询、模型预测等方法对于潜在的客户进行选择,这也是其主要任务,向潜在的客户推销其产品。

2.2金融投资方面的应用。投资评估与股票交易市场预测是金融分析的典型领域,一般以模型预测法来进行分析,包括统计回归技术等,因为金融投资是一个风险较大的领域,在进行投资前一定要进行各种数据分析,对于各种风险进行有效规避,选择最佳的投资方向。由于事物的发展都有一定的趋势,可以进行预测,从投资评估到股票市场预测,对于数据的分析都可以从中推理出一定的发展情况,对于已有数据进行处理,根据数据之间的关系进行深入挖掘,根据一定的模式进行合理的预测。鉴别潜在的欺诈行为,许多商业银行经常发生的恶意诈骗行为、恶意透支行为,对于银行来说都是非常严重的威胁,预测这些诈骗行为将有助于降低银行的风险,一般采用对比分析正常行为与诈骗行为的方式来鉴别,分析诈骗行为的独特性,对比正常行为与诈骗行为,一旦出现需要警惕的现象时提醒决策人员,目前许多公司都研发了这一类的软件,针对商业银行的欺诈进行评估,对于有风险的交易行为予以探究。对与日渐猖獗的洗钱活动等犯罪,数据挖掘技术都可以极大的提高其预防效果。

2.3其他领域的应用。数据挖掘技术在其他领域也得到很大发展,尤其在半导体领域不断做出贡献,数据挖掘可以在生产过程中检测出有问题的元件,从而保证的产品的质量。同时在电子商务领域也能发挥巨大的作用,在用户浏览,查找数据的速度变得更加迅速,然后结合云计算功能对用户的喜好、用户的需求进行分析,然后适时的向用户推送他们需要的商品,为客户提供了独特个人服务,同时根据用户性格变换与之相符的网站主题。

3、总结

计算机数据挖掘技术是多种学科之间相互融合的产物,它采用统计学和计算机技术为基础,结合现在医学神经网络结构,发展的一种新型技术。数据挖掘让我们对信息处理能力有了显著提高了,同时对市场营销和金融投资方面有重要的意义,另外在税务和虚拟货币方面也取得不小的发展。今后数据挖掘技术将为更多产业带来便捷和实际效益。

参考文献

[1]杨娟,李永辉,赵军.数据挖掘在CRM中的应用研究[J].科技经济市场,2015(12)

猜你喜欢

统计数据分析数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
2008—2015我国健美操科研论文的统计与分析
山东省交通运输投资计划管理信息系统的设计
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
市场经济背景下的会计统计发展探究
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书