APP下载

大数据背景下企业数据挖掘技术的应用研究

2017-09-18万晓燕陈姗刘汝元毕军涛

魅力中国 2017年11期
关键词:数据挖掘大数据企业

万晓燕 陈姗 刘汝元 毕军涛

摘要:大数据时代,企业能够进行精准决策、营销,关键还是数据分析,而其中最为重要的就是数据挖掘。本文对数据挖掘技术进行了简单分析,同时结合相关案例分析了数据挖掘技术在企业当中的应用步骤和成效,仅供参考。

关键词:大数据;数据挖掘;企业

自进入大数据时代以来,各个领域的大数据呈现飞速发展态势,数据采集、样本分析、图像识别、智能可穿戴设备等等纷纷面向大众。对于企业来说数据已经成为重要的资产,越来越多的企业开始重视对大数据的分析与利用,根据贝恩咨询公司的调研报告,其所调研的企业当中有超过400家年营业额5亿美元以上的企业,其中约60%的企业正在布局大数据,表明大数据已经走下神坛,逐步成为企业常规化的决策工具,其中的核心要点就是数据挖掘技术,这是实现大数据分析的前提。

一、数据挖掘技术

数据挖掘算法是大数据分析的核心部分,要科学表现大数据的特点就需要针对这些数据的类型及格式制定相应的算法。这些算法可以说是基于统计学的统计方法,也只有这样,挖掘出来的数据才具有公认的价值。同时数据挖掘算法是快速处理数据的关键,若一个算法需要很长时间才能获得结论,那么大数据的价值也就无从谈起。数据挖掘的主体没有限制,主要是将现有数据通过数据挖掘算法进行预测性分析,进行一些高级别的数据分析,可利用Mahout工具实现,比较典型的算法有SVM、Kmeans等。

从世界范围来看,数据挖掘技术已经十分成熟,对于一个企业,如果云平台架构能力强,能够将获取的数据实时传递到云端,再从云端向用户群体推送,这可以说是大数据时代下企业的新一种核心竞争力。事实上当前摆在企业面前的是一座数据金山,数据挖掘能力就成为企业另一个重要竞争力,并且挖掘能力是衡量企业业务水平高低的重要指标,通过数据挖掘以及数据分析抓住用户重点,只有这样才能实现大数据的真正价值,下文列举一些比较常用的数据挖掘方法。

MBR(Memory-Based Reasoning)这种方法就是利用已知case(案例)来预测未来case的一些attribute(属性),并一般寻找最为相似的案例来比较。主要的核心就是记忆基础推理法,涵盖距离函数和结合函数,前者旨在找到最相似案例,后者则将相似案例属性结合起来,以便预测分析时使用。该方法的优点在于能够容许各种型态的数据,且不需要服從某些假设,而且具备自学习能力,能够凭借旧案例的学习来获取关于新案例的知识,当然需要大量历史数据的支撑。处理速率上比较费时,效率不是很高,在欺骗行为侦测、预测客户反应、医学诊疗等方面应用有较强应用前景。

Decision Tree(决策树),这在解决归类与预测上能力极强,通过一系列的问题组成法则并表达出来,然后经过不断询问问题导出所需的结果。典型的决策树顶端是一个树根,底部拥有许多树叶,记录分解成不同的子集,每个子集可能包含一个简单法则。

Cluster Detection(聚类分析),该技术拥有相当广泛的范围,涵盖基因算法、类神经网络、统计学中的群集分析,主要是找出数据当中以前未知的相似群体,刚开始均在群集侦测技术但中运用,作为研究的开端。

除上述方法外还有遗传算法、OLAP分析、神经网络、判别分析、购物篮分析等等,在此不做一一介绍。

二、数据挖掘实践

数据挖掘最主要的作用就是为决策提供支撑,某企业ERP系统积累一定业务数据,具备了实施大数据决策的前提条件,对于领导或是管理层来说,关键还是要从业务数据当中挖掘、分析数据,提取信息进而支撑决策。所以在运营过程当中构建起统一的数据平台,实现数据的集成和共享,为企业决策提供技术支撑。

该企业基于市场风险、信用风险以及内部控制,建立起风险管理系统,整合现有风险控制,形成风控战略能力,建立起KRI(关键风险管理指标)、风险分析、风险组合管理、风险保管等,极大提升了企业风险管理水平。并在统一平台下实现业务中心、各部门不同层次的风控要求,满足不同的业务需求。对该企业市场、信用以及仓储三个方面的风险控制提供了极大助力,同时强大的开放性便于后续的扩展深化。具体而言就是建立风控计量模型,基于历史数据以及数据挖掘算法,针对模型进行调整优化,实现量化监控、预测分析以及自动预警。

一般来说企业进行数据挖掘主要遵循以下流程——准备数据,即收集数据并进行积累,此时企业就需要知道其所需要的是什么样的数据,并通过分类、编辑、清洗、预处理得到客观明确的目标数据。数据挖掘这是最为关键的步骤,主要是针对预处理后的数据进行进一步的挖掘,取得更加客观准确的数据,方能引入决策之中,不同的企业可能采取的数据挖掘技术不同,但在当前来看暂时脱离不了上述的挖掘方法。当然随着技术的进步,大数据必定会进一步成为企业的立身之本,在当前已经在很多领域得以应用。如市场营销,这是数据挖掘应用最早的领域,旨在挖掘用户消费习惯,分析用户消费特征进而进行精准营销。就以令人深恶痛绝的弹窗广告来说,当消费者有网购习惯并在网络上搜索喜爱的产品,当再一次进行搜索时,就会弹出很多针对消费者消费习惯的商品。

三、结束语

大数据时代下,数据已经成为企业重要的资产,而企业要真正发挥出大数据的价值,关键还是要靠数据挖掘技术,找到最精确的信息数据,帮助企业进行决策或是进行精准的市场营销。当然对于企业来说,要真正实现大数据还需要走很长的一段路,但不可否认的是运用大数据还是要依靠数据挖掘技术。

(作者单位:青岛酒店管理职业技术学院)endprint

猜你喜欢

数据挖掘大数据企业
2018上海企业100强
数据挖掘综述
软件工程领域中的异常数据挖掘算法
2016,中国企业500强发布
基于大数据背景下的智慧城市建设研究
基于R的医学大数据挖掘系统研究
新申请企业一经受理便预披露
新申请企业一经受理便预披露
企业名片Enterprises Card
一本面向中高级读者的数据挖掘好书