APP下载

基于云计算MapReduce的并行关联规则算法改进研究

2017-07-29邓宗强

电脑知识与技术 2017年12期
关键词:Apriori算法云计算数据挖掘

邓宗强

摘要:关联规则是数据挖掘的重要方法之一,但传统的关联规则算法Apriori需要多次扫描数据库,需要很大的I/O开销,不能处理节点失效和负载均衡。云计算下的MapReduce模型能够处理节点失效并能做到负载均衡。将传统的关联规则算法Apriori进行改进,然后移植到Hadoop平台,提出了基于MapReduce编程的数據挖掘算法,它能高效的、并行的完成海量数据挖掘任务。通过实验验证了算法的有效性。

关键词:云计算;数据挖掘;Apriori算法;MapReduce

猜你喜欢

Apriori算法云计算数据挖掘
基于并行计算的大数据挖掘在电网中的应用
基于Hadoop平台的并行DHP数据分析方法
实验云:理论教学与实验教学深度融合的助推器
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究