APP下载

数据挖掘技术在家具制造企业电商运营中的应用分析

2018-01-14梁剑瑶贾扬蕾

活力 2018年18期
关键词:Apriori算法关联分析数据挖掘

梁剑瑶 贾扬蕾

【摘要】随着互联网的迅猛发展,越来越多的企业开始重视应用数据挖掘技术研究网上购物、电商运营等策略,家具企业也不例外,本文依托T家具有限公司电商运营数据,运用数据挖掘技术中关联规则Apriori算法来研究店铺产品关联营销,得出分析结论和提出运营建议。通过研究发现产品之间的规律、预测趋势,帮助企业运营者制定精准的销售策略,有利于企业、电子商务健康有序地发展。

【关键词】数据挖掘;家具企业;电子商务:关联分析;Apriori算法

目前,随着家具行业竞争越来越激烈,网络营销已被众多商家所重视,借助电子商务带来的各种便利,国内家具行业的结构正在发生变化,2017年实现销售率增长11.4%,总产值达6500亿元。但同时也存在许多问题,如物流配送、定价、竞争和数据挖掘技术应用等问题。其中,数据挖掘技术由于能对顾客的购买行为和历史的规律进行分析和挖掘,从而定位目标用户群体,实现以顾客为中心的精准营销,已成为家具行业开展网络营销的一大利器。

一、数据挖掘的基本概念

(一)数据挖掘技术的定义

数据挖掘涉及多领域、多学科,华人数据挖掘专家韩家炜认为:数据挖掘,就是从大量的数据之中挖掘出潜在的、有真正意义的、有价值的、存在某种联系的知识。它主要通过对原来的数据进行分析,进行统计整理,挖掘出隐含的有价值的信息,为管理人员决策提供一定的参考建议,是一个制定决策时需经历的一个过程。

(二)数据挖掘的步骤

数据准备;数据清理;数据集成;数据选择;数据变换;数据挖掘;模式评估;知识表示。

(三)数据挖掘的对象

数据挖掘的对象包括一些文本、多媒体数据、Web数据、时序数据等,当然还包括各种类型的数据源、关系数据库及数据仓库等,这些数据既可以是结构化的,也可以半结构化的。

二、数据挖掘技术在家具制造企业电商运营中的应用分析

(一)关联分析基本概念及Apriori算法

关联分析主要是通过数据分析来找出变量之间的潜在规则,研究两个及以上事务之间一起出现的频率,得出变量之间隐藏的某种联系。它主要是研究消费者与商品之间的关系,其有利于制定商品销售计划,可以提高消费者的购买效率和服务质量。

事务是简单关联规则的处理对象。事务标识符( TID)和项目集合X是事务(T)的两个组成部分。有效的规则支持度和有效的规则置信度是关联规则的衡量标准。

1.規则支持度

它衡量了简单关联规则的广泛性,指出了项目X和项目Y同时出现的可能性,可以表示为:

Sx。y-IT(Xf-lY) / T

(1)

在公式(i)中,T表示事物的总数,如果规则支持度太低,则表示其不常出现。

2.规则置信度

它测量了简单关联规则是否准确,表明事务同时包含X和Y,在X出现后Y出现的可能性有多大。

C.- y=lT(XCIY) / T(X)

(2)

在公式(2)中,T(X)为项目X事务数,T(X n Y)为同时包括项目X、Y的事务数。如果置信度高,这意味着当X已经出现时,Y出现的条件概率更高。

通常,关联规则强有高信任度和高支持度这两个特点。关联规则弱表现为规则支持高而置信度低。如果规则的置信度高而支持度低,则说明这个规则不是很可信。

3.项集

事务表il-变量值和项集所包罗的具体项目。

4.频繁项集

支持度(S)大于等于给定的范围的项集。

Apriori算法是关联规则算法中被人们广泛应用的算法。而寻找频繁项集和凭借频繁项集产生简单关联规则主要是它的两个主要部分。

该算法主要通过自下而上寻找频繁集,先从数量少的项目的项集开始搜索,然后依次向多个项目的项集搜索,层层递进,范围是整个数据库,通过寻找支持度最小的项,并记录每项的数目,然后整理出频繁第1项集,即L1,然后根据L1用同样原理找出L2,以此类推,直到找出频繁第K项集,即LK。

(二)数据准备

T家具公司主要销售床垫,将床垫主要分为乳胶床垫、透气网床垫、按摩床垫、棕榈床垫、亲水棉床垫、有氧棉床垫、环保棕床垫这七种,将该公司销售数据进行整理。

(三)分析过程及结果

家具电商运营销售的淡旺季、节假日销量较大,还有一些特殊时期如3、4、6、7月的家具展会,也属于旺季。

进行关联分析,找出频繁规则,并将同时购买的几款产品进行标记,通过整理,将所需项目集整理出来,方便运用Apriori算法进行分析。

这里的前提条件为最小支持度和最小置信度分别为5 0%和70%。

分析步骤:1.扫描表2-1中的数据,得到候选频繁第1项目集CI:f环保棕床垫},{有氧棉床垫),{亲水棉床垫},{按摩床垫},{透气网床垫}。算出CI中每个项目集的支持度。每个项目的支持数和总项目集数可由表2—1得出。总项目集数为4。

由于初始假设的最小支持度为5 0%,并且观察表2—2巾的支持度,得频繁第1项目集L1:{环保棕床垫),{有氧棉床垫),{亲水棉床垫),{透气网床垫}。

2.然后根据L1得出候选频繁第2项目集C2:{环保棕床垫,有氧棉床垫},{环保棕床垫,亲水棉床垫),{环保棕床垫,透气网床垫},{有氧棉床垫,亲水棉床垫},{有氧棉床垫,透气网床垫},{亲水棉床垫,透气网床垫}。

3.同样算出C2中每个项目集的支持度。与(2)中的计算方法相同。

4.以此类推,频繁第3项目集L3为f环保棕床垫,有氧棉床垫,亲水棉床垫,。则所有的频繁项目集如表2-3所示。

5.现在选取一个频繁项目集如f环保棕床垫,有氧棉床垫,亲水棉床垫},来计算这个项目集所有非真子集之间的置信度。

观察表2-4并结合最小置信度为70%,能够知道,最后两个为频繁关联规则,也就是{环保棕床垫,亲水棉床垫}一>{有氧棉床垫),{有氧棉床垫,亲水棉床垫}—>{环保棕床垫}为。这表明买环保棕床垫和亲水棉床垫的同时肯定会买有氧棉床垫,买有氧棉床垫和亲水棉床垫的同时也是会买环保棕床垫。

通过以上的分析,可以给该家具电商运营提出一些建议:

第一,在一些特殊日期,如双十一、五一、十一,网上店铺经营者可以将有频繁关联规则的产品进行促销活动,吸引消费者。

第二,网上店铺里上传有频繁关联规则的产品,做关联营销,放在网上店铺首页顶端,吸引消费者,提高购买率。如环保棕床垫、亲水棉床垫和有氧棉床垫。

第三,店铺里的一些关联规则不强的其他产品,如环保棕床垫和透气网床垫,按摩床垫和亲水棉床垫等,可以采用新品推荐、低价促销等形式进行销售,放在其他关联规则强的产品详情之后或首贞的末端。

第四,而对于一些新产品,可以和一些产品如具有强关联规则的产品,往集中或组合形式方向去制定销售策略,这样可以有效推广新产品,降低推广费用的同时也能引起消费者的兴趣,提高消费者转化率和购买率。

(四)运营建议

1.产品摆放运营策略

将频繁关联规则的产品放在店铺首页顶端和前端,方便消费者浏览,提高消费者在店铺停留时间,有利于提高转化率,将弱關联规则的产品放在页面的尾端或者放在店铺推荐页面,用其他方式如促销活动向消费者推荐购买,

将强关联规则产品进行分组,分组后的产品可以按照关联规则的强弱分组摆放在店铺的各个位置。根据不同产品组成的不一样的关联营销,进行互相推荐,将消费者吸引到不一样的产品组合销售页面,分流,充分利用消费者进行产品推广。

2.产品规划运营策略

企业可以根据产品的关联性不同制定不同的销售策略。

(1)频繁关联产品营销策略:可以选择组合套餐降价方式的营销策略,或者更多推荐的营销策略,并呼吁购买越多,优惠就越大。

(2)弱关联产品营销策略:采用新品推荐、低价促销、热销产品、猜你喜欢等策略。

①新品推荐:新产品用特价优惠吸引消费者,刺激他们的购买欲望,提高购买率。

②低价促销:强调物美价廉,性价比高,价格比平常低,抓住消费者喜欢小便宜的心理,吸引更多消费者购买。

③热销产品:利用从众心理,向消费者推荐店铺中销量高的产品,用销售数量做保证,证明产品值得购买,提高转化购买率和销售订单的数量。

④猜你喜欢:通过分析掌握消费者的购买喜好,购买特点,向他们推荐符合他们要求的产品。

3.店铺推广运营策略

网络营销推广已经成为不可或缺的关键部分,通过微信/微博营销、SEO搜索引擎推广、直通车营销等方式,提高店铺的曝光率。同时,通过买几送几、第二件优惠打折等活动,吸引更多消费者,提高销售数量和其营业额。通过老客户大优惠、会员优惠等方式来提高老客户的忠诚度,并吸引更多新客户,吸引更多回头客的同时也能够提高转化率,并结合特价销售、送优惠券、买赠折扣、收藏有礼等促销活动,吸引更多消费者来购买。

关联规则在家具制造企业电子商务运营中的应用,能够有效帮助消费者购买其喜欢且价格合适的商品,吸引更多消费者,提高转化购买率,提高销售率和营业总额,从而提高店铺运营利润率。总之,企业运用数据挖掘技术,能迎合市场和消费者需求,及时调整营销策略,进行针对性营销,降低有可能损失的费用。

猜你喜欢

Apriori算法关联分析数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于Hadoop平台的并行DHP数据分析方法
基于随机函数Petri网的系统动力学关联分析模型
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
关联分析技术在学生成绩分析中的应用
基于云平台MapReduce的Apriori算法研究
关联规则挖掘Apriori算法的一种改进
基于R的医学大数据挖掘系统研究
基于关联分析的学生活动参与度与高校社团管理实证研究