APP下载

基于数据仓库的网络商店决策支持系统研究

2012-04-16程丽丽

电脑与电信 2012年5期
关键词:数据仓库商店粒度

程丽丽

(台州职业技术学院,浙江台州318000)

1.研究背景

随着计算机网络技术和数据库技术的高速发展,为网络商店的繁盛提供了技术的支持、交易的平台和丰富的资源。网络商店已经由小规模不断发展为大规模,而传统的网络商店的人工管理方式,已经无法适应快速发展的需求。越来越多的网络商店考虑使用电子化的信息管理系统来代替人工管理方式,提高运营效率,增加收益。

传统的信息管理系统中数据库技术的应用往往将关注的重点放在如何进行日常业务的处理、如何实现数据的收集、查询、存储、统计、处理等功能,更多的是数据事务系统。随着网络商店的数量不断递增,规模不断扩大,对系统的要求不是仅局限于数据的一般事务处理,而是如何借助系统,把原始的销售经营数据转化为网络商店决策支持的价值信息,获取最大的竞争优势,抢占市场。

数据仓库技术的应用则能够解决目前网络商店经营者思考的问题,弥补传统的数据库技术在分析应用、决策支持上的缺陷[1],快速、准确、高效地从大量的历史数据、报表、单据中萃取信息,获得知识。数据仓库是研究和解决从数据库中获取信息的问题,是决策支持系统和联机分析应用数据源的结构化数据环境,它的特点是面向主题的、集成的、稳定的和时变的[2]。数据仓库是分析系统的数据平台,为用户提供分析和决策的支持,把有价值的分析数据从事务处理环境中提取出来进行重新组织,同时建立分析处理的环境[3]。

2.数据仓库在网络商店中的应用

目前网络商店数量急速增加,经营者与客户是一种距离交易方式,这和实体店的面对面交易方式有很大的不同,提高网店的点击率、吸引顾客的眼球、获得良好的信誉评价、提高网店的等级等等都是网店经营者所关心的问题。如何将利益最大化、如何摸清市场需求、如何组织销售行为、如何控制库存、如何寻找最优供应商、如何分析客户群等等都成为了经营者亟待解决的问题。

数据仓库可以保证对业务数据的便捷访问,解决负责的问题。通过对大量原始数据的分析,帮助网络商店经营者解决最关心、最敏感的问题,这些问题中可能是如何选择商品打造爆款、热销款;如何对商品进行布局设计、组合设计,以提高销量;如何控制库存,保证爆款热销商品的有效供应,如何对滞销商品进行库存清仓;如何对市场需求进行预测,保证商品采购的合理提前期;如何对商品评价结果进行分析,寻找客户最关心的问题,并解决问题。

这些问题,可以通过建立基于数据仓库的网络商店决策支持系统,利用数据挖掘技术,获得有价值的决策信息,在日益激烈的网络商店竞争中脱颖而出。

3.基于数据仓库系统结构构建

数据仓库是在原有的数据库系统的基础上,利用抽取、转换、装载等方法去分析、集成和挖掘现有的数据资源,为管理者提供决策支持[4]。数据仓库体系结构由三部分组成,分别是数据获取、数据存储管理和数据展现,基于数据仓库的网络商店决策支持系统体系结构如图1。

在该三层结构中,我们把它分为四个部分,分别为:处理对象、核心构件、手段方法、工具。

(1)处理对象。也就是数据源,数据源作为该系统的处理对象,是整个系统数据的源泉。一般分为企业的内部信息和外部信息,在这里数据源主要包括:计划信息、销售信息、库存信息、采购信息、物流信息、客户信息、供应商信息和评价、流量信息等。

(2)核心构件。数据仓库是整个系统的核心部分。其关键在于对数据进行存储和管理。数据仓库的组织方式与传统的数据库有所不同,它能够决定对外部数据的表现形式[5]。要选择产品和技术来建立数据仓库,需要从数据仓库技术特点入手,对现有的业务系统的数据进行抽取、清理,并有效集成。

(3)手段方法。借助数据挖掘和联机分析,联机分析主要是对需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势[6]。数据挖掘主要是面向具体的应用,并不是简单的数据处理和操作,它能够为某一个具体的应用寻找可行的、合理的方案,为各级决策者提供支持,提高效益,节约成本。

(4)工具。工具主要是指前端工具,主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具[7]。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

基于数据仓库的系统结构主要采用了自底向上的开发模式,由数据驱动,以技术支撑,满足应用需求,逐渐完善的开发过程,可根据用户的反馈信息调整应用需求。

4.数据仓库模型设计与实现

数据仓库是面向主题的、集成的、随时间不断变化的数据集合,对库存信息、采购信息、物流信息、客户信息、供应商信息、评价流量信息等业务数据进行重组。

4.1 数据源分析

对于网络商店数据仓库来讲,其主要数据源有两个:一个是来源于网络商店的外部,例如:物流信息、客户信息、供应商信息、评价流量信息,这些信息对于网络商店来讲一般是只读的;另一个是来源于网络商店内部,例如:计划信息、销售信息、库存信息、采购信息等,这些数据来源于不同的对象,如电子商务平台、网络商店管理系统等。

4.2 维度设计

网络商店数据仓库的维度设计,从供应链的角度来看,其维度设计如下表1。

表1 维度设计表

在这些维度项中,可以将2个或2个以上的维护组合,分析出可供决策的信息。例如,时间维可和商品维进行组合分析,得出某种商品的销售、库存、采购的变化。再如,商品维、时间维和流量维组合分析,得出某种商品的流量变化等等。可以为网络商店管理者提供某种商品的销售预测情况,提供决策支持。

4.3 粒度设计

粒度是数据仓库中数据单元的细节程度或综合程度的级别。它可以对数据或数据综合所使用的时间段参数进行记录,决定了数据仓库中所存储的数据在时间上的级别和详细程度。

在进行粒度设计时数据可以是最原始的数据(关注细节的),也可以是汇总数据,例如1周的、1月的、1季度的、半年的、1年的等等。数据的粒度随着时间跨度的增大而逐渐变粗。时间细化程度越高,粒度越小,时间细化程度越低,粒度越大。

针对网络商店自身的特点,将销售分析、库存分析、采购分析问题中的粒度进行如下表2划分。

表2 粒度设计表

4.4 多维数据模型设计

多维数据模型由多维数据结构和多维数据操作组成。多维数据模型是由星形模型、雪花模型和星座模型构建,它是OLAP的逻辑模型。通过维度设计,寻找需要观察的特定角度,而每一个维的粒度就是维的层次数。维中的成员就代表该维上的一个确定取值。以时间维为例,其粒度有日期、周数、月份、季度、年、节假日。月份粒度上有1到12个月,季度有1到4季度。再如在商品维上粒度商品类别有新品、折扣品、清仓品等。多维数据模型多采用多维数组的表现形式:(维1,维2,维3……,维n,变量)。

在基于数据仓库的网络商店决策支持系统中,将主题分为三个:销售主题、仓库主题、采购主题,其星型模型如下图2。

5.数据挖掘、分析、输出

在基于数据仓库的网络商店决策支持系统体系结构中前台工具可以提供报表生成工具,借助诸如交互式窗口、联机帮助、向导式界面等方式,帮助用户定义各种复杂的报表,实现多维分析、随机查询、统计分析等功能,在满足现有数据源的基础上,为不同决策层提供相对有价值数据的提取、转换、展现[8]。通过数据分析展现工具对数据仓库中的数据进行挖掘和多维分析、汇总,并以报表、图表、交互式界面的形式展现给决策者,决策者可以很直观地看到分析的结果。针对用户的不同对工具进行合理选择,可以对可变报表、固定报表进行在线分析处理。

数据仓库可以有效地弥补传统数据库在分析型应用上的缺陷,从历史数据中获取有价值的信息。利用数据挖掘技术解决网络商店管理过程中有关决策支持方面的诸多问题。

第一,商品的摆放、搭配。在这里可以选择商品销售活动(促销)为维度对销售主题进行分析,将商品的摆放、搭配放在一起。也可以选择时间作为维度对销售主题进行分析,将同一段时间内,销售量相似的商品摆放、搭配在一起,并可考虑参加相同的销售活动。

第二,爆款商品的选择。可以通过改进的BP算法、聚类算法对同一个时间段内的商品销售量进行分析,找出畅销商品和滞销商品,分析商品的发展规律,对市场的变化进行分析,选择顺应市场变化的商品,并对爆款商品进行挖掘、开发、设计、打造,同时控制滞销商品。

第三,商品销售活动(促销)策略选择。可借助决策树、因果图的方法分析购买某种商品的客户行为,根据其购买行为对客户群进行分组、针对客户的属性,例如,性别、年龄等有针对性地策划广告和促销活动。也可针对商品在某一时间段内的销售情况或商品本身的属性,设计促销活动。例如,对于大单客户可设计赠送会员卡、积分等方式,刺激这类客户的二次甚至多次消费。对于新客户,可设计赠送小礼品等方式。提高网店的浏览量和人气。

第四,销售预测。可选择时间维,对商品的销售情况进行分析,爆款商品保证库存充足,滞销商品采取促销活动,清空库存。并根据市场需求情况进行预测,提前补足库存,提前设计促销活动。

第五,库存动态控制。选择时间作为库存监控的维度,分析库存随时间的变化情况。计算商品的安全库存、最大库存,通过库存动态控制保证资金的最大程度流通。

第六,采购分析。这里采购分析包含供应商选择,商品询价,成本计算等等。建立供应商评估体系,结合时间维度变化、商品维度变化对供应商选择进行支持。

6.结语

在目前激烈的网络商店竞争环境中,建立基于数据仓库的决策支持系统,对数据进行挖掘、分析,为管理者提供快速、高效、方便、准确的决策支持。通过对源数据库的数据进行抽取、转换后装载到数据仓库中去。本文对基于数据仓库的网络商店决策支持系统进行研究,构建其体系结构。同时对维度、粒度、多维数据模型进行设计,实现数据仓库建模。提供一个信息集成和决策的平台,实现对信息进行联机分析处理,构建数据分析环境,将原始的经营数据转化为商业决策信息,获取竞争优势。

[1]王柳靖,黎勇,王一川.基于内容管理的烟草企业信息仓库系统[J].计算机工程,2010,36(23):40-43,46.

[2]张波,耿在丹,杜保强.基于数据仓库的学生信息管理决策系统[J].实验室研究与探索,2009,(12):59-62.

[3]马刚,刘天时,程国建.基于数据仓库技术的医院信息系统应用研究[J].西安石油大学学报(自然科学),2010,(7):99-102.

[4]李洁,杨金会,滕振芳.数据仓库及数据挖掘技术在超市中的应用[J].吉林工程技术师范学院学报,2010(2):248-250.

[5]王炳雪,陈元忠.基于模糊逻辑的多维时序软关联规则挖掘[J].计算机工程,2011,37(10):35-37.

[6]谭锋奇,李洪奇,孟照旭等.数据挖掘方法在石油勘探开发中的应用研究[J].石油地球物理勘探,2010,(1):85-91.

[7]魏德志,洪联系,林丽娜等.一种基于HGA和数据挖掘的AMG模型[J].计算机工程,2012,38(7):99-101.

[8]张维群.数据挖掘研究和应用的现状与前景[J].统计与信息论坛,2004,(01):95-96.

猜你喜欢

数据仓库商店粒度
“剧场”商店
粉末粒度对纯Re坯显微组织与力学性能的影响
基于数据仓库的数据倾斜解决方案研究
天边的白云商店
基于数据仓库的住房城乡建设信息系统整合研究
逛玩具商店
无名火
基于粒度矩阵的程度多粒度粗糙集粒度约简
探析电力系统调度中数据仓库技术的应用
双粒度混合烧结矿颗粒填充床压降实验