APP下载

电子商务大数据分析平台的设计与创建

2021-09-13王宁忆

卫星电视与宽带多媒体 2021年15期
关键词:数据仓库数据分析数据挖掘

【摘要】在计算机技术和大数据技术的不断推广和应用下,电子商务行业在运营期间产生大量的数据,为了从海量数据中提取出有价值的数据,现设计一款功能完善、使用性强大的电子商务大数据分析平台。首先,根据系统功能需求分析情况,完成对系统总体设计。其次,从数据仓库构建功能设计、潜在用户分析功能设计、潜在用户挖掘结果管理功能设计等方面入手,完成系统核心功能的实现。希望通过这次研究,为相关从业者提供有效的借鉴和参考。

【关键词】电子商务;数据挖掘;数据仓库;数据分析

中图分类号:TN92                       文献标识码:A                 DOI:10.12246/j.issn.1673-0348.2021.15.028

在信息时代背景下,电子商务取得了迅猛发展,给人们的日常生活带来了极大的便利,但是,电子商务网站在实际的运行中,经常会出现数据处理效率低、数据分析集成度低等问题,不利于数据的充分利用。而电子商务大数据分析平台的创建和使用可以有效地解决这一问题,通过创建和使用该平台,不仅可以在最短时间快速提取到有价值的数据,还能保证数据处理高效性和针对性,为促进电子商务行业的健康、可持续发展提供重要的平台支持。因此,如何科学创建和使用电子商务大数据分析平台是技术人员必须思考和解决的问题。

1. 系统需求分析

电子商务大数据分析平台除了具有强大的数据仓库构建功能外,还必须具备一定的潜在用户分析功能和潜在用户挖掘结果管理功能,为了实现这一设计目标,现提出电子商务数据存储功能需求、电子商务数据预处理功能需求以及电子商务数据分析应用功能需求,这些功能需求完全符合电子商务大数据分析平台总体设计目标,为高效地分析和挖掘有价值的数据,提高数据利用率打下坚实的基础,同时,也为后期系统核心功能设计提供了相应的指导。

2. 系统总体设计

系统架构设计方案如图1所示。从图1中可以看出,该系统主要采用分层架构设计模式,根据数据分析处理需求,将系统功能模块分配于数据应用层、数据处理层、数据集成层、操作数据层、数据源层等各个层次中,從而将各个功能模块进行有效耦合处理,便于后期技术人员更好地维护和拓展系统功能。

2.1 数据源层

数据源层主要是指将各种类型的原始数据存储于相应的数据库中。现阶段,电子商务系统内部集成了多个子系统,这些子系统均设置有相应的数据库,为后期高效存储和管理数据提供有力的保障。为了提高现有数据资源的利用率,电子商务大数据分析平台要充分利用代理技术,全面获取和整理数据库内部所存储的信息资源,为实现对用户静态数据和动态数据的规范化管理创造良好的条件。

2.2 操作数据层

操作数据层主要用于对各类数据对象的保存。该数据层中包含了大量的原始数据,这些原始数据种类不同,其存储格式和数据结构也存在很大的差异,同时,还包含了大量的冗余无用数据,因此,需要对原始数据进行预处理操作,数据预处理操作主要包含数据清洗、数据转换和数据装载等。

2.3 数据集成层

数据集成层主要用于对潜在用户数据仓库的自动化生成,通过利用该数据层,可以根据用户的个性化使用需求,实现对源数据的统一化处理和整理,为完成对潜在用户数据仓库的构建产生积极的影响。数据集成层核心功能是指根据数据分析处理目标,将各种数据进行分类和汇总,并对网络不同节点信息进行集成化处理,使其集成在同一个节点位置处进行统一化处理。

2.4 数据处理层

数据处理层主要是指根据数据分析情况,选用合适的数据分析方式,以达到高效、科学处理数据的目的。该数据层在具体的运用中,需要借助服务构建模式,完成对数据分析挖掘模块、数据联机处理模块等功能模块的设计,以最大限度地提高源数据处理效率和效果。

2.5 数据应用层

数据应用层作为面向系统用户的数据层,主要包含了客户分析模块、流量趋势预测模块以及网络统计模块等各种模块,通过设计和开发这些功能模块,可以将多个数据处理件进行有效集合和处理,为提高数据分析结果的精确性和真实性,满足用户的多样化使用需求发挥出重要作用。

3. 系统功能设计

为了保证系统功能实现效果,促使系统能够可靠、稳定、安全地运行,技术人员要严格按照如图2所示的系统功能架构设计方案,完成对系统核心功能的设计和开发,以满足用户多样化的使用需求。

3.1 数据仓库构建功能设计

对于潜在用户而言,其数据仓库构建为后期高效地分析和处理数据提供重要的数据支持。潜在用户数据仓库构建主要包含以下几个步骤:(1)确定数据仓库主题。挖掘分析潜在用户数据主要是为了在全面分析静态数据和动态数据的基础上,获得数据最终挖掘结果。其中,静态数据主要是指用户的职业、年龄、性别等信息;动态数据主要是指用户在某一时间段内的网购次数、网购总体花销等信息。这些数据在具体的存储和管理期间,需要突出数据实际应用价值,便于后期快速筛选相关数据。(2)数据准备,为了进一步提高潜在用户数据仓库设计效果,需要从电子商务企业中选用真实的潜在用户挖掘数据,这些数据主要集中于2019年到2021年这一时间范围内。(3)电子商务潜在用户数据仓库建模。构建潜在用户数据仓库主要是指严格按照相关规定和标准,科学提取和整理有价值的数据,因此,在做好数据准备这一环节后,需要从概念模型构建、物理模型构建和逻辑模型构建三个方面出发,完成对潜在用户数据仓库模型的构建。(4)数据预处理。为了提高潜在用户数据处理效果,还要做好对数据的预处理,数据预处理主要包含数据清洗、数据转换以及数据装载等。

3.2 潜在用户分析功能设计

潜在用户分析功能作为系统的重要功能模块,主要是指潜在用户在构建数据仓库的基础上,确定合适的数据挖掘目标,然后,选用不同的主题,将数据挖掘和电子商務进行充分融合,为保证潜在用户数据分析结果的准确性和真实性打下坚实的基础。潜在用户分析功能流程图如图3所示。

从图3中可以看出,为了保证潜在用户分析功能设计效果,技术人员首先要做好对潜在用户挖掘数据模型确定。在这一环节中,需要选用合适的项目集合,然后,利用数据仓库,提取和整理潜在用户信息数据,在此基础上,根据项目数据提取需求,汇总出相应的数值,接着,通过使用关联规则挖掘算法,完成对算法相关参数的设置,最后,根据潜在用户数据挖掘分析需求,确定潜在用户的性别、网购时间、学历、网购频率以及所在地区等信息。其次,要做好对模型预处理及数据提取。在这一环节中,技术人员需要采用布尔化处理方式,将项目数据转换为布尔类型,然后,从相应的主题数据库中全面提取和整理潜在用户的年龄、网购时间、文化程度以及网购频率等信息,为后期更好地挖掘潜在用户提供重要的依据和参考。

3.3 潜在用户挖掘结果管理功能设计

该功能主要是指企业管理人员根据数据最终分析和挖掘结果,不断调整和优化产品的营销策略,从而最大限度地提高营销资源的利用率。该功能在具体的设计中,首先要针对潜在用户分析结果,从选择查看、记录管理等应用中,对最终的结果数据进行处理,然后,针对数据库读写操作情况,生成相应的用户集数据,在此基础上,完成对潜在用户挖掘结果数据的科学汇总、分类和整理,以实现对这些数据的规范化、标准化管理。

在大数据时代背景下,电子商务企业在日常的管理和发展中,数据的分析和处理能力提出了更高的要求,旨在实现重要数据的最大化利用。而电子商务大数据分析平台的创建和使用在提高数据处理效果方面发挥出重要作用,不仅可以快速获取和处理具有多源性的电子商务数据,还能对多种数据处理提供强大的支持,为用户提供了良好的数据分析服务。因此,电子商务大数据分析平台具有非常高的应用价值和应用前景,值得被进一步推广和应用。

参考文献:

[1]陈冰.试论第三方电子商务大数据分析平台的构建与应用[J].湖北开放职业学院学报,2020,33(1):127-128,133.DOI:10.3969/j.issn.2096-711X.2020.01.055.

[2]廖娟,阮运飞.大数据时代电子商务安全与数据分析平台分析[J].电脑知识与技术,2019,15(30):291-292.

[3]彭海静.第三方电子商务大数据分析平台的构建与应用研究[J].电子商务,2017(2):24-25.

[4]邹倩颖,罗岚.电子商务大数据分析综合实践平台建设[J].实验技术与管理,2017,34(11):198-201,209.DOI:10.16791/j.cnki.sjg.2017.11.049.

[5]何迪.第三方电子商务大数据分析平台的构建与应用研究[J].饮食科学,2020,33(5):12-13.DOI:10.3969/j.issn.2096-711X.2020.05.006.

[6]廖衡.电子商务数据分析平台的设计和实现研究[J].信息记录材料,2019,(333):290.DOI:10.3969/j.issn.2310-0036.2019.56.354.

[7]梁灼铭.电子商务数据分析平台的实现[J].环球市场,2020,(22):290.DOI:10.3969/j.issn.1006-0049.2020.22.223.

[8]赵秋霞.基于电子商务大数据分析的指标体系研究[J].商情,2019(4):59.DOI:10.3969/j.issn.1673-4041.2019.04.048.

[9]梁军.移动电子商务平台数据分析和推荐方案研究及设计[D].北京:北京邮电大学,2020,(8):4528.DOI:10.12159/j.issn.2095-6630.2020.08.4372.

[10]孟庆宝.基于大数据的电子商务数据分析平台研究[J].电脑迷,2019,47(6):1415-1420,1496.DOI:10.3969/j.issn.1672-9722.2019.06.028.

作者简介:王宁忆,重庆,职称:助教,学历:硕士研究生,研究方向:大数据技术

猜你喜欢

数据仓库数据分析数据挖掘
基于数据仓库的数据倾斜解决方案研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
数据仓库系统设计与实现
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于R的医学大数据挖掘系统研究
数据复用在存储数据仓库中的运用
数据仓库技术在档案管理领域的应用
一本面向中高级读者的数据挖掘好书