APP下载

Python cufflinks动态数据可视化在电商运营中的应用

2020-09-15罗博炜

计算机时代 2020年8期
关键词:商业智能数据可视化

摘要:对数据进行高效的分析挖掘并可视化地展现其背后潜藏的商业价值在今天显得尤为重要,拥有丰富的工具包与活跃开源社区的Python是许多商业数据分析者的首选。文章介绍了利用Python的cufflinks库来实现动态可视化绘图,使得对电商运营的监控与决策更为直观、清晰和及时。

关键词:商业智能;数据可视化;Python;cufflinks

中图分类号:TP3-05 文献标识码:A 文章编号:1006-8228(2020)08-72-03

0 引言

互联网时代电商的崛起,使零售行业的竞争变得越来越激烈,线上线下结合已成为企业运营的方向和潮流。为了洞悉零售与电商的运营,传统的财务报表管理已不适应潮流,需要更精细直观的数据化管理。经济学中最经典的概念“看不见的手”正在被另外一个更加重要的概念“看得见的数据”所替代。合理高效的分析,挖掘与可视化数据,对企业掌握市场环境、营销流量,运营管理等很有帮助[1],这也将最大程度上实现数据与商业的赋能。随着近年来商业智能(Businesslntelligence,以下简称BI)的崛起,Python语言在网络爬虫,机器学习,数据可视化等领域的价值日渐增长[2]。

1 Python中的动态数据可视化工具

Python的Matplotlib与Seaborn两个绘图库可绘制精美的静态可视化图片。但对于要求较高的时间序列类型的绘图,静态的数据可视化绘图已无法很好的满足精细化时段的查看与同步分析。Bokeh,pyecharts与Plotly是实现动态数据可视化的几大常用Python库,其中Plotly是一个用于Python的交互式、基于浏览器的高级声明式绘图库,它拥有所有Python绘图库中最全的API和最强大的交互工具,支持科学、统计学、金融、地理、3D等多个领域多种样式的图表,被广泛应用于印刷出版物和创建网站。pyecharts则是由百度开源的数据可视化Echarts与Python语言结合而来,亦能很好的实现常见的动态图表并将其部署至主流的Web框架中。但美中不足的是,这几大常用的Python库都存在可视化代码冗长和需要比较繁琐的额外函数来进行绘图的缺点。作为Plotly的包装器,Cufflinks通过将所有的绘图方法都封装到类似Pandas绘图对象的plot0方法iplot0中,很好的解决了这个问题,但它却常常被人忽略。本文结合常见的商务案例,采用Python的Cufflinks实现了仅用一行代码就能画出简洁、美观、多样的交互式图表。

2 利用Python的cufflinks库进行数据可视化

周权重指数是以某段销售周期内的历史日销售额数据为基础,以周为单位,进行权重分析处理的一种管理工具,它是一个相对概念,每个企业都不尽相同,一般介于7.0-14.0之間。值越大表示该企业或者店铺的日销售额波动幅度越大。周权重指数是零售店铺用来量化各种销售状况、销售事件的管理工具,非常强大。单位权重值则是日销售除以日权重指数的结果,该指标解决了“时间标准”没有可对比性的原则(如周一与周六的销售额对比),如果一个零售店铺的每日销售额是绝对服从周权重指数的规律,那对应的权重曲线则将是一条绝对的水平直线,但是这种情况根本不可能出现,所以正常的权重值曲线是一条围绕某个值变化的曲线,正是这种变化给我们提供了去洞悉某些营运现象的可能[1]。

本例的数据集为2019年8月广州某服装店的销售数据,经过清洗与处理后再使用Python的cufflinks库来来进行动态可视化,可实现及时直观监控异常销售情况。

2.1 数据预览

案例数据集中的部分数据见表1。

2.2 代码实现与绘图结果

两家店铺的权重值曲线的时间序列折线图的绘制代码如下,结果如图1和图2所示。

#注释:绘制折线图与箱型图 df.iplot(kind=line,x=[时间】,y=['店铺1权重值曲线,

店铺2日权重值曲线】,colors=['blue,green'l) df.iplot(kind='box,y=[店铺1权重值曲线,店铺2日权重值

曲线】,legend=False,title=两店铺该月每日权重值分布)

2.3 代码分析

Python的Cufflinks代码简洁,与Python中的Pandas绘图非常类似,在iplot0函数中添加的参数与pandas中的plot绘图方式大同小异,但cufflinks的成图在解决常见的中文横纵坐标显示及图片样式背景问题的同时还可根据鼠标的拖动而显示横坐标对应的动态数值,更方便查看指定日期的对应数值,另外,图示右上角的功能区还可实现时间段的选择并缩放(即查看具体的时间段),一键下载与横纵坐标的调整,功能齐全并兼具了高级美感,图示右下角的转换功能还可实现一键转Plotly绘图并部署至Web框架中[3]。

2.4 图片结果分析

从上面的折线图可以看出,八月份大部分的时间两家店铺的单位权重曲线都比较平稳,并未出现频繁波动。但店铺1出现了较为明显的月末踩刹车现象(零售业专业术语),原因可能是:①店铺已经或即将完成了当月的目标,员工心态上出现了松懈;②员工们担心本月销售额完成得过多将导致下月目标被拔高,进而有意识或无意识的放松了心态;③发现月底目标无法达成于是破罐破摔的踩刹车;④店铺员工藏匿销售,本该本月录入系统的销售,人为转移到下月初才录入系统。反观店铺2,则出现了明显的月初放松现象,原因可能为:①上月末拼得太凶,本月初习惯性地心态放松几天;②上月末有虚增销售额的现象,本月初将虚增部分做退货处理。总而言之,无论是月初放松还是月末踩刹车,抑或是月中出现上述的两种现象,都会对销售的最大化造成伤害。通过直观清晰的动态可视化绘图,相关管理者可以及时发现问题,商讨解决方案。

3 结束语

数据可视化的本质在于将数据以图形化的方式呈现,让观众有视觉化思考的能力,放在若干年前,其实就是EXCEL与PPT的结合。但随着相关技术的成熟和人们对阅读体验的需求更新,大量的数据可视化工具应运而生。数据可视化的需求场景中,一种是“看”,即主要作用是展示汇报,是信息的获取,让管理者、营运者、业务人员更好的获取相关信息;另一种是“用”,主要目的在于交互管理,是数据的应用。越来越多的信息系统中加入了数据可视化的内容,给应用程序带来了很大的易用性和可理解性。但是对不同领域的数据进行可视化展示时,图表设计往往与领域数据相结合,无法独立出来,带来了大量重复性工作。在用传统的可视化开发工具时,人们需要花费大量精力来编写程序,影响了系统的开发效率。针对这一问题,本文提出的Pythoncufflinks库方法可用十分简洁且易于理解的语句实现动态数据可视化展示,并将其应用到商业智能领域中数据的前端展示。在熟悉常用的图形与绘图方式后,还可根据企业或个人需求开发成动态数据可视化模板,并将其单独封装在自己定制的Python库中,只需根据需求添加或修改部分参数,便可又好又快的实现大量复杂的绘图操作。

参考文献(References):

[1]黄承明.数据化管理[M].电子工业出版社,2014.

[2]王媛媛.B/S模式下数据可视化研究及其在商业智能中的应用[D].河北工业大学,2007.

[3]罗博炜.基于Plrthon的数据可视化[J|.信息记录材料,2019.12:72-74.

★基金项目:本文获广东省高校高等教育教学改革项目“基于双螺旋结构模型的创新创业协同育人机制探索与实践”( GDJX2017011);五邑大学2019年度省级大学生创新训练项目(S201911349055)

作者简介:罗博炜(1998-),男,江西人,本科,主要研究方向:大数据分析。

猜你喜欢

商业智能数据可视化
什么是商业智能?它的定义和解决方案
可视化:新媒体语境下的数据、叙事与设计研究
关于实时商业智能的文献综述
我国数据新闻的发展困境与策略研究
广东省高速公路联网综合信息商业智能系统
浅谈中小企业的商业智能之路