APP下载

销量预测的文献计量学分析和可视化

2021-04-09薇,张

关键词:销量神经网络期刊

陈 薇,张 莉

(北京信息科技大学 信息管理学院,北京 100192)

0 引言

销售预测作为规划公司运营各个阶段的基础,以各种方式极大地影响着零售商和其他供应链上的成员,是动态市场需求下供应链管理的关键任务。有效的销售预测有助于进行合理的库存控制,改善供应链绩效,降低总体成本。在全球竞争日益激烈的环境下,为降低成本、提高竞争力,销量预测获得了持续的关注。近年来,大数据技术的发展推动着各行业快速生成大量多源异构的数据,如在线评论、网页浏览点击率等,使得消费者在进行购买决策时可以考虑在线口碑、网络搜索工具等更多因素,意味着不断有新的因素影响着销量的波动。这给销量预测带来机会的同时也带来了挑战。因此,有必要总结、探索和探讨当前销量预测的研究趋势,为未来的研究和实践提供启示。

文献计量学是一种基于历史出版物识别研究趋势和热点问题的定量分析方法[1]。到目前为止,文献计量学分析已广泛用于管理学、经济学、模糊研究、国际商务等多个研究领域,而销量预测的文献计量学研究还几乎空白。在已有研究中,李晓敏等[2]基于高涉入度产品的销量预测进行了文献计量学分析,指出要不断运用大数据时代所带来的信息资源以及现代技术手段进行预测分析。H.Niles Perera等[3]首次结合知识图谱探讨了判断性预测方法对供应链中产品需求/销售预测及其他决策的影响。但这些针对某一特定领域或特定方法进行的文献计量分析无法全面覆盖销量预测整个研究领域。

为了对销量预测研究进行全面的文献计量分析,本文采用社会网络和数理统计方法,对Web of Science数据库中1998—2019年销量预测相关的802篇文献进行了文献计量学分析,旨在探索:1)销量预测研究的总体数量和趋势;2)国家/地区的分布及合作,期刊的分布及共被引情况和该领域有影响力的作者和文献;3)销量预测当前的研究热点和研究趋势。

1 数据来源与研究方法

1.1 数据来源

汤森路透公司开发的Web of Science(WoS)是最常用的文献计量分析数据库之一。它提供了引文分析中的标准记录,并允许将完整的引文记录下载到与大多数文献计量学分析工具兼容的“.txt”文件中。本文样本取自于WoS核心数据集,检索主题为TS=(“sale*predict*” OR “sale*forecast*” OR “predict*sale*” OR “forecast* sale*”),文献类型包括所有种类,时间跨度为1998—2019年。由于WoS核心数据集里检索到的关于销量预测主题最早的文章发表于1998年,因此样本起始年为1998年,共获得样本文献802篇。

1.2 研究方法

社会网络分析被广泛用于文献计量学研究中进行关键词的共现及作者、机构和国家之间的学术合作分析。本文采用VOSviewer软件对销量预测文献的期刊共被引和关键词共现进行社会网络分析和可视化。此外,应用CiteSpace软件进行共被引文献的主题聚类和可视化。结合两个软件各自的优势共同探索20多年来销量预测领域的研究进展和理论热点。

引文数量被视为反映论文质量的主要因素[4]。影响因子反映了近两年期刊的平均年度引用量,代表了单个期刊的质量。h指数是一种评价学术成就的新方法,h代表“高引用次数”,一名科研人员的h指数是指他至多有h篇论文分别被引用了至少h次。人们普遍认为h指数可量化研究人员的学术产出数量与学术产出水平[5]。因此,本文统计引文数量、影响因子、h指数等指标,以识别主要研究国家/地区、期刊、有影响力的学者和文献。

2 研究结果

2.1 总体趋势

通过统计1998—2019年销量预测相关的论文发表数量,获得结果如图1所示。由图1可以看出,虽然论文数量在某些年份存在波动,但总体呈一个明显增长的趋势,表明了研究人员对销量预测领域的持续关注。

图1 历年论文发表数量

2.2 国家/地区的分布

从WoS数据库中获取的802篇销量预测文献共来自76个国家/地区。通过统计获得文献总量排名前5的国家/地区,如表1所示。由表1可知,中国大陆发文量171篇,为发文量最多的国家/地区,其次是美国(128篇),中国台湾(78篇),英格兰(66篇),澳大利亚(30篇)。中国台湾近年来主要关注机器学习、神经网络如LSTM、径向基函数神经网络等技术在销量预测中的应用。虽然发文量排名第3,但中心性较低,说明与其他国家/地区的合作较少,仅与7个国家/地区合作发表了10篇文章。而主要关注零售产业销量预测的英格兰中心性排名第1,表明英格兰在销量预测研究方面的国际合作较多。中国大陆虽然发文量最多,但中心性和h指数都低于美国、英格兰,说明中国大陆国际合作较少,且论文质量有待提高。美国发表文献总量和中心性均排名第2,h指数和被引总频次最高,表明美国在销量预测领域具有一定的影响力。近年来中国、美国都关注于大数据对销量预测的影响,除了不断优化各种神经网络技术以提高销量预测准确性以外,还全面考虑了数字化环境下销量预测影响因素,探索了在线评论、用户搜索行为等对销量预测的影响。

表1 出版物总量排名前5的国家/地区

2.3 期刊的分布及共被引

销量预测的相关文献收录在635份期刊中。期刊涉及经济、管理、计算机等多领域,表明销量预测研究的多学科性质。本文统计了发文数量排名前5的期刊的影响因子,如图2所示。

图2 发文量排名前5的期刊

发文量排名前5的期刊发文数量仅占9.85%。由图2可知,在销量预测研究的相关期刊中,关注神经网络等预测模型的期刊《Expert Systems with Applications》发文量最多,影响因子(5.448)在这5种期刊中排名第2,说明该期刊是销量预测领域较为活跃和有影响力的期刊。期刊《International Journal of Forecasting》主要从供应链角度出发研究销量预测,其发文量排名第2,但影响因子(3.964)相较其他4种期刊低。《International Journal of Production Economics》的影响因子(6.205)在这5种期刊中排名第1,说明它的影响力较大,该期刊更关注于零售等商业市场。

图3为期刊的共被引网络,节点越大,代表该期刊所发表的论文共被引的次数越多。《Expert Systems with Application》《European Journal of Operations Research》《Decision Support Systems》《International Journal of Production Economics》和《International Journal of Forecasting》在可视化图谱中占据着显著位置,这一方面是因为这些期刊发表的文献量相对较多,另一方面也是因为这些期刊发表的文献质量较高,所以被共引次数较多。

图3 期刊的共被引网络

2.4 最有影响力的学者和文献

文献计量学的另一个显着特征是能够识别在学科或探究领域内形成论述的学者和论文[6]。本文按WoS索引出版物数量统计了排名前5的作者信息,如表2所示。有3名研究者来自中国,主要关注人工智能和遗传算法。其中来自元智大学的Chang是销量预测研究中最多产的研究者,h指数39,发表文献被引总频次4 384。他和Liu等[7]结合神经网络、遗传算法,建立了加权模糊案例推理(WFCBR)为主要预测模型的混合预测模型,以预测印刷线路板厂的未来销售量。Kuo[8]不断优化径向基函数神经网络,同时也关注模糊神经网络和免疫系统神经网络在销量预测中的应用。来自英格兰的Fildes更关注供应链末端零售行业的销量预测情况。Thomassey运用模糊逻辑、模糊推理系统优化纺织工业的销量预测。可以看出,销量预测运用于各行各业,每个行业的销量预测影响因素也不相同,因此学者们在研究销量预测时,通常基于某一特定领域不断优化预测方法,提高预测效果。

表2 发文量排名前5的研究者

依据被引频次列出了排名前10的文献,如表3所示。其中6篇来自美国,这一结果再次证实了美国在销量预测研究领域的影响力。销量预测影响因素和销量预测方法是销量预测研究关注的重点,也是高被引文献关注的重点。被引频次最高的《Exploring the value of online product reviews in forecasting sales:The case of motion pictures》是中美学者Dellarocas C.、Zhang X.Q.和Awad N.F.[9]在2007年合作发表的文献,它主要引入在线评论的影响因素以预测电影收入,并证实可大大提高其预测准确性。Dhar V.和Chang E.A.[10]检测了互联网生成内容(包括来自博客和社交网站的数据)在预测音乐行业销售中的有用性。Morwitz V.G.等[11]探索了多因素对购买决策的影响。Lilien等[12]指出从最前沿的用户以及面临更极端问题的其他市场用户那里收集有关需求和解决方案的信息可以产生更好的销售额。Porath C.L.和Bateman T.S.[13]认为有绩效要求的目标导向可预测随后的销售业绩,而无绩效目标的导向会对销售业绩产生负面影响。Talukdar T.D.等[14]探索了新产品的销量预测。在调整预测方面,Sanders N.R.[15]等关注于判断性销量预测的影响,Lawrence等[16]综述了25年来判断性调整对预测的影响并提出了发展方向。此外还探讨了应用极限学习机(ELM)的新型神经网络技术、组合预测等。

表3 被引频次排名前10的文献

2.5 研究热点和研究趋势

2.5.1 文献共被引分析

当两篇论文同时出现在第3篇论文的引文中时,认为两篇论文建立了共引关系。共引分析为文献的知识结构和学术研究影响的广度提供了更深刻的见解。本文选取CiteSpace软件进行文献的共被引分析,以探讨销量预测的知识结构和研究趋势,分析结果如图4和图5所示。

由图4可知,销量预测的共引文献被聚类为时装销量预测、预测区间、大数据、变量选择、模糊逻辑、遗传算法、模糊神经网络、实证研究、模糊支持向量机和专家预测10个主题。图5详细地可视化了各聚类主题下文献共被引的时间顺序。通过观察时间线视图可知,在销量预测早期的实证研究中,对模糊神经网络、预测区间的探讨较多,遗传算法也不断引入到销量预测模型中。随后专家预测、模糊支持向量机被广泛应用于时装零售的销量预测。销量预测为合理的库存和生产计划提供支持,是动态市场需求下供应链管理中的关键任务,对于生命周期很短的时装零售行业尤为重要。因此时装产业的销量预测获得持续关注。

图4 共被引文献聚类知识图谱

图5 文献共被引的时间线视图

值得注意的是,大数据单独作为一个主题出现在聚类视图中,而且由图5可以清楚地看到,近年来大数据技术越来越多地应用到销量预测中。大数据技术不仅用于销量预测原始数据的收集和预处理,还可以优化预测模型。如Cui R.等[17]对Facebook社交媒体信息进行大数据处理并实施多种机器学习方法来预测每日销售额。Buyar V.和Abdel-Raouf A.[18]提出了一种基于卷积神经网络的模型,该模型基于制药公司的历史大规模销售数据预测其未来的销售。人们已经认识到大数据的重要性。

2.5.2 关键词分析

为进一步探索销量预测的研究热点,本文基于获取的802篇销量预测文献进行关键词的社会网络分析,采用VOSviewer软件绘制出关键词共现的可视化图谱。关键词共2 900个,限定关键词的共现次数大于等于5,共有159个关键词满足条件,如图6所示。图6节点和标签的大小代表了关键词共同出现的次数。节点和标签越大,关键词的共现频次越高。由图6可知,除销量预测和预测外,模型、时间序列和神经网络的共现频次最高,这表明时间序列和神经网络是建立销量预测模型最常用的方法。尽管这3个关键词出现的时间较早,但仍旧是销量预测的经典方法,因此近年来学者不断优化这些预测方法,如采用遗传算法优化预测相关参数,引入时间序列和神经网络结合的方法预测销量。LSTM等深度神经网络近年来也被引入到销量预测研究中。

图6 关键词共现网络

在近年销量预测研究的关键词中,可以清楚地看到口碑(world of mouth,WoM)、电子商务、评论、情感分析、大数据、人工智能出现在图谱的边缘。随着电子商务平台的发展,在线评论已成为提供产品口碑信息的重要工具。在销售预测中,分析和衡量在线评论十分有价值。它可以更准确地反应消费者的购买意愿和行为偏好。目前,许多学者运用自然语言处理、文本挖掘等技术探究在线评论中的情感信息对销量预测的影响,情感分析也逐渐由单一的粗粒度情感分析向更细粒度的情感分析发展,如计算在线评论中产品各个属性的情感得分,而不是仅计算在线评论的总情感分值。

此外,通过关键词共现网络,还可以发现销量预测的关键词主要围绕着销量预测的影响因素、销量预测方法及销量预测的效果展开。销量预测的影响因素包括早期对市场特点、季节、价格、促销的研究,以及近年来对在线评论、口碑等多源数据的探讨。除了ANN神经网络、极限学习机、机器学习、模糊预测、支持向量机、回归分析等各种预测销量方法,近年来学者还结合情感分析和大数据技术建立了融合情感分析的预测模型。在零售业务的有效运营中,预测未来的销售是最重要的问题之一。销量预测作为供应链环境中一个节点,准确的销量预测对于组织和规划生产、采购、运输和劳动力至关重要,它为管理者的决策提供了重要依据。所以零售、决策支持、供应链也是共现频次较高的关键词。而且现有的预测依赖于各种预测模型,但仍旧会存在误差,所以判断性调整仍然是预测中重要的一部分,管理者需要根据其他因素对预测结果进行调整以提高预测的准确性。

3 结束语

本文通过文献计量学分析提供了一个全景图来描述销量预测领域的发展趋势和研究热点:1)大数据技术的发展为销量预测影响因素提供了更多源的数据集,这要求预测应考虑更多维度的数据对销量预测的影响。越来越多学者关注在线评论、用户搜索行为留下的数据如网页浏览点击率等多维指标对产品预测的影响。2)大数据技术、人工智能为提高销量预测提供了技术支持。学者们不断优化和完善文本挖掘、深度神经网络等新兴技术以提高销量预测的准确性。3)零售产业特别是周期短的时装产业仍是销量预测的重点研究领域。准确的销量预测对于供应链上的各个环节至关重要。

在未来的销量预测研究中,基于大数据、人工智能等技术,挖掘用户生成评论及搜索行为留下的数据等多维度影响因素仍然是销量预测的研究方向。虽然零售产业对销量预测的要求更高,但不同行业产品的特征有所不同,销量预测的影响因素和预测方法也就不同。依据产品特征,选择合适的大数据方法,将情感分析融入到更多领域的预测中也是研究的趋势。

猜你喜欢

销量神经网络期刊
期刊更名启事
期刊简介
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
4月汽车销量225.2万辆同比增长8.6%
2018年12月与上月相比汽车产量略降销量小幅增长
盘点2018年车企销量
基于神经网络的中小学生情感分析
期刊审稿进度表