APP下载

基于贝叶斯网络模型的电子商务数据挖掘应用研究概述

2020-09-10李浩波

看世界·学术下半月 2020年6期
关键词:贝叶斯数据挖掘电子商务

李浩波

摘要:当前,随着以电子商务为特征的新经济逐步走向成熟,企业的竞争优势不再是企业的信息搜集能力,更重要的是分析信息并发现有用知识的能力,如何鉴别有效的、新颖的、潜在有用的、并最终可以被理解的知识模式是当今企业最关心的问题。以数据挖掘技术为主要手段的商业智能技术在企业进行知识管理和决策中扮演越来越重要的作用。

关键词:贝叶斯;电子商务;数据挖掘

数据挖掘是利用合适的方法和技术从大量数据中汲取模式和知识的过程,关于数据挖掘的研究已经取得了许多非常重要的成果,如关联规则挖掘、聚类分类,模式抽取等方法等。但是这些传统数据挖掘技术和方法主要面向目标数据内容的挖掘,即从数据内容、文档、属性中发现有用信息的过程。传统数据挖掘的目标是基于个体数据的抽取模式,致力于提取数据内容反映的有用知识。但是,基于内容的数据挖掘技术不能表现网络资源个体所组成的拓扑结构,缺乏从这些结构中提取有用知识的能力。例如,数据挖掘是通过分析某用户的历史购买行为来预测用户的需求,但是这种预测没有结合其他消费者对该用户的影响,而实际上一个人决定购买某种商品很大程度上受到其朋友、身边熟悉的人以及生意伙伴等等的影响。在这些有影响的人群当中,他们对该用户购买某种商品所起作用是不同的,有些可能较大,有些可能很小。

网络结构挖掘不同于传统的数据挖掘中基于个体目标数据模式抽取的方法,而是基于目标之间的关系进行模式挖掘,这种基于对象间的关系进行模式挖掘的目的是在目标网络中提取正确的、新颖的、有用的结构模式。结构模式指的是网络结构中的蕴涵的规律、内在机制、变化趋势等知识,例如:在商务系统中,谁是最有影响力的消费者,其购买决策可能影响着其他的消费者;在科学引文数据库中,哪些文献是在引文中经常被引用的经典文章;在互联网浏览过程中,如何帮助人们在互联网上查找和定位最有价值的网页等等。

在智能商务信息服务中,除了面向内容的数据挖掘外,也非常关注面向网络结构模式提取的网络结构挖掘。例如,在商务网络中如何查找网络中的关键资源,从而确定哪些企业、产品或者消费者在商务网络中起着关键的作用;通过对商务系统中用户群的分析和挖掘,研究和提取用户在消费中相互的影响和作用,发现消费习惯是如何在网络中传播的,研究网络结构的相互影响及其传播速度,以及随着时间的变化,网络结构的动态模式如何变化,网络结构如何进化,以及其进化机制如何,等等;通过对商务系统中商品群的分析和挖掘,研究商品之間的关系模式,提取重要商品结点或者利润最大化的商品结点,从而发现通过哪些商品或产品的增大生产或者推广能够为企业带来更多的效益。网络结构模式挖掘弥补了智能商务中传统数据挖掘的不足,开展商务网络结构挖掘的研究有助于更广范围的进行企业决策支持。

同其他数据挖掘领域相比,虽然网络结构知识挖掘的研究起步比较晚,但是这一问题已经得到许多研究人员和机构的重视,研究领域包括了社会学、数学、物理学、计算机科学、以及生物学等许多方面。在社会学研究方面,采用社会网络分析手段对社会成员之间的关系和交互方式进行分析和挖掘,以便发现潜在的社会结构。这种社会网络结构分析方法的最显著特征就是使用结构或相互信息来研究或测试社会学理论。不仅仅是考虑社会成员的属性,如他们的年龄、性别、社会经济状况、受教育情况,还要考虑社会成员之间的关系特性,如自然关系、强度、和关联频率等,这些都被认为是影响社会结构的重要因素。社会网络分析也被用来进行组织行为分析和组织交互关系分析等。在统计物理学中,文献采用网络拓扑统计分析方法来进行网络结构模式分析,该方法不同于静态的结构处理方法,而是将网络结构看成是某种进化的过程,通过某种统计机制进行描述和建模。在因特网的应用中,许多文献研究将网络结构模式挖掘用于查找网络中的关键资源问题。一个网络可以看成是资源的集合,在因特网网页中,网页文本的内容就可以看成是信息资源,计算机网络中的电缆电线也可以看成是资源,这些资源的损坏可能导致网络的故障。在网络中的起关键作用的人、文本、关系或通信通道通常是网络功能的重要部分。应用于关键资源查找的技术已经应用于多种应用系统,文献用于挖掘网页中的高质量页面,文献用于在计算机通信网络中查找网络上使得网络性能降低的电缆以及结点等故障。此外在其他领域也得到了广泛应用研究,如:科学文献的引用模式分析、在协同工作的网络上搜索特定问题的处理专家以及在犯罪和恐怖组织网络中确定领导者和跟随者等等。

虽然网络结构知识挖掘在许多领域进行了广泛的研究和应用,但面向商业智能领域来说还面临许多挑战:

第一,已有的研究中大多数以数据资源为研究对象,缺少一种完整的、面向商务环境的关于网络结构挖掘的知识资源表示框架。网络中的信息或数据资源是智能商务知识的基础,已有的研究中多数采用数据形式描述这些资源并据此构建数据关联模型。而知识服务要求对商务环境下的网络资源进行知识标引与表示,并通过知识之间的关联表示资源之间的关系和资源的动态维护。因此研究框架应该包括有关商务网络结构的大多数共性问题,并且需要包括网络资源和结构的统一观点和方法论,为将来的研究和应用提供指导。

第二,已有的研究中大多数是关于网络结构资源的静态结构进行研究,反映的是在某单一时间点上所观察到的网络资源结点和关系所处的状态和特征,发现的是在某时间观测到的结点和关系的特定配置结构和规则。由于商务网络应用大多数是网络在线进行的,个体的变化可能也会影响整个网络结构的改变,这种变化由于实时在线的原因可能频繁改变,因此研究和分析动态的网络模式是智能商务应用非常重要的问题。同时,网络结构模型的进化规律反映了模型从一种形态转化为另一种形态的过程和趋势,特定的结构模型进化过程导致了特定的网络结构,这些结构又进一步影响了网络的功能和执行,因此这种模型的进化问题也是特别重要的。目前,关于商务知识动态结构模型及其进化的研究还处于初级阶段。

第三,现有的基于内容的数据挖掘技术已经取得显著的研究成果,如何将这类数据挖掘技术与网络结构挖掘技术相结合,开展面向商务智能的综合性知识发现研究还有待进一步加强。传统的数据挖掘对单一的挖掘方法或技术的研究较多,对方法的适应性和综合应用的研究较少,对商务智能应用中经典问题的综合解决缺乏有效的方法,基于内容挖掘与基于网络结构挖掘技术相融合的研究不多。在商务智能中,研究现有数据挖掘方法与其它结构挖掘技术相结合,从而既能够从目标中提取有用的知识和模式,还可以发现目标个体与个体、个体与子群、个体与整体之间的关系模式,也是未来该领域研究的重点内容。

基于以上分析,我们提出基于贝叶斯网络的网络结构知识挖掘研究这一课题。拟从模型理论的角度,进一步研究基于数据挖掘平台的网络结构知识挖掘研究,探索将面向个体内容的数据挖掘提升为面向网络整体的结构挖掘的途径。

基金项目:2020年度浙江省高等教育学会高等教育研究课题科研资助项目“基于贝叶斯网络模型的电子商务数据挖掘应用研究”(KT2020214)。

猜你喜欢

贝叶斯数据挖掘电子商务
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
贝叶斯公式的应用和推广
辽宁大拇哥农业电子商务有限公司
数据挖掘综述
软件工程领域中的异常数据挖掘算法
电子商务法草案首审
基于R的医学大数据挖掘系统研究
2013年跨境电子商务那些事儿