APP下载

软决策分析方法及其在智能推荐中的应用*

2019-04-18陆汝华张家录钟嘉鸣

计算机与生活 2019年3期
关键词:论域信息系统逻辑

陆汝华,张家录,钟嘉鸣

1.湘南学院 软件与通信工程学院,湖南 郴州 423000

2.湘南学院 数学与金融学院,湖南 郴州 423000

3.湘南学院 经济与管理学院,湖南 郴州 423000

1 引言

软集理论是Molodtsov教授建立的一种描述和处理不确定性的数学理论。软集是由参数集及其到论域的幂集上的一个集值映射构成的二元组,或者说软集就是论域上由某些参数组织起来的一些子集构成的整体。软集中每个参数对应的子集称为近似集,软集理论中对近似集不做任何限定,近似集可以是空集,而且不同参数对应的近似集的交集可能非空。这使得软集概念涵盖的范围非常广泛,且具有灵活多变、适于应用的特点[1-2]。基于软集的决策研究吸引了国内外众多学者的注意,软集理论研究也得到快速发展,软集理论在不确定决策方面的应用也是其最为活跃的研究方向之一。如,Maji教授等人使用软集描述各个对象关于决策属性的满足情况,通过软集计算来决定决策对象的选择值,以描述对象的优劣程度,并基于选择值的大小确定最优决策对象或方案[3-5]。Roy和Maji教授等人研究了模糊软集,给出了一种通过模糊选择值排序的决策方法[6-7]。冯等人给出了软集、粗集和模糊集进行比较,结合定义软粗集、粗软集和模糊粗软集等的相关概念,指出粗集是软集的一种特殊情况[8-9],并给出软集及模糊软集等在决策、属性约简等方面的应用[10-11]。到目前为止,软集理论已经在分类、预测和模拟等方面得到了一些成功的应用[12-14],但软集理论在诸如聚类分析、关联关系分析、模式识别和近似推理等方面的应用研究,还少有相关文献报道。

商务推荐是不确定性决策理论应用的方向之一。目前主流的推荐方法包括基于内容的推荐、协同过滤推荐、基于知识推荐和组合推荐四种。各种推荐方法研究的重点主要集中在对象之间的相似性,协同过滤推荐考虑的是用户之间的相似性,内容推荐中关注的是所推荐商品之间的相似性。目前各种推荐方法常用的相似性计算方法有向量空间相似度、Pearson相关、Spearman相关、夹角余弦方法等[14-16]。从信息论的角度看,A与B之间的相似度一方面与它们的共性相关,共性越多,相似度越高,当A与B完全相同时,相似度达到最大值;另一方面与它们的区别相关,区别越大,相似度越低[17]。电子智能推荐是智能推荐的主要应用方向之一,它是“利用电子商务平台向用户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。电子商务推荐在网络经济环境下不仅可以将电子商务系统的浏览者转变为购买者,促进产品交叉销售能力,还可以提高客户的忠诚度,在市场竞争日趋激烈的今天显得尤为重要[18-19]。电子商务推荐功能实现的好坏主要决定于其采用的推荐技术,已有推荐算法的相似性计算方法在遇到稀疏数据时有其明显的不足,而数据缺失、数据稀疏又是电子商务销售数据的主要特征之一。软集中对每个参数所对应的近似集(论域U的子集)不做任何的限制,这使得软集在处理稀疏数据时有着明显的优势。

本文将命题逻辑思想应用到软集数据分析中,给出一种基于软集和逻辑公式的信息系统属性分析的新方法。首先,建立一种基于软集的命题逻辑推理语言,在这种形式推理语言中,原子公式是软集中的参数α,参数α的函数值F(α()是论域U的子集)是原子公式α的赋值集,软决策规则是决策软集上的由原子公式组成的蕴含逻辑公式。其次,引进真度、条件真度、绝对真度等概念从充分性、必要性、合理性等不同方面来评价软决策规则,将决策系统转化为决策软集来表示,提出不完备决策信息系统的软决策规则提取算法。最后,将基于命题逻辑和软集的数据分析方法应用于电子智能推荐,给出基于软属性关联关系分析的智能推荐算法,并通过实际例子和数值实验验证本文提出的算法是有效的。

2 软集及其诱导出的逻辑公式

论域U上的一个软集(简记为FS)是一个二元组S=(F,A),其中,E是参数集合,A⊆E,P(U)是U的幂集,F:A→P(U)是集值映射,即对e∈A,F(e)⊆U。如果U上有概率分布P,则称S=(F,A)为概率软集。显然,一般的软集在等概率分布P({u})=1|U|下可以看作为概率软集。论域U和参数集E上的全体软集记为PE(U)。设(F,A)和(G,B)是论域U和参数集E上的两个软集,如果A⊆B,且 ∀a∈A,F(a)⊆G(a),则称(F,A)是(G,B)的软子集,记为(F,A)⊆(G,B)。两个软集(F,A)和(G,B)的并定义为(H,C)=(F,A)⋃(G,B),其中C=A⋃B,当a=A-B时,H(c)=F(c);当 a=B-A时 ,H(c)=G(c);当a=A⋂B时,H(c)=F(c)⋃G(c)。同样,两个软集(F,A)和(G,B)的交定义为(H,C)(=F,A)⋂(G,B),其中C=A⋂B,对a=C,H(c)=F(c)⋂G(c)[2]。

信息系统(也称为数据库系统)是一个三元组I=(U,A,V,)其中U是对象集,A是属性集,V是属性值集合,V(a)是属性a的值域,每个属性a∈A都相应地确定一个函数a:U→V(a,)它指定了U中每个对象u的属性值。如果信息系统的属性集A被划分为C和D两部分,则称I=(U,C⋃D,V)为决策信息系统,并称C中的元素为条件属性,D中的元素为决策属性[17]。

以上介绍的软集和信息系统这两个概念之间有着密切的联系。首先,论域U上的一个软集S=(F,A)可以通过一种自然的方式诱导出一个信息系统IS=(U,A,{0,1},)对每一个a∈A,如果u∈F(a),则a(u)=1,否则a(u)=0其次,设I=(U,A,V)是信息系统,则每一个a∈A都可以诱导出一个软集Sa=(Fa,Ba),其中Ba={a}×V(a),对任何(a,t)∈Ba,Fa(a,t)={u∈U:a(u)=t};而信息系统I诱导出一个软集 S=(F,B),其 中对 (a,v)∈B,F(a,v)={u∈U:a(u)=v}。显然,{Fa(a,t):(a,t)∈Ba}构成论域U的一个划分,而{F(a,v):(a,v)∈B}构成论域U的一个覆盖[20]。

以下给出本文要用到的基于软集的软逻辑公式及其赋值等概念。

首先,回顾一下命题逻辑公式及其赋值的概念。设Q={q1,q2,…}为原子公式集,F(Q)是由Q生成的(¬,∧,→ 型)自由代数,称F(Q)中的元素为逻辑公式,简称为公式。设B={0,1}是标准布尔代数,则B={0,1}亦是(¬,∧,→ 型)代数。自由代数(F(Q);¬,∧,→)和B={0,1}之间的(¬,∧,→ )型同态v:F(S)→{0,1}称为F(Q)的逻辑公式的赋值,对α∈F(Q),v(α)称为公式α的值[21-22]。

设S=(F,A)是论域U和参数集E上的软集,称α∈A为基于软集S的软原子公式(为了与软集参数和信息系统属性术语相区别,以下用小写希腊字母作为软原子命题的标识符)。由全部原子公式生成的(¬,∧,→ )型自由代数记为F(S),F(S)中的元素称为基于软集S的软逻辑公式(为了与数理逻辑中逻辑公式概念相区别,本文称之为软逻辑公式),也就是说,F(S)是由A中的元素经过下列步骤所生成:(1)A⊆F(S);(2)若φ∈F(S),则¬φ∈F(S);(3)若φ,ψ∈F(S),则φ∧ψ,φ→ψ∈F(S);(4)λ∈F(S)当且仅当λ可经过以上3步有限次所产生[20]。

对软集(F,A),如果A被划分为C和D(即A=C⋃ D,C ⋂D=ϕ),此时也记软集(F,A)为(F,C⋃ D),并称之为决策软集。显然,决策软集SC=(F,C)和SD=(F,D)都是(F,C⋃D)的软子集,分别称之为条件软子集和决策软子集,并称相应的软逻辑公式FA(SC)和F(SD)为条件属性公式和决策属性公式[20]。

设(F,A)是论域U上的软集,由于F(S)是由原子公式集A生成的(¬,∧,→型)自由代数,因此,对每一个u∈U,映射可惟一决定公式集F(S)上的一个赋值vu:F(S)→{0,1},这里 χF(α)(u)表示集合F(α )的特征函数。设φ∈F(S),如果vu(φ)=1,借用数理逻辑中的术语,称vu为公式φ的模型(也称u支持公式φ),记为,并称为公式φ∈F(S)的软集合语义解释。显然,对每一个原子公式α∈A,有,当且仅当如果,则称φ为软重言式;如果,则称φ为软矛盾式。设φ,ψ∈F(S),如果对全部的赋值vu,有vu(φ)=vu(ψ),则称φ与ψ软逻辑等价。

关于软逻辑公式的软集合语义解释,有下面的结论。

命题1[20]设(F,A是)论域U上的软集,φ,ψ∈F(S),则:

从形式上看,命题1与粗糙集理论中的决策逻辑中公式解释相似,但其实它们定义的途径是不一样的,软集合(F,A)上的任何软逻辑公式的语义解释

本文引入的软逻辑公式及其语义与数理逻辑中的相应概念既有相似也有不同,相似之处是所讨论的公式都是由原子公式自由生成且都是用标识符表示;不同之处是数理逻辑中用于表示原子命题的标识符没有明确的实际意义,而软逻辑原子公式是软集中的参数,基于一个给定软集的软逻辑原子公式是有其实际含义的。另外,本文构造的软逻辑公式的软集合语义也可认为是文献[22-23]命题逻辑概率语义的具体化。为了在软逻辑语义意义下找到一种提取有用软决策规则的有效方法,在下一章先应用文献[22-23]的部分真度概念来刻画一个给定的软逻辑公式的正确程度,然后引进其他一些描述软决策规则的度量指标。

3 软逻辑公式的软真度

定义1设S=(F,A)是有限论域U上的概率软集,P是U上的正规概率分布,即∀u∈U,P({u}),>0,对于给定的逻辑公式φ,称

为软逻辑公式φ基于软集S的基本软真度(basic soft truth degree,BSTD)。

注意到vu(φ)=1意味着u支持φ,因此τ(⋅)可以被看作一种“投票模型”。由于在实际的数据处理中软集通常是用表格表示的,这时对象u的概率P({u})其实就是与u有相同参数及参数值的对象数目与全体对象数的比值,而公式φ的软真度其实就是支持φ的对象的概率和。一个软逻辑公式的可靠性通过软真度被程度化并且这种程度化是由支撑软逻辑公式的基础软集所确定。

命题2(1)0≤τ(φ)≤1;

(3)若φ与ψ软逻辑等价,则τ(φ)=τ(ψ);

(4)τ(¬φ)=1-τ(φ);

(5)τ(φ∨ψ)=τ(φ)+τ(ψ)-τ(φ∧ψ)。

证明(1)~(3)的证明是容易的,下证(4)和(5)。

设(F,C⋃D)为决策软集,称形如φ→ψ的逻辑公式为软决策规则,其中φ∈F(SC),ψ∈F(SD)。当φ、ψ分别只是C、D中的原子公式时,称φ→ψ为基本软决策规则;如果φ、ψ分别包含C、D的全部原子公式,则称φ→ψ为典型软决策规则。当φ→ψ是软重言式时,也记φ→ψ为φ⇒ψ。显然,φ⇒ψ当且仅当。因此,当时,总有φ⇒ψ,这在逻辑上是有效的,但从实际推理应用的角度来看却不是合法的。在属性关联关系分析中,既要关心所提取软决策规则的逻辑有效性,同时还需关心软决策规则实际应用中的合法性。基于这个原因,以下引进一些软真度来刻画软决策规则的合法性和可行性。

定义2设(F,C⋃D)是有限论域U上的概率决策软集,P是U上的正规概率分布。

(1)当τ(φ)≠0时,定义软决策规则φ→ψ基于软集S的条件软真度(conditional soft truth degree,CSTD)为:

(2)定义软决策规则φ→ψ基于软集S的绝对软真度(absolute soft truth degree,ASTD)为:

通常也称ζ(φ→ψ)为软决策规则φ→ψ的绝对充分软真度(absolute sufficient soft degree,ASSD),而称软逻辑公式ψ→φ的ζ(ψ→φ)为软决策规则φ→ψ的绝对必要软真度(absolutenecessarysoftdegree,ASND)。当前件φ的软真度τ(φ)≠0时,软决策规则φ→ψ的条件软真度γ(φ→ψ)可以被理解为在给定前件φ的条件下后件ψ为真的条件概率,它表示软决策规则φ→ψ的强度,描述了规则的置信程度。软决策规则φ→ψ的绝对软真度ζ(φ→ψ)由两部分组成,它们分别从两个不同方面对软决策规则进行刻画。从关联规则提取的角度看,前一部分τ(φ→ψ)关注于所收集的数据对软决策规则的支持强度,后一部分τ(φ)关注于所收集的数据对软决策规则前件的支持强度。从程度化逻辑语义、近似推理的角度看,τ(φ→ψ)着重考虑软决策规则的有效程度,它描述的是软决策规则的有效性,τ(φ)着重考虑软决策规则的合法程度,它描述的是软决策规则的合法性。因此,绝对软真度ζ(φ→ψ)从整体上刻画了软决策规则φ→ψ的有效性和合法性,这正符合软决策规则在实际应用中既需要考虑它的有效性,还要关注其合法性的需要。值得指出的是,利用绝对软真度可以排除那些伪真的软决策规则。如,对于一个软决策规则φ→ψ,前件φ的基本软真度τ(φ)=0,即使有τ(φ→ψ)=1,这种伪真的软决策规则在应用中其实是没有意义的,而绝对软真度ζ(φ→ψ)=0则刚好可以刻画这种应用中的实际情况。

命题3设(F,C⋃D)是有限论域U上概率决策软集,φ→ψ是软决策规则,则下列条件等价:

(1)φ→ψ是软重言式;

(2)τ(φ→ψ)=1;

(3)ζ(φ→ψ)=τ(φ);

(4)τ(φ)=0或γ(φ→ψ)=1。

证明(1)⇒(2)设φ→ψ是软重言式,则。由命题1(4),有:

(2)⇒ (3)是显然的。

(3)⇒ (4)由ζ(φ→ψ)=τ(φ),知τ(φ→ψ)=1。从而由命题2(2),有此时当然有从而φ→ψ是软重言式。若γ(φ→ψ)=1,则τ(φ∧ψ)=τ(φ。)由P是U上正规概率分布和有,故有,于是,从而

Table 1 Probabilitydecisionsoftset(F,C⋃D)表1 概率决策软集(F,C⋃D)

从而φ→ψ是软重言式。

例1一个概率决策软集(F,C⋃D)如表1。其中,U={u1,u2,u3,u4},U上的正规概率分布为:P({u1})= 1 3 ,P({u2})=1 3,P({u3})=1 6,P({u4})=1 6,条件参数集C={e1,e2,e3},参数的含义为 e1=“头痛”,e2=“肌肉痛”,e3=“发烧”,决策参数集D={d},参数的含义为d=“流感”。

各软决策规则BSTD为:

各软决策规则CSTD为:

各软决策规则ASTD为:

注1(1)一个软决策规则的三个真度值从三个不同角度描述了软决策规则的数值特性。一般来说,基本软真度关注的是软决策规则的有效性;条件软真度强调条件属性与决策属性之间的蕴含关系的确定性;绝对软真度同时考虑了软决策规则的合法性和条件属性对软决策规则的支持强度。

(2)从例1也可以看到,虽然软决策规则e2→d的有效性和确定性都很高(强度为1),软决策规则e2→d中的条件属性e2对软决策规则的支持强度很低(强度为1 6)。直观地说,可以理解为:由于u2也满足e1和e3,从而支持软决策规则e2→d的证据u2实际上可能不起作用。换句话说,u2的“流感”与“头痛”或“发烧”有关,而不是他的“肌肉痛”。

(3)根据数理逻辑的MP规则,当然有φ∧(φ→ψ)⇒ψ。当φ→ψ和φ是软重言式时,有τ(φ→ψ)=1和τ(φ)=1,从而ζ(φ→ψ)=。1因此,从某种意义上说,绝对软真度是一个由软决策规则φ→ψ和其前件φ的基本软真度来共同刻画后件ψ的真度概念。

定义3设S=(F,A)是有限论域U上的概率软集,对于给定的逻辑公式 φ、ψ,称 η(φ,ψ)=τ((φ→ψ)∧(ψ → φ))为逻辑公式φ、ψ的软相似度。当η(φ,ψ)=1时,称软逻辑公式φ与ψ是软相似的。

命题4设φ,ψ∈F(S),则:

(1)η (φ,ψ )=η (ψ,φ );

(2)若φ与ψ逻辑等价,则φ与ψ是软相似的。

命题4的证明是显然的。

命题5设S=(F,A)是有限论域U上的概率软集,φ,ψ,ζ∈ F(S),记 ρ(φ,ψ )=1-η (φ,ψ ),则:

(1)ρ(φ,φ )=0

(2)ρ(φ,ζ)≤ρ(φ,ψ)+ρ(ψ,ζ)

因此,ρ是F(S)上的伪距离,称之为软逻辑距离,并称(F(S),ρ)为软逻辑距离空间。

证明(1)是显然的。下面证明(2)。因τ(φ)=可表示为所以:

又由于:

故得:因此,有:

于是:

因此:

4 基于软逻辑的决策分析方法

对于一个给定的信息系统,分析属性之间的关联关系,尤其是在决策信息系统中,分析条件属性值和决策属性值之间的因果关系是系统分析的一个重要方面。从形式逻辑上看,一个软决策规则就是一个含有蕴含联结词的软逻辑公式,本章给出一个基于软逻辑的决策分析方法。

算法1基于软逻辑的典型软决策规则软真度分析算法(soft truth analysis algorithm,STAA)

输入:决策信息系统(U,C⋃ D,V),U上的正规概率分布P。

输出:典型软决策规则及其真度。

步骤1输入条件属性C={a1,a2,…,al},决策属性D={d}。

步骤2构造软集Sai(i=1,2,…,l)和Sb。

步骤3计算软集Sai(i=1,2,…,l)和Sb的并决策信息系统(U,C ⋃ D,V)被转化为U上的决策软集S=(F,CS⋃DS),条件参数集为CS={(ai,ri):i=1,2,…,l,ri∈Vai},决策参数集为 DS={(d,t):t∈ Vb}。

步骤4对每个ri∈Vai(i=1,2,…,l)和t∈ Vb,计算软决策规则(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的BSTDτ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。

步骤 5对每个ri∈Vai(i=1,2,…,l)和t∈Vb,计算软决策规则 (a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的CSTDγ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。

步骤 6对每个ri∈Vai(i=1,2,…,l)和t∈Vb,计算软决策规则(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的 ASTD ζ((a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t))。

步骤 7计算 (b,t)→(a1,r1)∧(a2,r2)∧…∧(al,rl)的ASTD得到软决策规则(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t)的ASND。

例2关于病人决策信息系统的软决策规则分析,一个病人决策信息系统如表2。

Table 2 Patientdecision-makinginformationsystem表2 某些病人决策信息系统

为了方便描述,分别将上述属性及属性值符号化,其中a=“头痛”,b=“肌肉痛”,c=“体温”,d=“流感”。

Table 3 Reduced and symbolized decision soft set表3 约简和符号化后的决策软集

a=“头痛”的两个属性值是、否分别用a1、a2表示;b=“肌肉痛”的两个属性值是、否分别用b1、b2表示;c=“体温”的三个属性值很高、高、正常分别用c1、c2、c3表示;d=“流感”的两个属性值是、否分别用d1、d2表示。利用粗糙集理论对信息系统进行属性约简,得到最小属性约简集为{头痛(a),体温(c)}。将约简和符号化后的属性表转化为软决策集如表3。

Table 4 Soft truth of typical soft decision rules表4 典型软决策规则的软真度分析

由条件和决策原子公式可以组成12条典型软决策规则,在不设定阈值情况下,BSTD大于0的典型软决策规则共有7条,这些典型软决策规则的软真度分析如表4。

从表4的计算结果,可以得到关于流感病人的更多信息。比如,可以说“头痛且体温高比头不痛且体温很高的人更可能患有流感”,因为软决策规则的CSTD表明:

Fig.1 Truth comparison between soft decision rule 1 and 2图1 软决策规则1和2的真度比较

从数据分析的角度看,上述结果意味着大约有100%的头痛且体温高的人患有流感,而只有50%的头不痛且体温很高的人患有流感。此外,结论“头痛且体温高比头不痛且体温很高的人更可能患有流感”可以通过ASSD得到进一步的证实,因为:

以上的分析结果可通过图1进一步说明,在图中,软决策规则1和2分别表示(a,a1)∧(c,c2)→(d,d1),(a,a2)∧(c,c1) →(d,d1)。

5 基于软决策分析的智能推荐方法及实例分析

本章在以上分析基础上,提出一个基于软决策分析的智能推荐方法并给出实例分析。为了表述的方便,以下通过电子商务推荐对该方法进行叙述,该推荐方法完全可以类似地应用于智慧旅游等其他智能推荐场合。该推荐方法是在已有用户购买电商产品信息的基础上,给那些有潜在购买意向的用户推荐电商产品,推荐的依据是用户有兴趣的电商产品信息,推荐的基本思想是认为对一些电商产品具有相同兴趣的用户对另一电商产品也具有相同的兴趣。推荐过程如下:(1)将用户已购买或已评价的电商产品作为条件属性,待推荐电商产品作为决策属性,构造决策信息系统。(2)将决策信息系统转化为决策软集。(3)将同时包含有条件属性和决策属性的对象(用户)作为典型软决策规则挖掘的基础集(称之为训练集),依据训练集挖掘出全部典型软决策规则。(4)将只包含有条件属性而不包含决策属性的对象(用户)作为推荐的基础集(称之为推荐集),挖掘出与推荐集相对应的条件属性公式。(5)按照条件属性公式与已挖掘出的典型软决策规则的条件属性公式之间的软逻辑伪距离的大小,激活典型软决策规则,利用所激活的典型软决策规则,采用逻辑推理的方式给出电商产品的推荐。

算法2基于软决策分析的推荐算法(soft decision analysis recommendation algorithm,SDARA)

输入:信息系统(U,A),对象集U是电商客户,属性集A是用户已评价(或购买)的电商产品,阈值α、β。

输出:满足阈值要求的推荐结果。

步骤1构造决策信息系统(U,C⋃D),条件属性C是用户已购买电商产品,决策属性D是待推荐电商产品。

步骤2将决策信息系统(U,C⋃D)转化为决策软集(F,C⋃D)。

步骤3依据所得到决策软集(F,C⋃D),应用算法STAA,挖掘得到全部如下形式的典型软决策规则其 中 ri∈Vai(i=1,2,…,l)是作为条件属性值的电商产品,t∈Vb是待推荐的作为决策属性值的电商产品。

步骤4应用算法STAA,提取BSTD和ASTD分别满足阈值α、β的典型软决策规则(比如(a1,r1)∧(a2,r2)∧…∧(al,rl)→(d,t),由于应用的是软逻辑公式概念,提取的典型软决策规则所包含的条件属性原子公式个数l可以不一致)。

步骤5对于一个给定的只包含有条件属性的待推荐公式 (c1,s1)∧(c2,s2)∧…∧(ck,sk),其中 si∈Vci(i=1,2,…,k),计算(c1,s1)∧(c2,s2)∧…∧(ck,sk)与步骤4所提取的典型软决策规则前件(如(a1,r1)∧(a2,r2)∧…∧(al,rl))之间的软逻辑距离(由于应用的是软逻辑公式概念,这些前件包含的原子公式个数,待推荐公式包含的原子公式个数都可以不相同)。

步骤6选择上一步计算出的最小软逻辑距离,设有最小软逻辑距离的典型软决策规则的前件为,选择典型软决策规则。

步骤7如果有多条典型软决策规则的前件为,则计算 这 些典型 软决策规则的CSTD,激活有最大CSTD的软决策规则

步骤8将步骤7激活的典型软决策规则的 前 件 代 换为待推荐公式,得到推荐规则(c1,s1)∧(c2,s2)∧…∧(ck,sk)→(d(0),t(0))。

步骤9按照推荐规则(c1,s1)∧(c2,s2)∧…∧(ck,sk)→ (d(0),t(0))得出推荐结果 (d(0),t(0))。

注2算法SDARA是基于待推荐软逻辑公式与已有公式的最小软逻辑距离来产生推荐规则,而软逻辑距离是通过真度来进行计算的。因此,从推荐方法分类的角度,本文的推荐方法是协同过滤推荐和基于规则推荐的结合,但由于算法2是基于软逻辑语义理论的,从而它有较强的逻辑基础和逻辑意义,这种方法将在模式识别、近似推理等人工智能方面有着较大的应用前景。

例3考虑一个电子商务网站,用户通过网站对电商产品评价(或购买)作出“有兴趣”“没兴趣”的评价。表5是该网站的部分事务数据库(在表中,没兴趣、有兴趣分别用0、1表示,*表示没有该用户对该电商产品的评价数据)。用户u3和u8对电商产品f的评价未知,网站平台通过寻找用户u3和u8的最近邻关于f的评价来决定是否应该将电商产品f推荐给用户u3和u8。

Table 5 Partial transaction data for e-commerce表5 某电子商务部分事务数据库

Table 6 Typical soft decision rules and their soft truth表6 典型软决策规则及其软真度

Table 7 Softlogicaldistancebetweena1∧b0∧c1∧d1∧e0 and antecedents of typical soft decision rule表7 a1∧b0∧c1∧d1∧e0与典型软决策规则前件的软逻辑距离

将以上事务数据库(信息系统)转化为决策软集(F,C⋃D),其中C={a,b,c,d,e},D={f},由于本例每个属性都只有两个值,决策软集(F,C⋃D)也可以表示为表5的形式,推荐集为{u3,u8},训练集为{u1,u2,u4,u5,u6,u7,u9,u10}。根据训练集,取阈值 α=0.5,β = 0.1,应用算法SLDTA,挖掘得到的6条典型软决策规则及其软真度如表6。

与用户u3相对应的软逻辑公式为a1∧b0∧c1∧d1∧e0,它与各条典型软决策规则前件的软距离如表7。最小距离为0,激活相应的软决策规则a1∧b0∧c1∧d1∧e0→f1,推荐规则为a1∧b0∧c1∧d1∧e0→f1,推荐结论:将电商产品f推荐给用户u3。

Table 8 Soft logical distance betweenb1∧c0∧d1∧e1and antecedents of typical soft decision rule表8 b1∧c0∧d1∧e1与典型软决策规则前件的软逻辑距离

与用户u8相对应的软逻辑公式为b1∧c0∧d1∧e1,它与各条典型软决策规则前件的软距离如表8。最小距离为1 10,激活相应的典型软决策规则,推荐规则为a0∧b1∧c0∧d1∧e0→f0或a0∧b1∧c0∧d1→f0,推荐结论:不将电商产品f推荐给用户u8。

6 实验验证

本章通过实验对本文提出的算法和文献[24]的关联规则推荐算法(下文称之为传统方法)的推荐准确率进行比较,进而验证本文算法的有效性。实验环境为Win 7 x64,Intel®3.4 GHz,RAM 4 GB。实验数据集为Movielens公开的电影点播及评分数据集,实验时从数据集中随机选取5组数据,每组数据个数为1 600,按照75%∶25%的比例随机生成训练集和测试集,取BSTD的阈值为α=0.6,ASTD的阈值为β=0.1。由于本文只处理二值属性,没有涉及多属性值,而Movielens数据集的电影评价为1~5级评分,为此,对电影评分只取“满意”和“不满意”两个值,客户评分大于或等于3分表示客户对电影“满意”,评分小于或等于2分表示客户对电影“不满意”。实验结果的比较指标选取为推荐准确率(recommended accuracy,RA),计算公式为:

Fig.2 Comparison results of recommended accuracy RA图2 推荐准确率RA的比较结果

实验比较结果如图2所示。

图2的实验结果显示,从推荐的准确率方面来看,本文的推荐方法比传统推荐方法要高一点。但正如注1所指出的,相对于传统的推荐方法,本文方法的更大意义在于其有较强的逻辑基础和逻辑意义。

7 结束语

软集在不确定决策方面的研究,是目前软集在应用研究中最活跃的方向之一。本文提出基于软集和逻辑公式的决策信息系统软决策规则分析方法.建立一种基于软集的形式推理语言,在这种形式推理语言中,原子公式是软集中的参数α,参数α的函数值是论域U的子集)是原子公式α的赋值集。通过将决策系统转化用决策软集来表示,软决策规则表示为决策软集上的由原子公式组成的蕴含逻辑公式。引进基本软真度、条件软真度、绝对软真度等概念从充分性、必要性、合理性等不同方面来对软决策规则作出评价,提出基于软逻辑的不完备决策信息系统的决策规则提取算法。将基于软逻辑的软决策规则分析方法应用于电子商务智能推荐,给出基于软属性关联关系分析的电商产品推荐算法,实际例子和实验表明本文提出的算法是有效的。

本文提出的基于软逻辑的电子商务智能推荐方法是基于用户对电商产品作出明确的评价(购买或不购买,喜欢或不喜欢等),而无须用户给出对电商产品打分或作其他的不确定性评价,得到的推荐结论也只有确定的推荐或不推荐。因此,可以说本文提出的智能推荐方法是一种确定的、刚性的推荐方法,这既是本文方法的优点,也可能是本文研究结论值得进一步完善之处。限于篇幅,本文所提出算法的实际应用,以及将本文方法进行推广,即如何将用户对电商产品评价程度考虑进来并考虑推荐的等级,讨论基于模糊软集的形式逻辑与相应的软决策规则分析方法及其在电子智能推荐中的应用,将在另外的文章中给出。

猜你喜欢

论域信息系统逻辑
刑事印证证明准确达成的逻辑反思
基于Simulink变论域算法仿真技术研究
逻辑
创新的逻辑
着舰指挥官非对称变论域模糊引导技术
2022年信息系统与运营管理专栏征稿
基于变论域模糊控制的Taylor逼近型内模PID算法
基于排队论的信息系统装备维修保障效能分析
基于并行构件技术的医疗信息系统的设计与实现
双论域上基于加权粒度的多粒度粗糙集*