基于差值诱导的Web服务评价可信度的评估

2016-12-01宫清勃钮俊孙秀廷王奎

电信科学 2016年8期

关键词：调用阈值向量

宫清勃，钮俊，孙秀廷，王奎

（宁波大学信息科学与工程学院，浙江宁波315211）

基于差值诱导的Web服务评价可信度的评估

宫清勃，钮俊，孙秀廷，王奎

（宁波大学信息科学与工程学院，浙江宁波315211）

Web服务的评价信息为服务选择提供了重要的参考依据，但服务评价信息具有主观性。结合客观QoS（服务质量）属性数据及请求者评分数据，采用差值诱导法评估历史评价信息是否可信。首先利用不同服务请求者调用同一服务产生的不同QoS属性数据，判断请求者之间的相似关系；然后基于该相似关系，融入对应请求者的主观评分，依据差值法构造可信度评估算法；最后结合所构造的算法，得出可信度平衡因子，判断请求者的评价是否可信。算法分析以及实验结果表明该方法是可行及有效的。

Web服务；服务请求者；服务评价；可信度评估

1 引言

目前，面向服务的体系结构（service-oriented architecture，SOA）已成为互联网中重要的计算模式，它能使应用系统具有更好的弹性，从而更加灵活地适应复杂多变的业务需求。近年来，云计算、物联网等新型计算模式的迅速发展，使得互联网中呈现出越来越多的各种类型的网络服务，如云服务、物联网服务等，为SOA的广泛应用注入新的动力［1，2］。

Web服务作为一种重要的网络服务构件，已经受到学术界、工程界的极大关注，它能快速、方便地构造复杂增值Web应用［3］，提高开发效率。在互联网中，实现特定功能的Web服务具有多个实例，分别隶属不同的机构或组织。不同的Web服务具有不同的 QoS（quality of service，服务质量）属性。如何选择适合的Web服务到所关注的Web应用中，一直是服务计算领域的焦点问题［4］。在Web服务的选择中，确保其功能满足客户需求是前提和基础，故服务选择时的关注点聚焦于Web服务的QoS属性［5］。

在基于QoS的Web服务选择中，一般通过历史经验数据或理论推导的方法判断或预测当前考虑的Web服务的QoS属性，进而判断其是否满足用户需求。随着服务计算技术的迅速发展，互联网中已存在越来越多的Web服务及对应的使用数据，其中用户对曾使用Web服务的评价信息也是其中的重要内容。借助用户对Web服务的评价信息来判断或预测其QoS属性，是一种有效且直观的手段，也是当前服务计算领域中的研究热点之一［6］。

2 相关工作

传统基于QoS属性的Web服务选择，大多关注服务的时间、空间等属性。比如，在服务选择时，参考文献［7］重点考虑服务的执行时间是否满足用户需求，而参考文献［8］则分析了服务执行过程中的存储消耗或带宽等是否满足约束。另外，参考文献［9］等也从服务调用时对用户产生的经济成本等方面进行了分析。

可以看出，已有文献重点关注客观QoS属性值，却未考虑请求者服务请求体验的历史评价数据，以“用户评分”的量化数据形式存在。事实上，这些评价数据也可用作直观、方便地判断或选择服务的重要依据。其中，参考文献［10］提出针对一种特定QoS属性的基于用户评分和协同过滤的方法。参考文献［11］则采用了一种基于用户满意度信息的服务反馈模型，提高选择的精确度。参考文献［12］引入一种基于QoS与用户推荐的Web服务信誉度评价模型，并考虑了评价信息的时效性。可以看出，这些基于Web服务历史评价信息的服务选择或推荐方法，一般均假定评价数据是有效或可信的。但事实上，某些评价数据可能不具有可信性，从而将误导服务选择过程，进而对用户造成损失。比如，用户评价数据客观上具有模糊性、主观性，同时，也并不能排除用户在服务评价时的情绪化表达。因此，对Web服务历史评价数据的可信性判断至关重要。

通过计算相似请求者之间属性的差值以及评分的差值，分析Web服务评分数据与具体运行过程中的真实QoS属性数据之间的差异，进而判断该评分信息是否可信。

3 服务评价的可信度评估过程

开放的互联网环境中，存在众多请求者对已使用服务的大量评价信息。这些信息对评估服务的可信度具有重要的参考价值。但是，请求者的评价信息本身存在主观性、模糊性，同时一些请求者存在恶意和不负责任的情感倾向。这使得服务的评价信息中可能存在不可信的内容，从而影响甚至误导将来请求者的判断。因此，在已有研究基础上，结合服务调用过程中实际产生的客观QoS数据来评估请求者对服务的主观评价的可信度。

为消除由于网络基础设施、地理位置等因素造成的请求者间固有的体验差距，以下界定所有请求者调用服务时所处的客观环境相同。

3.1 基本概念及问题定义

为了便于理解及方便描述，给出相关概念及定义。

定义1 服务请求者集与候选服务集

（1）服务请求者集 U={u1，u2，…，un}，描述请求者的集合，其中，ui（1≤i≤n）表示第 i个请求者。

（2）候选服务集 S={s1，s2，…，sm}，描述具有相同功能的不同 Web 服务构成的集合，其中，sj（1≤j≤m）表示第 j个服务。

定义2 服务QoS属性和服务评价

（1）服务 QoS 属性

指描述服务非功能性性质的相关参数，一般记为pi，j（x），表示当属性名称为 x 时，请求者 ui调用服务 sj之后记录的值。 Pi，j表示属性向量，由不同属性名称的 pi，j（x）构成，x 代表属性名称，见表 1。令 ai（sj）=Pi，j，有 Ai（sj）=＜a1（sj），a2（sj），…，an（sj）＞，表示由 n 个属性向量构成一个属性函数向量。

表1 服务的QoS属性

（2）服务评价

以“服务评分”的量化形式存在，指请求者完成服务调用后，根据主观感受，赋予一个反映被调用服务综合性能表现的值。一般记为 el（sj），表示请求者 ui调用服务 sj之后所给的评分。Ei（sj）=＜e1（sj），e2（sj），…，en（sj）＞，记作评分向量，描述服务sj被n个请求者调用所构成的向量。

定义3 属性距离相同Web服务的不同运行实例所反馈的实际QoS属性数据间的差值，用以度量不同实例之间客观状态的差异程度。

定义4 评分距离相同Web服务被不同请求者调用后，所给的评分之间的差值，用以度量请求者之间主观感受的差异程度。

定义5 服务评价可信度服务评价的评分值，遵从服务运行过程中产生的客观实际QoS数据所反映的服务真实性能表现的程度。以下称平衡因子，符号记作λ。

3.2 服务评价的可信度评估框架

为了对服务评价的可信度进行评估，首要问题是采集并规范化服务评分数据，然后通过计算评分数据、QoS数据的差值，以获得主观评分与真实QoS数据之间的差异。在参考文献［14］的基础上，给出如图1所示的整体评估框架。图1中的变量ui为第i个服务请求者，sj为第j个Web服务，Ei为第i个请求者的评分向量，Aj为调用 sj后返，实际QoS向量，Nc为可信评价的个数，ε为相似度阈值，δ为可信度阈值。该框架包含两个部分，第I部分为数据采集及表示，其中①反映请求者与服务之间的调用关系；②和③分别表示请求者调用服务后产生的实际QoS数据用向量A表示，请求者所给的评分数据用向量E表示。第Ⅱ部分为具体的可信度评估过程。大致过程说明如下：

（1）数据采集，将第I部分记录的数据保存到数据库中；

（2）相似度计算，同一服务被多个请求者调用，产生与请求者数量相同的实际QoS属性向量。式（1）用于计算这些属性向量之间的相似度；

（3）相似度判断，如果步骤（2）产生的相似度α大于或等于相似度阈值ε，说明属性之间是相似的，进一步说明对应的请求者之间是相似的。对由这些相似属性向量所构成的矩阵进行归一化处理；否则不相似，返回至步骤（2）；

（4）属性距离与评分距离的计算，由步骤（3）所得归一化后的属性数据，计算属性距离；再由步骤（3）所确定的相似请求者，利用其评分，计算评分距离；

（5）平衡因子的计算，利用步骤（4）求得的属性距离和评分距离，确定可信度平衡因子λ；

（6）评价可信度的判断，以可信度阈值δ作为判断评价是否可信的判定指标。若λ≤δ，评价可信，请求者各自的可信评价数加1；否则回到步骤（4）。

4 服务评价的可信度评估算法

图1 可信度评估框架

评估算法的建立包含数据预处理、属性相似度判断、相似属性矩阵的归一化处理以及可信度评估等步骤。数据预处理的目的是将收集到的数据进行规范化表示。图2为图1第I部分的展开形式，表示m个服务被n个请求者分别调用过。其中，左边部分为服务请求者给出的评分，右边为服务被调用后记录的实际QoS属性数据。

其中，n 个评分向量 Ei（sj）（1≤i≤n，且 i∈Z+）构成评分矩阵 ESMn×m，记为对应的n 个属性函数向量 Ai（sj）构成属性矩阵 VPMn×m，记为 VPMn×m=为方便计算，引入实值矩阵CPM，由VPM 的列向量构成。因此有

4.1 属性数据的相似度判断及归一化

引入余弦相似度［18］判断方法，筛选出在QoS属性向量上相似（即近似相等）的请求者。这是可信度评估的前提。同一服务被不同的请求者调用，当QoS属性相等或相似时，对应不同请求者的评分客观上是接近的。判断方法如式（1）所示。相比于利用皮尔逊相关系数法［15］以及欧几里得距离法［16］求相似度，余弦相似度可以很好地规避3个问题：QoS属性向量间的非线性相关性；依赖较高的数据精度；属性数据较多时导致过拟合。

其中，α表示所求相似度。当且仅当α≥ε（ε表示相似度阈值）时，表明请求者 ui与 uj相似；否则不相似。ai（sk）为属性向量。

经过上述判断，会得到一个相似属性矩阵，记为SPM。对SPM进行归一化处理。归一化［13］处理的目的是让不同单位以及变化方向的属性之间可以进行运算。QoS属性分正向属性和负向属性。正向属性，如可用性（availability），其值越大，服务质量越高；负向属性，如响应时间（response time），则相反。为便于计算，须消除这些差异。采用极值归一化［17］方法，对正向属性，采用式（2）进行计算；对负向属性，采用式（3）进行计算。

4.2 可信度评估算法

其中，λ为平衡因子。若λ≤δ（可信度阈值），表明评价可信，相似请求者各自的可信评价数记作Nc，加1。否则，存在不可信的可能。用Nc／N表示请求者的评价可信度，N为一个请求者总的评价数。评价可信度越高，对其他请求者是否选择调用某一服务的影响就愈大。

给出请求者评价可信度的评估算法，如下。

输入：属性矩阵VPM与对应评分矩阵ESM

图2 评分属性

输出：平衡因子λ

Confidence_Evaluated（）{

（1）for（int j=1；j＜M；j++）／／M 表示共同调用服务的个数

（2）for（int i=1；i＜N；i++）／／N 表示请求者数量

（3）α=simVector ［j］［i］=simQoS（ai（sj），ak（sj）of VPM）；／／相似度计算

（4）for（int j=1；j＜M（N（N-1））／2；j++）

（5）ε=fitting（simVector［j］）；

（6）for（int j=1；j＜M；j++）

（7）for（int i=1；i＜N；i++）

（8）if（compare（simVector［j］［i］，ε））／／根据相似度阈值判断属性之间是否相似

（9）CPM’=Normalize（）；／／对相似的向量构成的矩阵进行归一化处理

（10）λ=factor［k++］=getFactor（CPM’，Ei（sj）of ESM）；

（11）for（int k=1；k＜factor.length（）；k++）

（12）δ=fitting（factor［k］）；

}／／end of Credit_Eυaluated（）

算法核心目的是求得可信度阈值δ，如行（12）所示。行（5）为求解相似度阈值ε，行（10）为求解平衡因子λ。算法的时间复杂度为 O（M·（N·（N-1）+M·N））=O（M·（N-1）2），是多项式时间。M表示全部的候选服务，但并不表示每一位请求者都会调用所有的候选服务，因此，该时间复杂度表示最坏的情况。

5 实验验证与结果分析

为验证上述算法，设计了两个相关实验。实验1：确定相似度阈值 ε；实验 2：确定可信度阈值 δ。引入曲线 S：f（x）由于该曲线在 x∈（-1，+1）的区间上，二维图像逼近直线。因此在这个区间内，拟合出一条直线L，使得L与曲线S有最佳重合度。重合度是指在区间（-1，1）上，曲线S与直线L之间的相符程度。其衡量指标以同时存在于直线L与曲线S上点的数目占总点数的百分比来衡量。百分比越高，表明重合度越高，一致程度也就越好。

搭建的模拟系统在硬件配置为Intel i7 Core 2.60 GHz的处理器以及8 GB内存的PC上运行。操作系统为64位Win10。基于Java语言实现，编译环境为JDK 1.8.0_92。为增加实验的可信度，采用的数据基于Al-Masri E提供的真实服务数据集［19］。实验数据的部署方式为：先以30个请求调用同一服务s0，求得对应相似度阈值及可信度阈值；之后不断以30个请求者为增量，分别计算出不同数量的请求者调用同一服务时，两种阈值的变化情况；最后更换服务s0，重复前两个步骤。

5.1 实验验证

实验 1确定相似度阈值 ε。由于相似度 α∈（0，1），满足上述曲线S（-1，1）的定义域。因此以相似度α为横坐标，对应纵坐标为 f（α），组成坐标点（α，f（α））。利用这些坐标点拟合出在区间（0，1）上的直线L。通过计算重合度的大小，判断拟合出的最佳直线。直线的斜率即相似度阈值ε。

实验2确定可信度阈值δ。使用实验1所得ε过滤掉不满足该阈值的所有属性数据，然后对相似属性组成的矩阵做归一化处理，同时确定与相似属性矩阵对应的请求者评分向量；再求得平衡因子λ；最后以实验1的方法求可信度阈值δ。需要注意的是，由于λ＞1，因此需要以1／λ作为横坐标，组成坐标点（1／λ，f（1／λ））。最终的可信度阈值 δ为所得直线斜率的倒数。

为验证本文所用差值诱导法（differential induction，DI）的有效性，为实验2增加了两个对比实验，分别为参考文献［11］所提出的动态需求反馈（dynamic demand service feedback，DDSF）模型以及参考文献［20］所采用的层次分析法（analytic hierarchy process，AHP）。

5.2 结果分析

（1）实验 1

请求者数量为300时的相似度阈值结果如图3所示。其中，图3（a）利用余弦定理求相似度所得，重合度为88.5%，所得相似度阈值 ε=0.930 787 45。作为对比，图 3（b）和图 3（c）分别表示利用欧氏距离判断相似度与皮尔逊相关系数判断相似度所得的直线L与曲线S。其中，前者重合度为83.37%，后者重合度为85.41%。可以看出，余弦定理求相似度所得直线L与曲线S重合度最高。

（2）实验 2

在请求者数量不同的情况下，可信度阈值δ的变化曲线所图4所示。可以看出，随着请求者数量的增加，整体上δ在变小。而相比于DDSF及AHP两种方法，利用DI方法所求可信度阈值最小。图5是评估准确率曲线，与图4可信度阈值曲线相对应。可以看出，随着请求者数量的增加，利用DI方法所求可信度阈值的评估准确率比其他两种方法都要好。平均准确率比AHP高近7%，比DDSF方法高10%以上。

图3 相似度阈值对比结果

6 结束语

评估服务评价的可信度为更快速、准确地选择服务提供了重要的参考价值。本文通过计算服务每一次被调用时，所得QoS的属性相似度，确定请求者间的相似性，然后以该相似性为前提，通过构造差值评估两者之间的一致程度。实验结果表明该方法在区域基础设施相同的情况下，是可行且有效的。

由于仅考虑了请求者评价的评分，忽略了请求者评价会随时间衰减以及评价的文本信息中隐藏的请求者可能的情感倾向，所以评估的准确性会受到影响。在下一步工作中，将对评估模型进行改进，预备考虑更长时间范围的请求者评价信息，以期进一步提高评估的有效性。

图4 可信度阈值变化曲线

图5 评估准确率变化曲线

［1］SELIMI M，FREITAG F，CENTELLES R P，et al.TROBADOR：service discovery for distributed community network micro-clouds ［C］／／IEEE International Conference on Advanced Information Networking and Applications，March 24-27，2015，Gwangiu，Korea.New Jersey：IEEE Press，2015：642-649.

［2］JIN X，CHUN S，JUNG J，et al.A fast and scalable approach for IoT service selection based on a physical service model ［J］.Information Systems Frontiers，2016（4）：1-16.

［3］LIU C，TONG R.Designing value-added services platform architecture fortelematics ［J］.ComputerApplicationsand Software，2015，32（9）：102-104.

［4］LI L，LIU M，CHENG G Q.A local optimal model of service selection of multi-QoS based of FAHP ［J］.Chinese Journal of Computers，2015，38（10）：1997-2010.

［5］ZHANG L C，YANG Y H.Dynamic QoS data-driven reliable web service selection ［J］.Journal of Electronicsamp;Information Technology，2016，33（6）：1368-1376.

［6］SERRANO-GUERRERO J，OLIVAS J A，ROMERO F P，et al.Sentiment analysis：a review and comparative analysis of web services［J］.Information Sciences，2015，311（5）：18-38.

［7］WANG S G，SUN Q B，ZHANG G W，et al.Uncertain QoS-aware skyline service selection based on cloud model［J］.Journal of Software，2012，23（6）：1397-1412.

［8］CHEN L，KUANG L，WU J.MapReducebasedskyline services selection for QoS-aware composition ［C］／／IEEE Parallel and Distributed ProcessingSymposium Workshopsamp; Phd Forum，May 21-25，2012，Shanghai，China.New Jersey：IEEE Press，2012：2035-2042.

［9］FLETCHER K K，LIU X F，TANG M.Elastic personalized nonfunctional attribute preference and trade-off based service selection［J］.ACM Transactions on the Web，2015，9（1）：1-26.

［10］CHANG C C，KUO C Y.A web service selection mechanism based on user ratings and collaborative filtering ［M］.Berlin：Springer Heidelberg，2013：439-449.

［11］WU B，LIJE.Web businessconfidence collaborative computing based on dynamic demand service feedback ［J］.Application Research of Computers，2015，32（5）：1409-1411.

［12］LV F J.Web services reputation evaluation model based on QoS and userrecommendation ［D］.Qinhuangdao：Yanshan University，2010：18-26.

［13］LIU G Q，ZHU Z L，WANG H，et al.Model for evaluating QoS trustworthiness of web service ［J］.Journal of Chinese Computer Systems，2009，30（11）：2216-2221.

［14］ESTRELLA J C，TOYOHARA R K T，KUEHNE B T，et al.A performance evaluation for a QoS-aware service oriented architecture ［C］／／2010 6th World Congress on Services，July 5-10，2010，Miami，USA.New Jersey：IEEE Press，2010：260-267.

［15］WANG S L.Research on data mining technology and its application on web services ［D］.Jinan：Jinan University，2010.

［16］SHAO L S，ZHOU L，ZHAO J F，et al.Web service QoS prediction approach ［J］.Journal of Software，2009，20 （8）：2062-2073.

［17］MA Y，WANG S G，SUN Q B，et al.Web service quality metric algorithm employing objective and subjective weight［J］.Journal of Software，2014，25（11）：2473-2485.

［18］GONG Z C，LI X J，ZHANG J J，et al.Mixed collaborative filtering based on multi-directional measurement and attribute similarity ［J］.Computer Applications and Software，2015，32（6）：62-65.

［19］AL-MASRI E，MAHMOUD Q H.Investigating web services on the world wide web［C］／／17th International Conference on World Wide Web，March 3-8，2008，Beijing，China.New York：ACM Press，2008：795-804.

［20］YANG X M，SUN Y.Network user trust degree evaluation model by analytic hierarchy process ［J］.Computer Systemsamp;Applications，2016，25（3）：267-270.

Confidence of comments evaluated for Web service based on difference-induced

GONG Qingbo，NIU Jun，SUN Xiuting，WANG Kui
College of Information Science and Engineering，Ningbo University，Ningbo 315211，China

Historical comments of requestors provide important references for Web service selections.However，the information is subjective.An approach to evaluate the confidence of the comments through differential induction based on data of objective QoS （quality of service）and subjective score of comments was proposed.Firstly，the similarity relation between requestors was judged，according to different values of QoS produced by the same service invoked by more than one requestor.Then，the evaluation algorithm of confidence was built based on previous similarity relation and the subjective score of the corresponding requestor.Finally，the balanced factor of confidence formed by the algorithm assessed whether the comments from requestors are reliable.Algorithm analysis and experimental results show that the method is feasible and effective.

Web service，service requestor，service rating，credibility evaluation

s：The National Natural Science Foundation of China （No.61272107，No.51204185），The Natural Science Foundation of Zhejiang Province of China （No.LY15F020010），Zhejiang Public Technology Applied Research Project（No.2014C31059），The Open Project of the State Key Laboratory of Software Engineering（No.SKLSE2014-10-05），The Open Project of the Key Laboratory of Ministry of Education Embedded System and Service Computing （No.ESSCKF201302）

TP311

10.11959／j.issn.1000-0801.2016215

2016-05-31；

2016-08-04

国家自然科学基金资助项目（No.61272107，No.51204185）；浙江省自然科学基金资助项目（No.LY15F020010）；浙江省公益技术研究工业资助项目（No.2014C31059）；软件工程国家重点实验室开放课题（No.SKLSE2014-10-05）；嵌入式与服务计算教育部重点实验室开放课题（No.ESSCKF201302）