本体模式下Web可用性评估研究

2015-12-03何伟，李霜

怀化学院学报 2015年5期

何伟，李霜

(1.怀化学院数学与应用数学系，湖南怀化 418008;2.怀化学院音乐系，湖南怀化 418008)

1 引言

Nielsen 认为可用性并不是用户界面的一个单维属性，它具有多种成分，包括:可学习性、效率、可记忆性、低出错和满意度[1].Nielsen 还认为一个产品要有较高的可用性，该产品必须在每个构成要素上都要满足一个很好的水平[1].可用性是一个质量指标，它从用户角度衡量产品是否有效、易学、高效、少错和令用户满意[2].Web可用性在服务于公众的Web 应用中十分重要，指导着Web的发展，是提升Web 应用能力的手段之一.传统对Web可用性评估的方法一般都采取人工方式进行，通过邀请用户模拟完成体验任务，由专家对用户完成任务的操作过程进行可用性评估.这类评估方法存在的缺陷，一方面可用性评估都是主观进行的，由专家打分方式完成，可信度完全取决于专家的经验;另一方面邀请的参与体验的用户并不具备全体性，因此可用性评估结果依赖于参与用户的典型性.

随着语义技术以及本体研究的迅速发展，Web2.0的出现，Moraga[3]等人将本体作为Web 站点的语义基础，提出了分层的Web 站点模型，用以指导Web 站点开发，提高Web的应用能力和利用价值.因此，利用本体从语义角度对Web可用性进行评估已不再成为困难.使用本体评估Web可用性一方面可以减少参与体验用户以及专家的劳动力，节约成本;另一方面可从Web 内容出发，转换视角对可用性进行评估，弥补专家评估主观判断的不足，进一步改善Web的使用情况.基于此考虑，本文提出了一个在本体模式下对Web可用性进行评估的框架，该框架可从Web的物理和内容两个方面对其进行评估，给出了针对可用性评估框架的Web 内容可用性评估方法，结果证明本文方法对Web 内容可用性评估有较好的效果.

2 相关研究工作

国外对可用性评估研究在初步阶段大部分都是围绕着可用性评估指标构建来进行研究的.微软可用性指南(Microsoft Usability Guide MUG)就是最典型的一个代表，它是一个至今为止用户较为认可的通用的可用性评估指标体系.该评估指标主要围绕内容、易使用性、促销、定制服务、情感因素5个一级指标，每个一级指标被分解成若干二级指标，共二十几个二级指标，形成一套完整的指标体系，用于评估Web 网站的可用性;此外，影响较大的可用性评估指南准则还包括:Nielsen (1996，1999)提出的用于指导网站设计的十大准则[4，6];Spool 与Scanlon (1997)共同建议的为网站设计制定的可用性准则[7];Lynch和Horton(1999)的网站风格指引[8]，Rosenfeld 与Morville的网站信息架构[5]，以及国际人因机构(HFI)提出的可用性原则.在这些指标研究的基础上，国外学者纷纷提出或改进了许多不同的准则与指标.在这些不同类型的网站和不同Internet 发展阶段中提出的评估准则基础上，衍生出了大量的可用性评估指标，如Nielsen(1999)的用于对Web可用性进行评估的24个指标[6];Huang和Chao (2001)等人在总结了18个网站可用性问题指标基础上，对33个政府Web 网站进行评估，提出了7条有建设性的改进建议[9];Menno和Leo(2006)使用情景评估法对15个政府Web 网站进行了可用性评估，结果显示这些网站存在着人机交互界面以及网站导航的问题[10];Morrison 等人(1999)通过分级启发式指标方式评估了酒店网站的有效性[11];Leporini和Paterno (2003)在Web 有效性、效率以及满意程度方面设计了用于改善Web可用性的16个评估指标[12].

国内对Web可用性评估的研究起步较晚，初始阶段大部分借助国外的英文指标翻译成中文指标来对Web可用性进行评估.随着可用性评估在国内的兴起，许多国内学者纷纷探索符合中国国情的Web可用性评估方法.刘爱华(2008)通过对高校图书馆网站的可用性进行分析后，从用户角度入手给出了用于对高校图书馆网站进行可用性评估的指标体系，尝试进一步改善高校图书馆网站的设计、内容和服务功能[13].鄢沛(2010)等人提出了基于UCD 理论和可用性工程原理的Web可用性设计方法，该方法可作为Web 设计人员设计和提高Web可用性的设计指南[14].蔡屏(2011)以信息构建与可用性之间的关联为理论基础，采用可用性测试方法测评高校图书馆网站信息构建的可用性，并总结了一些对我国采用可用性测试方法的高校图书馆具有参考价值的建议[15].刘业政(2013)等人根据扫描路径理论，使用视线跟踪法提出了新颖实用的基于图上随机游动模型的Web页面布局可用性评价方法，并以淘宝商城和阿里巴巴的商品展示页面为例对其使用过程与效果进行验证，说明模型的可行性与方法的有效性[16].白志斌(2013)等人设计了一个基于大量用户行为数据的面向Web 系统的可用性自动化评估系统，该系统通过自动化匹配大量用户行为数据发现不一致的任务进而发现Web 系统可用性问题，为进一步改进Web 系统提供参考[17].

图1 Web可用性评估框架

3 本体模式下Web可用性评估框架

引发Web可用性问题的原因主要有物理和内容两个方面.物理方面主要指链接、网站结构、网页布局等，在评估技术上主要通过对网站结构的测试或对结构的可视化表示、访问日志的分析等方面来获取相关信息加以评判;而内容方面则指是在页面内容的含义传达上，从语义角度对内容的组织，表现在Web 主题和网页内容是否相符等.由于内容表达了设计者的目的，在其可用性的评估上通常都由参与者实际操作，然后再加以主观评价，具有较强的个人主观意愿.因此，本文着重讨论Web 内容可用性评估，从本体数据挖掘角度出发，设计了一个本体模式下自动或半自动对Web可用性进行评估的框架，如图1所示.

该框架具体描述为:首先输入Web URL 地址，页面URL 地址寄存器记录并保存网页间链接关系;其次利用自然语言处理技术如分词、词性标注等对获取的当前网页进行网页预处理，抽取当前网页的主题概念，获得Web 内容语义信息;然后根据网页间的链接关系以及抽取得到的页面内容语义关系，构建网站的内容本体，并将网站内容本体与领域标准本体进行对比计算分析，对网站内容本体作出定量评估，从而达到对Web 内容可用性评估的目的;因为定量的指标体系不能完全的合理的评价一个Web 网站，需要借助相关人员收集网站的其它性能数据，依据主观评估体系指标作出定性评估，最后得出整个Web 网站的评估结果.

3.1 构建网站内容本体

Web 内容可用性评估的基础是理清Web 内容间语义关系，建立以内容语义关系为基础的可用性评估模型.因此，需对待评估的Web 网站进行预处理，对网页进行语义提取，构建网站内容本体，获取用于代表网站内容的信息，为进行Web 内容可用性评估提供基础条件.

本文提出的网站内容本体的构建思路是:首先，从预处理的页面中抽取描述页面内容的信息，存储在文本文件中，用统计分词方法对文本进行处理并提取特征词，再利用特征词的共现完成特征词拼接处理，并将这些特征词作为本体概念的候选词，用于描述各页面的内容;其次，利用基于字面相似的等级关系识别以及基于聚类的等级关系识别构建页面内容概念树;最后，使用概念归一化对概念树进行修剪和转换，构建网站内容本体.具体过程如下.

3.1.1 特征词提取

将从页面中抽取出的描述页面内容的文本进行分词、去除停用词、词性和位置标注等处理，然后结合词语在文本中的位置、词长和词性等因素，利用TF-IDF 计算词语的特征权值，计算方法如公式 (1)所示，最后根据权值的大小，获取描述文本主题的特征词集合.

其中，α和β是两个可调节参数，且α+β=1，α 0.5，β 0.5，Loci表示词语wi位置的权重，Posi表示词语wi的词性权重，Leni表示词语wi的词长权重.

3.1.2 候选特征词拼接

在分词过程中，由于切分粒度较小，一些经常出现的词组短语常常被切分开.为了更好的发掘领域概念和知识，需要将经常共同出现的词语拼接在一起.本文根据候选特征词在文本中出现的位置，计算特征词间的共现度，计算方法如公式(2)所示，然后设定相应的阈值来判断特征词是否需要拼接.

fx、fy分别是词x、y 在文本中出现的频率.fxy是词xy 在文本中出现的频率;fyx是词yx 在文本中出现的频率.

3.1.3 内容概念树的构建

将拼接完成的特征词集进行同义词合并，并识别特征词间的等级关系，构建内容概念树.本文主要利用基于字面相似的等级关系识别和基于词聚类算法的等级关系识别相结合的方法来找出候选特征词集的上位概念，并实现等级关系的构建.其中，基于字面相似的等级关系识别是根据字面相似度的结果来进行的，如果两个词包含相同的词素，且该词素位于词语的后方，则包含字数少的词作为包含字数多的词的上位词;而词聚类的方法则是根据特征词间的统计或语义关系，将不同的特征词聚成一类，识别出被聚类的特征词的上位概念.通过上下位概念生成特征词间的等级语义关系.

具体构建过程为:①首先使用基于字面相似的方法将特征词集T 中的包含相同词素(其中词素的词个数≥2)的特征词进行等级关系组合，生成等级概念树CT，同时删除T 中被组合的特征词，并将概念树CT放入特征词集T;②重复进行①操作，直至没有字面相似的特征词为止;③最后使用基于词聚类的方法将特征词集T 进行词聚类，直到生成一棵完整的概念树为止，概念树构造过程完成.

3.1.4 内容本体的生成

若本体不做推理运算的话，则上述构建的内容概念树在一定程度上类似于本体.而本文的本体只是作为一种展示网站内容的手段，并用其来对Web 内容的可用性进行评估.因此将内容概念树进行剪枝处理后，可作为本体使用.本文将使用概念归一化对概念树进行修剪和转换，生成内容本体.

修剪转换原则为:

原则1:若概念树中某个结点只有一个特征词组成，则由该词表示结点概念，等同于本体概念;

原则2:若概念树中某个结点由多个特征词组成，且这些特征词是同义词，则选择其中词频最高的一个词作为结点概念，等同于本体概念，其余特征词作为该本体概念的同义属性;

原则3:若概念树中两个结点A，B 间有边直接相连，则将该条边转换成本体的上下位关系，其中概念树中的上层结点概念等同于本体的上位概念，下层结点概念等同于本体的下位概念.

3.2 内容本体的评价指标

本文采用将构建的页面内容本体与已有的领域标准本体进行对比计算在深度和广度指标下进行Web 内容可用性的评估.深度主要用于评估网站内容的主题覆盖度，广度则实现网站内容覆盖度的评估.

3.2.1 深度

本文使用内容本体的类目深度在领域标准本体类目深度中所占的比率来评估Web 内容在主题层次上的可用性，反映网站覆盖所属领域的主题比率.计算方式如公式(3)所示.从深度上可分析和建议该网站可添加哪些主题，以完善网站的主题信息，更进一步的满足用户的需求.

其中，CO表示内容本体，SO表示领域标准本体，Topic(SO)代表SO的主题类目，| Topic(SO)|表示SO的类目数.

3.2.2 广度

广度用来分析内容本体所含的概念信息在领域标准本体中所占的比重，主要评估Web 内容在内容信息上的可用性.它反映网站内容覆盖所属领域的比率.计算方式如公式(4)所示.从广度上可分析网站内容在所属领域中是否缺失或者内容表述错误，以进一步完善网站的内容.

其中，CO表示内容本体，SO表示领域标准本体，Concept(SO)代表SO的概念，| Concept(SO)|表示SO的概念数.

4 实证分析

为了验证本文提出的本体模式下Web可用性评估框架对Web 内容可用性的评估有效性，选取教育部网站——信息公开目录下与教育相关的页面进行Web 内容可用性评估.该栏目截止2015年3月31日，共有3 278个页面，内容涉及教育的各方面.使用《电子政务主题词表》[18]中“教育”部分充当领域标准本体，作为内容本体的比较对象.

采用本文提出的网站内容本体构建方式，对3 278个页面进行处理，构建了一个内容本体，该本体包含4 000多个概念.使用深度和广度对该内容本体进行评价，结果如表1所示.

表1 内容本体与领域标准本体的对比

根据表1，从深度上分析，内容本体的深度达到了0.896，由Web页面内容构造的内容本体包含26个类目，这些类目都存在于“教育”领域标准本体中.进一步对比领域标准本体可知，内容本体缺少了“婚前教育”、“职责教育”、“干部教育”等3个类目，这可能是由于教育部网站大部分关注的是比较常见的教育类型.“婚前教育”可能经常出现在一些有关婚育的网站中，在教育部网站“教育”类别下基本上不怎么使用;而“职责教育”、“干部教育”更是两个比较专的词汇，使用范围更窄.从广度上分析，内容本体中有5 118个概念存在于领域标准本体中，覆盖度达到了91%，这说明教育部网站信息公开目录下与教育相关的页面涵盖了大部分的教育内容，在内容可用性上是一个比较高的分值，其缺少的部分可能是由于少了“婚前教育”、“职责教育”、“干部教育”3个类别而造成的内容损失.构建的内容本体中剩下的179个概念并不在标准本体中，但它们也是一些与教育相关的概念，因此，可作为标准本体的词汇的补充.

5 小结

随着网络技术的快速发展，个人设计和开发Web不再是令人生畏.面对每天成指数级增长的网页，如何吸引用户选择浏览自己的网站，是Web 设计者面临的一个问题.Web可用性能指导和帮助设计者改进和完善Web 设计.基于此，本文提出了一个本体模式下Web可用性评估框架，并在该框架下，设计了一种构建Web 内容本体的方法，将该内容本体与领域标准本体进行比较，从深度和广度上对Web 内容的可用性进行评估，并进行了实证分析.但对于网站的可用性进行评估是一项复杂而庞大的工作，不能一蹴而就.对Web 物理可用性的评估，本文并没有较深入的讨论，这需要在以后的工作中继续讨论.

[1]Jakob Nielsen.Usability Engineering[M].Boston:Academic Press，1993.

[2]What is usability?[EB/OL].http://www.usabilityfirst.com/.

[3]MaAngeles Moraga，Coral Calero，Mario Piattini.Ontology Driven Definition of a Usability Model for Second Generation Portals[C].Proceedings of ICWE'06，2006(6):110-112.

[4]J.Nielsen，J.M.Faber.Improving System Usability Through Parallel Design[J].IEEE Computer.1996，29(2):29-35.

[5]L.Rosenfeld，P.Morville.Information Architecture for the World Wide Web[M].Sebastopol:O'Reilly ＆Associates，1998.

[6]J.Nielsen.User Interface Directions for the WEB[J].Communications of the ACM.1999 (1):65-72.

[7]Jared，M.Spool，Will Schroeder，Tara Scanlon，et.WEB Site Usability:A Designer's Guide[M].MA:User Interface Engineering，1997.

[8]Patrick J.Lynch and Sarah Horton.WEB Style Guide:Basic Design Principles for Creating WEB Sites[M].London:Yale University Press，1999.

[9]Chaomeng James Huang，Mei-Hui Chao.Managing WWW in Public Administration:Uses and Misuses[J].Government Information Quarterly，2001 (18):357-373.

[10]Menno de Jong，Leo Lentz，Scenario.Evaluation of Municipal WEB Sites:Development and Use of an Expert-focused Evaluation Tool[J].Government Information Quarterly，2006 (23):191-206.

[11]A.M.Morrison，S.TAYLOR，A.J.Morrison，A.D.Morrison.Marketing Small Hotels on the World Wide Web[J].Information Technology and Tourism，1999，2 (2):97-113.

[12]B.Leporini，F.Paterno.Criteria for Usability of Accessible WEB Sites[C].7th ERCIM International Workshop on User Interfaces for All.Revised Papers.2003:43-55.

[13]刘爱华.高校图书馆网站可用性评价研究[J].图书馆学研究，2008 (2):36-44.

[14]鄢沛，郭皎，应宏.Web可用性设计方法研究[J].重庆三峡学院学报，2010，26 (3):72-75.

[15]蔡屏.高校图书馆网站信息构建的可用性评价研究——以开普敦大学图书馆为例[J].情报杂志，2011，30 (5):169-173.

[16]刘业政，叶俊杰，蒋玮，徐俊芬.基于图上随机游动的Web页面布局可用性评价[J].管理科学学报，2013，16 (9):75-81.

[17]白志斌，杨达，李娟.Web 系统可用性自动化评估系统的设计与实现[J].计算机工程与设计，2013，34(10):3649-3653.

[18]《电子政务主题词表》编制与应用系统课题组.综合电子政务主题词(试用版).北京:科学技术文献出版社，2005.