APP下载

基于关联数据的高校图书馆场景化知识服务系统架构设计

2018-10-31

图书馆论坛 2018年11期
关键词:语义关联可视化

0 引言

数字图书馆通过知识资源的网络化传递,进而实现跨时空的知识服务。移动互联网环境下,用户在不同的时间、空间的信息需求呈现出明显的场景化特点,催生了场景化知识服务的概念。场景化知识服务要求资源平台——各类数字图书馆系统具备将资源融合、关联、语义化的功能,并具备针对个性化需求提供在线的、个性化的、符合当前语义场景的网络化知识传递,也就是能够提供跨时空的场景化知识服务。语义化的场景知识服务与传统信息服务不同,它不仅基于

关键词检索提供信息资源本身的下载或推送,还基于用户的核心需求而提炼出相应核心概念。围绕核心概念利用本体、关联数据等语义技术,将相关数据资源实现语义化聚合;通过对数据的分析及可视化发现数据关系,并揭示和预测数据发展趋势;实现个性化推送,根据不同的需求场景,辅助用户查找或得出解决问题的具体方案,为读者提供场景化的语义服务。

本文构建基于关联数据的高校图书馆(以下简称“高校馆”)场景化知识服务系统架构,将不同类型资源内容进行语义关联化深度整合,并无缝链接外部广阔的相关资源。主要目标:(1)通过本体与关联数据技术的应用构建语义检索平台,即基于本体库中概念间的关系,将信息内容从主题方向实现语义化组织,然后以关联数据的方式发布,并实现语义化检索关联化发布。(2)在语义检索基础上,梳理用户知识服务的核心需求并形成核心概念,围绕核心概念构建用户知识需求场景,以时间、空间、个性化需求配置,设计场景化知识服务的信息流、时间流,结合个性化需求形成具体的场景化知识服务。将上述检索平台和场景化服务系统的构建运用到高校馆具体实践,设计出高校虚拟“教与学”知识服务场景,为高校馆提升深层次的语义化、场景化知识服务提供参考,探索高校馆服务教学科研、提升核心竞争力的新路径。

1 场景理论及相关研究现状

1.1 什么是场景

场景本来是影视领域的用语,指在特定时间和空间内发生的情境,或者因人物关系构成的具体画面或音效。场景理论最早由美国罗伯特·斯考伯和谢尔·伊斯雷尔在《即将到来的场景时代》中提出,该理论源自“场景五力”:移动设备、大数据、传感器、社交媒体、定位系统[1]。场景成为继内容、形式、社交之后媒体的另一种核心要素[2]。

当前的网络信息环境与技术平台中,信息传播从本质上说都是基于情境感知的,即基于场景的信息适配应成为网络信息需求的主流形式,这是由网络媒介的本质特征决定的。《普通高等学校图书馆规程:移动、传感、数据和未来隐私》第2条规定:“高等学校图书馆是学校的文献信息资源中心,是为人才培养和科学研究服务的学术性机构”[3]。高校馆本身就是一个具体的信息需求场景,基于“场景五力”构建智慧化信息空间是确保图书馆在互联网“场景之争”中获得一席之地的重要途径。

1.2 场景化知识需求

罗伯特·斯考伯等提出场景概念正值移动互联网兴起之时,因而场景被认为是移动媒体的新入口和移动互联网时代的核心。场景时代下,基于“场景五力”的场景设备如影随形,能够知晓用户及外界的各种信息,理解有关用户是谁、正在做什么以及接下来可能做什么等场景,从而提供个性化的服务,以便“更加符合每个人当时的需求”。郜书锴围绕场景概念的内涵与演进、场景的理论框架与建构进行了论述[4],在此基础上探索场景理论的学术源流和实践策略。谭天指出:场景设计者可以有三个思考维度:满足需求、响应需求、创造价值,即从人性、社会和文化三个层面构建场景[5]。

基于场景分析的目的在于通过分析时间、空间、信息、人、设备、信息传播渠道等信息要素及其之间的多维度关系,确定特定场景内人的信息需求,并适配与之相应的知识服务。信息是物质的一种普遍属性,是事物存在的方式和运动状态的表现。知识是主体和客体相互统一的产物。信息服务向人们提供的更多是显性信息;知识服务强调的是根据用户的需求和场景的不断变化而有效地支持知识应用和知识创新。例如,在主题法信息组织领域,基于本体能充分理解用户的行为和需求,这其中的适配意味着要构建用户知识需求的核心概念,在不同场景下根据核心概念构建需求本体,基于需求本体迅速匹配与之适应的知识服务方式,并以用户个性化行为特征为轨迹在适当的时间推送给用户。

1.3 高校图书馆的场景化知识服务

图书馆服务步入“场景时代”[6],王东波从图书馆场景服务的要素分析与内容实现角度提出面对场景的时代,图书馆必须要实现场景服务,提高其服务水平[7]。包冬梅基于开放数字环境下科研用户科研活动场景和科研信息需求的角度,指出场景化思维是一种有效解决学术图书馆面向科研创新服务困境的思维方式[8]。王福、毕强从移动图书馆场景化信息接受情境聚合适配角度,以云舟知识服务空间为例,构建了移动图书馆信息接受情境聚合适配模型[9]。

笔者基于近年对本体与关联数据的研究及场景化传播效果领域的探讨,通过分析特定场景中用户的信息需求,指出应根据用户特定场景下的信息需求,提炼出该场景下用户信息需求的核心概念;然后以该核心概念为抓手,以关联数据为主要手段,实现对特定场景核心概念对应的信息资源的语义组织与聚合,最终与关联数据技术、可视化知识图谱技术为主要支撑手段,匹配出符合核心概念集所适配的资源及服务[10],即通过信息本体与过程(流程)本体来适配资源与服务。这种服务显然是知识服务的范畴,而决定基于场景的知识服务智能适配水平的主要是语义检索与场景化适配。这也是高校图书馆知识服务水平提升的重要路径,是智慧图书馆研究的重要内容。

高校馆场景化知识服务可分为两个层次:首先结合图书馆空间、资源与服务,感知读者的场景信息,然后为用户提供匹配场景信息与个性化阅读习惯的语义资源及获取路径导航服务,即基于场景化知识服务,见表1。要实现上述两个层次的功能,需要设计语义检索平台与场景化适配的平台。

表1 场景理论与图书馆知识服务

2 基于关联数据的场景化知识服务系统架构

系统架构设计目的:(1)实现不同资源的语义深度融合,即基于关联数据与本体等语义技术实现链接外部广阔的相关资源;(2)实现场景需求的核心概念集,即基于核心概念集及语义平台中的语义关系发现、内容聚合、可视化关系呈现等实现场景化知识服务。

系统架构实现路径:(1)知识服务重点在于如何揭示知识要点发现、挖掘关系、语义化检索、可视化呈现等,了解场景化情境下的个性需求;(2)基于场景的语义层面的知识服务要满足如下特性:预测性、预警性、针对匹配性、关联性、市场性等;(3)结合目前已有语义化、交互化、个性化与场景化设计,在信息传送中更好地呈现内容、深入用户的学习和创新过程,进而留住用户、迅速准确地获取用户反馈,达到支持用户的个性化需求的目的。

系统架构具体实施的基础实验:基于内容管理平台Drupal的概念云图的应用;基于Drupal的关联数据语义聚合实验;基于RelFinder的关联数据关系发现及可视化;语义化关联化检索平台的设计等。

2.1 内容管理平台:Drupal实验

Drupal采用PHP脚本语言编写、架构开放源码的内容管理系统。基于Drupal来构建线上平台的应用实例在美国和英国的政府信息平台中有很多,还有许多新闻媒体也采用该技术来实现关联数据的应用,如《纽约时报》、《纽约观察报》。笔者2010年基于Drupal平台开发的IRSCCO系统是基于Apache+MySQL+PHP的服务器架构开发,在Drupal系统(Content Management System,一种自主开发的内容管理系统)基础上通过修改部分程序而完成。笔者开发的IRSCCO系统融合部分Web2.0的功能。

2.2 多维度信息内容的语义聚合实验

笔者在先前的研究成果《叙词表构建本体的中文叙词词间关系细化研究》中提出,将汉语概念间关系表述为5层24种关系规范。在Drupal的关联数据语义实验中,首先从CNKI检索出主题词为知识组织与知识管理的相关数据,对其进行整理并从五个维度进行概念关系的梳理;然后通过本体库与关联数据技术分别建立相应数据间的语义关系;最后通过Drupal将其进行关联发布[11]。Drupal本身具有支持RDF的核心模块,分别为RDF模块、RDFCCK模块、ARC2模块、EVOC模块、RDF Sparql EndPoint等,这些模块在Drupal官网上均可找到下载地址。下载这些支持关联数据的核心模块,安装并启用后便可将这几个模块导入并导出、存储于数据库,根据数据之间的链接分别进行映射,针对建立的每一个实体、概念进行语义关联,再将以RDF格式存储于RDF仓储中的数据通过SPARQLEndpoint进行查询与调用,实现基于Drupal的关联化发布。在其他研究中,笔者探究了在Drupal平台的内容模型与RDF数据模型之间建立映射实验、图书等多种文献资源的RDF转化实验及MARC数据的批量转化实现方法[12]。

2.3 语义关系发现可视化实验

信息可视化指可以用来构建、传达和表示复杂知识的图形图像手段。除传达事实信息之外,信息可视化的目标还在于传输人类的知识,并帮助他人正确地重构、记忆和应用知识。信息可视化作为学习工具,改变以往的认知方式,让人们更容易接受信息的内容。大数据时代,可视化旨在借助图形化手段,清晰有效地传达与沟通信息,或通过把握设计与功能之间的平衡,将复杂的数据元素很好地可视化,达到准确传达与沟通信息的主要目的。经过多年的实践探索,业界已越来越清晰地意识到只有在数据可视化呈现方面做得好,才能实现数据应用的稳健成长和可持续发展。可视化元素呈现得好才能较好地传递信息内容,提示信息要素间关系。优秀的可视化方案能让用户更易于接受信息内容,从而提升信息传播效果。

本实验采用可视化开源软件平台RelFinder,将数据进行语义化关联发布后,再进行可视化呈现,以满足用户的信息需求心理;同时这些实验的累积可以发现用户对信息内容关系发现的需求规律,捕捉用户信息需求行为特征。学术内容关系可视化发现实验的具体过程为:将RelFinder安装与配置后,在服务器端需采用PHP脚本实现客户端和SPARQL端点间SPARQL查询的提交,以及返回的结果集呈现,所以运行环境中要修改config.xml中的SPARQL端点,再将Endpoint URI设置成为本地存储Virtuoso的SPARQL端点:http://localhost:8080。config.xml的文件片段见图1;人物、主题词、机构、基金、引文五个维角度的关系发现效果与可视化呈现见图2。RelFinder针对的便是依靠Web DATA或Linked Data数据格式的关系发现,它基于SPARQLEndpoint对这些数据进行统一的查询操作来访问RDF仓储中的关联数据,最终实现语义关系的发现与识别[13]。

图1 Virtuoso的SPARQL端点config.xml配置文件片段

图2 不同载体类型的学术资源内容五维关系发现与可视化结果

2.4 场景化知识服务系统平台设计

本体、关联数据等理论及语义技术方案的现有研究已有能力为大数据背景下语义化知识服务提供支撑。对于基于关联数据技术进行学术资源语义关系发现的研究和探索,语义检索平台是实现主题聚类的基础,而主题聚类是场景化知识服务最重要的一个维度,是主题维度的知识服务基础。

本实验中通过对“知识组织与知识管理”主题的学术资源进行语义化组织与检索,在本文2.1、2.2及2.3基础上,利用Drupal工具将整理后的数据发布为关联数据,通过映射语言分别建立相应的关联,通过适配算法,采用RelFinder平台去动态地交互地发现所研究领域学术资源之间的关系,并以此为导向进行可视化的展示。这个实验目的是了解知识点在不同的研究者、研究机构的关注度,便于研究学科发展规律从中选题,发现知识点间的交叉、融合演变关系,发现研究领域新的方向、研究热点及未来该领域的发展趋势[14]。基于关联数据的知识检索平台的设计方案如图3所示。

图3 基于关联数据的知识检索平台设计方案

3 高校图书馆虚拟“教与学”场景的知识服务平台设计

高校图书馆的核心竞争力可以概括为:持续参与用户泛在学习过程,增强支撑用户的研究创新过程,不断参与政府、高校及社会其他机构的管理决策过程。当前信息环境与技术平台下,提升高校图书馆核心竞争力的路径为:空间、资源、服务三个维度的深度融合。服务教学、科研与决策参考成为高校图书馆的核心竞争力。网络媒介环境下,虚拟“教与学”场景的知识服务成为最重要的环节。基于“场景五力”的图书馆知识服务设计愿景是:首先,传感器监测用户身份信息(who)和位置移动信息(where),通过身份和位置移动来判断用户为什么(why)访问图书馆,即有什么服务需求;其次,在确定身份后通过对用户大数据的挖掘确定用户信息需求偏好,同时确定空间内有什么资源(what);最后,结合用户需要和用户偏好为用户推荐合适的资源和获取方式(how),构建完全符合用户需求的人性化信息服务。

3.1 “教与学”知识服务场景化需求分析

高校图书馆知识服务的设计是将严谨、枯燥、呆板的传统“教与学”关系与自由、宽松、便利的“第三空间”理论相结合的产物。实践中会再造或置换全新的物理空间,如学习空间、讨论空间、创客空间、新技术体验空间等。又如,引入与虚拟空间相结合的学科化服务平台,在虚拟服务平台为读者提供互动服务,将实体空间与虚拟空间相融合,形成读者参与、馆员引导的,以学习、讨论、交流、分享为主要形式的虚实互动平台,让学习过程变成学习与社交相结合的过程。

综上分析,场景化知识服务是空间、资源、服务三维融合发展的直接体现,决定了高校图书馆存在的价值,是高校图书馆核心竞争力提升的直接路径。而场景化知识服务是以实体场所空间和网络虚拟信息空间复合并存的新型空间为基础,为用户提供多元、自我导向的场景环境。这种场景环境既包括正式的学习环境,也包括非正式的交流环境,包含虚拟社交的功能。图书馆场景化知识服务的特殊性主要表现在图书馆为用户提供的是复合空间与知识情境的完美融合。这种场景服务以知识情境理论为依据,可以更好地认识图书馆空间的物质构成和精神内涵。倾向从环境、资源、空间、内容和角色等多个维度寻求场景化知识服务,在开放的知识环境中寻求知识服务的新定位,在创新环境中开发实体、虚拟、虚实互动的空间服务新功能[15]。

3.2 “教与学”场景的知识服务功能设计

学生进行专题讨论或开题研究等任务时,面对海量的资源,经常是无从下手,很难快速梳理出知识点及这些知识点间的内在关系。这时候探究数据间的语义关联就成为学习中的重要环节。而关联数据与本体恰能有此优势,帮助用户梳理知识点间的关系,在语义检索的基础上实现基于语义的主题维度的语义聚类。并且,关联数据体现互联网思维融入的理念,可提升读者体验的效果。同时,平台也离不开基于资源的社交,基于场景的知识创造等新的功能。

教学场景的知识服务要求实现专题在笔记、消息、小组等各个交互场景中的快速流转,同时可以将不同专题分门别类放到不同的文件夹。结合知识间的关联关系,将不同主题知识组织成小的结点文件夹,然后结合用户的需求场景进行个性化推送,并把反馈较好的优质专题的评论与用户学习心得不断推荐给更多有共同知识需求的用户,实现知识传播、分享的最大化,实现图书馆多种资源的综合利用与传播,打赢未来场景之争的关键之战[16]。

3.3 “教与学”场景的知识服务平台设计框架

3.3.1 内容设计框架

以语义化检索平台为基础,构建场景中使用者群体对专业知识的语义信息,结合场景中用户的使用习惯及个性化需求的语义化揭示,创造出场景化的内容平台,包含大量语义化处理的内容:知识库(包括体系、算法、内容、链接等)。重点是研究如何揭示内容里的知识、内容间的知识关联、使用者的经验和方法上升为知识等,都属于知识组织的范畴。以语义检索平台为基础,强化知识发现是重点。将数据进行RDF描述,使数据具有语义元素,并实现关联化描述,语义化聚合,这是场景化的内容,是场景化知识服务的核心。

3.3.2 知识传播设计框架

教学场景的知识传播设计框架实质是在场景化知识服务平台的内容基础上,融入使用者的学习环境、人际环境、创新环境等与教学场景相关的知识传播社交空间。实体社交空间受到时间、场所、资金等限制,而在图书馆“教与学”知识服务平台中通过虚实结合的立体的知识传播社交空间,可提升检索、下载、学习、交流、分享等学术社交体验。各类虚拟空间技术发展推动教学交互的发展,在场景化教学知识服务平台中,教师备课、课堂讲授内容均来自于多种数据库资源以及数字图书馆语义服务的融合。

3.4 虚拟“教与学”场景化知识服务设计方案

教学场景是高校图书馆基础的服务场景,因为高校图书馆的定位是“三中心一课堂”(即知识服务中心、学术交流中心、文化传承中心,以及人才培养的第二课堂)。因此,本文以基础的信息需求为例进行设计,从用户信息需求场景获取角度,从用户在每个时间、空间节点的需求与行为特征值中挖掘出用户的需求数据,特别是从当前数字图书馆的虚拟语义空间入手,构建高校数字图书馆的“教与学”虚拟空间信息需求流程的核心概念,即用户的信息需求流程(过程)本体;从用户的搜索行为特征提炼用户搜索内容的域及语义场景,并构建该场景内容主题维度的语义核心概念,即信息本体,从而构建出基于语义层面场景下的知识服务框架;最终以关联数据技术及知识图谱可视化方式,将上述基于信息本体与流程(过程)本体生成实现语义化主题内容聚合的信息流、结合用户在特定时空下需求特征的场景信息,以合适方式、设备和渠道呈现给用户,并将用户对本次知识服务的反馈信息记录下来,服务于更多知识服务场景,优化知识服务的效果。

总之,基于关联数据的场景化知识服务能充分利用关联数据的特点及其在知识服务中的优势。笔者以高校图书馆的典型应用(教与学)为场景设计背景,尝试从语义空间构建入手,为用户设计基于语义的虚拟“教与学”场景知识服务构架,如图4所示。

图4 虚拟“教与学”场景的知识服务构架图

4 结语

基于关联数据的场景化知识服务设计可以动态交互地发现知识间的关系并实现可视化呈现,提高了直接或间接语义关系发现的效率。寻找有用的、概念之间未知的关联,从更细粒度方向开展知识间关系发现的研究,将分析结果通过图形方式客观、方便、直观地呈现出来,能提升知识组织与知识管理效率,对知识关系发现提供了初步探索,可直接服务于场景化知识服务。在此基础上,设计场景化的知识服务,构建学习者与教学者在不同视角下社交与学习、社交与教学的交互过程。这种设计思路是一种将严谨、枯燥、呆板的“教与学”关系与自由、宽松、便利的“第三空间”理论相结合的产物;是图书馆依托“互联网+”环境下海量的网络数据以及开放的网络服务,向虚实互动的智慧图书馆领域作出的有益探索[17]。

移动互联网时代争夺的目标是场景应用,“支付宝+快的打车”和“微信+滴滴打车”是关于用户出行场景的争夺,而智慧空间建设就是图书馆对知识服务场景的争夺。图书馆如果不能在这场场景之战中有所作为,在未来必然会遇到与当下数字图书馆遭遇百度、谷歌等搜索引擎类似的挤压。我们任重而道远。

猜你喜欢

语义关联可视化
真实场景水下语义分割方法及数据集
基于CiteSpace的足三里穴研究可视化分析
思维可视化
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
基于CGAL和OpenGL的海底地形三维可视化
语言与语义
“一带一路”递进,关联民生更紧
“融评”:党媒评论的可视化创新
奇趣搭配
智趣