APP下载

浅谈内容管理技术在数字图书馆中的价值

2009-12-17吴柳燕

河南图书馆学刊 2009年5期
关键词:数字图书馆流程

吴柳燕

关键词:内容管理;数字图书馆;流程;角色控制

摘 要:内容管理技术在数字图书馆建设中能够发挥重要作用。本文重点研究了内容管理系统在数字图书馆中的应用价值、流程和关键技术。从数字图书馆资源更新的过程,阐述了内容管理技术的核心思想,重点介绍了基于角色权限机制的安全访问的关键实施技术。

中图分类号:G250.76文献标识码:B 文章编号:1003-1588(2009)05-0039-03

1 前言

随着互联网的飞速发展,数字图书馆的应用越来越广泛,在西方发达国家早已经开始利用网络构建“电子化校园”或“连线校园”,以提升办学效率及方便学生的服务,并以更有效率的行政流程,为学生提供更广泛的、更便捷的信息及服务。我国很多院校也开始实施上网工程,各级院校都纷纷建立了自己的网站,电子教务的内网和外网建设成为校园上网工程的热点。目前国内校园信息化发展很快,但同时也存在着一些问题,机构调查评估表明:国内约有1/3的网站难以打开,约有1/3的网站应用价值比较低,还有相当数量的网站存在网站建设困难、信息更新不及时、服务功能不健全、发布的信息缺乏时效价值等问题。

存在以上问题的主要原因是信息更新比较困难。例如:根据工作需要增加一个栏目,首先需要专业人员来规划栏目内容,然后再聘请美工人员来设计网站页面,最后聘请专业人员来进行编码,整个过程相当复杂,也非常耗时;甚至只是需要修改一下栏目的名称,仅几个字,也需要聘请专业人员来修改程序;整个数字图书馆网站的维护成本非常高。并且随着数字图书馆规模的不断扩大,需要保持信息的实时性就更困难。

为了解决上述问题,可以引入内容管理系统(CMS-Content Management System)。内容管理系统能提供一种比较简单、方便的方式来进行专用信息网站的维护,它提供一个综合的管理平台和发布平台,管理人员和业务人员能通过它提供直接的接口,直接进行网站的建立和修改;业务人员还可以通过对数字图书馆中各种类型的数字资源管理、综合、增值和再利用,增加信息的价值。

2 数字图书馆中内容管理的作用

2.1 内容更新方式对比

数字图书馆内容发布的特点是:信息量大、资源种类庞大复杂、内容要求严格,图文并茂、格式丰富,更新速度快、审查机制完善。而传统的先制作页面,再上传至服务器进行发布的机制显然不适合这种信息的更新需求,成为数字图书馆应用推广中的瓶颈。

如何快速地管理和维护数字图书馆中的信息内容,全面提升管理水平,使复杂的过程变得简便易行,充分地发挥数字图书馆信息的时效性,真正达到快捷、实时、准确的发布信息,将内容管理提升到一个新的高度,以满足全校师生不断增长的需求,已经成为一个急待解决的问题。

传统的静态页面的网站的维护方式流程是:单位的业务人员(也就是内容的提供者)提出修改要求,然后网站管理人员通过编程的方式进行更新,必须要经过网管这一个环节(如图1所示)。

为了改变这种传统方式中对网站内容修改都需要网管人员参与,修改过程过于复杂,提出了内容管理的概念,业务人员可以通过内容管理系统直接进行页面修改和发布(如图2所示)。

2.2 内容管理在数字图书馆中的作用

采用内容管理系统,可以显著减少数字图书馆内容更新所需要的环节,提高数字图书信息管理的效率和质量。归纳起来,主要有以下几方面的具体作用:(1)管理人员能够方便地搭建网站、增加栏目、修改栏目的属性或者决定发布的内容,以及方便地管理系统的信息。(2)使最新的数字图书信息能够得到及时发布,保证数字图书馆中的信息能够与因特网中最新信息保持同步。(3)方便提供个性化图书信息检索服务。在开发个性化图书检索或推荐系统时,内容管理技术能够为用户提供个性化、经过定制的动态信息。(4)提高了数字图书馆信息管理和服务的效率。由于最新的图书信息能够被及时发布,因此不存在信息积累的问题,不需要专门安排时间统一对信息进行更新。(5)当数字图书资源中有错误信息时,能够得到及时的纠正,避免错误信息对读者带来严重的后果。(6)减少数字图书馆资源维护人数,既提高了效率,又降低了成本。

3 内容管理技术

3.1 内容管理的核心思想

内容管理技术作为一项新兴的技术,在业内尚未有统一的定义。不同的单位、机构对此有不同的理解。Garter Group认为内容管理从内涵上应该包括图书资源结构管理、网络组织管理、图书资源下载内容管理和数字图书馆外部网信息共享内容管理,如CRM(Customer Relationship Management)。也有研究者认为图书内容管理应侧重于给用户定制个性化动态信息。

内容管理本质上就是采用基于网络的协同计算和内容的索引、编码、存档、恢复和个性化的发布服务等先进的技术手段,将Internet的优势和数字图书馆应用相结合。简单地说,内容管理即管理网上需要发布的各种信息。内容管理所涉及的内容不仅仅是对文件、数据的管理,还包括资料获取、存储方法、访问权限、检索方法等方面。这些工作可以分为三个层次:即内容创建,内容管理和内容的分发(如图3所示)。

这样内容管理就可以定义为:协助组织和个人,借助信息技术,实现内容的创建、存储、分享、应用、更新,并在信息资源管理、组织、推荐、浏览等各个方面产生价值的过程。

概括起来,内容管理的内涵是:内容管理协助组织和个人,借助信息技术,实现内容的收集、确认、批准、整理、定位、转换、创建、存储、分享、应用、更新,使“内容”能在正确的时间,以正确的形式传递到正确的地点和人,并在信息资源管理、组织和用户使用的各个层次产生作用。

3.2 内容管理制作过程

一般来说,内容管理的生命周期分为三个阶段,即内容采集、内容加工和内容发布(如图4所示)。

整个生命周期的起点是内容采集。它包括内容及其元数据的创建和收集,可以有多种途径和工具——文字处理、扫描、识别、通用接口等等。内容管理系统可以将多种不同来源、不同格式的内容统一进行管理。内容加工就是内容的管理和控制,其中包括对内容的查找、编辑、归档和备份等。为了保证内容的安全和准确,监控、测试和存取控制也包括在内容加工的周期中。在内容加工的过程中,用户定义内容域的结构,将大量的内容组织成完整的实体以待发布。内容发布是内容管理中的重要阶段,在这个阶段,完整的内容资源按照用户定义的格式输出到不同的设备上。经历了这三个阶段,内容从最初的离散混乱状态变成高度组织和联系的整体。

3.2.1 内容采集

内容采集阶段的功能包括内容的设计、内容的新建和转入、元数据的建立、内容的审核、内容的转换以及内容的存储。

内容的设计主要指用户对所需内容的来源、格式和发布形式进行初步的定义,对不同的来源给出不同的接口形式,对不同的发布形式也给出相应的模板。

内容的新建是采用各种工具(如字处理软件、网页编辑工具等)建立新的内容。内容的转入是指对采集来的各种不同格式的内容(包括非电子化纸质文档)经过加工处理后,转入到内容管理系统中来。对内容的新建和转入方面的研究工作主要包括各种不同程序插件的设计和接口的定义以实现内容的转入。

元数据的建立就是建立内容的附加描述信息,包括语义上的描述信息和结构上的描述信息。内容的采集者一般要对元数据的建立负责。

内容的审核则是对进入网站的内容或者待发布的内容进行审查。一般来说每个内容都需要进行审核,而不同来源或者格式的内容可能需要经过不同的内容审核过程。因此,在内容审核阶段集成一个工作流的概念成为目前的一个趋势。其中的多级审批制度是今后研究的一个重点。

内容的转换是对采集来的内容进行结果或者格式的调整。比如将RTF文档转换成为带格式的HTML文档,压缩图片以便更快速地进行读取,调整数据库记录的格式以更新系统的使用等等。

内容的存储主要是对各种来源的内容进行统一的管理,以便加工和查找。解决图书资源中大量的非结构化的问题。

3.2.2 内容加工

内容加工阶段的功能包括内容的修改和版本控制、检索和分类、安全控制、测试、归档以及发布实体的建立。

内容的修改和版本控制除了对内容本身的修改外,修改过程还包括给内容加标注。这些标注不像元数据那么规范,只是起到注释的作用,这在资源更新中比较有用。对内容进行修改后,就会自动产生一个相应的版本,有的内容管理系统还产生一个修改日志来跟踪、记录这些变化。对本功能的研究主要在版本控制方面。

检索和分类主要对内容进行检索和分类,是为了方便用户进行搜索以及提高搜索的准确程度。结合元数据的应用,内容的检索和分类是内容管理中的一个研究热点,很多研究机构和院校都对此进行了大量的研究工作。

安全控制是控制每个内容的授权访问对象。比如,有的用户可以读取,有的可以修改。数字版权管理DRM(Digital Right Management)是内容管理中的一个研究方向,安全控制是进行数字版权管理的基础。

测试主要是对内容物理存储的有效性、链接的正确性、内容发布前的样式规格进行检查以及对最终的内容实体进行发布前的预览。发布前的预览能有效的检查出断链的和样式的错误,是数字图书馆内容管理的重要组成部分。

归档是指对过时的内容进行处理,可能是删除、备份到其他媒体上或者存放到仍可以被查询的位置。

内容发布就是将内容实体按照用户定义的格式输出到不同的媒体上,内容发布是实现内容重用和个性化定制的一个重要部分。

4 数字图书馆中内容管理关键技术

目前,安全访问授权是内容管理的一项关键技术,实施授权最常见的方式是基于角色的访问控制(Role-Based Access Control, RBAC)。基于角色的访问控制是美国KIST(National Institute of Standards and Technology)提出的一种新的访问控制技术。该技术主要研究将用户划分成其在组织结构体系相一致的角色,以减少授权管理的复杂性,降低管理开销和为管理员提供一个比较好的实现复杂安全政策的环境。访问者的权限在访问过程中是变化的。有一组用户集和权限集,在特定的环境里,某一用户被分派一定的权限来访问网络资源:在另外一种环境里,这个用户也可以被分派不同的权限来访问另外的网络资源。这种方式便于授权管理、角色划分、职责分担、目标分级和赋予最小特权,也是访问控制发展的趋势。

RBAC原理是比较容易理解的,不同于简单的USER-RESOURCE模型,它增加了一层ROLE层, 变成了USER-ROLE-RESOURCE,赋予管理系统更多的灵活度的同时,也简化了系统的权限管理。

5 结论

内容管理从本世纪初开始成为一个重要的应用领域,人们需要充分利用信息技术来提高竞争能力,而内容管理恰恰能够通过对数字图书馆中各种类型的数字资源的产生、管理、增值和再利用,改善组织的运行效率和服务能力。

参考文献:

[1] 王芳,郭英.电子政务内容管理及其应用分析[J].情报理论与实践,2008,(1).

[2] 陈静,蔡鸿明,徐博艺.网站内容管理及个性化网页系统的研究与实现[J].计算机应用与软件,2007,(9).

[3] 邓君,韩毅.国外企业门户平台内容管理比较研究[J].情报科学,2007,(6).

[4] 王向敏.图书馆与内容管理系统[J].农业图书情报学刊,2007,(4).

[5] 马建玲.开放源代码的内容管理系统Drupal[J].现代情报,2007,(2).

[6] 董平军,王东明,王宁.内容管理技术在高校学籍档案管理中的应用[J].现代图书情报技术,2007,(3).

猜你喜欢

数字图书馆流程
急诊快捷护理流程在急性脑卒中抢救中的应用
与元英&宫胁咲良零距离 from IZ*ONE
四川省高考志愿填报流程简图
“一课四备”磨课流程例说
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
刍议数字图书馆计算机网络的安全技术及其防护策略
流程的量化
客户导向的流程如何来评估?