APP下载

电子文件管理视角下背景信息与元数据的比较研究

2016-02-04郭鹏周庆山

山西档案 2016年5期
关键词:背景功能信息

文/郭鹏 周庆山

电子文件管理视角下背景信息与元数据的比较研究

文/郭鹏 周庆山

背景信息是电子文件管理的基础,同时也是数字档案元数据的主要信息来源,二者联系密切。文章结合国内外的研究现状,重点分析了背景信息与元数据的异同,从理论研究和实践操作角度对二者的含义、结构、形态、功能进行比较,揭示其区别与联系,旨在避免二者的交叉混用,进而提出具有针对性的措施,以保证电子文件的有效管理。

电子文件;元数据;背景信息

随着我国电子文件管理理论的不断发展,电子文件的数量和类型也在不断增长。如何才能使这些电子文件及时、准确、快速地移交到档案部门,并实现长期保存和有效利用,已成为学界急需解决的问题。就目前情况来看,档案界已经开始认识到电子文件背景信息和元数据在电子文件管理理论研究和实践中的重要意义。然而,在研究和实践中,二者经常被误认为同一事物。概念的混淆必然给档案工作带来诸多不必要的麻烦,因此,下面先就电子文件背景信息与元数据的含义、结构、形态和功能方面的联系与区别进行详细的分析。

一、背景信息与元数据的概念内涵

背景信息和元数据都是伴随着电子文件管理的理论研究而为人们所熟悉的。但是由于缺少专门的对比分析,二者的混用、乱用现象比较严重。

元数据一词最早出现在美国航空航天局(National Aeronautics and Space Administration, NASA)《目录交换格式》(Directory Interchange Format, DIF)的手册中。[3]但是,迄今为止各个专业领域还没有就元数据得出一个统一的认识。通常的情况,元数据被定义为:关于数据的数据(Data about data)。然而,由于不同类型的数据资源可能会有不同的元数据标准,[2]这个定义无法清晰地反映出元数据的内涵和实质。

背景信息也是一个复杂的概念,很难得出一个放之四海而皆准的定义,通常只能在特定的环境下来认识它。在电子文件环境下,一份完整的电子文件包括内容信息(文件所包含的表达作者意图的信息)、背景信息和结构信息(内容信息的组织表达方式)。电子文件背景信息是指除了内容信息与结构信息之外,与电子文件的价值实现和有效管理直接相关的信息。“价值实现”是保存文件的最终目的,“有效管理”是其逻辑基础,二者是文件发挥作用必不可少的因素,“直接相关”则是文件的一种价值特征,指“密切相关”。

二、国内外对于电子文件背景信息与元数据的研究情况

国际档案理事会电子文件委员会制订的《电子文件管理指南》指出,有两类相关信息应当记录和保存,一类是“元数据”,即关于电子文件的技术数据。另一类是“背景信息”,即关于电子文件业务和行政背景方面的数据。元数据有助于说明电子文件的内容、结构和上下文关系。背景信息有助于说明文件的真实性,并能帮助文件使用者理解文件的内容。由此可见,在电子文件委员会看来,元数据和文件的背景信息是两个并列的概念,二者的区别在于它们包含的数据种类和功能不同。根据背景信息的定义,电子文件的技术数据也是一种背景信息。所以这种表述方法虽然看似简单明了,但是却存在着矛盾。

ISO15489-1:2001第3.12 条指出:元数据管理是文件管理中不可缺少的一部分,它具有不同的功能与用途。在文件管理的环境下,元数据的定义为:自始至终地描述文件的背景、内容、结构及其管理的数据。[3]也就是说,元数据的管理对象是电子文件,它是对电子文件整个生命过程中产生的全部信息进行管理所形成的数据。然而值得注意的是,定义中的“管理过程”本身就是通过被记录的背景信息体现的,是背景信息的重要内容,所以此种定义也显得略欠妥当。

在我国的《电子文件归档与管理规范》( GB/T 18894 - 2002)中,元数据是指描述电子文件数据属性的数据,包括文件的格式、编排结构、硬件和软件环境、文件处理软件、字处理和图形工具软件、字符集等数据。这种元数据定义中有两点值得注意:一是定义中提到的文件的格式、编排结构、硬件和软件环境、文件处理软件等都是文件背景信息的一部分,其观点表明,元数据是用来描述背景信息过程中形成的数据的一部分。二是定义中启用了一个特殊的概念“数据属性”,数据的属性是数据的关键。数据作为信息在计算机环境下的表现形式,可以看出这种定义认为元数据是描述电子文件全部信息的数据,其中的“信息”当然也包括“背景信息”。

综合以上几种定义可以发现:元数据是结构化的、或半结构化的信息,是有关文件创建、登记、分类、利用、保存和处置的整个过程的信息;对背景信息著录所得到的数据属于元数据;元数据不仅仅是对背景信息的描述,而是针对整个电子文件进行的描述;对文件进行管理的元数据可用于确认文件、人员和文件流转的过程,以及创建、管理、维护和使用文件的系统,还有对文件进行管理的政策,并使它们融入相应的背景中。

三、背景信息与元数据的异同分析

背景信息与元数据,在很多情况下被作为同一个事物交叉混用,但是实际上二者并不相同。

(一)背景信息与元数据在含义上的异同

背景信息与元数据虽然是两个不同属的概念,但是在具体操作上有很多的部分是重叠交叉的。首先,元数据是描述文件内容、结构和背景信息的相关数据,它面向的对象是整个电子文件而不仅仅是其中的背景信息。它可以是技术数据、业务数据,也可以是行政数据,但这些数据都是在电子文件整个信息流程中记录下来的,是反映电子文件各个方面信息的数据。所以不能将元数据只看作是对电子文件背景信息进行管理、描述过程中形成的数据。“描述文件背景信息过程中形成的数据”只是元数据的一个“子集”。

其次,电子文件背景信息是一个很宽泛的概念,它并非都以有形的(或结构化、半结构化的)元数据形式存在,还有其他多种形态的表示方式。对背景信息的描述不一定非要通过“著录”这种形式,如隐性背景信息、文件本身带有的“参见”、附注等显性连接标志,它们虽然也是对文件背景信息的描述,但却不一定是结构化的元数据。我们可以说只有对背景信息进行著录或者由计算机及网络系统自动辨析、分解、提取和分析归纳过程中形成的数据才属于元数据,而不能说任何关于背景信息的数据都是元数据。

(二)背景信息与元数据表现形态上的异同

背景信息是一种信息,而元数据是一种数据,二者在表现形态上存在巨大的差异。背景信息是构成电子文件的重要组成部分,它的存在具有客观真实性。但是元数据无论是由计算机及网络系统自动辨析、分解、提取和分析归纳,还是由人工著录,都不是电子文件本身,它只能算是电子文件信息管理的痕迹。

(三)背景信息与元数据结构上的异同

背景信息作为一种信息的存在形式,没有固定的结构。在谈论背景信息的结构时,人们关注得更多的是它的组成范围。而元数据是数据的数据,电子文件管理元数据的结构分为宏观结构和微观结构。所谓宏观结构,就是电子文件管理元数据顶层框架的架构,而微观结构则是指电子文件管理元数据元素的构成,针对不同领域制定的标准,元数据微观结构一般不同。总之,电子文件背景信息与元数据的结构是不同的。也就是说,部分背景信息没有相应的元数据元素与其对应;而有些元数据元素也找不到与其对应的背景信息,二者不是一一对应的关系。

(四)背景信息与元数据功能上的异同

在不同的研究领域,元数据的功能也不一样。对于档案管理领域,元数据除了具有上面所列的功能以外,还有自己特殊的价值功能。元数据为电子文件背景信息的管理、发现和获取提供一种实际而简便的方法。虽然元数据无法涵盖背景信息的各个方面和全部内容,但是通过元数据,我们能够对背景信息进行比较详细、深入的了解,同时,电子文件的制作和管理者们也可以利用元数据进行数据维护、历史联系维护。由此可见,在功能方面元数据与背景信息既有相同的部分,也存在明显的区别,具体表现为:

首先,元数据在电子文件管理系统中的功能体现为构建信息检索机制。利用元数据可以为用户提供方便快捷、多层次、多途径的检索体系,而这一点是背景信息所不能达到的,这是背景信息和元数据在功能上的重要区别之一。

其次,元数据在一定程度上维护信息的识别与读取功能。元数据具有静态映射功能,能够系统地映射出电子文件的内容、背景和结构信息,还能够映射出电子文件的生成环境和行政管理环境。我们一旦获取了电子文件所携带的元数据信息,就可以比较全面地记录电子文件的形成和办理过程。但是,元数据反映出的信息多是一种静态的映射,并不是电子文件的原始状况,在这种映射过程中,就可能出现信息的失真现象。与此不同的是,背景信息是一种客观存在,可以如实地反映电子文件维持可读性、可识别性的相关信息。

再次,元数据的描述功能也与背景信息不同。背景信息包含的内容主要是文件生成和办理过程中产生的人员和机构信息,文件的形成目的和办理结果,以及文件与相关文件之间的上下文关系,形成和维护电子文件的历史环境等。然而,元数据的主要用途之一就是对资源进行描述,它可以全面地反映出电子文件整个生命过程中文件自身的全貌。除了对背景信息进行描述之外,元数据还可以对电子文件的内容和结构信息进行详细、全面的描述,从而帮助用户了解电子文件,实现信息共享。

最后,元数据可以在一定意义上帮助保障电子文件的真实性与凭证性,这与背景信息保证文件真实、有效的功能不同。元数据实际上就是在对电子文件进行描述的过程中得到的数据信息,这些信息专门用于管理电子文件,以帮助保证电子文件的真实性、可靠性和凭证性。元数据是一种描述型的数据,其中由系统直接记录的、计算机及网络系统自动辨析、分解、提取和分析归纳的数据,可以有效地帮助保证电子文件的真实性和凭证性。但是,人工著录和事后补录的那部分元数据则与此不同,它们的产生本身就不符合档案的形成规律,不是在事务活动过程中直接形成的历史记录,它是否“真实、可靠”本身就有待讨论。所以,真正可以保证电子文件真实性和凭证性的是背景信息,元数据只能在一定意义上帮助实现背景信息的这种功能而已。

综上所述,电子文件的背景信息和元数据在功能上是不相同的,元数据可以在一定程度上帮助背景信息实现其价值功能,背景信息也不是元数据的全部作用对象。二者的侧重点也有所不同,元数据以信息的共享和检索利用为首要功能,而背景信息则以保证电子文件的真实性、可靠性和完整性为根本目的。

四、结论

随着信息技术的快速发展,以往在纸质文件中被忽略的“背景信息”,到了电子文件管理系统中,在电子文件真实性、完整性和可靠性的保障体系中发挥着至关重要的作用。对于一个完善的电子文件管理系统来说,文件保存系统不但要保存文件本身的内容和结构信息,同时还应对系统内形成与捕获的文件的背景信息、元数据进行识别保存。如果元数据与背景信息不能被有效地检索与利用,这样形成的文件就毫无意义,这也就意味着文件保存系统设计的失败,甚至是整个文件管理系统的失败。元数据作为电子文件管理的重要手段,与背景信息既紧密联系又相互区别。只有准确把握二者之间的异同,明确它们在结构、形态和功能上的差异,才能实现电子文件的有效管理,提高档案工作效率和数字档案管理质量,使电子文件无可争议地成为人类社会记录、传递和留存信息的载体与工具。

[1]NASA. Directory Interchange Format Manual. Version10. NSSDC/WDC-A-R&S88-19,1988.

[2]全面透视电子政务发展的第三阶段.[2006-10-27]http://h50237.www5.hp.com/iPortal/Template/Publication/Common/OneColumnWithoutLogo.aspx?PublicationID=2615acd6-724f-4970-aa63-3265a1fde890.

[3]ISO15489.metadata:“data describing context, content and structure of records and their management through time”.

G270.7;G275.7

A

1005-9652(2016)05-0042-05

本文系国家社科基金项目“我国与欧美政府信息公开中信息安全审查机制及保障制度比较研究”(11BTQ030)研究成果之一。

(责任编辑:虞志坚)

郭鹏(1983-),女,汉,河北人,北京大学信息管理系博士生,北京大学档案馆,研究方向:信息政策与信息法,导师周庆山教授。

周庆山(1965-),男,北京大学信息管理系,教授,博士生导师,研究方向:信息政策与信息法、数字媒体。

猜你喜欢

背景功能信息
也谈诗的“功能”
“新四化”背景下汽车NVH的发展趋势
《论持久战》的写作背景
黑洞背景知识
奔驰S级香氛功能介绍
关于非首都功能疏解的几点思考
基于PMC窗口功能实现设备同步刷刀功能
订阅信息
展会信息
健康信息