APP下载

基于图像学理论的人物照片档案开发利用研究

2022-07-14钱毅崔浩男

档案与建设 2022年6期

钱毅 崔浩男

摘 要:人物照片档案资源蕴含丰富的隐性知识和语义信息,其深度开发利用仍处于探索阶段。文章借鉴图像学的图像类型和分析层次理论,结合当下的人脸识别等技术,提出以“认人—识人—用人”为明线、“人脸特征库—人物知识库—人物应用场景池”为暗线的人物照片档案开发新框架,以实现照片档案的要素识别、语义关联和深度利用,对于转变照片档案开发利用的传统思维和固有方式具有指导作用。

关键词:照片档案;信息资源开发;图像学理论;语义增强

分类号:G273

Research on the Development and Utilization of Portrait Photographic Archives Based on Iconology Theory

Qian Yi1,2, Cui Haonan1,3( 1.School of Information Resource Management of Renmin University of China, Beijing 100872; 2.Research Center of Electronic Records Management of Renmin University of China, Beijing 100872; 3.Research Center for Digital Humanities of Renmin University of China, Beijing 100872 )

Abstract: Portrait photographic archives contain rich tacit knowledge and semantic information, and their in-depth development and utilization is still in the exploratory stage. Based on the image type and analytic hierarchy theory of iconology, combined with the current face recognition and other technologies, this paper puts forward a new framework for the development of portrait photographic archives, which takes recognizing portrait - knowing portrait - using portrait as the bright line and face feature database - portrait knowledge database - portrait application scene as the dark line, so as to realize the element recognition, semantic relevance and in-deep utilization of photographic archives. This paper has a directive function for changing the traditional thinking and inherent way of photographic archives development and utilization.

Keywords: Photographic Archives; Development of Information Resources; Iconology Theory; Semantic Enhancement

檔案资源的智慧化转型是“十四五”时期档案工作应对数字时代挑战、实现全面数字转型的题中之义。但是,当前档案资源的智慧化转型研究还大多围绕常规文本类资源展开,对特殊门类资源的管理和开发关注不足,缺乏深入、可复用的智慧化开发路径与方法。特殊门类的档案资源往往信息表示更为复杂,凝聚的语义更为丰富,可挖掘的价值更强,对于丰富和提升档案机构的资源品质具有不可或缺的独特作用。因此,本文聚焦人物照片档案,即组织机构或个人在社会实践活动中直接形成的对国家和社会具有保存价值并归档保存的人像照片,结合图像学理论与人工智能技术,创新照片档案开发利用的思维,探索照片档案资源智慧化转型的路径和方案。

当前,照片档案管理的研究趋势已从传统照片档案转向数码照片档案,进入“深水区”和“内涵式”的高质量发展阶段。为聚焦研究主题,笔者通过在中国知网、万方、维普等文献库中检索主题为“数码照片档案”的文献(检索时间为2022年2月),发现当前研究主要围绕“数码照片档案”“数码照片”“照片档案”“档案管理”等主题展开;研究主体集中在公共事业单位;研究内容比较关注在数码时代的客观环境下,依托照片档案管理的现状改进实际工作,侧重经验总结。[1-3]此外,当前研究较少关注人物照片档案这一特定类别,仅有学者提出一种照片档案人物自动标注方法,以解决不同照片重复人物的标注问题。[4]

1 人物照片档案开发利用的新理论

本文的研究对象是人物照片档案,即原生数码照片档案和传统载体照片档案的数字化成果中包含人物要素的部分。人物照片档案归根结底属于“图像”的范畴,因而可以借鉴艺术领域中图像学的相关理论。图像志(Iconography)被认为是图像学发展的早期阶段,[5]是艺术史研究的一种方法学,主要涉及图像的收集、整理和描述、分类工作,并对作品中的人物身份、事件、形象进行知识性的解释。20世纪后,传统图像志发展为现代图像学研究,开始注重对图像作品主题事件和深层意义的探索。[6]

1.1 图像类型研究

美国艺术史学家马克·D·富勒顿区分了“象征性”和“叙事性”两种图像类型,认为象征性图像表示某种物体或现象,叙事性图像则主要和某个故事或事件相关联,都带有深刻的精神寓意和文化内涵。[7]据此,人物照片档案可区分为“象征型人物照片”和“叙事型人物照片”。象征型人物照片是指以人物形象为核心拍摄对象,为特定目的而进行的有选择性的拍摄,如人物标准肖像照、会议合影等形式。这类照片往往在照片档案中占据相当比重,由于其形成本身具有特定目的性和时机选择性,因而在常规管理到位的情况下,相关元数据信息有一定的保障。叙事型人物照片则是指为记录客观活动场景而拍摄的一类照片,人物作为其中的要素得以展示。这类照片的“叙事性”特点突出,主要用于展示客观活动过程和典型场景,承载更多的业务动作和事件属性,相对而言没有刻意突出人物形象,符合人们平时生活中的“抓拍”情形,人物形象表达也更为自然。简而言之,象征型照片有较强的确定性,数据来源更为明确;叙事型照片的随机性更强,数据来源更为丰富。在人物照片档案开发中应有机融合两种照片类型,在不同应用场景中充分发挥两种照片的优势。

1.2 图像分析层次研究

图像学提供的图像分析层次思想可以用于指导人物照片档案的开发。帕诺夫斯基将图像学分析步骤分为三层:第一层为“前图像志描述”,即描述图像的自然意义,包括外观的形式结构、外在事实意义等,解释者应该有实际经验;第二层为“图像志分析”,是发现、解释图像的传统意义和作品的特定主题,解释者应该有原典知识;第三层为“图像学分析”,解释图像或作品的内在意义和内容,解释者应该有综合直觉能力。[8]由此可见,结合图像背后的内涵才能理解图像的完整意义。在大规模数字化的当下,这种对图像作品内容的描述和阐释方法可为人物照片档案的内容开发环节带来启示。如表1所示。

2 人物照片档案开发利用的新框架

基于上述图像学理论,结合人工智能技术,尤其是人脸识别技术的广泛应用,本文从实际业务开展和基础设施构建两条线索共同切入,探索人物照片档案开发利用的新思维。一方面,从档案行业的业务开展内容看,“认人—识人—用人”分别对应图像学分析的三个层次,可作为“明线”贯穿业务活动中;另一方面,从资源体系和技术融合的角度看,结合上述线索可以构建“人脸特征库—人物知识库—人物应用场景池”的基础设施“暗线”,分别代表着要素与要素的连接、知识与知识的关联、场景与场景之间的协同。“明线”与“暗线”的三个环节分别由浅至深地实现信息要素识别、信息语义关联和信息深度利用的目的。如图1所示,本文提出基于图像学理论的人物照片档案开发框架,可根据需求进一步构建实现路径和应用场景模块,实现底层对象、中层要素、高层语义的连接。

2.1 明线——实际业务开展

照片档案管理可以围绕“人”这一基础性要素创新人物照片档案开发的流程,促使人物照片档案在“载体—文件—数据—语义—价值”维度上延伸。

(1)认人:人脸识别技术的成熟应用

认人,指通过人工智能技术中的人脸识别技术能够对数码照片档案中的人物予以高效识别和精准指认。就照片档案的利用而言,利用者通常会用“人名”作为关键字进行检索,这就要求对照片中的人物进行充分的识别和标注。目前对人物照片档案的识别方式比较传统:主要依据照片档案六要素“拍摄时间、事由、地点、人物、背景、摄影者”进行。在要素齐全的情况下,可根据“人物”要素的相关著录信息进行识别,而当照片档案进馆要素不齐、照片档案载体本身出现发黄粘连和脱落、只著录了主要人物信息却没有著录所有人物信息时,[9]则往往依靠人工识别。AI人脸识别技术的发展使得基于人物图像的数码照片自动“认人”成为可能,据此可以对人物图像识别的逻辑与嵌入照片档案管理全过程的技术要点进行重新设计。

(2)识人:人物照片档案的语义关联

识人,指基于现有人物图像,结合相关档案馆藏以及外部信息源进行语义分析和逻辑关联。目前,单靠文字说明和部分著录元数据的照片档案无法满足档案深度利用的要求,通过人工逐一标注海量照片数据的方式则囿于各项成本而难以实现。为突破瓶颈,需进一步创新“识人”机制,可使用对应的图像数据增强工具,结合图像语义提取图像特征值建立特征索引库。同时,设计“识人”模式下的成果反哺机制,通过人脸识别技术所识别的人物信息,回溯至档案特征索引库中增加“补充性著录资料”,逐渐丰富照片著录信息。依托这种方式,通过自建或利用相关语义基础设施,可以批量对人物照片档案相关信息进行语义增强,如利用其家族、所在机构、社交圈、相关事件、行动轨迹等基础数据对人物进行语义拓展和关联。

(3)用人:人物照片的深度挖掘利用

用人,指借助照片档案资源中的人物要素及其关联信息,在各类利用场景中挖掘人物照片档案资源的深度利用价值,最终服务于前端开发工作。其核心含义是将“认人”和“识人”中获得的人物表面信息,结合其他背景要素信息,在人工智能技术手段下,形成真实、完整、流畅的档案叙事。其主要思路包括:第一,基于人工智能的各项服务场景技术,如照片时间轴技术、GPS地点人物相结合的元素检索技术、情感分析技术等,实现对照片档案中人物的轨迹分析、交集分析、关系分析、情感分析等。第二,结合人物照片档案的其他元素信息(如主题、时间、地点、摄影者等)进行交叉分析处理,完整展示照片形成的历史背景和社会环境因素,探索多人物交集环境下多要素结合的档案检索、查询应用,明晰档案信息深度挖掘利用的基本路徑。第三,协助档案机构人员开展归档环节的决策分析,通过人物库与移交照片的对比,获取反馈结果,从而为档案人员开展归档鉴定提供判断依据,实现敏感信息自动识别与档案分级分类。第四,借助数据平台实现开发成果的实时迭代更新,当新的人物照片档案数据源纳入该成果主题时,依照开发模型和规范,相关新数据会被及时填入开发产品中。

2.2 暗线——基础设施构建

建设人脸特征库、人物知识库、人物应用场景池等档案语义基础设施是提升人物照片档案资源开发能力的“暗线”。档案语义基础设施是用于拓展档案数据内涵的具有工具性和服务性的语义产品。[10]照片档案语义基础设施不仅包含带有照片检索服务的文献库,还包含基于资源对象和数据单元层面的基础知识库和开发产品,应支持跨机构的共建共享、跨网域的开放互联和跨领域的知识融通。[11]这将涉及到照片档案数字化、文本化、数码照片的知识表示、数字图像互联与共享、照片知识库构建等多个环节。[12]

(1)人脸特征库:通过技术赋能管理

人脸特征库建设的核心是通过人脸识别技术赋能精细化管理,主要包括“技术认人”和“管理认人”两个关键节点。技术认人是通过人脸识别技术和外部资源的协同来建设人脸比对库,提高认人的效率,避免大量的重复劳动,是后续开发环节的基础。管理认人是在主题场景的指导下,通过人工提取著录项,丰富元数据中的基本信息,有利于进一步增强信息密度、打破信息迷雾、提升信息关联。通过技术和管理手段来构建人脸特征库实现照片人物识别,可以克服合影人物众多难以识别、老旧照片人物模糊、人物信息不全等难点,是照片价值得以充分发挥的重要途径,也是照片档案资源进行人机交互的重要方式。

(2)人物知识库:通过关联增强语义

通过人脸识别、人工著录能够得到较为充分的人物照片档案基础数据,由此可以进一步以人物照片档案内容的解析为基础,建立人物照片档案信息的关联关系,实现照片档案之间、照片档案与其他资源之间的灵活互动,建设人物知识库等语义基础设施。由于与照片人物相关的信息很有可能分布存放在不同单位和系统之中,加之采用不同的描述方法和标准,难以实现跨机构、跨系统的开发利用。但人物照片档案与相关档案资源往往隐含着共同的“记忆点”,因而通过对照片档案内容进行分层处理,形成照片层、元数据层和标签层的多层数据对象,针对数据对象采用主题建模、标签加注等手段来构建本体模型和知识图谱,可以在人物层面实现语义树的层次拓展和纵向延伸。在这个过程中,人物照片档案所记录反映的“人、事、时、地、物”要素及其互相之间的关系能够得到更加灵活的揭示,可以将更多的显性知识与隐性知识、内部知识与关联知识、通用知识与专用知识叠加起来,实现照片档案内容的语义增强,[13]有助于完整反映历史事实的证据情况和发展线索。

(3)人物应用场景池:通过成果辅助叙事

数字时代的人物照片档案开发成果及其应用场景应更加多元,包括数字出版物、专题数据库、微系统、融媒体可视化产品等。这些多元化的成果能提供各种数据服务,用户可通过可视化产品浏览、数据库检索、数据集调用、微服务应用等多种方式加以利用,并可以在线上直接与开发者进行双向交互,由此支撑构建以照片档案为核心资源的融媒体数字记忆空间,真正实现全方位、多模态图文互动的档案叙事。随着媒体融合时代的到来,档案叙事不再单单依靠文字,而是应综合运用图片、视频、音频等多种信息传播方式,给用户带来更加丰富的使用感受。随着互联网技术与数字展陈设备的发展,照片档案的图像叙事正在实现流程再造,叙事的“集中采编、移动优先、融媒产品、全屏直播”成为趋势,统一的档案故事在不同媒体中呈现出不同叙事特征,一种多元化的档案叙事形态正在形成。伴随着照片档案智能化的发展,照片档案在档案叙事中的作用将不断凸显,其与档案文本叙事方式可以有机结合,利用融媒体展陈产生新的叙事风格,实现从“零散信息”到“聚合信息”的跨越,即借助照片档案的典型性特点,结合其他档案材料的完整性特点,实现多资源、多媒体联动,完成全方位的档案叙事。

3 总结与展望

照片档案具有生动性、讲述力、故事感,采用图像文字组合等简单的数字化形式虽能复原或重构相关信息,却难以描述故事元素之间的复杂关联和模糊语义。本研究基于图像学理论,以“认人、识人、用人”为线索,提出实现人物照片档案信息识别、分析和挖掘利用的新框架,有助于从根本上转变照片档案的管理逻辑起点,实现从照片档案的载体管理转向照片档案的内容管理。未来在档案工作实践过程中结合人工智能技术不断检验、改进现有框架,可以将原先照片资源开发过程中对人物照片档案的简要罗列式的思维,创新为“以人叙事”的新型人物照片档案开发思路,将原先“用照片去衬托故事”的利用模式变为“用照片去讲故事”的新模式,实现人物照片档案资源和其他资源之间的关联叙事,真正实现照片档案资源的“活化”。

*本文系国家档案局科技项目“AI人脸识别在数码照片档案管理中的应用研究”(项目编号:2021-X-09)阶段性研究成果。

注释与参考文献

[1]朱玉清.基于高校照片档案编研的反馈及思考[J].中国档案,2021(4):44-45.

[2]曾静怡,顾伟,刘力超,等.照片档案创新编研思路探析[J].档案学通讯,2021(4):71-76.

[3]曾静怡.上下文在照片档案叙事中的应用[J].档案学研究,2021(6):100-105.

[4]李刚.一种照片档案的人物自动标注的方法[J].电子技术与软件工程,2020(15):137-138.

[5]比亚洛斯托基,杨思梁,宋青青.图像志[J].新美术,1990(1):73-88.

[6]徐建融.大辞海:美术卷[M].上海:上海辞书出版社,2012:516.

[7]李旭晖,吴燕秋,王晓光.基于角色关联的叙事型文化遗产知识表示方法[J].图书情报工作,2017(9):116-122.

[8]宋小蒙.从图像志看图像学的本土化[J].美与时代(下),2020(11):15-17.

[9]郭俊山.浅谈档案馆搬迁中的档案保护[J].黑龙江档案,2019(1):97.

[10]刘炜,谢蓉,张磊,等.面向人文研究的国家数据基础设施建设[J].中国图书馆学报,2016(5):29-39.

[11]夏翠娟.面向人文研究的“数据基础设施”建設——试论图书馆学对数字人文的方法论贡献[J].中国图书馆学报,2020(3):24-37.

[12]颜佳,杨敏,彭梅.面向数字人文的图像数据基础设施建设研究——以我国图博档领域为视角[J].图书馆,2021(5):51-58.

[13]陈涛.目标检测在数字人文图像中的应用尝试[J].数字人文研究,2021(3):39-50.