APP下载

大数据时代下高校审计档案信息化建设路径研究

2023-12-15高斯

南方论刊 2023年10期
关键词:数据挖掘关联检索

高斯

(中南财经政法大学 湖北武汉 430073)

大数据时代的到来给高校档案管理带来了颠覆性的变化。为满足日益便捷化、高效化、多样化的档案信息需求,高校审计档案也需要借助数据库、关联数据、数据挖掘、云计算等大数据技术,探索新时期高校审计档案信息化转型路径,强化审计档案数据资源建设,创新审计档案数据开发利用方式,促进高校审计档案数据资源的开放共享、深度开发及有效利用。

一、利用数据库技术加强高校审计档案资源建设

高校审计档案是高校审计部门在项目审计或专项审计调查过程中直接形成的纸质、磁性载体、光盘等形式的历史记录,其归档范围包括结论类、证明类、立项类、备查类审计文件材料。大数据时代下,高校审计工作对于数据采集、存储、挖掘等信息化需求也在不断提高,云审计这一新兴的审计模式也随之产生。通过建立云审计系统,用户和审计人员可以在云平台上存储并获取各种电子审计文件,以共享审计信息资源。

(一)高校审计电子档案收集归档

高校审计档案信息化建设,首先要开发数据库系统。高校审计及档案工作人员必须全程参与开发,在需求分析、系统定义、系统目标等方面提出充分意见。大数据时代的高校审计档案管理可实行纸质和电子档案双轨双套制。审计人员应及时收集所审项目的文件材料,做到及时、准确、相关和完整。审计电子档案也应按照审计流程同步收集,以每个审计项目为单位,实行谁审计、谁立卷,边审计、边收集,审结卷成的原则。项目审计过程中内部生成的审计报告、工作底稿等审计电子文件,可以直接著录到学校的档案管理信息系统。外来的送审结算文件,可随同纸质文件同时报送电子文件。在项目终结时,要对形成的全部材料进行整理和鉴别,按立卷规则进行组卷、编目,同时将纸质文件和电子文件移交档案馆。

(二)高校审计电子档案安全管理

数据库系统存在着数据非法访问和修改的风险,意外事故、操作失误也都有可能造成档案信息的损坏或遗失。所以,确保高校审计档案信息系统的安全,首先必须确保该系统运行环境的良好。高校审计和档案部门要制定严格的系统运行和维护的相关制度,加强审计人员的系统安全知识教育,落实安全责任认定,加强对系统安全的管理。同时,加强系统软硬件技术性能、网络安全建设,提供高性能的系统技术运行环境。其次,要做好系统的物理安全控制和逻辑安全控制。要通过不同介质定期对审计电子档案进行多套备份,并定期检查备份的内容。通过设定密码权限,对用户的身份和权限进行限制,同时对数据传输和存储进行加密,以确保数据不会被非法获取或窃取,保障审计电子档案的真实性和完整性。

二、通过数据挖掘技术完善高校审计档案检索利用

数据收集和存储技术的快速发展积累了海量的大数据,数据挖掘是一种从大量不完整、模糊和随机的数据中提取人们事先不知道的隐藏信息的过程。在传统的档案管理中,基于关键词的简单检索技术,难以从大量的档案数据资源中获取所需要的信息。在大数据背景下,高校档案部门迫切需要开发出一种简便有效的工具,从大规模的文本信息资源中提取出符合要求的、简洁精炼的信息。

(一)挖掘高校审计档案资源的潜在价值

数据挖掘技术旨在对海量的档案资源进行有效的挖掘和整合,而高校档案馆的档案资源多是以纸质档案、特殊载体档案和电子文件等方式存在于馆藏资源数据库。数据挖掘技术可针对高校审计档案资源深入挖掘,开展科学分析,利用数理统计工具、算法工具、信息聚合技术等手段,发掘档案资源中隐藏的价值,实现对档案资源中可能存在的信息的有效聚合,从而发掘档案资源中存在的价值。在高校审计档案利用方面,当用户的需求不在涉及某一具体档案,而是需要某类档案时,利用数据挖掘技术,可以将档案与主题相互关联,从多角度来综合展现高校审计档案的内容。

(二)提升高校审计档案信息的检索效率

检索是档案利用的重要途径。将档案形式特征、内容特征和其他信息数字化之后所形成的资料保存到数据库,并通过检索系统将结果资料返回,从而实现档案检索。档案信息检索中,所检索到的信息源以元数据为主,对某些元数据如主题词著录较少。运用数据挖掘技术,为高校审计档案资源的开发与利用建立的检索系统,既支持模糊检索、概念检索、多语言输入检索等多种检索方式,在可视化界面的辅助下进行智能筛选,同时又能够快速地运用数据挖掘算法对检索结果进行准确分类和条理化展示。此外,还可以根据用户个性化需求对档案资源检索结果进行准确定位,从而提高档案资源检索效率。

(三)提高高校审计档案信息资源获取速度

为了确保利用者在最短的时间内通过线上信息检索系统对高校审计档案资源进行检索,可以根据不同利用者对档案资源检索的要求,分别设立信息检索专题,寻找那些被频繁访问的专题项目集。在项目集合上,通过算法工具实现用户浏览不同档案资源日志记录的相似性匹配,并在同一条数据链上整理出了拥有相同获取信息习惯的用户。针对用户的信息专题需求进行关联检测,找到事务库中频繁访问的专题集。当利用者通过档案数据访问界面对高校审计档案资源进行快速访问后,可以通过网络代理按照预置规则迅速做出反应,加快获取信息的速度,确保用户能够快速地获取到符合个人要求的档案资源。

三、借助关联数据技术推进高校审计档案开放共享

关联数据作为一种新的语义发布工具,能够整合孤立的数据、提供开放的元数据服务、实现语义互操作、实现数据的服务。将关联数据技术引入高校审计档案信息化建设,可以提高审计档案科学高效的管理水平,通过创建跨馆际、跨部门、跨库的关联数据信息共享平台将各类信息进行资源整合,创建高校审计档案数据之间的关联关系,最终实现了可被发布,可供用户检索与利用的数据资源。

(一)建立高校审计档案数据基础及资源描述

高校审计档案由结论类、证明类、立项类、备查类审计文件材料组成,它们的类型和数据结构多种多样,影响着审计档案信息资源的聚类和聚合。建立关联数据是实现信息发布和开放查询等功能的基础。因此,对于高校审计电子档案的元数据格式需要建立统一标准并进行规范化描述,才能使数字资源在计算机上自动识别并相关联。高校档案馆的审计电子档案资源主要可分为:来自高校审计部门直接形成、流转的电子资源;馆藏内部审计档案数字化处理的数据资源;通过校园网络抓取、收集具有保留价值的信息资源。分散和异构的信息资源不利于实现信息资源共享和不断变化的综合管理模式。因此,将不同结构和性能的元数据转换成统一的格式,以统一的方式识别资源,从而方便档案利用者访问。

(二)创建高校审计档案信息发布及关联实现

信息发布层是指借助数据链接的自动关联处理技术,实现机器可以读取和理解的信息关联,将原始数字资源和再生数字资源以数据集的形式在网络上发布,完成信息资源的无限共享和利用,确保档案利用者可以通过使用各种类型的终端自由、公开地获取和利用档案数字资源。根据《审计机关审计档案管理规定》,高校审计档案应按审计项目立卷,不同审计项目不得合并立卷。建立数据间的相互关联关系,是高校档案发布关联数据的基础和前提。高校审计档案信息化建设中应借助关联数据技术提取出基于档案内容本身的关联数据创建与发布资源信息,资源可以优先选择已发布的数据,实现以数据为核心的个人、机构和组织之间的信息交流和资源共享。

(三)提供高校审计档案资源服务及应用

数字化档案资源建设的目的,是致力于为档案利用者提供多样化的档案信息服务。通过大数据平台记录和分析每一位使用网页的用户,根据用户的个人信息和浏览历史为每个人建立数据库,了解用户的信息需求,并向利用者提供个性化的服务。高校档案馆作为审计档案数据资源的管理者,应利用先进的理念和技术,以实现档案信息资源的综合管理和共享利用。同时,在资源应用层,可将数字化审计档案信息资源发送到每个终端的用户。数字化审计档案管理平台通过记录、聚类及分析等方式,根据每个登录用户的个人基本信息、检索及浏览等指标,为各个用户建立数据档案,开发具备更加智能化和个性化的信息推送服务。

四、依托大数据技术保障高校审计档案信息化持续发展

(一)健全大数据技术保障体系

大数据时代档案信息化建设稳步可持续发展,离不开相关政策支持及制度保障。首先,要不断完善“大数据+审计档案”相关的制度建设,在制度层面上为高校审计为档案信息化实践的实施提供指导。同时,还要健全相应的技术标准,进一步完善高校审计档案信息化建设工作中相应的存储格式、数字化、元数据等技术标准体系。在技术层面上,高校信息管理部门还需要提供技术咨询指导服务,针对大数据技术和高校审计档案的具体特点,制定实践所需大数据技术的利用指南,提高大数据技术创新能力和工具的研发能力。在资金保障方面,高校要建立健全档案信息数字化工作的资金保障机制,争取各方面有效资金支持。

(二)加强高校审计档案信息资源建设

高校档案部门与审计部门可以通过整合高校审计档案资源、构建多方协同联动机制、优化审计档案资源体系建设等方式,不断完善高校审计档案信息资源建设。数据和技术是开展大数据研究的两大支撑点,充足的高校审计档案资源是档案开发利用的物质前提,是大数据技术加工研究的基础。高校审计部门应积极树立“大档案观”,制定高校审计档案信息化的长远规划,使各种类型的高校审计档案信息资源能够全方位、无遗漏地被收集和开发利用,运用新理念和新方法广泛收集高校审计档案资源,建立高校审计档案数字仓储。同时,高校档案馆可借助大数据技术对审计档案信息资源进行有效的整合,采用智能化方式处理审计档案资源,建立分类资源系统,建立审计档案信息数据库,实现审计档案信息资源的快速精准获取,充分应用大数据技术展现审计档案与其他门类档案资源之间的联系,加快档案资源的“数字化”到“数据化”的转变,最大限度地发挥高校审计档案资源的价值。

(三)加强审计档案人才队伍建设

大数据时代的高校档案工作者不仅是以档案管理员身份存在,还要积极参与到档案的信息化、数据化、智能化开发过程当中,发挥高校档案工作者在档案管理工作中的能动性,促进集体性身份认同。因此,高校档案工作者和审计工作者应主动拥抱大数据理论与技术,在不断学习中积极投身审计档案的信息数字化建设。高校审计部门和档案部门应加强对大数据专业人才的招聘和培养,加强跨学科、跨专业、跨业务的交流与合作。要鼓励高校档案工作者、审计工作者、信息人员及大数据专业师生开展交流与合作,不断学习各行业理论与技术前沿知识,不断探索大数据技术与高校审计档案信息化建设高质量可持续发展。

在大数据时代的背景下,云审计已成为高校审计工作的新趋势,相应的高校审计档案管理也亟待加强信息化建设,以应对大数据时代的新变化。通过应用数据库技术、数据挖掘技术、关联数据技术,不断完善高校审计档案的数据资源建设,保障高校审计档案安全存储,推动高校审计档案的精准利用及开放共享,是大数据时代高校审计档案信息化建设的发展路径。高校档案部门、审计部门、信息部门应当通力协作,发挥各自业务优势,充分学习应用大数据技术,全面提升高校审计档案的管理水平。

猜你喜欢

数据挖掘关联检索
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
“一带一路”递进,关联民生更紧
2019年第4-6期便捷检索目录
奇趣搭配
基于并行计算的大数据挖掘在电网中的应用
智趣
专利检索中“语义”的表现
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究