APP下载

大数据时代档案数字资源整合的难点及对策

2017-06-16王益平

科学与财富 2017年17期
关键词:难点整合大数据时代

王益平

(哈尔滨市水利机械工程公司)

摘 要:随着计算机技术和互联网的不断发展和普及,大数据时代正在到来。档案资源作为记录重大事件的有效数据信息,对人类社会发展有着重要作用。在这样的时代背景下,档案资源的相关管理工作也就更加复杂。目前,我国的档案管理工作中,存在着一定的数据安全问题,可用的管理人员也相对较少。档案的数字化资源的有效管理工作非常具有难度。本文将主要针对大数据时代档案数字资源的整合问题作出分析,希望能够通过讨论得出有效的解决措施。

关键词:大数据时代;档案数字资源;整合;难点;对策

现代化社会中,管理工作者普遍认为数据才是管理工作中最重要的元素。随着大数据时代的到来,数字化资源已经逐渐成为主导人类生活的基础性资源。档案资源作为记录人类社会发展的重要资料,对人类社会有着重要的意义。在大数据时代发展背景下,档案工作的难度也相应增大。为了使档案管理工作更加高效、有序的进行,档案管理相关部门应改进和完善原有的数据资源处理方式,这样才能是档案管理工作的进行更加科学,从而促进我国档案事业的发展。

1 大数据时代背景下档案资源的特征

大数据的构成相对较为复杂,所呈现出的状态也相对多样,但其作用本质是为了使人类社会向着简单化发展。大数据的主要思想,就是其“预测”思想。在这种思想的指导下,人类可以找到解决某一问题的新视角与新方法。因此,大数据也在社会发展中得到了广泛的应用和普及。这样的发展趋势,也会帮助大数据在无意间逐渐的改变人们的社会生活的方方面面。在这之中,人类社会的各种资源也整随着时代特征出现变化,档案就是其中的一个具体表现。

1.1 数据量大,增长迅速

在大数据时代,我国档案数字资源建设可分为“增量档案电子化,存量档案数字化”两大部分二据国家档案局的统计资料显示,我国档案馆馆藏档案资源丰富,仅国家档案馆在}l}ll年的馆藏已达3.3亿卷,预计到2020年将达到6亿多卷州引随着馆藏档案数字化工作的推进,它们将汇聚成巨大的档案数字资源库二另一方面,在大数据时代,电子档案的数量成倍增长二它不仅包含电子文件、图表、声像、数据库等,更会包括那些在纸质保管时代,因单位信息价值低经鉴定没有归档价值的原始记录,如访间日志、浏览轨迹等二因为大数据技术能挖掘出以前无法为人们所发现的数据的潜在价值,因此有必要对数据的档案属性进行重新鉴定,自然会有海量数据新增到档案领域。

1.2 档案资源分布广泛

在大数据时代,信息资源的分布更加广泛。随着人类对数字资源逐渐增加的使用与探索,数字资源的发展速度整逐渐加快。加之移动终端的飞速发展更导致了数据产生方式呈现出多样性的特征二可见,大数据时代的档案数字资源将广泛存在于不同的信息系统中,会带有明显的时空特性,呈现出结构化信息、半结构化信息和非结构化信息相融合的态势,形成分布广泛的大量异构数据。

1.3 数据资源的高度可靠性

在资源的利用过程中,人们最为注重的是资源是否真实、可靠。大数据时代背景下,资源本身数量十分巨大,这就导致了人们获取信息的价值密度正在相应的减小。现实生活中,对于不了解的事實,人们更加倾向于通过查阅资料来增进自己对其的认识,进而在根据所了解到的事实作出判断。作为记录人类社会的事件的重要信息,档案具有其他资料所不具备的真实性。它是人们普遍相信的最可靠的信息来源。在大数据的背景中,工作人员应利用大数据的基本知识,完成对档案资源的进一步开发和管理,以实现档案资源的存在价值。

2 数字化档案资源的整合

随着大数据运用的逐渐深入,繁多的档案资源在整合的过程中存在着很多重要的问题。其中,档案数据的存储安全问题和隐私保护问题,是必须得到高效保障的。另外,随着档案数据的增多,管理人员的数量问题也是一个必须要解决的难点问题。

2.1 数据存储间题

在大数据时代,档案数字资源整合的首要挑战来自数据存储。一是档案管理系统在面对海量数据时需要高可扩展性的支撑二而目前集中式的数据存储和管理模式非但资金投入较大,更无法适应档案数字资源体量激增的新情况,在档案数字资源的高效存储和快捷访间方面面临严峻挑战。二是目前基于关系型数据库研发的档案管理系统无法适应大数据时代占数据总量80%以下的非结构化数据存储和处理的需要。

2.2 数据分析间题

大数据时代是一个泛在信息、泛在知识的时代,随着信息化程度的加深,档案数字资源的来源结构将发生巨大变化,传统的基于封闭的结构化数据进行的数据挖掘算法在分析处理非结构化数据时存在局限。而且,要获得大数据分析的价值,就应关注档案数字资源中的数据关系和语义表征,实现信息整合与知识整合。但目前档案数字资源整合还处于数据整合阶段,偏重于实现异质异构数据在物理或逻辑上的集中和互联互通,仅能为用户提供信息检索服务,这与大数据时代的要求相去甚远。

2.3 安全隐私间题

档案数字资源不同于其它信息资源,它是国家和社会精心挑选并保存下来的真实的历史记录,其中包含着大量国家秘密、工作秘密、个人隐私等重要信启、,事关国计民生。在大数据时代,如何对档案数字资源中敏感数据的所有权和使用权做出明确界定?如何选择合适的安全防护策略以适应数据非线性增长的需求,杜绝安全隐患?如何应对大数据分布式处理带来的数据、隐私等的泄露风险?这些都是摆在我们面前不可回避的重要课题。

3 解决问题的对策

想要解决资源整合问题,就需要对档案数字资源的管理工作进行相关改进。工作人员需要灵活应用云技术和数字处理技术,来提高档案部门的工作效率。

大数据时代赋予了档案数字资源新的特征,因此要实现其整合在很大程度上考验着档案基础数据的质与量。这就要求档案工作者突破固有狭义的档案资源观的局限,在大数据技术和理念的指引下,积极构建适应大数据时代的“大档案观”。即要从“社会记忆”的高度重新审视档案数字资源的构成范围和收集视角,改变过去以党政机关文书档案为主体的收集模式,加大对社会民生、对个人等复杂化、碎片化信息的关注,使档案能真正反映政治、经济、科技、文化、社会生活等的全貌,反映国家和社会的实时变迁。

从技术上来说,实现大数据时代档案数字资源整合的关键是要建立适应大数据要求的档案数字资源分析生态系统,这就需要云计算技术与大数据处理工具的协调配合。云计算(Cloud Computing)技术具有虚拟资源池化、高可扩展性、高可靠性、按需付费、泛在接入等显著的特征。它适应了大数据时代分布式存储与海量数据并行处理的需要,实现了计算机资源的服务化,是大数据时代挡案数字资源整合的基础平台和支撑技术。

结束语

为适应大数据时代的发展趋势,档案数字资源整合工作必须得到有效的保障。相关工作人员应该对目前工作中存在的难点问题进行深入的研究和解决,以推动我国档案数字资源的发展,进而使整个档案管理工作能够适应大数据时代的发展趋势。

参考文献

[1]周峰林大数据时代的数字档案馆(室)建设——专访国家档案局档案馆(室)业务指导司司长孙钢[J]浙江档案,2013.(8).

[2]杨冬权关于随馆藏数量增加而相应增加各级国家档案馆人员编制的提案[N].中国档案报,2013-03-07.

[3]冯惠玲,张辑哲档案学概论队[N].北京:中国人民大学出版社,2006.endprint

猜你喜欢

难点整合大数据时代
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
记初中英语词汇教学的一次归类、整合改革及反思
音乐与科学有效整合的研究
注重交流提升数学学习广度和深度探讨
新时期高校思想政治教育管理的创新研究
幼儿教育中美术与科学整合的研究
“1+1”微群阅读
巧用多媒体技术, 让语文课堂更精彩