APP下载

大数据时代图书馆海量数据的存储安全管理

2016-07-20洪克诗

科技传播 2016年11期
关键词:数据存储安全管理大数据

洪克诗

摘 要 大数据时代下,数据海量且纷繁复杂,这在丰富图书馆资源的同时也给图书馆数据存储安全管理等方面带来了新的挑战。本文立足于对大数据的特征把握,结合目前图书馆面临的存储安全管理问题,探讨了图书馆存储安全管理的有效策略,以期构建更加科学、高效的图书馆存储与安全管理模式。

关键词 图书馆;大数据;数据存储;安全管理

中图分类号 G2 文献标识码 A 文章编号 1674-6708(2016)164-0125-02

1 大数据时代下的数据特征

关于大数据至今各界尚未有一个统一且全面的定义,但笔者比较认同的一个定义方式是:大数据是难以在传统思维及常规软件的基础上,在规定时间内对其内容实施采集、管理及分析的数据集合[1]。大数据时代下的数据具有数据量大、数据类多、流动速度快、价值密度低等特点。不难看出,在大数据的背景下无论是从管理角度还是技术角度,对于图书馆的数据安全管理,尤其是基于海量数据的数据存储安全管理,都是新的挑战。

1.1 数量巨大

通常认为,数据量大于10TB即为大数据。伴随着计算机、云计算、物联网等技术普及,以及社交网络对人们生活的不断渗入,人们的个人信息、网络足迹、网络交际等数据爆炸性增长,这些信息与长期积累的结构化数据共同构成了大数据。对于图书馆来说,纸质电子资源增多,以及用户增多带来的大量用户信息,随着时间推移,数据量会越来越大。

1.2 种类繁多

数据种类繁多主要是指数据结构的多样化。伴随着传感器技术、移动终端、通信设备的广泛应用,数据结构形成结构化、半结构化和非结构化共存的局面,如音频、视频、网页等形式。

1.3 流动速度快

流动速度快主要指数据创建与处理速度。实时性是大数据的一个显著特征,生活在互联网环境中,人们通过移动终端使用的各类应用,如天气、物流、交通等应用,这些应用使用或产生的数据都是具有实时性的,即为流式数据。对于这些数据,传统的软件显然不能处理。

1.4 价值密度低

大数据的价值获取和应用是大数据应用的最终目标。然而在数据大量增长的同时,蕴含于其中的数据价值并未显著增长,因而数据价值密度降低,这就大大增加了获取有价值信息的难度。

2 大数据时代图书馆面临的存储安全问题

在大数据背景下,图书馆非结构化数据占80%以上,这为图书馆数据存储方面提出了新的要求,具体体现在存储模式、安全级别划分、身份验证等方面。

2.1 存储模式局限

随着数据量及数据复杂程度的迅速增长,非关系型数据库由于可扩展性及可用性较强优势被广泛应用,成为图书馆数据存储的主要方式。然而,由于非关系型数据库系统服务器软件内置安全管理系统不足且存在较大安全漏洞,造成在数据访问控制及用户隐私管理方面存在较大难度。

2.2 安全级别划分问题

图书馆在统一管理平台对数据进行存储、管理、分析、应用的过程中,难以对数据按照安全级别进行划分并分类存储。同时,数据库在用户进行访问的过程中,会将组织架构暴露给发起访问的程序,安全性受到威胁。另外,由于用户在操作中与多个信息节点进行通信,数据库难以对访问者身份权限进行即时验证。

2.3 安全管理产品局限

非结构型数据库在进行大数据资源操作中,会在多个网络通信会话间建立协调任务,因而传统安全管理产品具有的系统监视、日志分析以及安全评估等功能难以运行或难以取得良好效果,同时还可能对大数据应用效率等方面带来不利影响。

3 大数据背景下的图书馆存储安全管理策略

3.1 利用大数据决策及时发现安全威胁

图书馆在利用大数据技术来保护自身系统与服务安全时,不应仅仅将防范目标锁定在恶意事件的发现上,也应结合大数据安全资源进行分析,确定恶意攻击的来源、攻击途径及危害程度等,并结合数据挖掘与关联技术,实现对未来攻击的来源、途径及目的预测,提前把握危害程度,做好防范。

同时,在安全管理大数据平台的构建过程中,在维持平台一定的复杂程度与合理建设成本的条件下,尽可能选取技术成熟且兼容性强的数据包捕捉与分析工具,以此来实现信息的快速采集、定位与科学分析、决策的过程。而系统结构过于复杂的安全管理产品会导致平台功能性与可控性的大幅度降低。

同时,加强对安全数据仓库诸如监控日志、工作日志、服务器日志、防火墙日志等的管理控制,有助于图书馆大数据资源安全高效地处理以及安全攻击行为的及时发现。

另外,在了解图书馆大数据服务与安全管理需求的基础上,定制大数据资源挖掘工具以及相应的分析师,来提高图书馆利用大数据技术发现安全威胁的效率与主动性。

3.2 构建大数据安全威胁与防御能力为基础的评估体系

建设以大数据安全威胁与防御能力为基础的评估体系,是图书馆构建高效安全防御系统的关键内容,评估体系分为宏观网络感知与微观威胁检测2部分。

网络是图书馆各类信息传输的载体,在网络层面上,对于数据中心内部网络与外部传输网络的评估,需广泛地在网络上设置大量安全检测与数据采集设备,以此来保证安全评估平台全面且客观地收集网络安全评估数据。

在微观层面上,应注重数据采集并构建安全评估指标。应重点采集APT攻击方法、路径、后果等,并建立模型模拟预测。而在评估指标的建立上,应从大数据平台二次提取数据,并分为基础指标与应用层指标等多种类型,结合不同指标对图书馆安全的影响,进行科学的动态评估。

同时,由于结构化数据可降低对大数据平台的性能要求并提高分析效率,图书馆也应加强对采集数据的结构化处理,从而提高安全分析效率与分析结果的可靠性。

3.3 整合大数据安全管理软硬件平台

大数据安全管理平台应实现安全管理工具与流程的整合,以便图书馆依据相关信息来完成对安全事件的管理、分析与决策。将监控设备采集的信息进行传输时,需提前进行预处理,并经由SIEM工具传输至大数据安全仓库,传输数据需标准、高价值且具备可用性。同时,通过实时控制,以及安全管理平台数据的反馈,来实现对图书馆应用平台的参数设置及管理。

同时,大数据安全管理平台应使用科学算法、可视化决策与自动化管理,应通过大数据平台对用户行为数据、阅读终端参数分析,实现对用户行为特征模拟,以此来进行大数据下的读者身份认证。

3.4 执行安全的大数据管理与应用策略

针对图书馆大数据的具体特征,为提高数据的安全性与可用性,图书馆必须对原始数据进行有效精简,即通过过滤、删减、标准化、匹配、评估、清洗等过程,以及结合云存储平台,将无用数据和重复数据进行删除。同时,图书馆的大数据平台在保证开放共享的同时,也应保证数据不被非法访问和过度分析,因此,应允许用户查看、纠正或删除自身隐私数据,增加用户隐私数据使用的透明度。

另外,图书馆在大数据安全管理中,通常将内部系统视为可信环境,执行较为宽松的安全管理策略,往往造成内部环境相较于外部环境安全威胁更大。所以,为防止黑客利用内部系统漏洞提高攻击成功率,加强图书馆内部系统环境安全控制与监控十分必要。

4 结论

在大数据的背景下,图书馆的资源建设与管理存在大量的发展机遇,同时也存在更大的挑战。在图书馆的数据存储安全管理方面,应运用大数据决策敏锐感知安全威胁,构建起以大数据安全威胁与防御能力为基础的评估体系,对大数据软硬件平台进行整合,并执行安全的大数据管理与应用策略,真正提高图书馆的数据存储安全管理能力,以求更加稳定长远的发展。

参考文献

[1]张瑜.大数据环境下图书馆公共媒体数据库建设与利用研究[D].大连:辽宁师范大学,2014.

[2]陈臣.大数据环境下数字图书馆安全威胁与对策研究[J].图书馆工作与研究,2014(11):34-38.

[3]高煜红.云计算数据存储安全的研究[D].杭州:浙江工业大学,2014.

[4]鲍劼,李苏丰.大数据环境下图书馆信息安全问题与对策分析[J].科技情报开发与经济,2014(22):12-14.

[5]陈臣.基于大数据的图书馆个性化服务安全体系构建研究[J].新世纪图书馆,2014(11):47-51.

[6]陈臣.大数据环境下数字图书馆安全威胁与对策研究[J].图书馆工作与研究,2014(11):34-38.

[7]张毅,赵元媛.大数据技术在数字图书馆中的应用分析[J].网络安全技术与应用,2015(3):52-53.

[8]张鹤明.大数据对公共图书馆服务的影响探讨[J].图书馆界,2015(3):75-77.

猜你喜欢

数据存储安全管理大数据
开源数据库数据存储的实现路径分析
基于Android开发的APP数据存储研究
哈希算法在物联网数据存储中的应用
论加强建筑施工安全管理的措施
浅谈现代汽车检测技术与安全管理
基于大数据背景下的智慧城市建设研究