APP下载

大数据环境下图书馆个性化服务研究

2014-08-08杨亮雷智雁

现代情报 2014年4期
关键词:用户服务个性化服务大数据

杨亮+雷智雁

基金项目:广东省教育科学“十二五”规划项目(项目编号:2012JK290)研究成果之一。

作者简介:杨亮(1984-),男,馆员,硕士,研究方向:数字图书馆。·信息咨询与服务·

〔摘要〕文章在描述大数据研究背景及其特点的基础上,分析大数据对图书馆信息推送、参考咨询、学科服务,好书推荐等个性化服务的影响,总结大数据在图书馆个性化服务及图书馆管理中的应用,针对数据分析的平台、成本问题、用户隐私等关键问题展开讨论。

〔关键词〕图书馆;大数据;用户服务;个性化服务

DOI:10.3969/j.issn.1008-0821.2014.04.016

〔中图分类号〕G25076〔文献标识码〕A〔文章编号〕1008-0821(2014)04-0074-04

The Research of Personalized Library Services in the Age of Big DataYang LiangLei Zhiyan

(Library,Shenzhen University,Shenzhen 518060,China)

〔Abstract〕On the basis of description of the background and characteristics of big data,this article analyzed the impact on personalized library services,like information push,reference services,discipline services and recommended books.This article summarized the big data applications in the personalized library services and library management,discussed the key issues like data analysis platform,cost and privacy.

〔Keywords〕library;big data;user service;personalized service

现代科技的发展,尤其是计算机和互联网的出现,促成了全球信息总量以几何级数增长,据IDC(互联网数据中心)研究报告,2020年全球数据量将达到35ZB,为2009年的44倍[1]。毫无疑问,人类正在迈入大数据(Big data)时代。大数据正逐渐影响着行业的发展和个人的思维习惯。图书馆作为实现个人和信息资源交互的主要机构,如何应对大数据带来的冲击和挑战,并在大数据浪潮中提升服务水平和管理能力,是一个值得研究的问题。

1研究背景

11大数据研究起源

大数据概念的提出最早可以追溯到2008年9月《自然》杂志发表的文章《Big Data:Science in the Petabyte Era》,而大数据引起人们广泛关注,则是源于全球知名的咨询公司麦肯锡在2011年5月发布的《Big data:The next frontier for innovation,competition,and productivity》报告,报告指出,数据已经渗透到每一个行业和业务职能领域,而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来[2]。2012年,联合国一个名为Global Pulse的倡议项目发布了名为《Big Data for Development:challenges & opportunities》的报告,该报告主要阐述了大数据时代各国特别是发展中国家在面临数据洪流的情况下所遇到的机遇与挑战[3]。同年,美国政府宣布推出了“大数据的研究和发展计划”,将大数据的研究和开发提升到国家战略的高度,这是继1993年美国宣布“信息高速公路”计划后的又一次重大科技发展部署[4]。与此同时,IT行业巨头,如Microsoft、IBM、Oracle等相继投入大数据信息处理技术的研究,并针对企业的决策支持、风险分析、自动化流程等方面推出相关服务[5]。

12大数据特点

目前,学术界对大数据尚未有一个公认的定义,学者们也习惯于按照特征来描述大数据。大数据的常见特征是3V:(1)大量化(Volume),数据集合的规模不断扩大,已从GB到TB再到PB级,甚至开始以EB和ZB来计数;(2)多样化(Variety),在大数据时代,个人作为制造数据主体的特征越来越明显,而个体所产生的绝大部分数据为非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等;(3)快速化(Velocity),大数据的快速化特征一方面指大数据的增长速度快,另一方面指大数据所包含的众多非结构化数据具有很强的时效性,如新闻、金融及社交等数据,随着时间的流逝其利用价值会越来越低。此外,也有组织和个人将大数据的特征归纳为4V,但第4个“V”所代表的含义众说纷纭,IBM认为大数据的4V应包含准确性(Veracity),而IDC则认为大数据应该具有价值性(value)。虽然大数据的概念目前还存在一些争议,但这并不影响人们对其研究,正是因为这些争议的存在,证明大数据对人们工作和生活的方方面面产生影响,也将逐渐影响到各个学科的发展。

13大数据的应用

大数据的应用价值在于从不确定数据中提取有价值数据,借助于Hadoop等处理和分析平台,大数据在诸多方面都体现了其价值。在能源领域,丹麦能源公司Vestas利用IBM大数据分析软件和系统对气象报告、潮汐相位、地理空间等非结构化数据进行分析,改进了风力机组的位置,获得最佳的能量输出[6]。在政治领域,奥巴马在2012年美国大选中获胜得力于其背后的大数据分析团队,如分析师们根据每个选民的住址、家庭状况、家庭背景等数据分析得出其性格特征,从而针对他们进行不同的竞选游说,用最低的成本,更高的效率获得了大选的成功[7]。在零售领域,淘宝数据魔方是一个基于淘宝海量数据分析的商业数据产品,可以分析淘宝全行业的浏览、交易、收藏、搜索等数据以及消费者的用户特征,从而得出消费者的去向以及消费者的消费偏好,方便卖家分析竞争对手,探究消费行为,提高销售的针对性。

2大数据对图书馆用户个性化服务影响

21大数据研究深化了图书馆个性化服务内涵

用户是图书馆资源的利用者,是图书馆服务的对象。有学者认为,图书馆用户个性化服务是根据每个用户的需求而特别定制的服务,有3个方面的含义:①时空服务的个性化,在用户指定的时间和指定的地点得到服务;②服务的方式的个性化,根据用户的个人爱好或特点的要求来开展服务;③服务内容的个性化,所提供的服务不再是千篇一律,而是各取所需,各得其所[8]。自数字图书馆兴起以来,图书馆在时空服务的个性化方面已经取得了长足进步,用户使用图书馆不再受时间和地点的约束,可获取的信息量近乎无限的增加,这是图书馆发展史上的一次重要的变革。相对于时空服务的个性化,数字图书馆在服务方式个性化和服务内容个性化方面还有较大的提升空间,而这正是大数据在图书馆能够发挥作用的地方。

endprint

22大数据在用户个性化服务方式中的应用

在服务的方式的个性化方面,传统的图书馆个性化服务包括图书借阅、参考咨询、馆际互借、文献查收查引、馆际互借等。大数据的平台能对图书馆用户的个人信息、借阅历史、浏览记录等数据进行分析,从而得出用户的偏好和研究兴趣,为不同的用户提供不同的服务。大数据可从以下几个领域为用户提供个性化服务:

221个性化信息推送服务

数字图书馆对传统图书馆的资源进行了数字化,使其更加易于获取,并采用个人图书馆(My Library)平台对图书馆可提供的服务类型进行整合,提供简单的信息推送服务,不过,这种信息推送服务大程度都是图书馆发布的统一的通知类信息,并不能针对每一个个体用户而推送个性化的信息。大数据分析平台可以改善信息推送的针对性,通过分析用户使用记录就能够推测出其信息需求,当用户登录个人图书馆时,系统就会自动为其推送其可能感兴趣的信息,如采购新书、数据库、甚至期刊论文全文。

222参考咨询服务

目前的数字图书馆参考咨询服务已能做到记录用户的咨询记录,当用户再次使用参考咨询服务时馆员能够浏览其以往的咨询记录,做到心中有数。大数据分析平台能够根据用户以往的咨询记录以及用户的个人信息、浏览记录,预判用户的需求,从用户启动咨询的那一刻,大数据分析平台随机启动,并随着用户提问的不断深入,在后台为咨询馆员提供精确的参考答案。

223学科服务

大数据分析平台能够利用图书馆拥有的数字资源及用户的访问记录,分析相关学科领域的科研热点,形成报告,为不同学科的科研人员服务,使他们及时了解本学科的最新的科研动向,以及本学科其他科研人员的研究进展。

224好书荐读

好书荐读是图书馆提供的特色服务之一,深受用户的喜爱,目前,好书的甄选主要由人工完成,书籍的来源有用户推荐、借阅排名以及各类畅销书排行榜等。大数据分析平台能够采集用户在使用图书馆服务时提及的各种图书书名,对这些图书进行综合排名,能够分析出用户最感兴趣的图书名单。此外,大数据分析平台也能通过分析图书馆数据库中文献的引用率,为用户推荐图书。

23大数据在用户个性化服务内容中的应用

在服务内容的个性化方面,目前大多数图书馆凭借本馆内的资源或图书馆联盟的图书、期刊、数据库等资源提供服务,对网络上大量的非结构化信息资源较少涉及。随着大数据在日常的生活和科学研究中发挥的作用越来越明显,用户也渴望通过图书馆统一检索的平台获取对他们有用的各类结构化、非结构化信息。为满足用户需求,图书馆界有必要对大数据展开研究,提供复杂信息资源分析处理的服务。在大数据时代,图书馆的传统业务将向数据分析、数据挖掘方向转移,对大量数据的分析与处理,为用户提供知识信息服务将成为图书馆的主要业务。图书馆信息资源数据量的扩展、服务质量的提升、服务策略的转变不仅仅是依靠简单的数据共享、丰富资源、创新方式、增加时间等,从大量数据中发现的规律越多,找出潜在的价值越大,图书馆的服务水平也将提升得越快[9]。事实上,数据分析所依赖的大量数据资源中,图书馆具有所有权的数据资源数量比较少,从而成为限制这种服务发展的瓶颈。图书馆如何与数据库供应商以及其他与用户相关联的数据拥有者合作,共同开发和维护数据资源,将成为图书馆为用户提供个性化服务的关键。

24大数据在图书馆管理中的应用

图书馆作为一个生长着的有机体,用户的个性化需求会经常会发生变化,这些变化可以通过用户的建议来获得,也可以通过分析用户使用图书馆服务的记录,预判用户需求,为图书馆发展提供决策支持。首先,借助大数据分析平台,图书馆可通过对用户访问、浏览、使用图书馆服务、来馆时间、频次以及活动范围、使用图书馆设备等非结构化数据,生成报告和图表,图书馆管理人员就能够直观地了解图书馆各类服务和设备被使用的情况,从而为优化人员和设备配置提供决策支持。其次,借助大数据分析平台,图书馆还可以分析图书借阅的情况和数据库使用情况,为图书采访的副本量和主要采访对象提供参考依据,通过数据量使用数据的分析,可以得出哪些数据库需要增加,哪些可以取消,增加与数据库商进行谈判的筹码。再次,借助大数据分析平台,大数据能节省大量的人力物力,在资源有限的情况下提高图书馆的工作效率,为用户提供比如竞争情报等高水平的知识信息服务。此外,通过大数据平台对用户群体特征进行分析,建立图书馆业务建设的模型,可以为调整馆藏资源、设备布局,评估风险等提供决策支持。

3大数据在图书馆用户服务应用中的关键问题

31数据分析的平台

处理结构化大数据的关系数据库管理系统目前已经比较成熟,三大主流关系数据库Oracle、DB2和SQL Server在性能上各有千秋,均提供了强大的结构化数据管理及处理、数据仓库、数据挖掘、数据分析、数据决策等功能[10]。在处理复杂的结构化及非结构化大数据方面,图书馆面临复杂数据处理和迅速增长的海量数据的挑战,选择一个合适的大数据分析平台至关重要。Hadoop是目前最为流行的平台,具有高可靠性、高扩展性、高效性、高容错性的特点,在电子商务、基础设施管理、医疗保健、在线旅游等领域都有丰富的应用实践。在Hadoop平台上,图书馆大数据处理可分为4个层面,即客户端层、中间层、应用服务层和存储层[11]。客户端层是用户用来浏览和操作数字图书馆的各种应用服务的界面,一般是WEB浏览器和应用软件。中间层主要是Web服务器,响应来自客户端的HTTP请求,调用各种应用服务,并将处理的数据通过中间层返回给客户端。应用服务层主要是一些应用服务器,负责提供各种数字图书馆的应用服务,主要是用户管理、索引管理、资源管理、资源搜索、安全管理等。存储层负责将数字资源实体虚拟成一个文件系统,提供数据的分布式存储。

32成本问题

大数据有利于图书馆降低运营的成本,图书馆可以根据大数据分析结果,提高资源的利用率,增加能为用户带来更好使用体验的服务项目,减免不必要的支出。在大数据的运行成本方面,储存持续增加数据量在总成本中占据相当大的的比例,如淘宝目前每天的活跃数据量已经超过50TB,然而,就图书馆而言,目前可分析的数据量并不算很突出,清华大学图书馆2012年建立的集中存储系统也仅有500TB,这为经费并不充沛的图书馆减轻了压力。此外,大数据时代到来的原因是成本的降低和能力的提高,根据摩尔定律,当价格不变时,计算机的性能约每隔18个月将提升一倍。随着技术的进步,图书馆利用大数据的成本也将会越来越低。

33用户隐私

用户数据的妥善保存对图书馆的信誉度有较大的影响。在大数据时代,图书馆用户的个人信息和通过人机交互产生行为信息都属于用户隐私的范畴,这些信息如果得到了合理的利用,可为用户提供更优质的个性化服务,反之,如果图书馆用户数据遭到泄露,则极易遭到商业化或非法利用,给用户带来损失,从而使用户对图书馆的信任度降低,导致用户流失。

参考文献

[1]Big Data:What It Is and Why You Should Care[EB/OL].http:∥sites.amd.com/es/Documents/Big-Data-WP-06-2011.pdf,2013-11-12.

[2]Big Data:The Next Frontier for Innovation,Competition,and Productivity[EB/OL].http:∥www.mckinsey.com/insights/businesstechnology/bigdatathenextfrontierforinnovation,2013-11-12.

[3]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1):146-169.

[4]Big Data Across the Federal Government[EB/OL].http:∥www.whitehouse.gov/sites/default/files/microsites/ostp/bigdatafactsheet.pdf,2013-11-22.

[5]IBM智慧的分析洞察[EB/OL].http:∥www-31.ibm.com/ibm/cn/bao/bigdata/smarteranalytics/index.shtml,2013-12-18.

[6]IBM大数据助Vestas将气候转化为资本[EB/OL].http:∥www-03.ibm.com/software/products/zh/category/SWP10,2013-12-18.

[7]姜山,王刚.大数据对图书馆的启示[J].图书馆工作与研究,2013,(4):52-79.

[8]周青.试论图书馆个性化服务与未来展望[J].图书馆,2004,(1):73-75.

[9]杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012,(4):120-122.

[10]郭自宽,张兴旺,麦范金.大数据生态系统在图书馆中的应用[J].情报资料工作,2013,(2):23-28.

[11]王亚民,刘学胜.基于Hadoop平台的数字图书馆研究[J].情报科学,2012,(11):1685-1690.

(本文责任编辑:马卓)

endprint

猜你喜欢

用户服务个性化服务大数据
新媒体时代老年类报刊的用户服务转型与升级对策
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究