APP下载

基于大数据共享环境下图书馆“区块链”技术应用研究

2018-07-11房永壮王辉王博

现代情报 2018年5期
关键词:用户服务收集区块链

房永壮 王辉 王博

〔摘要〕[目的]图书馆作为公共产品其本质属性就是服务用户,而提高服务质量是图书馆追求的第一目标。在大数据时代,图书馆只有掌握最先进的技术才能真正实现这一目标。[方法]大数据技术解决了图书馆信息服务的针对性、有效性问题,而“区块链”技术解决了图书馆信息收集多样性、存储的安全性和传播的广泛性,可以说它给图书馆服务带来革命性的变革。[结果]“区块链”技术使图书馆信息服务真正成为多中心、安全存储和高效率的信息中心,解决了传统图书馆技术中无法解决的一些难题。

〔关键词〕大数据;图书馆;用户服务;信息;收集;区块链

DOI:10.3969/j.issn.1008-0821.2018.05.019

〔中图分类号〕G2507〔文献标识码〕A〔文章编号〕1008-0821(2018)05-0120-05

〔Abstract〕[Objective]The most essential attribute of library as a public product is users service,and improving service quality is the first goal that the library pursues.In the era of high-tech and big data,only libraries truly realize the most advanced science and technology,they can realize the goal.[Methods]Big data technology solved the problem of the pertinence and validity of library information and information services,and“Blockchain”technology solved the diversity of library information gathering,the security of storage,and the breadth of communication.It brought revolutionary changes to library services.[Results]“Blockchain”technology made library information services truly a multi-center,secure storage,and efficient information center,solving some pain points that cannot be solved in traditional library technology.

〔Key words〕big data;library;service;information;collection;blockchain

2016年被稱为“区块链”元年,面对这一有可能带来颠覆性的新技术,我国工信部等国家部委以及各省市给予了高度重视。2016年10月,工信部信息化和软件服务业司指导编写了《中国区块链技术和应用发展的白皮书》,对区块链技术的发展提供政策支持;2016年底,贵州省发布了《贵阳区块链发展和应用》白皮书。同时,各地通过成立联盟(中关村区块链产业联盟)和研究机构(青岛区块链研究院)等方式大力推进其发展和应用[1]。“区块链”技术发展至今应用的领域越来越丰富,从金融保险到跨境贸易,从文娱版权到存证溯源,而且“区块链”技术与大数据、人工智能技术逐渐结合,衍生出越来越多的应用领域。

1区块链技术与图书馆服务

2017年9月,国内第一家“区块链”主题图书馆在深圳前海蛇口自贸片区揭牌。虽然这是一则普通的新闻报道,但其背后的含义是一种新的图书馆业态的诞生,同时也标志着图书馆信息服务一场革命性的变革从此拉开了序幕。据金色财经报道,早在20世纪90年代中期,美国图书馆服务研究所就成立了“区块链”技术运用于图书馆的数字管理中心。基于区块链技术的公共图书馆系统试点,解决图书馆和档案领域面临的挑战,并且有可能利用新的工具、研究成果、模型、服务或联盟来推进图书馆和档案实践(金色财经2017年9月5日讯)。基于大数据共享环境下图书馆“区块链”技术应用研究日益为图书馆服务的提升带来无限空间。众所周知,图书馆作为公共产品其本质属性就是服务用户,而提高服务质量是图书馆追求的第一目标。在科技无限发达的今天,大数据服务即是其服务的重要基础、抓手和共享纽带,也是图书馆高质量服务的必然选择和途径。因为,只有在大量数据分析的环境下才能研究用户区分用户,充分满足用户的多样化需求,细致到一个国家、一个地区、一个群体、一类用户,甚至是针对某个用户的真实需求进行超前预期判断。只有这样工作才谈得上“用户第一”、“用户至上”,才能充分实现印度图书馆学大师阮冈纳赞在其著名的《图书馆学五定律》中提出的:“图书馆是一个不断生长着的有机体”。“有机体”代表的是图书馆本身,是服务的基础,而“不断生长”是图书馆对自身服务能力的无限追求和本领的不断增强。现代图书馆的服务方式主要表现在如何把馆藏资源、馆员、服务、技术和用户这五个要素的有机体最大效率地组织在一起。图书馆界常常在思考这样一个问题:“有没有一条主线把这五个要素圆满地有机地串联在一起”,形成一个能使服务发挥最大能量的最佳链条,把图书馆服务能量与读者需求能量最大效率地结合与匹配。以克服馆藏资源不足、馆员素质不高、服务质量不优、技术手段落后的问题,以及用户需求最大限度满足和积极引导的问题,“大数据”技术的出现圆满地解决和回答了这一问题。因为,随着用户阅读需求日趋多元化、个性化,图书馆要想满足读者深度阅读、深度研究及其多样的需求,必须在技术服务层面上推陈出新,在高度上深度挖掘。可以说图书馆因科技发展而腾飞,二者是密不可分的。因为在大数据时代,读者与图书馆发生的一切关系中,哪怕是一个及其细小的动作,都会产生一系列电子地图和电子轨迹,让图书馆研究每个用户、每个用户群体的各种借阅习惯和学习需求成为了可能,使图书馆在为用户的服务关系中,始终处于一个掌握主动并且能够主动出击的地位,可以说是“利剑在手服务全有”,图书馆用大数据服务用户的时代已经开启。

既然大数据对于图书馆这么重要,那么如何使信息收集更加准确、存储更加安全、传播更加有效就成为新的核心问题,有没有哪项技术可以满足上述要求?答案回答是肯定的,就是“区块链”技术。这一技术最大的特点就是最终解决了图书馆信息链中所有的技术难题。

11“去中心化”技术

“去中心化”技术是利用分布式核算和存储,不存在中心化的硬件或管理机构,任意节点的权利和义务都是均等的,系统中的数据块由整个系统中具有维护功能的节点来共同维护,使人人都成为信息的提供者,解决了信息收集的多样性问题。这种技术方式大规模的使用,使图书馆用户对图书馆的依赖程度大大减少,客观上就迫使图书馆改变工作方式,转变工作重心。

12分布式账本不可更改技术

分布式账本不可更改技术证明,一旦信息经过验证并添加至区块链,就会永久地存储起来,除非能够同时控制系统中超过51%的节点,否则单个节点上对数据库的修改是无效的。因此,区块链的数据稳定性和可靠性极高。以其“不可篡改、不可抵赖”等特点带来了一种全新的信用模式,解决了信息存储安全性问题。

13“开放和共识”技术

“开放和共识”技术解决了信息传播的最大化问题,系统是开放的,除了交易各方的私有信息被加密外,区块链的数据对所有人公开,任何人都可以通过公开的接口查询“区块链”数据和开发的相关应用,因此整个系统信息高度透明[2]。

可以说“区块链”技术与“大数据”技术的完美结合是图书馆起飞的无穷动力,有了技术的飞跃发展才能有图书馆服务的巨大进步。“区块链”技术的工作原理非常简单,但是理论非常深奥,技术非常复杂,它非常像我们平常召集人吃饭在微信上发信息接龙一样。第一,人人都可以组织饭局,信息的提供者来源非常广泛;第二,人人都是监督者,如果有人排序错误,大家都会及时提醒;第三,信息绝对安全,因为没有中心者,信息完整存储在每个人的手机上,任何人都不能篡改;第四,传播范围广、传播速度快,传播影响力大,可以说有多少人就有多少个传播者,比传统的传播方式要提高千万倍。深圳前海第一家“区块链”主题图书馆完美、真实地把人们还处于想象中的学习关于“区块链”知识层面的东西赋予实践中,“区块链”技术解决了传统图书馆技术中无法解决的一些痛点。区块链原本是比特币等加密货币存储数据的一种独特方式,是一种自引用的数据结构,用来存储大量交易信息,每条记录从后向前有序链接起来,实现了数据公开、透明、可追溯的产品的架构设计方法,算作广义的区块链。狭义的区块链仅仅涉及到数据存储技术,数据库或文件操作等,这与图书馆信息服务一脉相承。

2“区块链”环境下图书馆重心的华丽转身

“区块链”技术使图书馆由信息的传播者向组织者和管理者转变。信息的快速传播是图书馆生存的根本属性,是图书馆的压舱石,但是在图书馆服务质量提升过程中读者诟病最多的就是信息更新慢,数据信息慢、图书慢、杂志慢、服务态度也慢,这也是许多读者不愿意利用图书馆的一个重要原因。而图书馆的公共属性决定了它的关注度在于大多数读者的广泛需求上,而对个性化多样性需求很难满足。在大数据时代,用户的信息意识得到了极大的增强,信息来源也越来越广泛,需求也越来越迫切。以往那种单一信息源的時代已经落后,需要有一个中心对所有信息进行高效处理,多方组织,深入管理。这个中心无疑就应该是图书馆,这是基于图书馆本身的巨大实力以及用户的充分信赖这一公共属性所决定的。这中间必要的条件就是必须要有相关的技术和平台,以前之所以不成功的原因就是缺乏相关的技术手段。今天“区块链”技术使图书馆由信息的传播者向信息的组织者和管理者的战略布局转移成为可能,使图书馆的信息收集更加准确。

21区块链“去中心化”技术使信息收集来源多样化

“去中心化”就意味着“多中心化”,就信息而言恰好符合用户的需求,因为用户对信息的多样性需求是与生俱来的。传统图书馆基于公共属性几乎无法满足用户这一需求,这几乎涉及信息体制、成本、人员、流程和共享体系。“区块链”技术的多中心特征极大地满足了用户需求的多样性、复杂性和个性需求,弥补了图书馆公共属性中的缺憾。而图书馆身份就是组织者和管理者,要做的就是对信息进行打分和评级,对外大力推介。作法是可以把信息分成官方区、自由讨论区、核实区等等。“区块链”技术让大数据真正安全传递起来。

22区块链“点对点传输”技术使信息准确率得到极大提升信息的准确率是其生命,而信息的利用率是其“活力”,只有大力激活信息能量,图书馆才谈得上服务效率的提升。传统图书馆很难对馆藏信息进行适当的筛选和甄别,然后分门别类地提供给有需求的用户。一方面是大量信息的时滞;另一方面是用户寻求无门,完全由用户进行自我救赎,信息利用效率大大降低。图书馆只是成为了信息的搬运工,而无附加值。这一问题随着大数据的应用有所缓解,但是信息激活需要的“点”越大越好,力度越大越好。而“区块链”技术中的点对点传输、共识机制技术可以极大地把所有信息都公开呈现在用户的面前,极大地增强了传播性,进而极大地提高了利用率。任何用户都可以对所发布的信息进行评点和提出改正意见,尤其是相关利益人,在彼此讨论中,信息经过多层过滤往往最趋近真实。

3区块链“不可篡改、强背书、全历史”技术确保存储安全性

信息存储安全是信息服务的根本保障,也是核心的问题。如果这一工作做不好一切都是无用功,相反还会带来巨大的灾难,尤其是馆藏特色资源一旦被串改,就会给历史给社会带来一系列不可估量的损失。数字图书馆是用数字作为技术处理和存储的方式,对图书馆各种图文资料进行存储,实质上就是一种多媒体制作的分布式信息存储系统。它把各种不同载体的资料、不同地理位置的信息资源用数字技术存储起来,以便于所有跨越区域的用户进行信息的网络查询和传播。数字图书馆业务涉及信息资源加工、存储、检索、传输和利用的全过程。在新技术提高图书馆使用效率的同时,也引入了大量的安全风险和隐患,成为[WU1]网络攻击者攻击的目标,可以说安全风险问题从有数据概念开始就一直伴随其左右。公共图书馆掌握着大量高密度、高价值的数据,尤其是用户需求数据,是其最独特资源。大数据开放是社会客观要求和大势所趋,越开放其价值越大,从而对整个经济社会的前进和发展产生一系列推动力。然而,在大数据开放的模式下如何保护个人隐私和馆藏资料数据成为主要难点和挑战,其次才是开放大数据服务。区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的安全,利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算方式。“区块链”技术中的数据脱敏技术极大地保证了数据的私密性。其运行原理是根据密码学原理Hash()函数的单向性:Hash(x)=y,通过y很难找到x。哈希链:假如现在有顺序产生的数据块A、B、C。那么我们可以这样计算一个Hash。注意“‖”表示拼接h0=Hash(A);h1=Hash(B||h0);h2=Hash(C||h1),h2是我们计算的Hash头部,之所以称之为Hash链,因为h2的值依赖于之前一系列数据的内容和计算顺序。假如说现在你知道了h2,别人拿着A、B、C,他不管是修改A、B、C的任一点内容还是A、B、C的出现顺序,你都无法再次计算出正确的h2。利用世界最先进的哈希处理技术等加密算法,可以使数据进行脱敏处理,比如基于“区块链”技术的英格码系统(Enigma),在不访问原始数据情况下进行一系列数据运算,可以对数据的私密性进行保护,杜绝数据共享中的信息安全问题,从而避免了来自多个方面的漏洞对图书馆的威胁。

31“区块链”技术使外界攻击变得几无可能

“区块链”技术具有不可篡改、强背书、全历史的数据库存储技术,本质上就是一个去中心化的数据库,它利用一串使用密码学方法相关联产生的数据块,其中每一个数据块中都包含了一次信息网络交易数据,用于验证其信息的有效性和生成下一个区块。其中的原理是,假如网络中大家都默认遵守协议,只在最长的哈希链后计算新的头部,那么一切都很好,但是如果有人想篡改、搞不一样技术,那他就得拥有更为强大的计算能力,能够计算出一个链条分叉,或者说直接计算出一个新的链条,让大家都承认,而这几乎是不可能做到的事情。至于这个难度的证明,中本聪就是建立了一个泊松分布的概率模型,假设了诚实结点计算出新的哈希头的概率p和不诚实结点计算出新的Hash头的概率q后,算出了一个N值。这个N值的含义是给出了当一个新的哈希头部h1计算出来后,其后追加N个头部(h2,h3,h4,…)后,网络才应该承认这个新的头部h1。因为此时,攻击者要想成功发动攻击,至少需要计算出一个长度大于N的分支,这个概率在攻击者没有掌握全网算力50%的时候是很难达到的[3]。它通过网络中所有节点共同参与共同计算,互相彼此验证其信息的真伪以达成全网一致的共识,可以说“区块链”技术是一种特定的数据库技术。因为“区块链”是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。保证了“区块链”数据难以篡改,代表诚实节点的最长的链包含了最大的工作量,如果想要对业已出现的区块进行修改,攻击者必须重新完成该区块的工作量外加该区块之后所有区塊的工作量,并最终赶上和超越诚实节点的工作量。工作量最多的链,一定是数据最完整的链,一定是代表了全网用户利益的链[4]。人们都说“区块链”其实是一种去中心化的分布式记账手法,什么意思呢?例如在影视剧中常常会出现这样一些桥段:某人贪赃枉法,事情败露后,大家却找不着那个关键证物——账本,因为账本记录了彼此交易的详细信息,于是大家根据各种线索去找账本才能侦破此案。而“去中心化”的意思就是根本不存在这个账本的问题,不是某个人或者某个中心化的主体来控制,而是所有节点共同维护、共同记账,任何单一节点都无法篡改它。这条链上拥有永久和透明可查的交易记录,全球一本账,每个人都可以查找。同时,一旦记录完成,就会永远存在并且无法更改,这可以为图书馆信息的存储保护提供最完美解决方案。就拿图书馆大量存储的文本资料来说,该技术有一大功能就是可以全程追溯,从作品登上“区块链”的那一天开始,每一次翻拍、改编,均会被盖上一个时间戳、源头的原创作者可以追溯,在作者去世后“区块链”也不会停止工作。原则上,只要互联网继续存在,“区块链”技术就会永远存储相关资料。这一技术也可以在一定程度上改善一个大IP授权紊乱的现象,毕竟,这是一种共同记账的模式,单一节点不可随意篡改,每次篡改必须是这一链条上所有节点均同意才行,用户以后再也不会被无数翻拍乱花迷人眼了[5]。第一,它避免了安全漏洞频发。系统漏洞的频发给业务系统的安全运行造成极大的威胁,恶意入侵者可以利用此漏洞,通过发起恶意扫描和远程溢出等攻击方式,进入数字图书馆业务处理系统的后台,以获取、篡改甚至破坏敏感的数据手段来破坏整个网络的正常运行。香港公共图书馆RFID存在漏洞致使手机1分钟即可篡改借书RFID(无线射频辨识)是现在常见的一种无线通信技术,究其原因是图书馆安全识别系统没有进行加密处理装备,因此,用户只要利用智能手机再配合一些应用程序,即可轻易更改借书纪录,并将有关书籍资料带离图书馆,1年的时间图书馆因遗失而注销的资料总数为926项。第二,它避免了数据库安全受到极大威胁。大数据是数字图书馆的生命,准确而完整的数据库是图书馆自动化管理的核心和开展工作的基本保证。但是内部人员蓄意的侵犯或其他敌意的攻击,如一些心怀不满的授权用户可能基于某种目的蓄意破坏数据,从而使数据库中的部分数据出现丢失或数据更新不一致的情况。因网络安全问题导致数据丢失或信息被盗使图书馆大数据屡遭重大损失。比如河南封丘图书馆网站未采取防范措施遭黑客篡改网页,经查封丘县图书馆未采取防范计算机病毒和网络攻击、网络侵入等危害网络安全行为的技术措施,致使网站遭到攻击。第三,它避免Web应用层攻击。攻击者通常通过SQL注入、跨站脚本等攻击方式,很容易获取图书馆网站的管理权限,进而篡改网页代码,加入恶意网站连接或恶意程序,造成极其恶劣的影响。第四,它避免拒绝服务攻击。拒绝服务攻击造成数字图书馆业务中断,数字图书馆信息系统作为一个重要的业务信息平台,很容易受到攻击者恶意的大流量拒绝服务攻击。由于拒绝服务攻击具有发起简单、难于追查、危害巨大三大特点,具有非常大的破坏性,很容易造成系统瘫痪,无法提供服务。第五,它避免人为失误及权限管理。人为失误及业务权限管理问题也是图书馆数据面临的主要风险,人为管理失误包括弱口令,不正确的共享、应用系统的错误使用等问题。权限管理问题包括内部人员对业务应用系统的越权访问、违规操作或者操作人员直接的错误输入导致系统宕机等。

32区块链技术“永久存储”属性避免突发事件造成的巨大遗憾

突发事件可以说是伴随人类而生,有人类就有一系列突发事件。突发事件可被理解为突然发生的事情,具有速度很快,出乎意料,难以应对,必须采取非常规方法来处理,不管怎么说突发事件都会给图书馆带来巨大的无法弥补的损失。图书馆作为重要的突发事件防范区域也是避免不了被毁坏的后果,尤其是馆藏特色资料,其具有唯一性、不可复制性,一旦毁坏不可重生,这对图书馆和社会都是毁灭性的打击。1951年1月8日,青海省图书馆发生大火,烧毁其全部馆藏,甚至包括罕见的用金粉写成的《甘珠尔大藏经》108部和价值连城的宋朝壁画36幅。还有1991年2月13日,福建省建筑专科学校图书馆发生了人为纵火事件,诸如此类的“文明劫难”并不罕见,它带来不可弥补的巨大损失,尤其是一些弥足珍贵的绝版、孤本、善本及古玩字画,一旦焚毁,会造成历史性的遗憾。同时随着这些珍贵资料母本的消失,图书馆记录这些资料的大数据也有可能消亡,因为资料是孤本,大数据在不共享的情况下也是孤本。“区块链”技术具有分布式数据存储特点,可以极大地避免以上问题的出现,它可以完整保存关于孤本的所有大数据。

33区块链“开放和共识”技术凸显信息传递属性价值

传统信息传递与新型信息传递环节对比图,其中主要缺少了“可信任的第三方”,如图1所示,就是相关机构的管理,它使信息传递链大大的缩短了,信息时滞问题随之迎刃而解。“区块链”技术中的开放和共识技术解决了信息传播的最大化问题。传统图书馆信息的传播方式主要特征就是“慢”,它必须进行与图书馆“点对点”的服务模式,否则就进行不了,车马劳顿、费神费力,效果不好。“区块链”技术利用自身的公开性、便利性、无限性使信息传播速度更快,力度更大,范围更广,影响更大,更符合大数据时代的用户需求。为此“区块链”技术开始涉猎图书馆系统,这样就使信息的传播由单中心变成了多中心,随时随地都可以在任意某一点成为信息的传播点,而且这种方式的传播速度是由信息本身的能量所决定,能量越大说明对社会的影响越大,需要的用户越多,这也是信息的社會价值感[6]。能量越大传播的速度越快,范围越大,影响力越大,成几何级速度无限扩张,大大提高了信息的利用率。区块链“开放和共识”技术极大地凸显了信息的及时性,信息失去及时性就等于失去了生命,其价值就会大打折扣,用户在信息多样性、准确性、完整性、及时性中往往更重视及时性。“区块链”的多中心模式真正体现了信息的及时性原则,它让图书馆的服务具有了极大的资源价值,对读者和用户来说就是效率的极大提升。而保障信息的及时性需要一个巨大的服务平台,它必须具有公益属性同时技术无比先进,才能获得用户的极大信赖,这个平台非公共图书馆莫属。

4结论

图书馆提高服务质量是永恒的主题,而信息服务是最重要的服务方式,信息服务的载体就是大数据,分析大数据的目的是为了给用户更好的个性化和多样化服务,所有这一切的前提是依靠数据来源的广泛性,数据存储的安全性和数据传播的准确性来推动,比如区块链技术为高校图书馆自馆配整本OA电子期刊资源建设就有巨大的优势[7]。而“区块链”技术可以完美匹配这些要求,鉴于“区块链”技术的复杂性,以及其带来的人文思考,对现有的社会不论是技术层面还是人与人的价值观层面都是一场颠覆性的革命,图书馆处于新技术应用的末端节点,来日方长,但是“区块链”在图书馆应用之趋势不可阻挡。

参考文献

[1]刘德生,葛建平,董宜斌.浅议区块链技术在图书著作权保护和交易中的应用[J].科技与出版,2017,(6):76-79.

[2]长铗,韩锋,等.区块链:从数字货币到信用社会[M].北京:中信出版社,2017.

[3]张健.区块链:定义未来金融与经济新格局[M].北京:机械工业出版社,2016.

[4]邹均,张海宁,唐屹,等.区块链技术指南[M].北京:机械工业出版社,2016.

[5]申屠青春.区块链开发指南[M].北京:机械工业出版社,2017.

[6](加)唐塔普斯科特(Don Tapscott),(加)亚力克斯·塔普斯科特(Alex Tapscott).区块链革命:比特币底层技术如何改变货币、商业和世界[M].北京:中信出版集团股份有限公司,2016.

[7]于新国.基于区块链技术的图书馆自馆配数字化文献资源建设研究——以高校图书馆整本OA电子期刊资源建设为例[J].图书馆研究与工作,2017,(2):40-43,82.

(责任编辑:郭沫含)

猜你喜欢

用户服务收集区块链
新媒体时代老年类报刊的用户服务转型与升级对策
城市规划档案的收集与利用策略分析
巧用物理“秘籍”,帮助学生练功
浅论非法证据排除
网络犯罪中电子证据的收集及保全分析
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
用“区块链”助推中企走出去