APP下载

大数据时代公共图书馆咨询知识库研究

2020-10-20李一男

卷宗 2020年20期
关键词:公共图书馆大数据时代研究

李一男

摘 要:人工智能,大数据,网络,物联网作为当今信息技术的新发展,越来越接近我们的生活,如果他们被视为我们的身体,大数据是触觉存储的外部信息的集合,数据库就像人类的大脑的记忆系统,没有数据库,就没有记忆系统。近年来,国家加大了对公共图书馆公众服务系统的建设,提供便捷的阅读服务。如今在城市里,也可以看到马路上出现了公共图书馆的身影,它们不需要你远去到图书馆或书店,在你家附近也许就有,带着手机前去,通过点击柜端上的屏幕,扫码免费借阅,通借通还,打造了便捷的服务网点,受到市民的关注。公共图书馆打通所有实体书店,自助共享图书馆,做到数据相互打通,方便读者,为高效的公共图书服务行业奠定坚实的基础,提高了老百姓的阅读水平。要高效的进行图书、报刊采编、借阅等工作,就需要提供舒适的阅读体验,让读者能自助借阅图书。而“知识库”包含两个不同的领域,即传统的知识传统数据库和人工智能及其分支-知识工程,所谓的智力知识基础。本文将重点讨论公共图书馆咨询知识库的建设。

关键词:大数据时代;咨询知识库;公共图书馆;研究

1 大数据特征分析

尽管不同业界对“大数据”(Big Data)的定义充满分歧,但都强调首先必须从数量维度去理解“大数据”的“大”。也就是说,大数据的首要特征就是数量大。国外学者一般把大数据的量级限定在10 TB 到1 PB 之间。中国学者一般不主张所谓的“大”做具体规定。“一般认为,大量级的数据应该是‘TB级,我们也不需要‘什么是大来解决特定的‘尺寸,因为随着技术的进步,这个尺寸本身还在不断地增大。此外,对于各个不同的领域,‘大的定义也是不同的,无需统一”。张兴旺曾经通过梳理大数据的发展历程展示了“大”的语义。认为:GB级别的数据是“超大规模数据”(Very Large Data),TB级别的数据是“海量数据”(Massive data),只有PB级别的数据才称得上是“大数据”。鉴于此,从纵向维度来把握大数据的基本特征是非常可取的,因为它可以充分彰显大数据增长量大的特征。根据国际数据公司IDC监测,仅在2010年,人类生产的数据量是1.4ZB(引注:1ZB=1024PB),2011年增长到1.8ZB,到2012年达到2.9ZB。如果按照目前60%的增长速度,这意味着数据的关于世界的量每两年翻一番所述数据;到2020年,全球将有35ZB的数据,增长近30倍。数据呈几何级数增长,完全超出人类世界目前的IT体系结构和可携带范围的存储容量。为此,世界权威的IT研究与顾问咨询公司Gartner大数据将被定义为“超越了传统的信息处理技术,在极端的信息管理能力和处理问题或多个维度”,大数据是“不能用常规软件工具,为他们的内容采集,数据管理和收集的处理在一定时间内。”不言而喻,与人类的能力有限,以控制数据的新兴数据之间的矛盾关系一直是大数据时代的基本矛盾。因此,图书馆馆际之间的竞争是馆藏资源和空间建筑方面竞争的传统觀念已经不适应大数据时代发展的需求了。

2 图书馆存储能力面临的挑战

1)基本矛盾关系决定了图书馆不可能存储所有数据。该结论不仅对单个图书馆存储容量适用,而且对整个图书馆事业的存储能力也适用。在这种情况下,无论是读者根据自己的需要,还是图书馆根据自身办馆特色和发展定位,选择性记忆“有意义”的数据。但是,这并不意味着你可以忽略其他数据,因为所有的数据都有它的潜在价值,只是相对于不同的对象来说。

2)图书馆不得不存储非结构数据,目前图书馆还习惯于存储结构数据,但非结构数据的所占有比例远远高于结构数据的比例。而这些来自人类日常生活世界且占主要份额的非结构数据同样是人类生存体验、社交对话和情感互动的缩影,同样是人类智慧的“呈现者”,因而在很大程度上更富有“隐性知识”的价值和意义。从人类生存论上看,大数据时代已经悄然来临,不管你是否意识到都已经身临之中,都必须借助数据与世界“打交道”。可见,非结构数据具有不可或缺和不可忽视的价值,因此,在后台不仅要注意结构大数据库,但也应注意非结构化数据。目前,图书馆也应顺应大数据时代,进入大数据领域。大视野看图书馆的数据建设,会发现今天的数据存储挑战:一方面是不能完全控制大数据却不得不尝试将其保存;另一方面,如果你想保存它,我们不得不面对的半结构化数据存储的难题。

3 大数据时代下公共图书馆咨询知识库的可能性路径

在大数据时代,图书馆的数据存储问题主要是“怎样对非结构数据进行存储”。解决该问题,学界有两种可能路径:一是寄托信息工程技术领域的突破,能够构建出与非结构数据性质相适应或相兼容的数据库,亦即IT界所说的“非关系型数据库”;二是借用可资利用的“大数据技术”,通过专业化的数据处理,把半结构数据和非结构数据勾连、转换或改造为结构型数据,使之与现存的关系型数据库同质化。

坐等数据存储技术成熟是一项消极被动的路径选择,图书馆界学人大多主张走第一条路径,但他们却又无时无刻不在感叹图书馆的基础设施建设的滞后。按照这样的思维逻辑推演可以预见,在大数据带来的巨大契机面前必将碌碌无为。原因有3点:一是非关系型数据库建构观念能否转变为现实还是一个未知数。很多 IT 界权威机构以及资深人士预计,还需要再经历10年以上时间,大数据存储技术的应用前景才能基本清晰。如果把解决问题的方案寄托于一个似是而非的设想,那是非常不可取的。二是建构出的非关系型数据库也不一定能解决所有数据存储问题。如前所述,大数据之“大”是因为数据总量超出人类存储、管理和处理能力。该矛盾关系始终构成大数据时代存在的现实基础,因为假如当人类有能力把控所有数据之时,数据也就无所谓“大”了。三是非结构数据还不是完全意义上的知识,不能直接运用。即使人类拥有了非关系型数据库,如果不加整理地把全部非结构数据都装了进去,仍然不是知识形态的数据。图书馆的基本职责不仅要存储知识,而且还要提供知识服务。“传统意义上的数据、信息和知识具有完全不同的概念。数据是信息的载体、信息是有背景的数据,而知识是经过人类的归纳和整理,呈现规律的信息。”这也就是说,数据要成为知识还需要一个复杂的转换过程。按照当代图书情报学的观念来讲,图书馆存储的文献资源如果是零利用率则属于资源的浪费。这不仅对纸质书籍适用,而且对数据也同样适用。这即是说,大数据给图书馆的数据存储管理提出了更高的要求。首先,要有针对性地采撷、提取、挖掘能够满足读者需求的数据。这与大数据本质完全契合,即我们不可能存储全部数据,但可以有选择地存储有用数据。其次,要把特定的非结构数据“知识形态化”。

3.1 传统咨询知识库

呼叫中心的咨询知识库截至目前其实是属于传统知识库,或者叫做知识库管理系统。主要是用来管理我们常用的一些咨询的结构化知识以及其它文档、图纸、视频和音频等信息的非结构化知识。

3.1.1 操作员管理

每个运营商使用自己的运营商代码到系统中,操作员的操作来实现权限管理:运营商的不同操作权限是不同的,系统操作员的操作權限,可以分为三种类型:浏览知识,搜索权限,添加和修改权限知识库,提交权限,修改权限,最终的审计权限。

3.1.2 知识库管理

知识集锦:知识,包括数量,标题知识类,小类,关键字,发布时间,意见,发行人,是否审核,知识内容的详细介绍,最后一次浏览,笔记等。

知识来源:直接录入、坐席的【我的知识】模块的知识转入、服务受理模块的知识转入。

知识维护:修改知识的题目、发布时间、发布人、备注、历史记录等。同时可以删除该需求。

知识审核:由拥有审核权限的操作员对知识进行审核。只有当该知识通过审核后,该知识才能在知识库生效。

3.1.3 搜索和浏览

搜索和预览是咨询知识库管理系统的关键,运营商需要找到答案,在有限的时间内找出问题。在这种压力下,该系统提供了寻找答案的快速且有效的方法是非常重要的。

搜索和浏览主要功能如下:

1)浮动搜索:对知识的称号即时搜索。这种搜索方式非常类似于谷歌的搜索和,只要你输入一个有效的关键字浮点立即下拉显示相关的答案,选符合客户给出的答案信息的需求。

2)快速搜索:可分别根据标题、关键字、内容快速匹配,便于客服人员快速找到答案。

3)自定义搜索:操作员可以根据需要,自定义结构化的搜索

方式。

4)排行榜:将一段时间内,访问最大的知识呈现给坐席,清晰明了,便于客服人员在其中选择合适的答案。

3.1.4 报表统计

系统提供按照知识登记日期、知识大类、知识小类统计报表。

可以看出来传统的知识库其实是管理系统的一种,也是增删改查为核心的传统IT应用(偏向于管理结构化数据和知识)。起码运营商的知识库管理系统在每个省的应用是规模较大的IT系统,涉及的人员多、流程多,需求调整频繁,用户满意度低。传统知识库系统对于坐席来说非常重要,最新的资费、业务、政策或者营销活动都通过知识库系统传递给坐席,没有一个坐席是可以掌握这么多结构化知识的,所以传统知识库对于坐席来说非常重要的,但是重要意义仅限于“咨询知识库”,通过这个工具来学习、掌握和使用业务知识。

3.2 智能咨询知识库研究

3.2.1 知识智能辅助

结合语音识别系统,通过识别实时通话内容,确认服务场景,分析用户意图,主动、智能提供知识内容,支持人工服务与智能服务结合,减少坐席手动操作步骤。

3.2.2 智能自我进化

能够通过自我学习,完成知识库引擎的自我进化,能够自我升级语义分析能力,提高搜索准确率以及自动采编识别率。

3.2.3 自动采编

支持知识自动采编,能够将多种非结构化素材进行结构化转换,并自动采编为知识,具有学习能力,能够逐步提升采编的准确性,减低知识采编压力。

3.2.4 服务智能融合

将知识和服务进行结合,为客户提供智能化的知识服务,能够为客户提供实时的相关业务操作,提高服务效率。

3.3 下一步规划

1)咨询知识库在传统客服、文本服务机器人、语音导航里面都将得到更好的应用,起码语音导航的语义理解知识库(小型知识库)我们是必须统筹建设的。

2)针对传统客服的传统知识库,通过提升搜索、跟随能力提升知识库的利用率。

3)希望统一做的知识库可以考虑融合坐席的需求,建设更加强大的知识库系统。智能咨询知识库作为智能服务系统中的独立且关键的一环,对效率和效果有决定性作用。

4 结语

对于大数据时代而言,知识库就是能量源。能量产生于知识的创造、汇集、利用、共享这一动态过程,先进的知识库能够让知识的价值形成势能,最终驱动智能化系统实现高效、精准的运行,为用户提供极致的服务体验。随着用户量和服务频次的快速增长,智能客服系统的数据量暴涨,将海量的数据和知识进行更科学的管理和利用,使其反哺于客户服务和业务管理成为新的方向。

参考文献

[1]宫春梅.大数据时代公共图书馆咨询知识库研究[D].湘潭大学,2016.

[2]王丽慧.关于大数据时代公共图书馆图书资料管理的改革与创新[J].才智,2020(18):247.

[3]寇月兰.大数据时代公共图书馆微服务研究[J].传媒论坛,2020,3(11):121-122.

猜你喜欢

公共图书馆大数据时代研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
MOOC时代公共图书馆服务探索研究
从“数据新闻”看当前互联网新闻信息传播生态