APP下载

人工智能机器人在图书馆的设计与实现
——以国家图书馆数字图书馆体验区为例

2020-07-03

图书馆 2020年6期
关键词:国家图书馆检索书籍

申 悦

(国家图书馆 北京 100081)

1 引言

随着大数据、云计算、AR、VR、物联网等技术不断发展,人工智能技术的研究和应用领域不断蔓延。人工智能技术的发展极其迅速,已渗透到各行各业和社会生活的各个领域。机器人开始具有能够依托云服务和大数据挖掘自主学习、不断完善自己的智能交互能力和对环境的感知能力。在图书馆领域,人工智能机器人也有了很大的应用空间,上海图书馆前台咨询机器人“图小灵”,沈阳市图书馆智能机器人“伴读”,南京大学图书馆交互机器人“图宝”等都是人工智能技术在图书馆服务中的应用实例[1]。国家图书馆数字图书馆体验区探索新技术在图书馆的创新应用,引入人工智能机器人承担部分体验参观的引导讲解,辅助办理图书馆日常业务等工作,不仅可以吸引读者,增强体验区智能科技感及互动感,同时也能提高参观率,优化体验区参观模式,更好地为读者提供服务。国家图书馆数字图书馆体验区人工智能机器人“小图”(以下简称体验区机器人)是国家图书馆引入的首个机器人,在国家图书馆数字图书馆体验区的应用目前处于探索阶段,相信在未来几年会有很大的发展。

表1 国家图书馆数字图书馆体验区展项列表

2 国家图书馆数字图书馆体验区概况

国家图书馆数字图书馆体验区是国家数字图书馆建设与服务成果展示和宣介的重要窗口,利用新颖的展示技术及创新科技向公众进行数图宣传及推介,自开放以来吸引了大量的来访嘉宾和读者参观体验。

国家图书馆数字图书馆体验区位于国家图书馆总馆北区二层,于2014年9月9日正式面向公众开放。整个展区占地面积约1 300平米,分为“国家数字图书馆工程”展示区域、“公共数字文化工程”展示区域以及互动体验展示区域。体验区运用科技手段,通过灵活、趣味、互动的方式向读者全面展示国家数字图书馆建设成果,让更多的读者通过“零距离”体验的方式,了解、使用、分享国家数字图书馆提供的资源与服务。国家图书馆数字图书馆体验区展项列表如表1所示。

3 体验区机器人设计与实现

3.1 系统总体架构设计

体验区机器人分为两部分,其中本地化的智能云平台和移动端APP是本系统的软件部分,机器人客户端为硬件部分,系统结构如图1所示。机器人主要实现的功能有语音交互、人证识别、导航避障、讲解演示、OPAC检索、任务管理、统计报表和日志管理等。

图1 系统结构图

智能云平台主要是对机器人终端设备的传感器搜集的数据进行处理、分拣,判断读者意图,并提供相应服务,主要分为感知处理(语音交互、图像识别、动作控制等)模块、信息展示模块、外部查询模块、任务配置模块、统计报表模块、系统管理模块。其中的语音交互部分,包括语音识别、语义分析、答案生成、监督学习、语音播报等功能。

机器人客户端为本系统硬件部分,包括多种传感器、核心控制板、安卓板、电源管理模块、移动导航避障模块及其他物理装置。

3.2 体验区机器人架构设计

体验区机器人系统基于安卓SDK编写。机器人通过语音、视觉、触控等交互调用机器人应用层接口,机器人内部程序通过REST API向服务器端发送任务请求,机器人根据请求结果执行相应任务,同时通过Socket与服务器端同步机器人状态,机器人架构如图2所示。

图2 体验区机器人架构图

体验区机器人语音部分的功能贯穿整个机器人执行任务始终。机器人的语音服务,调用科大讯飞的语音识别服务将机器人识别到的音频流转换为文本发送给机器人后台服务器,经过处理后发送给机器人SDK,调用科大讯飞的语音合成,播放文本内容。具体的语音交互流程如图3所示,用户对机器人说话,机器人通过六麦阵列麦克风进行声音采集,机器人语音模块监听到声音,调用科大讯飞语音识别服务,将监听到的音频流转换文本返回给机器人语音处理模块。语音模块再调用机器人服务器端的语义模块,发送识别出的文本,服务器端经过语义处理返回机器人回答的语音文本。机器人通过外网调用科大讯飞的语音合成服务,返回音频流,语音处理模块再将音频流播放出去。

图3 语音交互流程图

3.3 网络连接设计

图4 网络连接图

体验区机器人服务器接入的网络与OPAC服务器网络以及无线网络同时在国家图书馆网络区域内,网络连接如图4所示,三个网络均可互相访问。机器人与手机APP接入无线网络,该无线网络可访问机器人服务器。当机器人使用语音功能时,通过无线网络调用外网的科大讯飞服务器。机器人通过获取到的检索信息,发送给服务器,服务器经过对文本的处理,格式化成检索条件,机器人服务器所在网络开通权限可调用OPAC的检索接口,获取书籍信息,再将书籍信息返回给机器人,机器人将结果显示在大屏幕上。

3.4 内部接口设计

图5 内部接口设计图

体验区机器人各个功能内部即软件逻辑模块之间是需要调用接口来完成的,内部接口设计规约定义内部模块之间的调用关系和传递的数据结构。体验区机器人内部接口设计分为应用层逻辑、Presenter业务逻辑层和Diver底层,如图5所示。应用层逻辑包含国家图书馆机器人项目UI、界面跳转逻辑和调用底层库的方法。Presenter业务逻辑层是串联底层库与应用层的封装层,主要包含与硬件相关、驱动相关的封装,方便二次开发时调用。Diver底层是分模块进行底层驱动开发的,包括了底盘、身份证读卡、语音、人脸处理以及其他串口通行设备。针对底层逻辑,在设计时采用了额外的UDP通讯协议,UDP不属于连接型协议,因而具有资源消耗小、处理速度快的优点,所以成为底盘处理传输的主要选取协议。底盘需要在运行时保持局域网畅通,并且设置了UDP连接重连4次若失败,则不可重复连接,防止假死状态。

3.5 机器人主要功能设计与实现

图6 主功能界面

体验区机器人具有五大功能(如图6所示),可以进行人脸识别,主动问候,打招呼;能够进行智能问答,回答读者提出的常见问题,如开闭馆时间、借阅室位置、厕所位置等,实现图书馆领域的专业语音交互;能进行导引讲解,带领读者嘉宾参观数图体验区,并自主规避行进途中的障碍物和人;实现与国家图书馆OPAC系统对接,可以通过语音进行书目检索和读者信息查询。

3.5.1 智能迎宾及问答

体验区机器人的智能迎宾和问答功能优先级较高,可随时触发并完成。体验区机器人可进行人脸识别,在读者嘉宾靠近时对其进行主动问候,打招呼。鉴于人脸识别技术涉及个人隐私问题,机器人后台在录入人员信息前会经当事人允许,并且可以随时更新和配置并预先设定数据库中人员信息内容,遇见并识别该人员匹配在数据库中已录入的信息,能准确地称呼问候,如:候主任,您好!

智能问答功能是随时随地可以进行的,读者嘉宾可从主界面进入问百科界面,然后进行问答,也可随时在其他功能页面与机器人互动问答,这是机器人智能性的体现之一。读者可以咨询一般性问题,如天气情况、百科知识,也可以咨询图书馆领域专业问题和读者常见问题,如中文图书馆借阅规则、开闭馆时间、厕所位置等。针对读者嘉宾提出的问题,机器人后台完成记录,工作人员可以对读者热点问题或者机器人无法回答的问题进行设置,实现持续优化FAQ语料库。

3.5.2 讲解展示

机器人讲解展示功能分为全部展项讲解和单独展项讲解,如图7所示。选择单独展项讲解时,机器人引导读者嘉宾到达所选展项开始讲解。选择全部展项讲解时,机器人带领读者嘉宾按照事先规划的路线参观体验区,参观体验路线可按不同需求进行配置,讲解内容能灵活配置,录入的文字和图片可按需替换修改。

图7 讲解展示界面

机器人两种讲解模式可根据需要进行选择,机器人进行讲解引导时可自主规避行进途中的障碍物和人,参观途中读者嘉宾可随时语音控制机器人开始或者暂停讲解,并且进行智能问答,问答结束可恢复语音讲解。针对全部展项讲解功能,当机器人恢复讲解后读者可以重新选择继续讲解该展项,也可以跳至下一个展项进行讲解或可取消讲解。

3.5.3 导航指引

读者嘉宾通过语音或点击查找机器人小屏幕左侧显示的目标位置名称(如图8所示),机器人可完成导航任务,带领读者嘉宾到达指定位置。机器人在导航行走过程中,可自主规避障碍物,并且自动规划路线,完成任务。

图8 导航指引界面

3.5.4 书籍检索

书籍检索功能对接国家图书馆OPAC系统,通过语音实现书籍查询,书籍列表可通过语音进行翻页、选中,并显示用户所找书籍的馆藏信息、索书号、单册状态等。如,读者可语音对机器人说出找书等相关话语,机器人会进入书籍检索页面,对机器人说出“小图+【书籍名称】”或者点击屏幕上的内容进行书籍检索,如果成功检索到书籍,则检索结果将显示在大屏幕上(最多400条)。如果未检索到书籍,机器人将提示未检索到书籍。例:“小图,红楼梦”,在机器人大屏幕上显示的搜索结果如图9所示。也可以点击或者说“第n条”进入该书籍的详细页面。例:“第x条”,显示如图10所示。

图9 书籍检索结果界面

图10 书籍详情界面

3.5.5 读者信息查询

图11 读者基本信息

图12 借阅信息

主界面中读者可以通过语音命令说出“读者信息查询”,或者直接点击“读者信息查询”图标进入读者信息查询功能页面。进入读者信息查询功能页面后,机器人会通过语音提示刷二代身份证,将身份证放到机器人的肩部读卡识别区,系统将自动识别身份证的信息。如果查询成功,小屏幕上将显示您预留的个人信息如图11所示,大屏幕上将显示您的外借信息,外借信息如图12所示,可显示外借书籍明细、外借书籍历史数量。如未查询成功,机器人将提示您信息查询未能获取,可到咨询台询问。

4 结语

图书馆与人工智能技术的融合与应用是图书馆自身发展创新的方向,未来人工智能机器人要从根本上提高自身学习能力,在机器人的语义理解、逻辑判断和系统控制等方面研发更有效的算法应用,为用户提供更精准贴心的服务[2]。另一方面也特别需要注意机器人有些功能可能会涉及用户隐私,要注意避免由于数据使用不当而使用户的合法权益受到损害等问题。笔者相信人工智能机器人将很快可以探索网络资源,整合云端庞大的数据,实现信息的整合筛选和处理,加快智能化进程。

猜你喜欢

国家图书馆检索书籍
鲁迅与“书籍代购”
中国书籍享誉海外
Chinese books find an audience overseas中国书籍享誉海外
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
曹文轩主编的书籍
图书馆中文图书借阅排行榜
图书馆中文图书借阅排行榜(2016年3月)
《安徽园林》杂志继续为国家图书馆收藏