APP下载

广东省立中山图书馆联合新书采选系统的构建与设计

2022-09-23张鹏彬吴羽冰

图书馆论坛 2022年10期
关键词:书目馆藏出版社

张鹏彬,吴羽冰

0 引言

文献资源是图书馆传承文化、服务读者的立馆之本。文献资源建设是指图书馆根据自身使命和服务定位,系统规划、选择、收集、组织管理文献资源,以建立具有特定功能的馆藏体系的全过程。当前在公共图书馆领域,采选新书依旧是图书馆推进文献资源建设的主要举措。新书采选是一个决策过程,而记录拟采图书详细内容数据的书目信息就是采选的参考基础,图书馆对书目信息的有效获取和利用,将对其馆藏建设整体效益产生深远影响。大多数公共图书馆采取政府采购模式采选新书,图书馆通过招标确定合作馆配商,再由馆配商沟通上游出版社和下游图书馆,传递书目信息并提供相应配送加工服务。随着互联网信息技术高速发展,云计算技术的不断进步和成熟,为大数据分析提供了强大的计算基础,也给各行业内或不同行业间资源共建共享带来了新的契机[1]。出版社与图书馆是天然的同盟,共同服务于人类的知识需求,二者加强合作,有望打通产业链上下游的信息壁垒,减少不必要的中间环节,实现知识传递效率的最大化[2]。本文以广东省立中山图书馆(以下简称“广东省馆”)正在建设中的基于馆社合作的联合新书采选系统为例,分析图书采选业务中加强馆社合作的必要性,对如何构建一种应用于书目资源共享和联合采选业务的一站式云服务系统进行阐述,探讨馆社合作平台建设遇到的问题和解决策略。

1 搭建馆社合作平台的必要性

(1)采选书目信息不对称。在实际采选工作中,仅靠馆配商提供的书目信息,并不能很好地保障图书馆所购图书的整体质量。以广东省馆为例,2019年全年从5家中标馆配商获取到中文书目信息约38.3万条,其中属于当年新版图书的去重后仅约11万条,而2019年我国新出版的图书多达22.5万种[3],可见通过多家馆配商提供的书目信息依旧不够全面。另外,馆配商出于利益驱使,在书目信息中加塞库存和高利润劣质图书,人为地屏蔽掉一些折扣高的书目信息等现象普遍存在,特别是采购经费有限的基层图书馆,往往中标馆配商只有一两家,对馆配商行为的约束力有限,且缺乏自发搜集书目信息的人力和资源,极易陷入采选书目信息与出版信息不对称的困境[4]。因此,图书馆在采选业务上,如何突破馆配商的信息壁垒,有效地获取、整合和利用书目信息这一实际问题长期存在,亟待解决。

(2)公共图书馆实践不足。笔者通过CNKI进行文献调研,分别以“馆社合作”“联合采访”“书目信息共享”“采访平台”为主题词,筛选得到2012-2021年发表的相关文献125篇。分析文献可知,图书馆加强与出版社群体的合作,有利于突破当前馆配市场存在信息不对称的问题,能提升图书馆文献资源质量[5-6];依托互联网信息技术,搭建馆社多方共同接入的信息管理平台或业务联合系统,可以实现数据信息的有效整合和利用,提升合作成效[7-9];高校图书馆在馆社合作方面已有较多的研究和实践[10-12],以与“CALIS联合编目系统”共同组成采编一体化服务平台的“CALIS联合采访平台”为代表,主要应用于全国高校图书馆领域,功能架构的专业性和研究性较强,且联合采选内容主要集中在数字资源[13-18];公共图书馆在馆社合作方面的研究较少,馆与馆之间的合作多见于以提高采访规模效益、优化地区文献资源配置为目的的市县(区)级公共图书馆联合采访[19];各大馆配商建设的采选平台,迎合了当前馆配市场部分新需求,在“纸电融合”“荐购服务”等领域各有所长,但其本质仍是以营利为目的的馆配服务,并不能解决根本问题[20-21]。只有由业务管理机构或大型图书馆牵头建设公益性的采选平台,才能确保信息传递公开透明,得到馆社各方用户的充分信任,从而促进平台良性发展[22]。

(3)基层图书馆需求旺盛。广东省馆作为省级公共馆,馆藏建设的质量要求更多体现在“品种”上,因此尤为重视书目信息的搜集,除了通过馆配商、各类书目报、当当网、豆瓣网等渠道获取书目,近年来已与全国多家出版社取得直接联系,逐渐搭建起馆社合作架构,共同解决书目信息获取等图书采访工作中的实际问题。2019年开发面向出版社的“图书采访数据上传平台”,实现了由出版社定期按照规范格式制作提交书目的数据整合机制。同时,广东省馆肩负引领全省图书馆共同推进地区公共文化服务文献资源保障体系建设的重任,历来积极与全省基层馆共享采选书目信息,并依托馆社合作措施为全省基层馆与出版社提供沟通渠道,针对不同馆的实际需求为其对接相应出版社的专业服务[23]。2017-2021年通过广东省文献编目中心QQ群累计向全省基层馆共享40.8万条通过各类出版社汇集的新书书目,成为部分基层馆重要的采访书目数据来源。基层馆依托馆社合作平台,实现与出版社的业务对接,增强与区域内不同图书馆的业务交流,有望显著提升其馆藏资源建设效益。

2 基于馆社合作的联合新书采选系统构建

2.1 需求分析

广东省馆研发联合新书采选系统(以下简称“采选系统”)是在多年加强馆社合作成效基础上,期望组织起省内公共馆采选业务的交流群体,打造配合公共图书馆馆藏建设方向的书目资源平台,带动人力和经费有限的基层馆提升文献资源建设效益,通过数据共享为出版社展现公共图书馆的文献需求,提供出版决策参考,增进实际业务对接。采选系统的设计依据,是广东省馆在推动馆社合作和书目共享工作中发现的馆社双方实际需求。图书馆用户需要更全面、规范、精细的出版社书目数据,希望系统能支持书目分类检索、主题检索、在线采选、个性化推送等。出版社用户除了上传新出版书目,还需要发布库存书目,方便图书馆补缺,减轻自身仓储库存成本压力,也希望通过系统获取图书馆采选数据,了解公共馆读者的阅读偏好。因此,采选系统的设计理念是实现书目数据收集和利用,满足多个图书馆和出版社之间业务数据的交流共享,提供一站式线上新书采选服务。系统采用云计算技术,所有用户都在同一平台上操作,各类出版社和省内各级图书馆通过审核后均可入驻,数据资源共建共享。

2.2 功能架构

采选系统设计面向广东省内各级公共图书馆、全国范围内的出版社、系统管理员和普通读者,且在后续建设中还将考虑纳入馆配商用户。在业务应用层面上,分为书目资源、读者荐购、书目采选等功能模块(见图1),通过设置不同角色用户的账号权限为其对接相应的功能服务,同时构建统一的信息安全防护体系,为核心业务信息安全提供全方位的管理和服务。本节就组成系统架构主体的5 个核心业务应用模块展开阐述。

(1) 用户管理。采选系统设置“管理员、省馆馆员、成员馆馆员、出版社、读者”5 种角色,分别对应不同类型的使用需求,用户是指登入系统的操作账户,每一用户必属于某一种角色,角色由管理员审核该用户注册申请时分配。“管理员”使用最高权限,负责设置系统参数、审核用户注册申请、分配用户权限和数据维护,其他角色用户可使用权限内各类功能。

(2)书目资源整合。书目资源由出版社用户和图书馆用户批量上传,出版社主要上传新书书目和库存书目,图书馆主要上传各类出版热点和专题书目。系统自动将所有上传资源进行分析整合成标准化、规范化、格式统一的新书目录并集中展示,用户可以在新书目录中按版权信息、中图分类、价格等具体条件进行筛选,自制成需求书单并下载,甚至对需求书单进行本地馆藏查重。“书目智能推送”支持图书馆用户个性化设置推送频率、筛选条件和订阅范围,系统根据需求自动推送书目信息。所有用户的上传和下载信息数据开放共享,能满足数据的横向传递和用户之间的业务交流。

(3)读者荐购。读者荐购模块面向普通读者,读者进入荐购页面填写荐购图书的基本信息,提交时可选“图书上架后预约”。系统自动检验被提交荐购书目的馆藏信息,拒绝有在架复本的图书参加荐购,提示读者到馆借阅,合规的荐购书目信息归集至荐购管理模块,由馆员进行批处理。有预约需求的荐购图书订单,在被写进馆藏业务系统时即被标记预约信息,该书采编上架后将被保留规定时间,系统会触发通知读者到馆借阅。

(4)书目采选。系统上获取的书目,通过“拟定库”[图书馆一定时期(约1-2年)已完成采选的,包括选中和剔除的书目集合]和“正式库”(图书馆真实的馆藏书目集合)两层查重后进入选订环节,由馆员逐条对书目信息进行研判。选订列表的每条书目提供“详细信息”“去冠词题名查重”“著者查重”等功能按钮,以及该书目ISBN号在网上商城(当当网、京东、亚马逊等)的检索结果页面链接按钮,作为馆员的决策参考。馆员选订书目的同时可选择采购数量和馆藏规则,以确定图书采编后的馆藏分配,此环节的馆藏规则模板可以由馆员在参数设置模块自定义创建。书目审定环节用于检验采购数量与馆藏规则是否正确,发订前查重环节用以避免采购图书与捐赠、征集等不经采购的图书重复建设的情况,确保采购经费和文献资源得到充分利用。正式发订书目会在馆藏业务系统自动生成订单,发订清单则由馆员打印出来后发给馆配商配货(详见图2)。

图2 书目采选流程图

(5)数据统计分析。数据统计分析模块建立在所有用户在系统上的操作记录和使用内容的大数据基础上,可以对用户的基本数据与发布数据的内容、时间、频次、使用情况进行统计分析,设计了“书目分类统计、图书馆采选统计、出版社数据统计、共享书目排行”4个前端功能。“书目分类统计”揭示各馆用户下载书目的学科分布情况和具体数量数据,“图书馆采选统计”揭示各馆用户下载书目的来源出版社分布情况和具体数量数据,“出版社数据统计”揭示各出版社用户上传书目数据被使用情况和具体数量数据,“共享书目排行”展现共享书目被使用频次的排行。用户可以在此模块获取所需的统计结果并下载到当地,从而实现馆社数据交流。

3 业务和技术保障

3.1 提高系统易用性

易用性是系统设计的重要方面,指的是系统对用户来说意味着易于学习和使用、减轻记忆负担、有较好的使用满意程度等。采选系统面向跨行业的应用场景,用户的知识背景和使用经验不尽相同,而且作为一种公益建设项目,需要充分调动出版社和基层馆参与的积极性,因此在功能设计层面需要注意降低系统的操作门槛,尽量采用自动化、智能化方式来优化用户体验。例如,书目上传支持多种主流文件格式且由系统智能识别表头以及自定义书目筛选、个性化需求订阅等。

3.2 保障数据有效利用

采选系统多方共建多向共享的模式,随着资源的不断建设,必将产生海量数据和新的功能需求。如何确保数据的安全和有效利用,对系统数据存储和计算能力都会带来一定考验。云计算是一种能够通过网络以便利的、按需付费的方式获取计算资源(包括网络、服务器、存储、应用和服务等)并提高其可用性的模式,这些资源来自一个共享的、可配置的资源池,并能够以最省力和无人干预的方式获取和释放[8]。可见云计算理念非常契合用来搭建书目信息共建共享平台,它具有大规模、分布式、虚拟化、高可用性和拓展性、经济、安全等特点,解决了海量书目信息的存储和共享问题,为平台数据的挖掘和分析提供强大的计算基础,也保障了平台后续功能拓展的弹性空间。采选系统采用了Hadoop架构来实现更好的数据处理效果,其核心设计主要是HDFS和MapReduce。HDFS为海量数据提供了存储,而MapReduce为海量数据提供了计算框架。通过分析用户的使用记录和书目本身被使用的情况,来揭示不同图书馆的文献需求和馆藏建设方向、不同出版社的优势学科和出版重点、热门被采图书和读者最关注的学科分类等等。

3.3 增加用户黏度

采选系统设计初始目的是实现书目信息的有效整合与利用。但如果仅构建书目共享功能,对于图书馆用户而言,通过采选系统获取到的书目信息还需再导入采访业务系统进行采选,操作性不强,使得采选系统对馆员业务工作缺乏黏度;对于出版社用户而言,图书馆未在系统上进行采选,则其书目信息被使用数据只揭示了书目被图书馆参考的情况,并不是实际被采购的情况,数据挖掘分析的意义不够充分。因此,将书目采选模块嵌入到系统功能架构中,构建书目从获取、筛选到发订的业务全流程模式,是有效实现馆社合作书目信息整合与利用的必要需求。

3.4 重视读者需求

读者荐购是公共图书馆传统的文献资源建设保障业务,荐购书目一定程度上反映了图书馆服务人群的文献需求,也是新书采选的参考。采选系统搭载读者荐购模块,不仅满足馆员一站式处理采购业务的需求,还能通过对荐购书目的数据挖掘,如荐购读者的分布情况(年龄、性别、文化程度、接入荐购端口),荐购图书的分布情况(学科分类、出版社、出版年、复借率),分析出图书馆不同层次读者的阅读偏好和需求,反映既有馆藏资源结构存在的问题和短板,为馆藏建设提供决策参考。荐购书目的数据挖掘价值与读者参与荐购的数量和覆盖率呈正相关关系,因此除了要加强宣传,在应用设计层面更应该考虑读者体验,优化荐购流程,吸引更多读者参与荐购。例如,通过设计微信公众号和官网主页接入口满足读者的“主动荐购”,设计新书借阅系统(线上“你阅读,我采购”)和OPAC检索页面接入口,在读者欲借书但查无可借时,引导其“被动荐购”;在荐购页面内置自动检验馆藏信息功能,当读者填写完图书ISBN时弹窗即可提示该书是否可以荐购,减少读者不必要操作;提供预约外借功能,给予荐购读者最先借到所荐图书的权利,提升读者的荐购热情。

4 思考

(1)对接成员馆馆藏系统。图书馆用户要在采选系统上实现馆藏查重、发订的订单信息自动写入馆藏系统等功能的前提,是要完成各自馆藏系统与采选系统的对接。实际研发中,系统对接耗费了大量的时间和人力进行反复测试,解决查重结果不准确、逻辑语言转换、参数设置或数据写入错误等问题,目前只实现与广东省馆馆藏系统的对接。随着系统规模迭代,根据成员馆的需求,逐步实现与不同馆藏系统对接是主要难点之一。因此,采选系统开发初期,系统接口设置要多样、开放,充分调研省内各级公共馆馆藏系统使用情况。实现系统对接关键是实现人的对接,采选系统开发人员要与成员馆采选人员加强交流,获取成员馆的使用需求,掌握对方馆藏业务系统的架构逻辑和业务流程,优化对接效果。

(2)完善书目数据整合机制。馆社合作是采选系统书目数据建设的基础,但仅有出版社书目对基层馆的吸引力有限。实际推进中发现,许多基层馆期待更优质、更有指导价值的书目数据。作为牵头图书馆,需要自觉完善书目数据整合机制。一是设立专人专岗,通过各行业书评报刊、各媒体书目报、互联网好评书单、线上书城畅销榜单、各类获奖书单等多渠道收集书目数据,制作专题书目上传到采选系统;二是依托自身大馆资源,组织专业团队,定期制作并发布读者好评书单、读者借阅排行、馆员推荐书单、年度公共馆适藏书单等榜单,上传到采选系统;三是建立针对出版社的出版内容和质量评价体系,通过数据分析描述各出版社的优势出版物和产品质量,并把具体评价在采选系统展示,为成员馆采选人员提供决策参考。

(3)优化图书采选策略。通过采选系统,图书馆掌握了更全面的书目数据,但如何保障图书采选效益仍是不可忽视的问题。选择直接向出版社采购图书,确实有到货周期短、到货率高的优点,但单次向单一出版社采购规模较小,付款手续繁琐,且图书加工等相关馆配服务难以得到保障。通过馆配商采购图书,有覆盖面广、服务到位的优势,但仍有高折扣图书难以到货的风险。提高图书采选效益,图书馆要灵活制定采购策略,对于重点馆藏、往年图书补缺、目标出版社图书,尽量直接向出版社采购,大批量基础读物则通过馆配商采购。还要建立针对馆配商到货率和服务质量的评价体系,作为选择馆配商的重要参考,并在招标和签订合同环节明确馆配商职责,提前规范馆配商行为,保障馆配图书整体质量。

5 结语

采选系统的初步设计已经基本满足书目信息传递与利用的需求,但仍要加快推进与成员馆、出版社及馆配商等业务系统的对接,实现图书采选业务全产业链的信息贯通。在智能化方向上,可考虑应用人工智能领域的机器学习技术,利用图书馆馆藏和读者借阅数据、出版社分类分级、作者知名度和图书销售量分级等大数据,通过训练系统自主学习完善系统算法,提升个性化定制和图书采选模型构建效果。在书目信息资源的获取方面,未来可以关注对互联网上众多虚拟媒介和信息内容中所包含的书目信息的抓取和利用。在业务拓展方面,可考虑结合全国联合编目中心广东省分中心现有的业务和资源基础,探索实现省域内公共图书馆采编一体化模式的可行性,进一步优化知识传播路径,更有效地利用资源,更好地为社会服务。

猜你喜欢

书目馆藏出版社
推荐书目《初春之城》
馆藏几件残损《佚目》书画琐记
我等待……
博物馆的生存之道:馆藏能否变卖?
知还印馆藏印选——古印篇
今日華人出版社有限公司
介绍两件馆藏青铜器
石油工业出版社
本刊邮购书目
《全国新书目》2009年1月荐书榜