APP下载

基于模糊控制的高校图书馆图书剔除研究

2014-05-07张竣淞

华北科技学院学报 2014年10期
关键词:册数模糊化模糊集

孙 宝,张竣淞

(1.华北科技学院图书馆,北京东燕郊 101601;2.华北科技学院信息检索教研室,北京东燕郊 101601)

0 引言

迫于本科院校评估中对图书馆藏书量的要求[1][2],高校图书馆每天都在购进大量新书,但是库容架位有限,只得不断剔除陈旧破损的过时图书,为新书上架腾出空间。同时,出于提高藏书利用率的目的[3][4],高校图书馆剔除的理论与实践研究正在受到越来越多的关注。本文试图引入模糊控制理论,从客观的、定量化的角度研究探讨一种新的图书剔除方法。

1 客观定量化的图书剔除方法研究文献综述

图书剔除,一般称为图书剔旧,二者差别不大。在中国知网中检索图书剔旧文献,有17篇论述了客观定量化的图书剔旧方法,大多选择基于出版年的书龄和借阅率作为剔旧标准[5][6]。徐敏综合考察了出版年、图书利用率等十一个因素,建立了神经网络专家系统图书剔旧模型及软件系统[7][8][9]。张琳对书龄、流通率等影响因素进行了分析和排序,根据重要性程度构建并验证了等级藏书剔旧模型[2]。郑磊计算出图书半衰期和利用率(即本文中之借阅率),建立了图书剔旧辅助决策系统模型及软件系统[10]。张惠玲构建了图书平均借阅次数和书龄之间的回归模型,计算出各类图书剔旧书龄[11]。信丹丹为时间因素、流通因素等赋以不同指标权重,生成了图书剔旧指数[12]。蔡璐计算了环境科学类图书半衰期,统计分析了流通频次,确立了图书剔旧方案[13]。汪跃春对图书借阅频次与书龄进行回归,计算出各类书老化半衰期,应用于图书剔旧[14]。谷永清和夏明顺统计分析了借阅频次与图书老化的规律,确定了各类图书剔旧年限[15]。胡敏对出版时间、流通频次等量化指标赋以权值后求和,输出剔旧清单[16]。魏俊貂设计出文献剔旧计算机辅助程序,根据图书出版年、文献利用率(本文中称为借阅率)确定剔旧清单[17]。王万起根据借阅量计算出图书半衰期,指导图书剔旧[18]。叶林根据利用率(即借阅率)、半衰期等图书老化指标,开展藏书剔旧工作[19]。谭忠顶指出图书被借概率随时间作倍速递减原理,并给出了将其应用于图书剔旧时的估值[20]。陶然、王树文、张亮建构了图书文献“采购、流通、剔旧”系统灰色预测模型,输出了未来三年的剔旧文献量[21]。

2 模糊控制理论简介

模糊控制是一种先进的智能控制技术,以模糊集合理论和模糊推理为基础,模拟人脑的模糊思维方法,把基于丰富操作实践总结出的、用自然语言表述的控制策略或者通过大量实际操作数据归纳总结出的控制经验,通过模糊理论转换为用语言变量描述的控制规则,用逻辑推理去处理各种模糊性的信息,获得对被控量的控制,用计算机予以实现的自动控制[22]。模糊控制器的实现主要由以下三个过程组成。

1)精确变量的模糊化:目标是将输入的“精确”变量转化为如“正大”、“正中”、“正小”等“模糊”变量。在这个过程中利用到了已经建立好的模糊规则库(查隶属度赋值表),通过比较判断,将精确的输入信号归类入其中一个模糊子集,从而获得对该精确变量的模糊描述,即模糊变量。

2)对模糊变量的推理:选用一种模糊推理方法(取舍归类的原则),由已经获得的模糊变量和建好的控制规则库进行推理,从而得到一个模糊输出量集合,即模糊化输出。

3)输出的精确化计算:因为控制器的输出必须是精确的控制量,所以需要将最能代表模糊推理结果的一个精确值(模糊子集中的)作为输出量[23]。

3 高校图书馆图书剔除的模糊控制模型

总结华北科技学院图书馆图书剔除经验和下架规则,选取每种图书的出版年和各复本平均借阅频次(此处称为种次借阅率)作为图书剔除模糊控制模型的两个输入控制变量,构建相应模糊集,得出馆藏书目库中正在流通借阅的每种图书的剔除系数,输出剔除册数。

3.1 图书剔除模糊控制模型结构

图书剔除模糊控制模型主要由种次借阅率和出版年模糊化、构建模糊规则进行模糊推理、解模糊器、输出剔除册数四个部分组成(见图1)。

图1 图书剔除模糊控制模型结构示意图

3.2 种次借阅率模糊集

种次借阅率用p表示,用以衡量每一种图书被读者借阅的频繁程度,计算公式为:

公式中i为下标变量;N为某种图书的复本量,即图书馆采购该种图书的册数;Li为该种图书每个复本被读者借阅的次数,可以通过查阅流通日志库中该种图书的借阅历史而获知。

在本馆技术人员协助下,统计了剔除到超级库的65535种图书的种次借阅率,并导出到Excel中对种次借阅率进行了频数分布分析,绘制了直方图(见表1和图2)。

图2 剔除超级库种次借阅率直方图

表1 剔除超级库种次借阅率频数分布

图书剔除模糊控制模型中有两个模糊输入变量,种次借阅率是其中之一。根据剔除超级库65535种图书的平均借阅频次统计分布情况,把种次借阅率模糊化为3个模糊集:很少借阅(用P1表示)、借阅频次低(用 P2表示)、频繁借阅(用P3表示,3个模糊集隶属函数示意图见图3)。

很少借阅模糊集P1的隶属度函数为:

借阅频次低模糊集P2的隶属度函数为:

图3 种次借阅率模糊集示意图

频繁借阅模糊集P3的隶属度函数为:

这里的3个种次借阅率模糊子集隶属度函数公式中,μ为隶属度,p为该种图书种次借阅率。

3.3 出版年模糊集

根据华北科技学院图书馆图书剔除规则及惯例,把图书剔除模糊控制模型中另一个模糊输入变量——出版年模糊化为3个模糊集:很旧(用Y1表示)、较旧(用 Y2表示)、很新(用 Y3表示,3个模糊集隶属函数示意图见图4)。

图4 出版年模糊集示意图

很旧模糊集Y1隶属度函数为:

较旧模糊集Y2隶属度函数为:

很新模糊集Y3隶属度函数为:

这里的由出版年确定图书新旧程度的3个模糊子集隶属度函数公式中,μ为隶属度,y为该种图书出版年。

3.4 剔除模糊集

根据本馆图书剔除实际经验,参照有关参考文献,把图书剔除模糊控制模型中模糊输出变量——剔除系数模糊化为4个模糊集:不剔除(用W1表示)、半数剔除(用 W2表示)、大部分剔除(用W3表示)、几乎全部剔除(用W4表示,4个模糊集隶属函数示意图见图5)。

不剔除模糊集W1隶属度函数为:

图5 剔除模糊集示意图

半数剔除模糊集W2隶属度函数为:

大部分剔除模糊集W3隶属度函数为:

几乎全部剔除模糊集W4隶属度函数为:

这里的4个剔除模糊子集隶属度函数公式中,μ为隶属度,w为剔除系数,即剔除图书册数占该种图书复本量的百分比。

3.5 模糊控制规则

在实现模糊控制的过程中,如何确定模糊控制规则库是至关重要的一环,通常是将操作人员、专家的经验整合到计算机之中而得到[23]。完备的模糊规则库是传统模糊控制的出发点,它涵盖了足够丰富的人工经验或专家知识,形成了从控制输入到控制输出的映射关系[24]。模糊控制规则库的设计原则:当偏差较大时,控制量的变化应尽量使偏差减少;当偏差较小时,除了要消除误差外,还要考虑系统的稳定性,防止系统产生不必要的超调,甚至震荡[25]。

由于种次借阅率和图书出版年分别被模糊化为三个模糊集,故需为图书剔除模糊控制模型制定九条模糊控制规则:

规则l1:如果频繁借阅P3而且很新Y3,则不剔除W1;

规则l2:如果频繁借阅P3而且较旧Y2,则不剔除W1;

规则l3:如果频繁借阅P3而且很旧Y1,则半数剔除W2;

规则l4:如果借阅频次低P2而且很新Y3,则不剔除W1;

规则l5:如果借阅频次低P2而且较旧Y2,则半数剔除W2;

规则l6:如果借阅频次低P2而且很旧Y1,则大部分剔除W3;

规则l7:如果很少借阅P1而且很新Y3,则不剔除W1;

规则l8:如果很少借阅P1而且较旧Y2,则大部分剔除W3;

规则l9:如果很少借阅P1而且很旧Y1,则几乎全部剔除W4;

将前述模糊控制规则库的九条规则整理成模糊控制规则表,以便于计算机系统在运行过程中检索、识别、处理(见表2)。

表2 图书剔除模糊控制模型控制规则表

3.6 中心平均解模糊器

中心平均解模糊器,又叫重心解模糊器、加权平均解模糊器[26],是在模糊系统与模糊控制中最常用的解模糊器。它计算简便,直观合理,克服了最大隶属度法、中位数法等其它解模糊器的缺陷[27][28]。图书剔除模糊控制模型采用中心平均解模糊器,由每种书的种次借阅率和出版年信息直接计算出剔除模糊集的剔除系数,其与该种图书复本量的相乘之积可以作为该种图书的剔除册数。剔除系数计算公式为:

因为种次借阅率模糊集和出版年模糊集采用了全交叠三角形模糊化处理,前述剔除系数计算公式中分母为1,故可简化为:

4 计算实例

下面以本馆收藏的一种索书号为“H319.4/744=3”、国际文化出版公司出版的大学英语阅读理解学习参考书为例,演示一下获得该种图书剔除册数的过程。

步骤一、种次借阅率模糊化。该种图书累积借阅量为128册次,复本量为5本,种次借阅率为p=128/5,激活了很少借阅和借阅频次低两个模糊集,隶属度分别为:

步骤二、出版年模糊化。该种图书第1版出版于2002年9月,第3版出版于2004年2月,此处讨论分析的是第3版,故而激活了很旧和较旧两个模糊集,隶属度分别为:

步骤三、选择模糊控制规则。查对控制规则库和控制规则表,得知激活了四条规则 l5、l6、l8、l9。

步骤四、计算剔除系数。根据中心平均解模糊器原理,计算得出该种图书剔除系数:

步骤五、输出剔除册数。将前述计算得出的剔除系数与该种图书复本量相乘的乘积即为剔除册数:

从计算结果来看,输出的剔除册数一般会是一个小数,对其四舍五入,可知该种图书最好剔除4册,仅需保留1册。

5 全部37类图书剔除总册数

华北科技学院图书馆金盘管理系统选用的是Oracle 10g数据库系统,只需从客户端登录数据库服务器,执行若干条SQL查询和计算语句,就可输出剔除的书名、著者、出版社、索书号、剔除册数等重要信息,也可导出成Excel数据表文件。为了不影响本馆日常采编、借阅业务,本人今年七月在一台个人笔记本电脑中安装了Oracle 11g数据库管理系统,把金盘系统中的数据库导入到其中,在技术人员协助下执行SQL查询语句,以入馆收藏年份近似代替出版年,输出了全部37类图书剔除册数及占该类图书总册数的百分比(见表3)。若输出剔除册数为小数,均已进行了四舍五入处理。

表3 全部37类图书剔除册数及百分比

6 结论

借阅率(有时也被称为流通率、利用率)和图书出版年通常被视为图书剔除中首选的、重要的影响因素,本文建立的图书剔除模糊控制模型以借阅率和出版年为系统输入变量,输出了所有37类图书的剔除清单、册数,可以指导图书馆员据此清单在书库中选择剔除一些陈旧过时、利用率低的图书,在图书剔除的理论和实践上进行了有益的尝试和创新。

一直以来,图书剔除研究都非常活跃,鉴于主观方法的随意性,普遍呼吁客观量化方法的研究和探讨。但是,客观方法也会产生一些缺陷,会遗漏本该剔除的、破损严重的图书,剔除清单中也会列入不该剔除的、有重要价值的图书。因此,在剔除实践中不能盲从客观方法给出的剔除清单,需要专业人员根据实际情况加以补充和选择。

本文讨论的剔除理论与实践没有深入分析不同类别图书在借阅率和出版年剔除标准上的差异,最好对不同类别图书采取不同的模糊化方法,尽管这有可能增加输出剔除清单的复杂性和繁琐性。由于技术和安全的原因,本文仅提出图书剔除模型及理论,未能直接利用鑫盘系统的实时流通和馆藏数据输出剔除清单,未能设计出实践性更强的图书剔除子功能。

[1] 刘萍.藏书剔除误区辨析[J].洛阳大学学报,2007,22(3):121-123.

[2] 张琳.数字环境下高校图书馆纸质图书等级剔旧模式研究一一以西南大学图书馆为例[D].重庆:西南大学,2011:1-2,14,16 -19.

[3] 杨剑平.高校图书馆馆藏图书建设与剔除[J].农业图书情报学刊,2014,26(5):30 -32.

[4] 刘玲.浅谈图书馆图书剔旧工作[J].中国报业,2012(3)下:191-192.

[5] 胡东.对开架图书剔旧工作的思考[J].图书馆建设,2008(9):72-74.

[6] 孙莹莹.RFID技术环境下的藏书剔除工作——以国家图书馆中文图书阅览区剔除工作为例[J].图书馆建设,2011(11):49-51.

[7] 徐敏.基于神经网络集成的图书剔旧专家系统的研究[D].镇江:江苏大学,2006:2-4,35 -48.

[8] 徐敏.神经网络集成在图书剔旧分类中的应用[J].计算机工程,2006,32(20):210 -212.

[9] 徐敏.基于神经网络集成的专家系统模型[J].计算机工程与设计,2006,27(7):1216 -1219.

[10] 郑磊.图书剔旧辅助决策系统模型研究[D].威海:山东大学威海分校,2012:12-13.

[11] 张惠玲.基于书龄分析的图书剔旧实证研究[J].图书馆论坛,2013,33(4):126 -129.

[12] 信丹丹.公共图书馆图书剔旧指数指标体系构建研究[J]. 图书馆论坛,2013,33(3):122 -125.

[13] 蔡璐.论图书剔旧的标准——以环境科学类图书为例[J]. 图书情报工作,2010,54(3):15 -18.

[14] 汪跃春.馆藏图书老化规律的实证及应用[J].情报杂志,2009,28(3):50 -53.

[15] 谷永清,夏明顺.论高校院系资料室的“剔旧”问题——以南京大学历史系资料室为例[J].图书情报知识,2008(11):80-83.

[16] 胡敏.科技类图书剔旧标准量化探讨[J].情报探索,2008(3):112 -113,127.

[17] 魏俊貂.馆藏文献剔旧计算机程序设计与实现[J].广东广播电视大学学报,2007,16(2):106-108.

[18] 王万起.基于馆藏利用率统计的图书老化实证研究[J].新世纪图书馆,2014(6):52-56.

[19] 叶林.利用文献老化理论指导图书馆剔旧工作的研究[J]. 农业图书情报学刊,2010,22(11):157 -159.

[20] 谭忠顶.图书被借概率随时间递减倍速原理及其在图书剔旧的应用[J].广西师范学院学报(自然科学版),2011,28(3):98-101.

[21] 陶然,王树文,张亮.图书馆文献“采购——流通——剔旧”系统灰预测模型的建构[J].现代情报,2011,31(6):42-45.

[22] 张健.基于PLC的模糊神经网络控制策略的应用[J].山西电子技术,2014(3):45-47.

[23] 张慧.MATLAB与PLC相结合的模糊控制系统在加热炉温度控制中的应用[J].辽宁化工,2014,43(6):757-758,767.

[24] 杨文光,张昆龙.模糊插值控制器的控制精度分析[J].安徽大学学报(自然科学版),2013(2):36-40.

[25] 梁月云,崔天时,何亚非.温室节水灌溉系统模糊控制器设计及MATLAB仿真[J].农机化研究,2014(6):202-205,209.

[26] 向虹霖.基于PLC的模糊控制应用研究[D].成都:西南石油大学,2010:32-38.

[27] 陈建良.蚁群算法在模糊控制器优化设计中的应用[D].镇江:江苏大学电气信息工程学院,2006:28-34.

[28] 徐开军.基于数据挖掘的模糊控制器的设计研究[D].镇江:江苏大学,2006:8-13.

猜你喜欢

册数模糊化模糊集
([0,1],[0,1])-模糊拟阵的基和秩函数
基于上下截集的粗糙模糊集的运算性质
复图片模糊集及其在信号处理中的应用
餐饮娱乐空间的“边界模糊化”态势探讨——餐饮娱乐空间设计专辑
三角模糊数去模糊化对VIKOR妥协解的影响研究
求比一个数多或少百分之几的数是多少的应用题教学设计
区间直觉模糊集相似度构造
理解意义掌握方法
基于粗糙模糊集的输电杆塔塔材实际强度精确计算
高校图书馆藏书分析与评价
——以沈阳理工大学图书馆为例