APP下载

基于大数据的图书馆文献信息库访问优化的实现

2021-07-01张骏孙臻

中国新通信 2021年6期
关键词:校园网优化

张骏 孙臻

【摘要】    校园网环境下的互联网应用以教学科研为主,对图书馆文献信息库访问的需求不断增加,优化网络资源实现快捷查询是一项重要工作。结合校园网出口带宽用量数据和《电子资源访问分析系统》项目中读者访问数据,采取定期检测为主、忙时检测为辅的方式,着重在用网高峰时段和查询高峰时段,对访问目标文献信息库的网络响应速度等状态进行自动检测,形成多维度优化策略,提升访问体验,提高查询效率,增强服务能力。

【关键词】    校园网    文献信息库访问    优化

The Realization of the Optimization of Library Document Information Database Access Based on Big Data

ZHANG jun,SUN zhen (Ocean University of China,Qingdao 266100,China)

Abstract: The Internet application in the campus network environment is mainly for teaching and research, and the demand for access to the librarys document information database is increasing. It is an important task to optimize network resources to achieve quick query. Combining the campus network export bandwidth usage data and the reader access data in the “Electronic Resource Access Analysis System” project, adopt the method of regular detection as the main and busy hour detection as the supplement, focusing on the peak hours of network usage and query peak hours, and access to target documents The network response speed and other status of the information database are automatically detected to form a multi-dimensional optimization strategy to improve access experience, improve query efficiency, and enhance service capabilities.

Keywords: campus network; document information database access; optimization

引言

利用国内外著名文献信息库获取科研信息资料,成为高校师生日常工作中必不可少的技能。但由于国内互联网运营商众多,网间互联和国际互联带宽的不同,产生访问文献信息库的速度快慢的差异。本文试着从分析影响网络访问的变量因素出发,基于校园网产生的网络大数据分析,提出一种图书馆文献信息库访问优化的方法。

一、影响变量因素

打开浏览器,输入网址,填入关键字,点击回车,返回结果,这一连串网络通讯过程中的变量因素,可能影响目标是否可达,或者影响访问速度。

1.1域名解析

浏览器应答的第一步是DNS域名解析,它将我们输入的英文域名转译成对应的IP地址。由于中国联通、中国电信、中国移动以及各大互聯网云服务提供商并存,同一个域名对应着多个IP地址信息,这些IP的归属可能包含上述服务商的一种或者多种,也可能是IPv4或IPv6的一种或者多种。解析返回哪个IP信息能够访问更快捷,是第一个变量因素。

1.2路径选择

当域名解析成IP地址后,第二步就该选择走哪条路到达对方。校园网一般配置多运营商互联网出口,通过链路负载均衡设备进行预设和动态调整算法控制着各链路流量占比和路由选择情况。当流量进入链路负载均衡设备后,链路负载均衡设备会根据访问流量的目的IP地址对照运营商列表进行逐一匹配。在匹配的过程中该地址如果命中某运营商的IP地址,链路负载均衡设备则将流量引导向该运营商所对应的接口,从而将流量成功的进行分流引导。选择从那条路走,这是第二个变量因素。

1.3带宽情况

第三个变量因素是带宽,包含内部设备互联带宽和互联网出口带宽。校园网内接入层、汇聚层、核心层、边界层等设备的性能和接口带宽拥塞程度,也影响着访问互联网的体验。中国海洋大学部署千兆到桌面,万兆骨干互联的网络硬件设备,配置中国教育和科研计算机网(以下简称教育网)、中国联通、中国电信、中国移动共计13.3Gbps的IPv4和Cernet2[1]总计4Gbps的IPv6互联网容量。对关键设备进行流量统计,按需采取QoS流量保障,优化特定应用或访问。

二、校园网大数据

与文献信息库访问关系最为密切的校园网大数据,主要包含出口带宽用量和读者访问数据两部分。通过SNMP协议[2]读取负载均衡设备的互联网接口属性,形成带宽用量历史数据,便于我们了解出口使用情况。大数据项目《电子资源访问分析系统》中,通过镜像梳理校园网全流量,便于我们了解用户关心的文献数据库情况,如统计访问文献信息库站点域名热度排名,或是单列访问cnki.net的条目数量及内容。

三、系统设计建设

分析检测系统采用tracert、ping方式检测用户到目标站点的连通情况,加入校园网大数据的统计信息进行系统功能设计,辅以优化效果对比。系统功能设计主要确定各模块组成以及功能关系,优化效果对比举例比较调整前后的差异。

3.1系统功能设计

前面提到的影响变量因素中,因DNS工作机制具有缓存、老化和更新周期等因素,除检测到某解析不可达时修改外,我们不对它进行过多调整。校园网虽具备IPv6通讯资源,但仅由Cernet2唯一提供,不具备多运营商多路由条件,不在本文讨论范围内,本系统设计仅考虑在IPv4环境下。所以路径选择和带宽情况这两个因素,是本系统主要控制单元。

本系统通过模拟四个运营商的网络环境,按大数据平台输出的读者访问量排名的目标站点进行测试,算法分析将最优者的DNS解析IP地址信息设定至负载均衡设备列表中,以实现访问目标站点的最快路径,优化图书馆文献数据库访问体验。

检测模块:部署四台Windows 2012R2虚拟机,在链路负载均衡设备上对其设置强制出入向流量分流,分别模拟教育网、联通、电信、移动的单一网络环境,配置对应运营商提供的DNS信息。虚拟机上部署脚本,对目标站点进行预设周期的tracert、ping检测,返回跃点和时延存储至SQL数据库。通过tracert回显检测站点是否可达;通过ping回显检测站点网络层延迟情况。

采集模块:部署一台Windows 2012R2虚拟机,部署SNMP程序获取出口链路带宽用量情况和内网设备接口情况,记录用网高峰时间点;调用大数据分析平台的API接口獲取读者访问量排名信息,记录查询高峰时间点和目标站点信息。上述信息存储至SQL数据库,并将用网高峰时间点和查询高峰时间点反馈给检测模块,在下一个周期增加一次额外检测记录。

分析模块:调用记录数据对比tracert跃点、ping时延和抖动等多种参数进行算法分析,并输出设备操作命令行以供执行模块修改相关设备配置。同时将初步输出结果进行浏览器加载测试,形成最优路径选择。

执行模块:通过SNMP的write权限,将目标站点的IP地址信息写入到链路负载均衡的对应运营商列表库内,将QoS流控操作执行到相应节点设备间的链路上。

分析检测系统与其他设备的逻辑结构见下图1:

3.2优化效果对比

根据读者访问排名,选取apps.webofknowledge.com为例,按照校园网默认访问路由经由联通至互联网,网页打开速率不是很快。经分析检测系统判断处理,截取四次部分检测数据形成表格,可见经过系统算法分析得到优选从教育网访问目标站点。将该域名解析IP添加到教育网列表,tracert检查从教育网出互联网,实际从浏览器加载时长可知,网站打开速度变快,系统预判正常。

四、意义和结语

一切以数据说话,依托读者访问量排名等大数据为基础进行的调整具有准确定位,实时性高等特点,符合现代高校在教学科研方面标新立异、多维度发散、融会贯通的趋势。结合校园网出口用量、设备接口情况等大数据评估体系,由内而外、自下而上的疏通整个网络架构体系,优化资源配置,保障重点应用。在图书馆文献信息库访问的研究过程中,将大数据信息价值作用于实际需求,变被动接收反馈问题为主动发现梳理隐患,提升了网络服务能力,提高了文献信息库服务质量。

由于受时间和条件有限,系统还有很多待完善的功能。比如,目前基于脚本后台执行方式,没有图形化交互界面,对非开发人员不友好,暂时不支持手工输入站点计算,系统在执行前未通过任何途径告知管理员,也未形成包含修改时间和内容的日志文件等存在尚待增改的地方。

参  考  文  献

[1]吴建平,李星,李崇荣.CNGI核心网CERNET2的设计[J].中兴通讯技术,2005(03):16-20.

[2] 网络管理协议及应用开发[M].清华大学出版社,岑贤道,安常青编著, 1998

猜你喜欢

校园网优化
优化问题设计
营商环境五方面持续优化
中职学校校园网教育功能应用现状及对策的研究
优化英语课堂教学策略的探索
促进学生认识发展 优化初中化学复习
高职院校校园网应用存在的问题与对策
网络安全技术在校园网中的应用
校园网如何为大学生提供安全可控的情绪宣泄环境的研究与实践
高校网络管理问题及对策初探
校园网贷 今生后世