APP下载

基于RFID技术的网络搜索引擎自适应优化

2020-10-13闫机超

现代电子技术 2020年19期
关键词:电子标签搜索引擎网页

闫机超

摘  要: 随着网络信息量的增长,在给人们带来丰富的共享资源的同时,也给人们查询信息带来了困难。在此背景下,以一些小型网站或企业集团内部网络搜索引擎存在的问题(搜索覆盖率低、搜索速度慢)为对象,利用RFID技术对网络搜索引擎进行自适应优化。优化分为两部分:对传统搜索引擎进行分析,确定存在的问题以及原因;利用RFID技术实现搜索引擎优化。结果表明,优化后的网络搜索引擎较优化前,搜索覆盖率提高、搜索速度加快,由此说明该研究能够为提高信息查询质量提供一些借鉴和参考。

关键词: 自适应优化; 搜索引擎分析; RFID技术; 网络信息查询; 搜索引擎优化; 性能测试

中图分类号: TN711?34; TP315.61                  文献标识码: A                   文章编号: 1004?373X(2020)19?0062?03

Abstract: With the increase of network information content, it not only brings about abundant shared resources for the people, but also brings about difficulties to people′s information query. In this context, RFID technology is adopted to optimize the network search engine adaptively for solving the problems existing in some small websites or enterprise groups, such as low search coverage and slow search speed. The optimization is divided into two parts: the traditional search engine is analyzed to identify the existing problems and reasons; RFID technology is used to achieve search engine optimization. The simulation testing results show that the search coverage rate and search speed of the optimized web search engine are higher than those of  the unoptimizable one, which indicates that this study can provide a reference for improving the quality of information query.

Keywords: adaptive optimization; search engine analysis; RFID Technology; network information query; search engine optimization; performance testing

0  引  言

隨着信息技术与通信网络的发展,信息交互在人们的日常工作、学习和生活中占据了重要地位。通过无线网络人们可以突破时间、空间的限制,实时共享资源。经调查分析,在2011年,我国网民的数量就达到了5亿以上,且这一数字每年仍在以接近40%的速度在不断上涨,预计到2020年,我国网民的数量将接近我国人口总量[1]。在此背景下,计算机网络中网页的数量也在不断增大,这也就导致网络中信息量以几何形式呈现爆炸式的增长。为此,网络为人们提供了所需的各类信息的同时,也给人们带来了一大难题,那就是如何在海量的信息中快速且准确地找到自己所需要的信息变得越来越困难。1990年由Montreal的McGill University三名学生率先提出了Archie,它是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎[2]。随后受其启发,不同的搜索引擎被发明出来,到目前为止,最常用的3个搜索引擎为百度、谷歌和雅虎,但是搜索引擎技术不仅局限于这些专门的搜索引擎网站,在一些小型网站或企业集团内部中同样需要适应于自身的搜索引擎技术。然而,这些小型网站或企业集团内部中搜索引擎技术并不是很成熟,主要体现在根据用户指令从网络中搜索信息时,搜索覆盖率较低,导致检测出的信息出现不全面或不准确的现象[3]。此外,信息检索速度也是一大缺陷,影响了服务质量。

根据上述情况,本文针对小型搜索引擎,利用RFID技术对其进行自适应优化,以期提高搜索覆盖率以及搜索速度。最后经测试,优化后的网络搜索引擎的搜索覆盖率以及搜索速度较优化前有了极大的提高,达到了研究的目的,改善了信息检索质量以及网络服务质量[4]。

1  RFID技术优化网络搜索引擎

搜索引擎优化是指针对搜索引擎原理,使网站内容更容易、更迅速地被检索到,以便用户查询信息[5]。对于搜索引擎优化主要有两种方式,即搜索引擎定位和搜索引擎排名,从定位角度和排名角度对引擎进行优化。以往搜索引擎优化多是从排名的角度进行,很少从定位角度进行优化,而从信息搜索过程上看,定位是排名的基础,只有准确定位出所需信息,才能更好地进行排名,因此本文从定位角度对搜索引擎进行优化,即利用RFID技术提高搜索引擎搜索能力,研究过程[6]具体如图1所示。

1.1  网络搜索引擎研究

搜索引擎定义:根据用户输出的指令要求,按照设置好的程序从特定的网络上搜索相关信息,然后对其按照一定的先后顺序进行排列处理,并将其结果呈现给用户,以便实现用户信息检索的目的[7]。一个搜索引擎主要由四部分组成,如图2所示。

图2中搜索引擎各组成部分的功能如表1所示。

根据表1中的说明,可以将搜索引擎的工作归纳为三个环节:从互联网上抓取信息、建立索引数据库以及搜索排序。以往搜索引擎优化的主要作用在第三个环节,用来提高排序功能,从而达到优化的目的,对前两个环节并没有过多关注,导致信息搜索查全率和查准率并没有提高多少,因为没有从根本上解决问题。因此在本研究中应用RFID技术,在简化信息搜集过程的同时,实现信息的查全和查准[10]。

1.2  网络搜索引擎优化研究

根据上述网络搜索引擎的研究以及存在问题,本节对其进行优化研究。该研究主要内容为通过RFID技术提高搜索引擎搜索功能,主要针对传统搜索引擎的前两个环节进行,具体包括RFID技术研究以及引擎优化实现[11]。

1) RFID技术

RFID技术是一种非接触式的自动识别通信技术,通过无线电信号识别特定目标,并读写相关数据,其基本组成如图3所示[12]。

电子标签又叫射频卡或应答器,主要负责储存被识别物体的相关信息,相当于被识别物体的铭牌。电子标签一般会被贴在被识别物体表面,很少会储存在物体内部,而其中所蕴含的信息需要下一元件——读写器进行读取[13]。电子标签组成结构如图4所示。

电子标签的出现,使得每个物品都具有了独一无二的“身份证”,根据该身份证,从信息出现到被应用都将变得“有迹可循”。

读写器也称为阅读器,是位于电子标签与应用系统之间的一种设备,主要负责利用射频技术识别电子标签内的内容并将需要储存的信息写入到电子标签内,其组成结构如图5所示[14]。

数据处理系统位于阅读器之后,主要负责信息的采集和处理。该系统主要包括中间件与应用软件系统两部分,其中,中间件的作用是对阅读器读取到的电子标签内的内容进行过滤、分类等处理;应用软件系统主要起到协调、控制作用。

2) 搜索引擎优化实现

当蜘蛛程序在网络上爬行并下载信息时,会在不断的遍歷中,逐一给遍历过的网页一个URL,并放到一个队列中去,直至所有网页搜集完毕。之后,根据传统搜索引擎步骤进行特征提取,建立文档库,而应用RFID技术后,就无需再进行该步骤,这也是本次利用RFID技术优化网络搜索引擎的关键。蜘蛛程序在遍历过程中直接生成电子标签,贴在表面,在后续检索时,直接就可以根据用户指令,通过电子标签检索出相关信息,再进行排序就完成了整个信息搜索过程,具体如图6所示[15]。

2  搜索性能仿真测试

为验证本次优化后网络搜索引擎的有效性,进行仿真测试。该仿真测试以新华网地方板块为例,进行网页爬行,以此分析搜索引擎的优化结果。

网页介绍:由于在该地方板块中集中了目前各地方发展与建设情况的介绍,以此形成了一个庞大的网络信息结构。本次从中选取“养老问题”作为实验查询主题。在新华网这个庞大信息网络中,一共搜索到关于“养老问题”主题的47 859张网页,以此为基础进行搜索。

测试指标:本次网络搜索引擎优化的目标是提高搜索覆盖率以及搜索速度,因此本次实验的测试指标就以上述两个指标为搜索引擎性能测试标准,其公式如下:

1) 搜索覆盖率

查全率[R]:检出的相关文献数量[A]与系统全部相关文献量[C]的百分比。

查准率[P]:指检出的相关文献量[A]与检出文献总量[B]的比率。

2) 检索速度

检索速度指规定时间内检索出的相关网页数量,单位为张/s。

测试平台采用Microsoft Visual Basic 7.0进行测试,其结构组成如图7所示。

搜索引擎性能结果如表2所示。由表2可知,利用优化后的搜索引擎搜索关于“养老问题”主题的相关网页,得到查全率为96.57%、查准率为95.46%、搜索速度为10.36张/s。与优化前的搜索引擎搜索结果对比,这一结果要更好,达到了本次研究的预期目标。

3  结  语

互联网技术的不断发展极大地促进了信息资源共享的发展,但与此同时,人们要想从庞大的信息中获取到自己想要的信息变得异常困难。为此,本文研究一种有效的搜索引擎具有重要的意义。在本研究中将RFID技术应用其中,不但简化了信息检索步骤,提高了搜索速度,还增大了搜索覆盖率,实现了更有效的信息检索。

参考文献

[1] 魏政磊,赵辉,韩邦杰,等.具有自适应搜索策略的灰狼优化算法[J].计算机科学,2017,44(3):259?263.

[2] 袁志会.上市公司门户网站搜索引擎优化情况调查研究:以汽车制造业为例[J].现代商贸工业,2017(7):65?66.

[3] 李德华,巩宇,张自锋,等.基于.net构建海量非结构文本与用户行为协同的搜索引擎研究[J].软件工程,2018,21(5):42?47.

[4] 李敏.基于搜索引擎优化技术与模板引擎技术的网站优化策略初探[J].通讯世界,2017(9):45?46.

[5] 马原,沈炜,贾宇波.AngularJS框架的搜索引擎优化策略与实现[J].工业控制计算机,2017,30(4):113?114.

[6] 孙新杰,潘水凡,李伟,等.大数据下校内搜索引擎优化研究:以六盘水师范学院为例[J].信息通信,2018(6):116?117.

[7] 黄元铨.基于搜索引擎排序算法的搜索引擎优化方法探讨[J].数字通信世界,2017(3):131?133.

[8] 刘晓敏,张艳丽,聂磊.物流管理网站的搜索引擎优化策略研究[J].商场现代化,2017(13):39?41.

[9] 谢人强,叶福兰.基于信息生态视角的网站搜索引擎优化策略评价研究:以华为在线商城为例[J].科技促进发展,2017,13(7):516?522.

[10] 郑燕娥,郑志明.基于Heritrix与Solr的就业主题搜索引擎的研究与优化[J].齐齐哈尔大学学报(自然科学版),2018,34(4):13?20.

[11] 刘丽媛.方便搜索引擎抓取内容的SEO优化如何做[J].计算机与网络,2017,43(24):46?47.

[12] 何竞松,彭光强,李清,等.基于嵌入式单片机的移动网络信息采集系统[J].电子设计工程,2018,26(23):182?185.

[13] 曹伟,江平宇,江开勇,等.基于RFID技术的离散制造车间实时数据采集与可视化监控方法[J].计算机集成制造系统,2017,23(2):273?284.

[14] 周先军,曹基军,周瑾,等.基于关键词提炼的搜索引擎优化方案[J].科技创新与应用,2016(12):78?79.

[15] 叶伟洲,吴汝趁,蔡志岗.基于RFID技术的智能档案管理研究[J].现代电子技术,2017,40(6):109?113.

猜你喜欢

电子标签搜索引擎网页
基于CSS的网页导航栏的设计
适用于高衰减汽车玻璃的电子标签方案与应用
基于URL和网页类型的网页信息采集研究
一种新型结构电子标签天线
网页制作在英语教学中的应用
网络搜索引擎亟待规范
探寻“千万”的背后——写在金溢科技电子标签销量超1000万之际
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
ETC电子标签的自由流应用