APP下载

远程分布式数据库动态图像信息检索系统设计

2018-03-27

计算机测量与控制 2018年3期
关键词:信息检索分布式检索

(湖北大学知行学院,武汉 430011)

0 引言

现代计算机的发展越来越智能,对于文字、图像、声音的各种信息都能够快速的识别与处理[1-3]。随着多媒体技术的迅速发展,图像信息所占的资源也在不断的扩充,大容量的、高速的远程分布式数据库的建立为海量的动态图像提供了最基础的保障,在各行各业中的应用越来越广泛,人们对动态图像信息的管理与检索就更加的重视[4-5]。动态图像的检索一直是我国研究的技术问题,无论是理论、方法还是技术都需要根据不同领域用户提供的图像来寻找一种适用于该领域图像的检索技术手段。现在图像数据库研究的中心就是对图像进行检索,这是最具有本质性的研究领域,已经成为国内外学者研究的热点,这也成为了必须攻克的目标[6-7]。近几年,随着大量文献的出现带动了人们对于过去研究成果总结的动力,对于图像检索的产生与历史背景都是促进检索功能进步的基础。传统的图像信息检索系统存在检验图像完好率与检索图像准确率方面较差、检索的速度较慢等问题,已经不能满足当下人们对图像信息检索的需求。

文献[8]中提出了一种基于内容的图像检索系统的设计,该系统设计的方法就是利用图像的纹理、形状以及颜色对图像的特征提取、描述以及相似性度量,虽然检索的信息比较全面,但是在理论上还存在许多问题等待解决;文献[9]中提出了一种基于小波动态图像检索的系统设计,该系统设计的方法就是利用小波分析图像的分辨率,用二维动态时间的方法进行计算,虽然能够对相关的程序进行匹配与识别,但是在检索技术的方面尚不成熟。文献[10]中提出了一种基于动态图像信息互动的特征检索系统的设计,该系统设计的方法就是将动态的图像信息互动为基础,将图像信息的特征进行分类,采用迭代的算法对动态图像进行检索。

针对上述的观点,我提出了一种远程分布式数据库动态图像信息检索系统设计。首先根据远程分布式数据库的特点,设计出了动态图像的检索硬件系统框图;然后基于动态图像特征检索算法对软件进行了设计;最后进行了对比的实验。实验结果证明,远程分布式数据库动态图像信息检索系统的设计能够改善传统图像信息检索系统检验图像完好率与检索图像准确率较差的问题,并且在检索速度的方面也有较大的提升,具有分布性广、通信良好以及稳健性较强等优点,为我国未来的图像检索技术奠定了坚实的基础。

1 远程分布式数据库动态图像信息检索系统硬件设计

远程分布式数据库动态图像信息检索系统硬件设计需要对整个系统从上至下进行分层,分别是:远程分布式数据层、公共服务层、主业务层、支撑系统层。远程分布式数据层的设计主要包括整个系统中会用到的数据,通过对特征的处理得到模型的数据,而图片的特征主要用于模型的训练,进行索引特征的建立与处理;公共服务层主要是提取图片中最原始的特征,并对特征处理,这其中就包括了利用训练模型得到的数据;主业务层主要就是用Web服务技术的设计来服务普通的用户;支撑系统层为整个系统的存储提供支撑的作用。而每个层次主要包括管理员与普通用户这两个角色,管理员是对硬件系统的管理与维护;用户是系统检索服务的使用者。为了能够应对远程分布式数据库的动态图像的需求,在硬件设计的时候应该使用FastDFS的系统对图片进行储存,该系统能够直接的使用OS对计算机的管理与控制。对于图片的上传与下载需要将存储的服务器按照原来的路径进行返回,但是直接在浏览器上就对图片的传输协议请求进行系统上的支持,这种效果并不好,为此,应该对每台存储服务器进行重新的配置,并安装上具有软件开发和高性能的反向代理服务器如图1所示。

图1 图片储存的系统架构设计

对于Web服务设计采用的是Java EE应用程序的技术,框架为MVC的分层模型,主要包括:业务的逻辑层、控制层和视图层,如图2所示。

图2 Web服务技术的架构

由图2可知:业务的逻辑层主要是对图片的属性进行解析,然后向检索的服务模块发出相应的请求,并归纳多个检索服务模块所接收到的结果信息;控制层主要是对图片的上传、参数的处理、返回的信息以及接收的请求进行处理,一定的情况下可以调用业务的逻辑层辅助完成工作;视图层用户界面(UI)的模块,主要通过JSP的负责来完成相应的程序。

框架为MVC的分层模型能够降低Web服务技术架构之间的模块耦合程度,并使数据的显示情况与业务之间的逻辑相互分离,并且可以方便的对视图层和业务逻辑层进行扩充或修改,后续的相应工作也可以精心的维护。

结合远程分布式数据库优点与比较成熟的Web服务技术建立了动态图像的检索系统,该系统的模块主要包括:查询的引擎、特征的提取、特征的对比、特征的图像库、查询的反馈与满意程度、图像信息的参数以及数据库的管理,具体结构如图3所示。

图3 动态图像的检索硬件系统框图

从图3可以看出,交界口能够接收用户提供的图像,等待查询,设置相应的特征进行提取并对参数对比,即可显示查询的结果,并通过接口对查询的结果进行评价,将特征修改后能够重新对信息进行查询。根据用户对查询结果的满意程度对参数进行修正,通过调整可更新图像的数据库,从而提高查询的精准度。而特征的对比就是利用提取的图像特征进行对比,筛选出符合规定的数据提供给用户,该模块可根据具体的情况进行控制与调整。

2 远程分布式数据库动态图像信息检索系统软件设计

整个系统的设计是在Linux的平台上进行的,并且使用的软件系统环境都是在64位以桌面应用为主的Ubuntu17.04券商提供的自由交易系统版本,并且在该系统中的语言开发环境主要是Java和C++为主体的脚本语言,而Web服务的结构与Hadoop的集群为主要计算的部分,并用Java进行语言的开发。

基于动态图像特征检索算法的软件设计:

软件设计采用的是直接面对检索对象的一种算法,将动态图像的处理分成图像人工的注释、图像内容的特征、图像基本的属性以及图像的数据源。图像人工的注释是对整个远程分布式数据库动态图像的内容以文字的形式进行描述;图像内容的特征是对原始图像进行处理,并进行相应的匹配运算;图像基本的属性是将文件的种类、所占的内存、处理的日期以及一些其他的属性信息存放在检索对象的变量之中,通过指定的程序进行初始化的编辑;图像的数据源指的是最原始的图像,通过远程分布式数据库的建立,进行相应字段的索引。远程分布式数据库动态图像信息加载的流程如图3所示。

图4 动态图像信息加载的流程

由图4可知:动态图像的信息加载是一个重要的环节。检索系统主要是对具有颜色模型的不同分量来对人类视觉感知的情况进行非均匀的量化,并有效的对维数进行矢量的压缩,然后采用主元的分析方法将整个图像进行降维,并研究通过主分量来解决多变量的方差结构的检索方法。

1)颜色分量的方法。

颜色分量的方法是将颜色的数值对图像的信息进行索引的方法,这种方法又被称为拉普拉斯或者方向导数的方法,得出的结果就是与之相邻的变化率,具体方法如下所示:

首先确定颜色数值的对数:

i(a,b)=ln(r(a,b))

(1)

公式(1)中(a,b)为给定的点的对数;r(a,b)为点(a,b)的L值。然后计算不同的卷积:

①拉普拉斯卷积:

i(a,b)Δ2⟹c(a,b)

Δ2={[p(a+1,b)-p(a,b)]-[p(a,b)-p(a-1,b)]}

+{[p(a,b+1)-p(a,b)]-[p(a,b)-p(a,b-1)]}

(2)

②方向导数:

i(a,b)Δn=cn(a,b)

(3)

最后构造直方图:

①拉普拉斯卷积:

(4)

②方向导数

(5)

2)主元的分析方法。

由上述(1)中得出的图像特征的准确率还是比较高的,但是同时也产生了较高的维数,为此,必须采用PCA的方法对图像降维。首先设置{ai}ci=1作为一个图像的集合,其中c为图像集合中的若干个图像的个数,ai为图像特征的向量。从整个集合中随机的抽取出若干个样本组成{ai1,ai2,…,aim}的训练集合,那么样本的平均值n以及协方差Q的表达式如下所示:

(6)

(7)

(8)

设yi,i=1,2,…,m作为协方差Q的特征向量,对应的特征值为βi,因此可得:

Q=AATyi=βiyi

(9)

根据上述的计算步骤得出协方差Q的特征数值与特征的向量,那么计算出来的特征向量就是根据相应的特征值按照大小的降序顺序进行排列,并将得出的特征值按照组列的形式变换成矩阵:

yi=QTai

(10)

公式(10)中的yi即为动态图像检索的特征向量。

3 实验结果与分析

3.1 实验步骤

为了验证远程分布式数据库动态图像信息检索系统设计的合理性,进行了如下的实验。随着社会的不断发展,多元化的社会环境也逐渐成熟,人们对于数据库的动态图像信息检索的性能要求也越来越严格。对于检索性能的验证主要从两个方面进行实验,分别是检索的速度与检索的精准程度。数据库的动态图像信息检索的速度主要是由图像的特征提取的匹配复杂程度所决定的;而动态图像信息检索的精准程度主要是由图像的特征区分与匹配的算法所决定的。检验图像完好率与检索图像准确率是目前检验数据库的动态图像信息检索性能的主要指标,具体表达式如公式所示:

(11)

选取两幅人脸表情的动态图像、两幅人体运动的图像作为图像信息检索实验的样本,这些图像均具有纹理谱特征,这种特征对图像信息检索实验的影响如表5所示。

表5 纹理谱特征对图像信息检索实验的影响

由表5可知:该特征并没有影响动态图像信息检索的完好率与准确率,为此可以将特征忽略不计。

3.2 实验结果

由上述的实验过程,可以知道选取的图像样本可以忽略图像的检索的特征,因此,也不会对检索的过程造成影响。传统的数据库动态图像信息检索系统与远程分布式数据库动态图像信息检索系统在检验图像完好率与检索图像准确率方面进行了对比,如表5所示。

表6 传统检索系统与远程分布式的检索系统之间的对比

由表6可知:传统的检索系统在检验图像完好率与检索图像准确率都比较差,人们对色彩感知相互一致,但是在对色彩的判定上具有一定的差距,传统的图像索引主要存在的问题就是对色彩特征的感知能力仍然不够。

而检索速度的方面两个系统之间的对比情况如图5所示。

由图5可知,远程分布式数据库动态图像信息检索系统与传统的数据库动态图像信息检索系统相比,检索的速度较快。

实验结果证明:远程分布式数据库动态图像信息检索系统具有分布性广、通信良好以及稳健性较强的优点,作为具有完整的数据库能够将分布在各个结点上的图像信息进行汇集,在逻辑上统一。该系统结构的检验图像完好率与检索图像准确率较高,速度较快,适应分布式的管理模式对机构进行控制,在经济上的性能也比较优越,可靠性与可用性较强,扩展性能极好,有益于多图像的共同检索。

4 结束语

动态图像的检索一直是我国研究的技术问题,无论是理论、方法还是技术都需要根据不同领域用户提供的图像来寻找一种适用于该领域图像的检索技术手段。由于图像信息的多变,不能仅仅根据图像的特征频率就直接对图像进行检索,还需要通过经验的知识来判定图像的大小,远程分布式数据库动态图像信息检索系统正是综合了上述的特点,并结合自身的分布式数据的优势进行图像的检索。

总之,远程分布式数据库动态图像信息检索系统所涉及的领域较广,发展的速度较快,不会受到时间与文献的束缚,通过不断的优化,能够将图像数据库分成3种主要的领域,分别是图像的识别、图像的处理以及数据库,将三者的技术成果有效的结合起来,是未来的一个发展趋势。远程分布式数据库动态图像信息检索系统扩展了传统数据库中技术的应用,为未来的图像处理提供了有力的技术手段。

[1] 李 应, 陈秋菊. 基于优化的正交匹配追踪声音事件识别[J]. 电子与信息学报, 2017, 39(1):183-190.

[2] 吕其兵, 张 曦, 骆德阳,等. 基于闪光声音信息的钢轨焊接接头质量分析[J]. 焊接学报, 2016, 37(9):105-109.

[3] 张艳博, 于光远, 田宝柱,等. 花岗岩破裂过程声发射主频多元前兆信息识别[J]. 采矿与安全工程学报, 2017(2):355-362.

[4] 李晴晴, 周长胜, 吕学强,等. 基于动态纹理基元的外观设计专利检索[J]. 微电子学与计算机, 2016, 33(3):25-31.

[5] 孙 震. 信息与技术的利用:创新知识与提升生活水平——从ASIS&T 2016年会论文看信息科学研究当前热点与动态[J]. 图书情报知识, 2017(3) :24-32.

[6] 韩正彪. 基于分布式认知的文献数据库用户心智模型演进驱动因素研究[J]. 情报学报, 2017, 36(1):79-88.

[7] 陈小莉. 基于大数据的计算机数据挖掘技术在档案管理系统中的研究应用[J]. 激光杂志, 2017(2):142-145.

[8] 陈 倩, 潘中良. 基于内容的服装检索系统中颜色特征提取算法的研究和改进[J]. 激光杂志, 2016(4):62-68.

[9] 翟奥博, 温显斌, 张 鑫. 基于改进双树复小波和灰度-梯度共生矩阵的纹理图像检索算法[J]. 计算机科学, 2017, 44(6):274-277.

[10] 刘 晙, 刘 丹. 基于组合特征检索策略的图像检索技术研究[J]. 合肥工业大学学报:自然科学版, 2015(7):918-922.

猜你喜欢

信息检索分布式检索
浅析分布式发电对电力系统的影响
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
计算机信息检索技术的发展及问题研究
基于预处理MUSIC算法的分布式阵列DOA估计
英国知识产权局商标数据库信息检索
对大学案理研讨课学生信息检索意识若干问题的思考
分布式并联逆变器解耦电流下垂控制技术
家庭分布式储能的发展前景
公共图书馆信息检索服务的实践探索——以上海浦东图书馆为例