APP下载

基于卷积神经网络的图像检索

2016-09-26张杰

卷宗 2016年7期
关键词:卷积神经网络

摘 要:最近邻搜索是一种有效策略的大规模图像检索,由卷积神经网络(CNN)的最新研究启发,我们提出了一个有效的深度学习框架生成哈希码的方法。当数据标签是可用的,hash码可以利用标签通过采用一个隐藏层代表的潜在概念学到的。实验结果表明,对数据集Cifar10,我们的方法优于其它几种哈希算法。

关键词:卷积神经网络;哈希码;图像检索

基金号:中央高校基本科研业务费专项资金资助(supported by “the Fundamental Research Funds for the central universities)(2016-zy-065)

1 前言

近年来,每一天数十万张图片被上传到互联网上,根据不同用户的要求寻找相关图片非常困难。例如,基于内容的图像检索类似于一个给定的查询图像找出相似的图像。“相似”可以指视觉上相似或语义上相似的。假设在数据库中的图像和查询图像表示成特征, 寻找相关图片最简单的方法就是数据库中的图像按照距离在特征空间的排序,并返回最接近的图片。然而,对于一个数据库,数以百万计的图像,这是现在相当普遍,即使是通过一个线性搜索将花费大量的时间和内存。

2 基于卷积神经网络的图像检索的原理

本文的目标是学习图像的紧凑的二进制代码,特点如下:(a)在汉明空间,相似的图像应该被编码到相似的二进制码,反之亦然;(b)二进制代码可以计算高效。虽然许多散列方法已被提出,以获得相似性保存的二进制代码,他们遭受的限制,无论是手工制作的功能或線性映射。最近的CNN由于其强大的非线性模型功能成功完成了各种各样计算机视觉领域的任务。为此,本文使用了卷积神经网络学习图像的特征表示和紧凑的二进制代码的同时,可以打破双方的手工特征和线性模型的局限性。如图1所示。

本文使用如图一的网络结构。该网络由3个卷积层和2个完全连接的层。在滤波器卷积层分别为32,32和64个大小5×5滤波器,和最大池化采用是3×3与步长为2。完全连接的第一层包含512个节点,第二输出层有K(长度)节点。

?是RGB空间,本文的目标是学习一个映射从?到k位的二进制码:F:?→{ 1,1 }K,这样

相似的(无论是在视觉上类似的或语义上类似的)图像被编码到相似的二进制代码。为了这个目的,相似的图像的二进制码应该是尽可能的相似,而不同的图像的二进制码在较远的距离。则损失函数是设计学习的相似性保持二进制码和利用分类的目标函数。然后通过对图像的网络输出得到的二进制码。

3 实验和结果分析

为了验证本文方法的有效性,故本文采用数据集Cifar-10,该数据集包含6万张大小是32×32彩色图像,共有10类,每类6000张图像。根据文献[9],我故随机选取10000张查询图像,其中每类选择1000张图片和使用剩余的图片作为训练集。我们的方法比LSH,SH,ITQ,BRE, MLH, KSH的精度高,但是没有文献中方法的精度高,但相比较这些传统方法,精度有明显的提升。

图显示在不同的位数的汉明距离为2的图像检索结果;由上图可以看出在汉明距离为2的情况下在不同的位数都是有提高的,在8位,16位,24位,32位提高的大概7%左右,但是位数越来越多时候,检索精度越来越高了。

使用64位二进制码获得的精度。在64位时候,本文方法比KSH-CNN的方法无论在返回多少张图片的情况下精度都高。虽然CNN的特征促进传统方法的性能方法有明显的差距,但我们的方法仍然优于这些传统的方法。

4 结论

在本文中,该方法有不错的检索性能,三个方面:第一、非线性特征的耦合学习和哈希提取指定任务图像信息的编码;第二,该化为减少了实数网络之间的差异输出;第三、使用单标签来监督,以及描述所需的汉明空间。在高效率实验表明,该方法编码的新的图像比传统的哈希的更快方法.由于我们目前的框架是比较普遍的,更复杂的网络结构也可以很容易地利用。此外,在这项工作中的“网络集成”的初步研究已证明是一种很有前途的方式,是值得我们未来的调查,以进一步提高检索性能。

参考文献

[1]李向阳, 庄越挺, 潘云鹤. 基于内容的图像检索技术与系统[J]. 计算机研究与发展, 2001, 38(03):344-354.

[2]王涛, 胡事民, 孙家广. 基于颜色-空间特征的图像检索[J]. 软件学报, 2002, 13(10):2031-2036.

[3]于淼, 朱琼, 王国宇. 基于特征点匹配和哈希法的图像检索方法[J]. 网络新媒体技术, 2006, 27(04):397-400.

作者简介

张杰(1992-),男,汉族,湖北省,武汉理工大学,硕士研究生,研究方向:统计学。

猜你喜欢

卷积神经网络
基于深度神经网络的微表情识别
卷积神经网络中减少训练样本时间方法研究
卷积神经网络语言模型研究
基于卷积神经网络的车辆检索方法研究
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法