基于视觉仿生的图像目标分类算法

2014-09-10柳培忠王守觉

计算机工程与设计 2014年5期

关键词：亮度分类人类

柳培忠，王守觉

（1.华侨大学工学院，福建泉州362000；2.中国科学院苏州纳米技术与纳米仿生研究所，江苏苏州215123）

0 引言

复杂图像的目标分类是计算机视觉领域的核心研究热点之一。而目标分类属于计算机学科领域的模式识别范畴，更应理解为人类对图像的视觉内容认知［1］。传统的计算机目标分类方法可以概括的分为以下四类：

（1）基于统计的识别算法

依据图像中目标特性的统计数据，通过大量数据的训练和基于空间距离的度量特征匹配技术进行分类。如二维不变矩［2］等，这类图像的目标分类算法目标和周围背景变化不大的效果显著，对目标解决姿态变化或目标部分被遮挡等问题效果不佳。

（2）知识理解的目标分类算法

将专家系统运用到图像的目标分类中，专家系统是以逻辑推理为基础，如马尔科夫模型等描述目标的特征量［3］。由于存在可利用的知识源的理解和最后的验证很困难，因而难以在复杂变化的图像中获得很好的效果。

（3）模型化的自动分类算法

采取一种描述图像空间各种复杂变化特性的研究方法。如空间投影理论［4］等，该类算法要建立非常复杂的样本空间模型。

（4）人工神经网络的目标分类算法

人工神经网络［5－7］以结构简单的神经元连为基础，通过大量的神经元构成复杂的网络系统，该系统提供更强更丰富的处理信息能力。实现很好的目标识别效果。

人类视觉仿生的图像目标分类算法主要研究视觉感知器官对图像的理解和分析方法，研究人类视觉系统对图像信息的检测、提取、整合等过程，实现复杂图像的目标分类［8］，因而其原理和方法与上述的目标分类算法有着本质区别。

1 人类大脑的图像认知

随着人类对大脑思维模式的研究不断深入，其图像的视觉认知及在人类大脑的反映被清晰地描绘出来［8］，基于视觉仿生的图像理解模型构建是通过以下相关理论来获取数学模型：

1.1 亮度适应性原理

依据Weber－Fechner定律，人眼对图像视觉的亮度差别感觉取决于相对图像亮度变化［9］。即人眼的主观感觉亮度与实际亮度之间的关系不是线性关系，而是一个积分关系如下所示

式中：I——图像的光分布，γ——相对光强度效率函数，亮度（光强度）与环境有关。

生物学研究表明，人眼对图像内容的主观亮度是图像内容进入眼睛的光强度的对数函数。图1为实际图像所含的光强度对数与人眼的主观亮度的关系曲线关系。

图1 光强对数与主观亮度关系曲线

1.2 视皮层生理及仿生理解

人视觉系统从复杂的图像背景中快速辨认出要分类的目标信息是一项热门的研究问题，在人眼的视皮层中，有一种与处理大范围复杂图像特征有关的功能结构［8］，如图2所示。

（1）人类视觉处理系统对图像视觉信息认知存在两种状态：静态和动态。

1）对图像中对象的认识通过静态信息处理通路完成；

2）对图像对象中的空间定位则由动态信息处理通路实现处理。

（2）无论静态还是动态的视觉信息，人类视觉处理系统采取层次化的结构进行处理。层次化的各层次之间，既有前馈连接联系，又有反馈连接联系。

（3）人类视觉处理系统对图像视觉信息的获取不是均匀处理，而是根据视觉场景的内容及具体的视觉任务，人类视觉处理系统会选择部分信息（如颜色、亮度、形状、运动状态等视觉信息）进行重点处理。

图2 视皮层结构

基于上述人类视觉系统的功能特性，本文提出了一种模拟人类视觉处理方法的图像目标分类算法。

2 图像目标分类算法

（1）基于亮度适应性原理，首先对图像进行整体亮度自适应调整［9］，使得调整后图像的亮度信息符合人类视觉处理系统对图像信息的理解；

（2）依据人类视觉系统视皮层的层次图像理解机制，视皮层中静态和动态视觉信息关注的图像内容不同，构造一个基于层次化的图像目标分类方法；

（3）依据人类特有的形象思维原理实现对目标信息的特征分类。

2.1 图像整体亮度自适应调整

依据上述人类对图像的理解机制，本文的图像整体亮度变换是对图像整体明暗程度进行调整，通过对图像中暗区域的像素点进行局部的增强和降低，以适应人类视觉系统对于图像光强的需要，其调整如下描述：

（1）基于视觉仿生的图像整体亮度获取

实验表明，在一定的范围内，数字图像亮度的LOG值与人类的视觉响应近似成线性关系。人类对图像的视觉仿生特性通过用式（2）的亮度值变化描述

（2）基于视觉仿生的图像非线性亮度变换

为使得图像中某些区域亮度过高的亮度值降下来，本文通过引入一个非线性亮度压缩调整，使得图像整体更为适合视觉特性，如下所示

宝鸡市位于陕西省关中平原西部，东连咸阳市，南接汉中市，西北与甘肃省天水市和平凉市毗邻。全市辖区南北长约160.6km，东西宽约156.6km，总面积18 172km2，辖三区九县。

式中：Is——原图信息，β——亮度调整的强度因子，具体值和Im有关，且大于1；I′——视觉仿生的非线性亮度变换后的图像。

为了验证本文视觉仿生调整算法对图像视觉仿生的适应性，本文通过对不同类型的图像目标进行亮度调整分析，如图3和图4所示，本文算法提出的亮度调整算法与其它算法比较，通过实验分析可见，本文算法具有很好的鲁棒性，其亮度调整结果基本符合人类的视觉感知，而文献［9］算法相对来说并不太符合视觉感知特性。

图3 亮度调整比较（一）

2.2 图像目标分类方法

人类获取图像同类目标的流程：依据人类视觉原理，本文提出了一种基于仿生原理的图像同类目标方法［11］。如图5所示，该方法融合了人类视觉系统中的反馈机制，包含了人类已经认知的目标数据库。

基于内容的图像层次化是模仿大脑进行目标分类的前提；而反馈机制提取层次化后图像的目标区域，提高分类的精度。图像目标区域提取后，下一步目标区的特征与人类记忆的数据库比较，判断目标区域是否与人类认识一致。

图4 亮度调整比较（二）

图5 仿生图像目标分类流程

具体步骤如下：

步骤1 人类视觉对亮度的敏感度远远超过对颜色的敏感，在仿生视觉计算中，采用HSI空间进行对图像进行空间转化处理，如下所示

其中

步骤2 依据视皮层的视网膜感受野对视觉信息的感受机理，通过三维高斯函数获得图像主观感觉亮度，如下所示

式中：A1、A2、A3——中央、四周和边缘的权值系数，σ1、σ2、σ3——中央、四周和边缘的参数。

在处理图像亮度对比变化时，该模型符合人类认识图像内容的原理［12］，图像中间信息包含的能量大且区域集中，需要中间区域的能量增强；中间的四周区域属于辅助作用，包含信息的能量较小；而边缘包含的信息丰富，能量大，因而可有效地实现视皮层感受野认知的图像内容层次化。

步骤3 在步骤2获取目标区域后，接着进行目标区域的边界确定，本文采取Sobel算子边界确定方法，改进的Sobel算子对噪声具有一定的抑制能力。

（1）为达到更好的边缘检测效果，本文对Sobel算子进行改进，确定某个点X在8个方向的边缘方向式子，例如在45°边缘方向，改进后的算子如式（6）所示，对某个点X进行计算相邻8个点的亮度值，最大值对应的方向为该点X的边缘方向

（2）上述检测到的层次边缘包含噪声，为了实现目标区域的准确划分层次，本文设置的阈值θ（θ为经验值，依据图像大小自动调整），将像素数目小于θ的点自动剔除，用于去除噪声，然后对得到的结果进行形态学运算以得到最优的边缘曲线［13］。

2.3 图像目标的特征分类方法

文献［10］已经对图像特征分类方法做了大量的研究工作，图像目标的理解更多体现在形象思维方面，本文按照文献［10］的图像特征分类方法对图像目标的特征提取。

3 实验分析

3.1 图像目标分类分析

如图6和图7所示是本文分析各种算法的目标分类结果，图像中同类目标本文用同一种颜色进行表示，不同类的目标用不同的颜色区分。

本文可以看出，相对于另外3种算法，本文算法的目标分析总体上来说比较好，能够比较准确地认识出图像里的同类目标。

3.2 分类准确率分析

本文用COREL标准图像数据库作为测试数据源，用本文算法、文献［14］、文献［15］和文献［16］等计算比较的分类准确率（见表1）。计算方法：统计能正确识别图像中不同类的数目占图像库的百分比。

图6 同类目标提取比较（一）

图7 同类目标分类比较（二）

4 结束语

图像的目标识别在众多领域及其重要，特别是军工、航天等特殊行业的应用，随着各种仿生技术在当前的模式识别应用领域的不断深入，仿生技术也在不断成熟和完善，其实现的原理更符合自然界的规律，因此探索一种视觉仿生的图像目标分类算法一直是一项很有意义的工作。

总之本文在分析了当前图像目标获取算法的发展现状，提出了视觉仿生的图像目标分类算法，通过实验分析验证算法的优越性，但在图像的语义分析方面还存在众多不足，以后继续研究的方向。

［1］HUANG Shuangping.Study on key technologies of generic visual object recognition ［D］.Guangzhou：South China University of Technology，2011：10－26 （in Chinese）. ［黄双萍.通用视觉目标识别的关键技术研究［D］.广州：华南理工大学，2011.］

［2］XUE Bindang.Fresnel transform based invariant moments extraction and object recognition method ［J］.Journal of Beijing University of Aeronautics and Astronautics，2012，38 （8）：1001－1005 （in Chinese）. ［薛斌党.基于菲涅耳变换的不变矩提取及目标识别方法［J］.北京航空航天大学学报，2012，38（8）：1001－1005.］

［3］LEI Xiaogang.Fast segmentation approach for SAR image based on simple Markov random field ［J］.Journal of Systems Engineering and Electronics，2010，21 （1）：31－36.

［4］Myung J C，Torralba A，Willsky A S.A tree－based context model for object recognition ［J］.IEEE Transactions on Pattern Analysis and Machine Intelligence，2012，34 （2）：240－252.

［5］Mutch J.Multiclass object recognition with sparse，localized features ［C］／／New York：IEEE Computer Society Conference on Computer Vision and Pattern Recognition，2006：11－18.

［6］Bosch.Scene classification using a hybrid generative／discriminative approach ［J］.IEEE Trans Pattern Analysis and Machine Intelligent，2008，30 （4）：712－727.

［7］Kawasaki K.Learning to recognize visual objects with microstimulation in inferior temporal cortex ［J］.Journal of Neurophysiology，2008，100 （1）：197－211.

［8］WEI Longsheng.Research on the computation models of attention mechanism in the visual information processin ［D］.Wuhan：Huazhong University of Science and Technology，2011：14－81（in Chinese）.［魏龙生.视觉信息处理中注意机制计算模型研究［D］.武汉：华中科技大学，2011：14－81.］

［9］CHEN Chen.An adaptive biomimetic image processing method：LDRF algorithm ［J］.CAAI Transactions on Intelligent Systems，2012，7 （5）：404－408 （in Chinese）. ［谌琛.一种自适应的仿生图像增强方法：LDRF算法［J］.智能系统学报，2012，7 （5）：404－408.］

［10］WANG Shoujue.An image retrieval algorithm based on biomimetic imaginal thinking ［J］.ACTA Electronica Sinica，2010，38（5）：1－4 （in Chinese）.［王守觉.基于仿生形象思维方法的图像检索算法［J］.电子学报，2010，38 （5）：1－4.］

［11］WANG Shoujue. Analysis and theory of high－dimension spacegeometry for artificial neural networks ［J］.ACTA Electronica Sinica，2010，38 （5）：1－4 （in Chinese）. ［王守觉.人工神经网络的多维空间几何及其理论［J］.电子学报，2002，28 （5）：1－4.］

［12］GAO Qingyi.Target recognition algorithm based on visual perception ［J］.Journal of Harbin Institute of Technology，2013，45 （1）：101－105 （in Chinese）.［高庆一.视觉感知的目标识别算法［J］.哈尔滨工业大学学报，2013，45 （1）：101－105.］

［13］CAO Jiannong.Review on image segmentation based on entropy ［J］.PR ＆ AI，2012，25 （6）：958－971 （in Chinese）.［曹建农.图像分割的熵方法综述［J］.模式识别与人工智能，2012，25 （6）：958－971.］

［14］KUANG Jinjun.Kernel sparse representation classification and multi－scale block rotation－extension based robust image recognition method ［J］.PR ＆ AI，2012，26 （2）：129－135（in Chinese）.［匡金骏.基于核稀疏分类与多尺度分块旋转扩展的鲁棒图像识别［J］.模式识别与人工智能，2012，26（2）：129－135.］

［15］Yang J.Group－sensitive multiple kernel learning for object recognition ［J］.IEEE Transactions on Image Processing，2012，21 （5）：2838－2852.

［16］Koen E A.Cees Snoek.Evaluating color descriptors for object and scene recognition ［J］.IEEE Transactions on Pattern Analysis and Machine Intelligence，2010，32 （9）：1582－1596.