人工神经网络在图像处理中的应用

2010-02-13陈京水李业勤刘玉蔡显圣

中国医学装备 2010年7期

陈京水李业勤刘玉蔡显圣

人工神经网络在图像处理中的应用

陈京水①李业勤②刘玉③蔡显圣④

图像处理是包含丰富内容和具有广阔应用领域的研究学科。近几年来，作为具有自组织、自学习和联想功能的人工神经网络理论已成功地应用于图像处理的许多方面，神经网络应用于图像处理的主要思路是：把原始图像或经过适当预处理的图像作为网络的输入信号，在网络的输出端得到处理后的图像信号或分类结果。

图像处理；人工神经网络；图像压缩；图像分割；边缘检测；图像增强

[First-author's address]Department of Medical Equipment Management, Jinan Health School, Jinan 250023, China.

1 引言

图像是用各种观测系统以不同形式和手段观测客观世界而获得的，可以直接或间接地作用于人眼进而产生视觉的实体。图像技术在广义上是各种与图像有关的技术的总称，包括利用计算机和其它电子设备进行和完成的一系列工作。例如图像的采集、获取、编码、存储和传输，图像的合成和产生，图像水印的嵌入和输出，图像的变换、增强、恢复和重建，图像的分割，目标的检测、跟踪、表达和描述，目标特征的提取和测量。因此，为了对各种图像技术进行综合研究集成应用，有必要建立一个整体框架——图像工程。图像工程根据抽象程度和研究方法等的不同可分为3个层次：图像处理、图像分析和图像理解。

随着科学技术，特别是信息技术的发展，图像处理技术已经成为科学研究不可缺少的强有力工具，传统的图像处理方法已经无法满足需要，研究人员开始探索新的更有效的方法，其中利用神经网络进行图像处理是最活跃的方向。神经网络算法比起传统的算法显示了更大的优越性，主要表现在:(1)高度并行处理能力，处理的速度远远高于传统的序列处理算法；(2)具有自适应功能，能够根据学习提供的数据样本找出和输出数据的内在联系；(3)非线性映射功能，图像处理很多问题是非线性问题，神经网络为处理这些问题提供了有用的工具；(4)具有泛化功能，能够处理带有噪声的或不完全的数据。

最初，人工神经网络是作为模式识别分类器和聚类技术在图像处理领域中得到应用的。随着神经网络理论的进一步研究，神经网络的特点得到人们充分的认识，如印刷体和手写字符识别、语音识别、指纹、人脸识别、图像压缩复原等。

2 人工神经网络在图形处理中的应用

2.1 图像数据压缩

为克服存储容量较大的图片在存储和传输过程中带来的不便，我们常常希望通过某种变换手段，将数量巨大的图像信息进行压缩，以压缩后的图像数据信号进行存储和传输，当需要提取图像或在传输终端接收图像时，按一定规则将图像恢复，这就是图像数据压缩。

神经网络图像数据压缩系统主要由压缩网络（输入层/中间层）、传输通道（中间层/中间层）和再生网络（中间层/输出层）组成，输入层和输出层由相同的N个单元组成。在网络学习过程中，输入层的学习模式及输出层的教师模式使用同一图像信号。由于中间层单元数可以大大少于输入层、输出层的单元数，所以学习后的网络将以较少的中间层单元有效地表示输入图像模式，并以此进行存储和传输，在输出层将输入图像模式再现出来。在这一过程中，输入层/中间层的变换可以看作是压缩编码过程，中间层/输出层的变换可以看作是解码的过程。

2.2 图像分割

在任何人工视觉系统中，分割是早期视觉中最重要、最困难的一步。分割时将图像划分为互不相交部分的过程；通过分割，将我们感兴趣的部分（如物体）提取出来，将不感兴趣的部分（如背景）滤除掉。目前，神经网络在图像分割方面也有很多应用。

Blanz和Gish使用一个三层前馈网络进行图像分割。输入层神经元数取决于每个像素的输入特征数，输出层等于类别数，Babaguchi等使用一个多层BP网络对图像取阈值。网络的输入是图像的直方图，输出是期望的阈值。学习过程采用的样本是大量已知阈值的图像，这些阈值经验证能产生具有良好视觉效果的二值化图像。最近，Ghosh等人用一个巨量连接的神经网络在噪声环境中提取物体。

2.3 图像分类与识别

在前面提到的图像分割问题中，有时也会涉及划分属于多个不同类别的区域，这实际上已经包含了图像分类的任务。如果图像中的类别不多，模式不复杂，类之间的区别明显，当分割任务完成时，分类任务也就完成了。这里主要是指那些类别众多，模式复杂、类之间区别细微的图像分类问题，如手写体字符识别、人脸识别、指纹识别、染色体识别等。

图像分类也许是神经网络应用最多的一个领域。具体实现时，可以用原始图像作为输入，用中间隐层进行特征提取。这样做虽然简单、直观，但存在很大的缺陷。一是图像的分辨率不宜太高，否则会导致网络输入单元剧增，计算量也随之成倍增加，而降低图像分辨率又导致相近模式间的差异不明显，给识别带来困难。二是原始图像包含了大量冗余信息，且信息量分散，特征隐蔽较深，大大增加了模式特征提取的难度，降低了网络的学习效率。因此，大多数情况下需要对原始图像进行一定的预处理。如何抽取有效的特征，是图像分类问题的关键。由于各类图像的特点各不相同，相应的特征提取方法也千差万别，专用性非常强，将提取出的特征输入合适的网络模型，最后得到分类结果。

J.Cao等人用一个主分量分析（PCA）神经网络提取输入图像的10个主特征，再将提取出的特征输入后一级网络——贝叶斯增长聚类神经网络（BICNN）。这两个网络是以级联的形式串接起来的，分别以不同的学习规则训练，其性能略优于三层BP网络。根据传统的误差BP原理进行学习，有时显得效率较低，因为中间隐层抽取特征的过程很难，未必能如我们所期望的那样抽取有效特征。前一层网络还未充分学习并对输入模式形成正确的特征映射前，后一层网络的权值调整不具有明显效果。采取级联形式的网络能克服这个问题，各层网络任务单一、目标明确，极大地提高了学习效率，并减少了陷于局部极小值的概率。

B.Lerner等人在人体染色体分类的问题中，采用染色体的中轴密度投影以及染色体长度和着丝粒指数作为特征。中轴密度投影将二维图像用一维形式表达出来，其幅度被归一化到-0.5～0.5区间，长度被修为64，染色体长度和着丝粒指数也被归一到-0.5～0.5区间。采用的网络是一个三层BP网络，共有66个输入单元。输出层单元数等于类别数。中间隐含层单元数用PCA方法确定，事先规定一个阈值，若最大的n个特征值之和占所有特征值总和的百分比大于该阈值，则隐单元数就设为n。

利用多分辨率信息进行识别是近来的一个热点。文献提出了一个新方法，用小波变换和一个简易的多层聚类神经网络（MCNN）进行手写体数字的多分辨率识别，将字符图像与Haar小波卷积得到小波系数作为多分辨率特征向量输入MCNN。与传统的全连接型网络不同，MCNN是一种局部连接型网络。对于全连接型BP网络来说，由于输入层各单元与担负特征提取任务的中间层单元实行全连接，学习模式的整体相关特征被分布记忆在网络的各连接中。手写体文字的特点是其模式整体相关性变化大，而各笔划之间的相关系数较稳定，所以在网络运行时，当遇到未学习过的输入模式，由于整体相关性的差别造成网络输出模式的振荡，降低了网络的识别率，网络的泛化能力不强。虽然减少连接权数量能避免振荡，但是过少的连接权甚至对训练集也不能精确学习。因此，有必要将输入层单元分成若干区域，每个区域的单元仅与部分中间层单元连接，目的是使网络对学习模式的特征分解记忆，淡化对其整体特征的记忆。MCNN的输入层由8个聚类组成，每个聚类都与隐层中对应的聚类进行全连接，这样构成8个子网。每个子网都从随机的初始值开始，学习不同的特征映射。学习完后，每个子网都有不同的内部表示。而输出层是与所有隐层单元全连接的，这样当一个子网辨认不出某一给定输入时，依靠其它子网仍能得到正确输出。很多图像识别问题要求算法具有不变性、旋转不变性、缩放不变性等。对于特定一些问题，存在某种特征提取方法或变换，其本身就具有不变性，是较为通用的方法，Jeffrey Wood 作了一个详尽的总结，神经网络当然也是其中必不可少的一种方法。最简单（但效率最低）的方法就是给网络提供每一模式许多形态的样本，使其充分学习。利用网络的内插能力，能识别其它各种形态的样本。Simard等通过修改BP算法，使得网络经训练后其输出不受输入微小变化的影响。

很多方法利用权值共享的原理实现不变性识别，其基本原理是：强迫网络中的某些连接权具有相同权值，这样就能对网络输出施加约束，例如在某些给定的集合下执行不变性输出。这种结构化网络自由参数的数目少于具有相同连接形式的同类网络，因此训练过程加快，由于这种受约束网络在其结构中包含了先验知识，它的推广能力将优于未受约束的网络。

很多学者采用高阶神经网络解决不变性识别的问题。高阶神经网络中的每个神经元不仅将它的输入进行加权求和，还对输入之间的组合乘积进行加权求和，也就是引入了高次项。这使计算复杂度大为增加，因此在高阶神经网络解决不变性识别问题时，通常只采用一个神经元。这样一个单结点网络的学习算法类似于感知机收敛算法，因而学习速成度快，容易收敛。

Fukushima提出的新认知机模型是不变性识别方面最成功的应用之一，它对于输入样本的位移、畸变和噪声干扰等都有较强的抵抗能力。网络是由若干结构相同的神经元模块加上输入层而构成的，由于处理的视觉信息，所以每个模块都是由一些不同的二维阵列的神经元层所组成。各神经元层以级联的形式组织起来，第一层（或前面几层）能够抽取局部特征；后面几层通过对前一层中性平面的组合，能够形成整体特征。经过这样一个从局部到整体，从低级到综合的过程，最后在输出层得到决策，并且不受位置和畸变的影响。网络采用自组织竞争算法进行学习，自动调节一些神经元的可变连接权，并对学习样本集进行分类。

2.4 图像增强

图像增强的主要目的是使图像处理后达到特定的效果。不同的图像，其处理方法也各不相同，使我们很难找到一个标准的公式或函数，因此可利用神经网络的学习特性和自组织能力帮助我们完成这一任务。此外，神经网络在图像恢复、目标识别、计算机视觉中的体式匹配等方面也有应用，它的引入极大丰富了图像处理的手段。

3 应用举例和发展前景

鉴于以上提及的优势，近些年来，人工神经网络在图像处理中的应用十分广泛，领域也比较宽。在车牌识别、字符识别、红外图像识别、遥感图像识别中发挥了举足轻重的作用。不仅如此，作为人工神经网络在医学图像处理中，意义也是十分重大的。举例说明，通过对医学影片获取的图像，如CT、核磁共振成像等，进行特征纹理提取，然后输入训练好的神经网络，从得到的输出判别出相应的病症，在临床上可作为医师治疗和诊断的辅助。

鉴于神经网络的强大处理功能和解决问题的强大优势，我们相信，它将在图像处理领域发挥越来越大的作用。当然，有些问题也是需要我们去考虑，比如，哲学上的具体问题具体对待，对于什么样的要求和目的，我们采用什么样的模型，建立何种神经网络，如何使学习效果最好，都需要我们进一步的去探索和追究。

4 结束语

人工神经网络应用在图像处理方面案例比比皆是，如图像压缩、图像分割、边缘检测、图像增强、图像识别等。人工神经网络具有的自组织，非线性，自学习能力使其在很多领域发挥了重要作用。相信随着人工神经网络理论和实践的发展，在不远的将来，它将在图像处理领域发挥更大的作用。

[1]王保华，罗立民.生物医学电子学高级教程[m].南京：东南大学出版社，2001：98-102.

[2]杨建刚.人工神经网络实用教程[m].杭州：浙江大学出版社，2001.

[3]章毓晋.图像工程[m].北京：清华大学出版社，2002:6-9.

[4]赵建民，朱信忠，殷建平，等.基于特征提取和BP神经网络相结合的车牌字符识别技术[J].全国理论计算机科学学术年会，2005(8):1-4.

[5]周羽.红外图像人脸识别研究[D].大连理工大学，2007.

[6]刘伟.基于纹理分析和人工神经网络的肝部CT图像识别[D].泰山医学院，2006.

[7]于洋.利用BP神经网络进行龋齿诊断[D].北京师范大学，2006.

[8]Sing-Rong Li and Idongesit E. Ebong，Tunneling-Based Cellular Nonlinear Network Architectures for Image Processing[J], IEEE,2009.

[9]Edward Dunstone', James Andrew，SUPER-HIGH, SCALE INVARIANT IMAGE COMPRESSION USING A SURFACE LEARNING NEURAL NETWORK[J], International Symposium on Speech,1994.

[10]Segyeong Joo1, Woo Kyung Moon2 and Hee Chan Kim3，26th Annual International Conference of the IEEE EMBS[J], 2004.

[11]H. Saad1, A. Hussain，Classification for the Ripeness of Papayas UsingArtificial Neural Network (ANN) and Threshold Rule[J], 4th Student Conference on Research and Development, 2006.

[12]Blanz W E, et al. A connectionist classifier architecture applied to image segmentation. Proc 10th ICPR, 1990:272-277.

[13]Babaguchi N, et al. connectionist model binarization. In: Proc 10th ICPR,1990:51-56.

[14]Ghosh A, et al. Image segmentation using a neural network. Biol Cybern, 1991, 66:151-158.

[15]Cortes C, et al. A network system for image segmentation. In: Proc Intl Joint Conf on Neural Network, 1989,1: 121-125.

Application of artificial neural network in image processing

CHEN Jingshui, LI Ye-qin, LIU Yu,et al

Image processing can be seen as a large class of imaging technology, emphasizing on the transformation between the images, image processing is a subject with rich content and broad application areas. In recent years, as a selforganizing, self-study and associate function artificial neural network theory has been successfully applied to many aspects of image processing such as image compression, image segmentation, edge detection, image enhancement, image recognition and so on. In general, the main idea of neural network application in image processing is as below: put the original image or an appropriate preprocessing image as the input signal of network, the network output is the result : processed image signal or classification results.

Image processing; Artificial neural network; Image compression; Image segmentation; Edge detection; Image enhancement.

1672-8270(2010)07-0039-04

TH 774

陈京水,男,(1982- ),本科，现就职于山东省济南卫生学校医械学科，从事医疗器械维修技术专业的一线教学工作。

2010-02-29

①山东省济南卫生学校医疗器械学科山东济南 250023

②山东省日照市中医院设备科山东日照 276800

③山东省平阴县人民医院设备科山东平阴 250400

④山东省聊城市人民医院设备科山东聊城 252000

China Medical Equipment,2010,7(7):39-42.