模式识别理论及其在图像处理中的应用

2015-01-02曹倩倩

赤峰学院学报·自然科学版 2015年20期

曹倩倩

（宿州学院数学与统计学院，安徽宿州 234000）

1 引言

随着第一台计算机ENIAC的出现以及人工智能的兴起，人们自然而然的把目光投向如何将人类的识别成为计算机的一部分功能，从而减轻人类自身的脑力劳动.模式识别在20世纪60年代迅速发展并成为一门新学科，它所研究的理论和方法在很多学科和领域中得到广泛的重视，推动了人工智能系统的发展，扩大了计算机应用的可能性.其中，图像处理就是模式识别方法的一个重要领域[1,2].

2 模式识别的基本概念

2.1 模式与模式识别

什么是模式呢？广义地说，存在于时间和空间中可观察的事物，如果可以区别它们是否相同或相似，都可以称之为模式；狭义地说，模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息，把模式所属的类别或同一类中模式的总体称为模式类.

模式识别则是研究一些自动技术，使计算机能自动地把待识别的模式分到各自的模式类中去.计算机模式识别就是指利用计算机等装置对物体、图像、图形、语音、字形等信息进行自动识别[3-5].

模式识别的研究主要集中在两方面，一是研究生物体（包括人）是如何感知对象的；二是在给定的任务下，如何用计算机实现模式识别的理论和方法.前者是生理学家的研究内容，属于认知科学的范畴；后者通过数学家、信息学专家和计算机科学工作者近几十年的努力，已经取得了系统的研究成果.

2.2 模式识别的特点

从模式识别的起源、目的、方法、应用、现状及发展和它同其他领域的关系来考察，可以把它的特点概括的描述如下：

（1）模式识别是用机器模仿大脑的识别过程的，设计很大的数据集合，并自动的以高速度做出决策.

（2）模式识别不像纯数学，而是抽象加上实验的一个领域.它的这个性质常常导致不平凡的和比较有成效的应用，而应用又促进进一步的研究和发展.由于它和应用的关系密切，因此它又被认为是一门工程学科.

（3）学习（自适应性）是模式识别的一个重要的过程和标志.但是，编制学习程序比较困难，而有效地消除这种程序中的错误更难，因为这种程序是有智能的.

（4）同人的能力相比，现有模式识别的能力仍然是相当薄弱的，机器通常不能对付大多数困难问题.采用交互识别法可以在较大程度上克服这一困难，当机器不能做出一个可靠的决策时，它可以求助于操作人.

3 模式识别的主要方法及其在图像处理中的应用

模式识别方法大致可以分为四类：统计模式识别法、结构模式识别方法、模糊模式识别方法与基于人工智能方法.其中基于人工智能的方法本文主要介绍人工神经网络模式识别方法.前两种方法发展得比较早，理论相对也比较成熟，在早期的模式识别中应用较多.后两种方法目前的应用较多，由于模糊方法更合乎逻辑、神经网络方法具有较强的解决复杂模式识别的能力，因此日益得到人们的重视[6,7].

3.1 统计模式识别法

统计模式识别法以概率论和数理统计为基础，它包括参数方法和非参数方法.

参数方法主要以Bayes决策理论为指导.其中最小错误率和最小风险贝叶斯决策是最常用的两种决策方法.假定特征对给定类的影响独立于其他特征，在决策分类的类别N已知与各类别的先验概率P(ωi)及类条件概率密度P(x|ωi)已知的情况下，对于一特征矢量x根据式（1）计算待检模式在各类中发生的后验概率P(ωi|x)，后验概率最大的类别即为该模式所属类别.在这样的条件下，模式识别问题转化为一个后验概率的计算问题.

在贝叶斯决策的基础上，根据各种错误决策造成损失的不同，人们提出基于贝叶斯风险的决策，即计算给定特征矢量x在各种决策中的条件风险大小，找出其中风险最小的决策.实际上对于具体的模式识别问题，先验概率和类条件概率密度很难精确知道.先验概率根据样本总数可大致估计，类条件概率密度可采用统计学中的最大似然估计法、Bayes估计法等进行估计.这类方法应用于图像分割、图像复原以及图像识别等方面.在图像分割中，假定图中的数据是服从K个概率密度混合分布的样本，然后估计概率密度函数的参数，最后计算后验概率或风险，对像素进行归类，从而达到分割图像的目的.一般情况下，往往假定概率密度函数是高斯型的，这一方面很多情况下样本的分布接近高斯分布，另一方面是数学上处理相对比较简单.和图像分割的原理类似，图像识别也是对图像的某些特征采用贝叶斯决策的方法设计分类器，根据分类器对未知图像的特征进行识别.

参数估计方法的理论基础是样本数目趋近于无穷大时的渐进理论.在样本数目很大时，参数估计的结果才趋近于真实的模型.然而实际样本数目总是有限的，很难满足这一要求.另外参数估计的另一个前提条件是特征独立性，这一点有时和实际差别较大.实际上在样本数量不是很大的情况下，往往根据样本直接设计分类器，这就是非参数方法.这类方法物理意义直观，但所得的结果和错误率往往没有直接联系，所设计的分类器不能保证最优.比较典型的方法如线性分类器、最近邻方法、K均值聚类法等.在图像压缩领域的矢量量化编码算法中，码书的训练就是一个典型的聚类过程，压缩的效果和聚类的结果关系很大.在图像分割中，采用对像素或图像的其他特征进行聚类，达到图像分割的目的.

然而，统计决策理论主要集中在数量的统计关系上而忽略了刻画模式的结构特征.图像处理往往与图像的结构信息有关，对于很复杂的图像，要求的特征量非常巨大，要把某一模式准确分类很困难，这时采用统计分类方法很难实现，因此设法分割出图像的基元子模式，将基元按照一定句法关系组合来代替原图像进行分类，这就涉及到结构模式识别的问题.

3.2 结构模式识别方法

结构模式识别是利用模式的结构描述与句法描述之间的相似性对模式进行分类.每个模式由它的各个子部分（称为子模式或模式基元）的组合来表示.对模式的识别常以句法分析的方式进行，即依据给定的一组句法规则来剖析模式的结构.当模式中每一个基元被辨认后，识别过程就可通过执行语法分析来实现.选择合适的基元是结构模式识别的关键.基元应具有“结构简单、含义明确、能方便地描述数据、易于抽取、结构信息少”等特点.由于基元选择的不确定性以及基元特征的多样性，实际应用中有时很难同时满足以上特点，所以有必要在基元的复杂性和易识别性之间取一个恰当的折衷.

结构模式识别主要用于文字识别、遥感图形的识别与分析、纹理图像的分析中.该方法的特点是识别方便，能够反映模式的结构特征，能描述模式的性质，对图像畸变的抗干扰能力较强.如何选择基元是本方法的一个关键问题，尤其是当存在干扰及噪声时，抽取基元更困难，且易失误.

基于统计决策和结构模式识别在早期的模式识别中应用比较多，随着人们对模式识别要求的提高，在解决一些复杂的模式识别问题时，上述方法的局限性越来越明显.模糊逻辑思想和神经网络的提出，为人们解决模式识别问题提供了新的思路.

3.3 模糊模式识别方法

1965年Zadeh提出了他著名的模糊集理论，使人们认识事物的传统二值0，1逻辑转化为[0,1]区间上的逻辑，这种刻画事物的方法改变了人们以往单纯地通过事物内涵来描述其特征的片面方式，并提供了能综合事物内涵与外延性态的合理数学模型—隶属度函数.对于A、B两类问题，传统二值逻辑认为样本C要么属于A，要么属于B，但是模糊逻辑认为C既属于A，又属于B，二者的区别在于C在这两类中的隶属度不同.所谓模糊模式识别就是解决模式识别问题时引入模糊逻辑的方法或思想.同一般的模式识别方法相比较，模糊模式识别具有客体信息表达更加合理，信息利用充分，各种算法简单灵巧，识别稳定性好，推理能力强的特点.

模糊模式识别的关键在隶属度函数的建立，目前主要的方法有模糊统计法、模糊分布法、二元对比排序法、相对比较法和专家评分法等.虽然这些方法具有一定的客观规律性与科学性，但同时也包含一定的主观因素，准确合理的隶属度函数很难得到，如何在模糊模式识别方法中建立比较合理的隶属度函数是需要进一步解决的问题.

3.4 人工神经网络模式识别

早在20世纪50年代，研究人员就开始模拟动物神经系统的某些功能，他们采用软件或硬件的办法，建立了许多以大量处理单元为结点，处理单元间实现（加权值的）互联的拓扑网络，进行模拟，称之为人工神经网络.这种方法可以看作是对原始特征空间进行非线性变换，产生一个新的样本空间，使得变换后的特征线性可分.同传统统计方法相比，其分类器是与概率分布无关的.人工神经网络的主要特点在于其具有信息处理的并行性、自组织和自适应性、具有很强的学习能力和联想功能以及容错性能等，在解决一些复杂的模式识别问题中显示出其独特的优势.

人工神经网络是一种复杂的非线性映射方法，其物理意义比较难解释，在理论上还存在一系列亟待解决的问题.例如在设计上，网络层数的确定和节点个数的选取带有很大的经验性和盲目性，缺乏理论指导，网络结构的设计仍是一个尚未解决的问题.在算法复杂度方面，神经网络计算复杂度大，在特征维数比较高时，样本训练时间比较长；在算法稳定性方面，学习过程中容易陷入局部极小，并且存在欠学习与过学习的现象范化能力不容易控制.这些也是制约人工神经网络进一步发展的关键问题.

3.5 仿生模式识别

前面介绍的各种模式识别方法都是假定分类信息是完全包含在训练样本内，以两类或多类样本的最优划分为基础，分类器的训练过程实际上可以看作对样本的划分过程.有文献提出把模式识别问题看成是模式的“认识”，而不是分类划分，不是模式分类；是一类一类样本的“认识”，而不是多类样本的划分.为了强调与传统模式识别在概念上的不同，有的文献中采用“仿生模式识别”这一概念，“仿生”的含义只是在模式识别的功能和数学模型上强调了“认识”的概念，更接近于人类的认识.

传统模式识别从特征空间中不同类样本的划分出发设计分类器.而仿生模式识别就在引入特征空间同类样本的连续性规律，对一类事物的“认识”，实际上是对这类事物的全体在特征空间中形成的无穷点集合的“形状”的分析和认识，文中根据这种规律性建立起“多维空间中非超球复杂几何形体覆盖”的识别原理.基于仿生模式识别的多镜头人脸身份确认系统研究中，采用多权值神经网络算法，能得到比较好的识别率.这种高的识别率显示了这一思想在模式识别方面的潜力.

仿生模式识别提出了一种新的模式识别思想，为模式识别的研究开辟了一个崭新的研究方向.采用神经网络覆盖来实现该思想，不可避免地遇到训练速度慢、网络结构参数、节点个数选择等选择问题，因此这种思想的实现模型有待于进一步的研究.

4 结束语

随着计算机和人工智能技术的发展，人们对计算机图像处理中自动处理图像的要求越来越高，因此对模式识别技术提出更高的要求.到目前为止，虽然模式识别在图像处理中的应用取得了一些可喜的成就，但是它还存在一系列亟待解决问题，例如支撑向量机中核函数的选择问题、VC维的计算和估计问题，神经网络节点选择和结构设计问题、仿生模式识别新思想的建模和实现问题、多种方法综合运用中的分类器选择问题等，这些问题的解决将直接推动模式识别领域的发展，进而推动其在图像处理领域的应用.

同时，模式识别是一门综合性学科，它涉及和利用到数学、计算机科学等多学科的知识，如何将这些学科的新方法新成就综合应用到模式识别中，提出更加符合人类认识的识别方法也是值得进一步研究的问题.

〔1〕张俊玲,赵林.模式识别理论基础上的图像分割研究[J].科技创新导报,2014(19)：234.

〔2〕程方.浅谈模式识别在图像处理中的应用[J].信息通信,2012(06)：264-265.

〔3〕王宪保.基于仿生模式识别的人脸身份确认研究[D].浙江工业大学,2003-05.

〔4〕朱俊株,郭立,王宁.一种基于模糊增强的图像分割方法[J].微机发展,1999(6):33-35.

〔5〕杜干,孙肖子.医学图像分割的神经网络方法[J].西安电子科技大学学报,1998,25(5):602-605.

〔6〕王守觉.仿生模式识别(拓扑模式识别)—一种模式识别新模型的理论与应用 [J].电子学报,2002,30(10):1417-1420.

〔7〕王守觉,徐健,王宪保,等.基于仿生模式识别的多镜头人脸身份确认系统研究 [J].电子学报,2003,31(1):1-3.