APP下载

模式识别系统及统计模式识别研究概述

2016-11-24李志伟

考试周刊 2016年88期
关键词:发展趋势

李志伟

摘 要: 模式识别是解决机器智能的一种工具,也是对测量进行描述的或者分类的一门科学。本文主要介绍了模式识别的一些基础知识,着重介绍了模式识别系统中五个组成部分和统计模式识别方法,目的在于让更多的人很快了解、学习和研究模式识别。相信随着模式识别理论与技术的不断完善和法则,其应用领域和方向将更广阔。

关键词: 模式识别系统 统计模式识别 发展趋势

1.引言

通常我们所说的机器识别、计算机识别等都属于模式识别。它是通过某种方法对事物进行分析比较,根据某种判别规则识别事物。如:手写数字识别,是对0~9数字进行模式匹配,计算出相似度较高的对应值作为识别结果。模式识别研究的内容是使机器完成曾经只有人类才能完成的事,它具有分析、描述与判断事物的能力。经过多年的迅速发展,当前模式识别已经广泛应用于各个领域,如工、农、医、自然科学、社会科学等。在农业中,通过分析土壤成分及农产品的收成,决定种植何种作物、了解养料是否充足,以提高产量。在工业生产中,有语音识别、过程控制、地下探测、图像分割等。医学中主要有心电图与向量心电图分析、显微观察与生物医学数据分析、基因染色体研究、医学图像分割等。在自然科学中有地球和行星探测、卫星数据分析、遥感图像地质勘探等方面应用广泛。然而,种种应用都是随着问题的出现而出现的解决方法,至今模式识别还没有发展成统一的、有效的可以应用于所有模式识别的理论。模式识别的技术对国民经济建设和国防科技发展的重要性已得到人们的认可和广泛重视。本文将就模式识别所涉及的基本问题、研究的领域及其当前进展现状进行详细的介绍,并对模式识别的发展趋势进行展望。

2.模式识别系统

模式识别系统在工作时,只要判别被识别的对象落入哪一个区域,就能确定出它所属的类别。由噪声等导致的变异性,可通过预处理部分消除;模式本身固有的变异性可通过特征提取和选择得到控制。因此,一个典型的模式识别系统由数据获取、预处理、特征提取、分类决策及分类器设计组成。对应部分分别完成未知类别模式分类、分类器设计训练和对识别样品的分类决策。基本的模式识别方法有统计模式识别方法和结构模式识别方法。除此之外,还有模糊模式识别、神经网络模式识别和多分类器融合方法。以下对模式识别系统中五个组成部分简单介绍:

(1)数据获取

通常获取的数据类型有二维图像、一维波形、物理参量逻辑值三种。计算机使用可运算的符号研究文字、指纹、心电图、体温等对象。

(2)预处理

预处理的目的就是对原退化或干扰、冗余的数据信息进行去噪、复原,提取有用的信息。

(3)特征提取和选择

一般来说它包含将所获取的原始量测数据转换成能反映事物本质,并能将其最有效分类的特征表示,输入的是经过预处理的量测数据。通过将原始量测数据转换成有效方式表示的信息,分类器能根据这些信息决定样本的类别,对所获取的信息实现高维量测空间转换成地维特征空间。

(4)分类决策

模式识别系统工作有训练方式和分类决策两种方式。前一种是在确定的特征空间中,对测量数据进行特征选择与提取,得到样本的特征空间分布,并决定分类器参数。后一种方式是对待分类样本进行分类决策的过程。

(5)分类器设计

模式识别研究的主要目的是利用计算机进行模式分类。分类器设计的基本做法是在样品训练集的基础上来确定判别函数、改进判别函数和误差检验。我们把执行模式识别的计算机系统成为模式识别系统。

3.统计模式识别

统计模式识别(Statistic Pattern Recognition)的基本原理是,相似性高的样本在模式空间中相互接近,形成“簇”,根据模式所得的特征向量,判归所属类目。统计模式识别的方法有:

(1)贝叶斯决策方法

贝叶斯决策包含三种基本假设:首先是各类别总体的概率分布式已知的,其次是被决策的分类数是一定的,最后是被识别的事物或对象有多个特征观测值。运用统计决策理论设计的分类系统又称为分类器。分类器的判别准则有:最小错误概率贝叶斯判别准则、最小风险贝叶斯判别和聂曼·皮尔逊判别准则。

(2)判别函数法

判别函数可以是线性的,也可以使非线性的。利用已知类别的训练集,通过统计方法,求得判别函数的具体形式和参数,求出未知样本类别。由于该方法无需依赖条件分布密度等先验知识,因此,在一些场合要比基于贝叶斯公式的概率分类法简单。

(3)监督参数统计法

包括该方法分为KNN法(K最近邻法)和Fisher判别分析法。前者的基本原理是将分好类别的训练样本点映射到多维空间中,建立与待分类的未知样本对应关系,若近邻中某一类样本最多,则将该未知样本判为该类。该方法的优势在于对数据的结构没有特定要求,也无需训练,缺点在于计算量大。

(4)非监督参数统计法

有基于概率密度函数估计的直接方法和与样本空间相似性度量的间接聚类方法。

(5)聚类分析法

该方法是在没有训练集的情况在,对一批没有类别划分的样本根据相似度进行划分类属的方法。通常被称是一种无教师的非监督分类方法。

(6)近邻函数法

该方法根据距离测度,判别样本的类属,如基于最近邻规范的试探法和最大最小距离法。

4.结语

模式识别是一个快速发展的学科,其在国民经济和国防现代化建设中应用广泛。本文围绕模式识别的一些基础知识、模式识别系统和统计模式识加以介绍,着重介绍了模式识别系统中的五个组成部分和统计模式识别方法。随着模式识别理论与技术的不断发展前进,其应用领域和实际需求将会不断增长。

参考文献:

[1]杨淑莹.模式识别与智能计算——Matlab技术实现(第二版)[M].电子工业出版社,2011.

猜你喜欢

发展趋势
湖北省P2P借贷行业发展趋势研究
浅析暖通设计的问题
我国机械设计制造及其自动化的现状及发展趋势
简析住宅建筑设计中BIM技术的应用
机械自动化技术运用和为来趋势
基于网络的信息资源组织与评价现状及发展趋势研究