APP下载

中国6 个民族的面部几何特征聚类分析

2015-02-17李志洁段晓东王存睿

大连民族大学学报 2015年1期
关键词:维吾尔族人脸聚类

李志洁,段晓东,王存睿

(大连民族学院 大连市民族文化数字技术重点实验室,辽宁 大连116605)

人类面部特征研究在很多学科中都具有重要作用,是人脸识别的重要依据。人脸五官除了具有共性外,会由于民族、文化等的不同而具有差异性,这种客观存在的差异性给不同民族的人脸识别提出了新的问题。本文就当前中国主要少数民族的面部特征进行聚类研究,依托构建的多民族人脸库[1-3],针对中国的6 个民族样本:汉族、朝鲜族、藏族、蒙古族、维吾尔族和壮族,利用多种系统聚类方法来分析不同民族的基本面部指标,进而探索多民族人脸几何特征的共性和差异性,揭示不同族群的人脸信息及其之间的内在规律。

人脸的特征抽取与描述方式可分为两大类:基于统计特征和基于几何特征[4-6]。基于统计特征的人脸图像通常计算复杂度较大并且维数很高,不利于分类;基于几何特征的基本思想是利用人脸上的一些特征点(例如眼、鼻、嘴等)的相对位置和相对距离,再辅以人脸轮廓的形状信息来描述个体。虽然其识别准确率较依赖于几何特征的提取,但从人类视觉经验可知,通过二维平面的人脸几何特征可以初步判定民族类别。为了便于分类,简化计算量,选取面部几何特征进行分析。

目前,国内外针对民族面部五官几何特征的研究较多[7-9],研究目的、指标和方法各不相同。方法主要以活体测量为主,指标采用绝对值。文章利用先采集人脸图像,后在图像上测量的方法,指标采用相对值。这种一次采集,多次测量的分析方法更适合于较大规模的民族问题研究。根据测量指标和相应的计算指标,对各个民族数据进行多种聚类分析,总结不同民族的面部特征,以达到粗略分类,探索各民族面部相关性的目的,为多民族人脸识别问题提供新的指标依据。

计算方法如下:如图1(a),瞳距指数=瞳距/上脸宽,即线段(3,4)与线段(1,2)的距离比值。同理可得,鼻宽指数=鼻宽/中脸宽、唇宽指数=唇宽/下脸宽。如图1(b),眼距指数=眼部宽/眼部长,即矩形(1,2,3,4)的宽和长的比值。同理可得,唇距指数=唇部宽/唇部长、面距指数=面部宽/面部长。如图1(c),眼鼻指数=鼻长/瞳距,即线段(3,4)与线段(1,2)的距离比值。同理可得,下颌指数=下颌长/唇宽。X 型指数=线段(1,6)和线段(2,5)之间的夹角/100。

1 面部几何特征测量

研究的所有样本均来自我校的各民族青年学生。根据五官形态,选择了与面貌特点关系密切的15 个测量指标以及9 个计算指标。其中,测量指标的量纲均为像素,计算指标为测量指标的比值。

测量指标包括:瞳距、上脸宽、鼻宽、中脸宽、唇宽、下脸宽如图1(a),眼部长和宽、唇部长和宽、面部长和宽如图1(b),鼻长、下颌长、X 型角如图1(c)。

计算指标包括:瞳距指数、鼻宽指数、唇宽指数、眼距指数、唇距指数、面距指数、眼鼻指数、下颌指数、X 型指数。

图1 人脸几何特征测量示意图

根据以上指标进行测量和计算后,将6 个民族的人脸特征数据进行总结见表1。9 个计算指标的取值范围为(0,1),便于进行后续的聚类分析。不同民族的面部特征有所不同,此外,同一民族的面部形态在各个年龄阶段和性别方面也有显著差异。为此,针对不同民族的不同性别进行测量计算。

表1 6个民族的人脸几何特征数据

2 特征数据的聚类分析

表1 中的9 个计算指标是根据视觉经验选取,是否都应纳入聚类分析的分类变量,需要用相似性测度,测度结果见表2。度量标准选用person系数,聚类方法选择最远邻元素。在得到的相似性矩阵里,相关系数的绝对值均小于0.8。其中,眼宽指数与下颌指数最为相似,但仍旧不能相互替代。表2 的结果说明,选取的9 个计算指标之间相似性不大,均可以纳入聚类分析中。

表2 计算指标的近似矩阵

采用系统聚类法进行聚类分析[10]。依据计算指标,对多民族人脸进行分类,按照在性质上的亲疏程度,自动产生多个分类结果。系统聚类法的基本原理为:首先将6 个民族的9 项指标各自看成一类,然后根据人脸的亲疏程度,将亲疏程度最高的两类进行合并,接着考查合并后的类与其他类之间的亲疏程度,再进行合并。重复上述过程,直到将所有的人脸合并为一类。进行类别合并的准则是使得同一类内部人脸特征之间差异最小,不同类之间人脸特征的差异性最大。

在系统聚类法中,亲疏程度(类与类之间的距离)的确定方法可影响到最终的聚类结果。所以,选择目前常用的6 种聚类方法,对表1 中的数据进行聚类分析。生成的聚类结果总结在表3 中。

(1)组间联接法(Between -groups Linkage):两类距离为两类元素两两之间的平均平方距离。

(2)组内联接法(Within-groups Linkage):两类距离为两类所有元素之间的平均平方距离。

(3)最近邻元素法(Nearest Neighbor):两类距离为两类之间每个元素距离的最小值。

(4)最远邻元素法(Farthest Neighbor):两类距离为两类之间每个元素距离的最大值。

(5)质心聚类法(Centroid clustering):两类距离为两类重心点之间的距离。

(6)中位数聚类法(Median clustering):两类距离为介于最近距离和最远距离间的距离。

表3 不同聚类方法的聚类结果比较

3 讨 论

分析6 种不同的聚类方法,其聚类结果被简化为3 大类,以便比较不同聚类方法的结果。从结果中可以看出,最近邻元素法和最远邻元素法的分类结果相差较大;而组间联接法、组内联接法、质心聚类法和中位数聚类法的分类结果大致相同。因此,主要分析这4 种聚类的分类结果。第一类包括藏男、藏女、维男、壮女;第二类包括维女;其他民族人脸属于第三类。

第一类将藏族划分出来,且在民族特征上没有明显的性别差异。其民族人脸具有显著特征,这与藏族常年生活在高原地带有关,比如,眼宽、唇宽较大,鼻宽较小,嘴唇偏薄,下颌窄等等。另外,维吾尔族男性也被划分到第一类中。维吾尔族的人脸特征与中国其他少数民族差异较大,具有欧洲人种特点。比如,眼大,唇薄,X 型角较大,五官排列大气。壮族女性也具有五官排列大气的特点,同样被划分到第一类,作为除汉族以外人口最多的一个少数民族,其显著特点是鼻较宽较短,唇较厚,下颌窄,X 型角较大,这些特点与壮族女性长期吃苦耐劳的生活传统息息相关。

第二类只包含维女。维吾尔族女性的人脸样本较胖,导致了与维吾尔族男性的分化。但在最近邻元素法中,维吾尔族的男性和女性被划分到一类中。由于样本来源有限,第二类的维吾尔族女性在面部特征上不具有代表性,可将其忽略。

第三类包含蒙古族的男性和女性,朝鲜族的男性和女性,汉族女性和壮族男性。从这个分类结果可以看出,除去服饰和民族习惯,蒙古族、朝鲜族和汉族这三个民族具有很多共同的面部特征,比如眼小,鼻略窄,下颌宽,X 型角较小,五官紧凑。蒙古族与汉族的交集可以追溯到13 世纪的蒙古国入侵中原。中国朝鲜族是从朝鲜半岛迁移而来的外来民族,现主要分布在黑龙江、吉林、辽宁三省。这两个少数民族在长期的生产生活中与汉族产生了融合,故其面部几何特征也有诸多相似之处。

综上,6 种聚类方法的聚类结果揭示了不同民族的面部特征受到多种因素的影响。其中,最重要的是地域和生活环境的影响,比如第一类的藏族、维吾尔族和壮族。其次,面部特征还和民族迁移、民族融合有关,比如蒙古族,朝鲜族和汉族。

4 结 论

研究的是中国6 个民族的面部特征问题。这些民族的面部二维几何特征主要表现为:在瞳距、鼻宽、唇宽、眼距、唇距、面距、X 型角等计算指数上具有明显的民族差异。针对不同民族不同性别的样本进行聚类分析,为了提高结果的可信度,选择了6 种常用的系统聚类法并对比其聚类结果。根据这些聚类结果,可以得出的结论是几个民族既有各自的民族特征差异,也具有民族之间的相似性。除了种族原因以外,生活习惯、民族迁徙甚至侵略战争也可能是其中的重要因素。尤其是蒙古族、朝鲜族和汉族被聚类为一大类,因此可以认为,这三个民族在面部几何特征上已经发生了较大面积的民族同化和融合。由于条件所限,本文仅选取了6 个民族进行计算分析,但聚类结果仍然具有代表性,这对研究民族的历史变迁具有一定的参考价值。有待进一步研究的方向是多民族多表情的聚类分析和对比。

[1]段晓东,王存睿,刘向东,等. 人脸的民族特征抽取及其识别[J]. 计算机科学,2010,37(8):276 -301.

[2]段晓东,王存睿,李志洁,等. 基于Haarlike 的人脸民族特征分析[J]. 微电子学与计算机,2011,28(7):17 -20.

[3]段晓东,王存睿,刘慧,等. 基于人脸识别的面部民族特征研究[J]. 大连民族学院学报,2009,11(5):454 -458.

[4]ZHAO W,CHELLAPPA R,PHILLIPS PJ,et al. Face Recognition:A literature Survey[J]. ACM Computing Surveys,2003,35(4):399 -458.

[5] HJELMAS E,LOW B K. Face detection:A survey[J]. Journal of Computer Vision and Image Understanding,2001,83(3):236 -274.

[6]刘青山,卢汉清,马颂德. 综述人脸识别中的子空间方法[J]. 自动化学报,2003,29(6):900 -911.

[7]李小林,万立华,廖家万,等. 人体面部形态特征的研究进展[J]. 中国法医学杂志,2011,26(2):119 -121.

[8]杨雷,徐国昌,席焕久,等. 河南汉族成人头面部形态特征研究[J]. 天津师范大学学报,2012,32(1):60 -64.

[9]李小林,万立华,兰玉文. 中国南方5 个少数民族人群面部五官形态特征研究[J]. 重庆医科大学学报,2009,34(10):1378 -1383.

[10]张文彤,董伟. SPSS 统计分析高级教程[M]. 北京:高等教育出版社,2013.

猜你喜欢

维吾尔族人脸聚类
有特点的人脸
一起学画人脸
维吾尔族手艺人
基于K-means聚类的车-地无线通信场强研究
三国漫——人脸解锁
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
Ad36感染对维吾尔族肥胖患者progranulin表达的调节作用
长得象人脸的十种动物