APP下载

基于极限学习机的乳房形态识别

2022-03-17王奥斯

西安工程大学学报 2022年1期
关键词:文胸个数准确率

周 捷,王 萍,毛 倩,王奥斯

(1.西安工程大学 服装与艺术设计学院,陕西 西安710048;2.利兹大学 设计学院,英国 利兹 LS2 9JT)

0 引 言

女性乳房形态具有差异性与复杂性,导致市场上文胸号型分类往往不能满足消费者的个体需求[1],因此准确识别乳房形态将对改善文胸合体性[2]、优化文胸结构设计[3-6]和钢圈设计[7-9]、完善文胸号型的分类[10]以及满足消费者对文胸的情感需求[11-12]具有重要作用。一些研究者主要从人体测量、乳房分类[13-17]等方面对乳房形态开展相关研究。基于三维人体扫描,文献[15]以上乳房角和内外乳点角/乳房深为参数,将267位18~35岁女性的乳房立体形态分为9类。文献[16]以乳间距和胸高将西部女大学生乳房形态也分为9种类型。文献[17]基于马丁人体测量,采用K-means聚类分析法,将华东地区20~40岁女性罩杯分为AA、A、B、C等4类,再通过几何推导关键值,最终将胸部侧面形态分为圆盘型、圆球型、纺锤型和下垂型4种类型,以上分类方法均能够有效表征乳房形态立体特征。虽然乳房形态分类在文胸款式和结构设计中起着不可或缺的作用,但还不能直接应用到号型推荐及文胸个性化定制中。而运用神经网络结构模型能够相对快速且高效地识别不同的乳房形态[18-20],基于其形态识别的参数可以设计生产文胸。因此,乳房形态识别模型在实际应用过程中就显得尤为重要。

目前已有研究学者以胸围、下胸围、胸宽作为输入变量预测乳房根围,计算并比较了BP神经网络模型和线性回归模型的预测精度,结果表明BP神经网络模型识别精度更高,达95.9%,但没有给出具体的运行时间[18]。文献[19]采用基于多视角卷积神经网络的乳房X射线分类方法对乳腺图像进行分类,其精度和鲁棒性有所提高。有研究学者通过广义回归神经网络和概率神经网络2种算法研究了乳房特征对乳房形态识别的影响[20],尽管这2种算法的识别准确率均相对较高,如广义回归神经网络模型为88.89%,但其准确率还有待提高。

而ELM是一种单隐层前向神经网络的机器学习算法,已被广泛应用于识别、预测以及医学诊断领域[21-22]。与传统的训练算法相比,ELM算法最突出的优势在于:输入层和隐含层之间的连接权值随机产生,且确定后无需再调整;隐含层和输出层之间通过解方程一次计算完成,无需依靠迭代计算来完成训练学习,整体精确度较高且训练速度较快[22]。因此,为进一步提高乳房形态识别的精度与模型运行速度,本文通过CFSFDP算法对108位青年女性的乳房形态进行分类,再用ELM算法对乳房形态进行识别,分析ELM乳房形态识别模型的识别准确率与模型运行时间,并对比不同激活函数下隐含层神经元个数对ELM乳房形态识别模型识别准确率的影响,确定最佳参数。

1 实 验

1.1 测量方法与对象

采用马丁人体测量仪,对108位年龄(23.13±3.75)岁、身高(160.07±5.89)cm、身体质量指数(21.01±3.97)kg/m2,且乳房基本发育成熟的西部地区女性进行乳房特征数据采集。

1.2 测试条件

室内环境温度为(25±2)℃,相对湿度为(65±2)%。被测试者上身呈裸体状态、足跟并拢、自然站立于水平地面上、双眼平视前方、肩部放松、双臂自然下垂。测试者依照GB/T 5703—2010《用于技术设计的人体测量基础项目》的测量要求采集被测试者的乳房特征数据。

1.3 测量项目

基于相关文献研究[12-14],选取6个测量项目部位:乳平围、乳间距、胸厚、胸宽、颈窝点至乳头点长以及胸围至下胸围高。

1.4 研究方法

根据测量的6个项目计算得到4个乳房特征值,其中乳平围、胸厚与胸宽的比值,共同描绘了乳房的丰挺程度;乳间距与胸宽的比值描绘了乳房聚拢的情况;颈窝点至乳头点长与胸围至下胸围高的比值代表乳房高度情况。因此确定乳平围、乳间距/胸宽、胸厚/胸宽、颈窝点至乳头点长/胸围至下胸围高4个乳房特征为乳房形态类别的判断依据[20]。

本文首先采用CFSFDP算法[23]对4个乳房特征进行乳房形态的聚类分析,建立ELM乳房形态识别模型并对乳房形态进行识别,然后通过式(1)计算模型的乳房形态识别准确率R,同时得到模型运行时间,对比采用不同激活函数时ELM乳房识别模型的识别率。ELM乳房形态识别流程如图1所示。

(1)

式中:N表示测试集中乳房形态识别正确的样本数;M表示测试集样本总数。

图 1 ELM乳房形态识别流程图Fig.1 Flow chart of ELM breast shape recognition

2 乳房分类

常用的K-means、FCM聚类算法对非球形集群数据监测效果并不显著,而CFSFDP算法适用于各种形状的数据集,且对非球形集群数据聚类效果较显著[24],并能够在得到直观聚类中心数的同时提高聚类准确性[20]。因此本文采用CFSFDP聚类算法对乳房形态进行分类。基于局部密度和相对距离[25],根据决策图识别出密度最大且与其周围的点距离最短的4个样本数据点作为聚类中心,利用该算法计算出4类类簇中心的乳房特征值及特征均值,见表1。

表 1 类簇中心的特征值及特征均值

由表1可知,从乳平围和胸厚/胸宽这2个特征来看,乳平围在类簇2的数值最大,类簇3的数值最小,且相差较大;而胸厚/胸宽在类簇2的值最大,类簇1、3、4的值较小且相差不大。这表明类簇2的乳房形态特征表现为丰满且挺拔,类簇1、3、4的乳房形态特征均为扁平状,同时类簇1相对丰满,类簇4次之,类簇3的乳房形态相对瘦小。乳间距/胸宽在类簇2、3的值较大,说明这2种乳房形态表现为内敛;类簇1、4的值最小,乳房为偏外扩形态。根据颈窝点至乳头点长/胸围至下胸围高的特征数值,类簇2的值最大,类簇1、3的值次之,类簇4的值最小,表明类簇4的乳房高度最高,类簇1、3适中,类簇2最低,乳房呈下垂状态。计算4类乳房形态的各项乳房特征平均值,求得4类类簇中心特征值与4类类簇特征均值的差值绝对值范围中心,分别为[0.01,0.67]、[0.03,0.59]、[0.04,1.3]、[0.01,0.64] cm。差值范围越大,则类簇样本分布越离散。类簇2的差值范围0.56 cm最小,表明该类簇样本分布较集中且类簇中心代表性较强,类簇1和类簇4的差值范围0.66 cm和0.63 cm相对较小,表明该类簇样本分布较为集中,类簇中心可以代表该类簇乳房形态。类簇3的差值最大,为1.3 cm,表明该类簇样本分布较分散,这类类簇的聚类效果偏差。因此,将相对丰满、较扁平且偏外扩的类簇1定义为标准型乳房(A型),丰满、挺拔、内敛且下垂的类簇2定义为丰满型(B型),相对瘦小、扁平且内敛的类簇3定义为扁瘦型(C型),特征为扁平、比较瘦小、乳房高度较高且外扩的类簇4定义为高挺型(D型)。

将样本数据点归属到相对距离较小的聚类中心,得到4类乳房形态的分类,如图2所示。

图 2 乳房形态分类图Fig.2 Classification of breast morphology

图2中,属于标准型(A型)的类簇1数量最多,占比为41.28%,其次为高挺型(D型)的类簇4,占比33.03%,扁瘦型(C型)的类簇3较少,丰满型(B型)的类簇2最少仅占总样本量的6.42%。说明标准型和高挺型是西部地区女性乳房的主要特征。

3 乳房识别

ELM算法结构包含输入层、隐含层和输出层(图3),其中输入层和隐含层之间的连接权值以及隐含层神经元的阈值随机产生[26-27]。

图 3 ELM算法结构Fig.3 ELM algorithm structure

图3中,x代表训练集样本的输入层,即4类乳房特征数据;y表示训练集样本的输出层,即4种乳房形态类别;ωij表示第i个输入层神经元和第j个隐含层神经元之间的连接权值;g(·)表示激活函数;O1,O2,…,OL表示隐含层节点;βjk表示第j个隐含层神经元和第k个输出层神经元之间的连接权值。

3.1 ELM学习与识别

ELM学习与识别步骤如下:

1) 导入训练集样本的矩阵X与输出矩阵T,其中矩阵X的行是样本的4个乳房形态特征,矩阵T的行是4类乳房形态,两矩阵的列均代表训练集样本数为88个,见式(2)与式(3)。

(2)

(3)

2) 随机产生输入层和隐含之间的连接权值ωij以及隐含层神经元的阈值bi(i=1,2,…,L),其中L代表隐含层神经元个数。

3) 计算隐含层的输出矩阵H。

(4)

式中:G函数代表隐含层神经元的输出;g函数为激活函数。

4) 通过求解方程组计算隐含层和输出层之间的连接权值β,‖Hβ-T‖=0,即

β=H-1T

(5)

5) 输入测试集样本的矩阵X′,其中行是4个乳房特征,列是20个测试集样本数量,见式(6)。

(6)

6) 得到ELM乳房识别模型预测结果的输出矩阵T′:

(7)

3.2 ELM模型乳房形态识别结果分析

采用Matlab R2019a(MathWorks公司)自定义elmtrain函数,以4个乳房特征作为ELM的输入层,以乳房聚类结果作为ELM的输出层。随机产生训练集和测试集,其中训练集包含88个乳房数据点,测试集包含20个数据点。激活函数设为sin且隐含层神经元设为30,建立ELM网络模型并训练。得到乳房形态测试集预测准确率,见图4。

图 4 测试集仿真预测Fig.4 Simulation prediction of test set

从图4可以看出,测试集预测准确率为90%,其中A型和D型乳房形态识别率为100%,B型识别率为50%,C型乳房形态识别率83.3%,在这种情况下ELM乳房形态识别模型识别率整体较高。有2个样本识别错误,其中一个为B型乳房被识别为C型乳房,可能是因为这2类乳房特征的乳间距/胸宽的值很相近,且B型乳房形态样本量偏少,训练样本不足导致该类型乳房形态不易被识别。另一个是C型乳房形态样本被识别为D型乳房,可能是因为这2类乳房形态特征数据中胸厚/胸宽的值很相近导致识别出现偏差。

将ELM乳房形态识别模型运行10次并计时,结果见图5。该模型第1次运行时间最长为11.57 s,可能是由于模型首次训练时需要额外的读取数据时间,之后的运行时间大多在1.28 s左右,整体来看运行时间较短。

图 5 ELM模型运行时间Fig.5 Running time of ELM models

通过以上分析可知,ELM模型乳房形态识别率整体较高,运行时间较短。可以为内衣企业个性化文胸定制以及完善文胸号型起到重要作用,给不同乳房形态的消费者提供更满意的选择,同时指导文胸罩杯及结构设计,降低文胸对不同乳房形态女性的不合体度,从而做到对女性胸部的支撑与塑型功能。另外,本研究存在乳房形态样本量不充足的缺点,后续研究应扩大受试者群体,减少识别结果的误差,进一步提高乳房形态识别的准确率。

3.3 识别模型激活函数对识别精度的影响

为了提高乳房形态识别精度,采用不同的激活函数与神经元个数来定义ELM模型[28]。针对hardlim、sig、sin等3种不同的激活函数,分析隐含层神经元个数值在500以内、按照首项为5、公差为5的等差数列形式对样本乳房形态识别精度产生的影响。

将乳房形态识别模型中的激活函数设为hardlim,见图6。

图 6 hardlim激活函数对预测准确率的影响Fig.6 Influence of hardlim activation function on prediction accuracy

图6中,当隐含层神经元个数在5~150之间时,测试集预测准确率波动较小,但不低于50%;隐含层神经元个数在150~500时预测准确率波动较大,且当隐含层神经元个数为470时,预测准确率达到最高,为71.7%。表明激活函数为hardlim时,ELM乳房形态识别模型的识别率整体较低。

将乳房形态识别模型中的激活函数改为sig,见图7。不难发现当隐含层神经元个数为30时,该模型识别乳房形态的准确率最高达到81.7%;当隐含层神经元个数在10~55之间时,模型预测准确率高于70%;而在30~45之间时,准确率均大于80%;说明神经元个数设在此段时模型识别精确率较好;隐含层神经元个数在50~100之间,预测精度下降明显;隐含层神经元个数在60~500时,模型预测精度整体低于70%。因此当激活函数为sig时,建议将隐含层神经元个数设置为30~45之间。

图 7 Sig激活函数对预测准确率的影响Fig.7 Influence of sig activation function on prediction accuracy

最后,将乳房形态识别模型中的激活函数改为sin,见图8。可以看出ELM乳房形态识别模型的预测准确率较好,隐含层神经元个数设为25时,预测准确率平均达到98.3%,乳房形态识别率最好;隐含层神经元个数在5~60之间时,模型识别准确率为80%以上,这表明此时模型识别准确率较高,识别效果较好;隐含层神经元个数在60~500之间时,模型识别率均不超过80%,当隐含层神经元个数在85~90时识别精确率仅为45%,表明采用此段隐含层神经元个数的模型预测精度不高。

图 8 Sin激活函数对预测准确率的影响Fig.8 Influence of sin activation function on prediction accuracy

综上,在自定义乳房形态识别模型时,激活函数设为hardlim时,预测准确率整体较低,不建议采用该激活函数;sig激活函数下,建议将隐含层神经元个数设置在30~45之间识别效果较好,准确率均大于80%,且当隐含层神经元个数为30时,该模型识别乳房形态的准确率最高,为81.7%;激活函数为sin且当隐含层神经元个数在20~50时,预测准确率较高,平均为95%,隐含层神经元个数设为25时,预测准确率平均为98.3%,最高可达100%。

4 结 语

ELM乳房形态识别模型识别效果较好,在sin激活函数下,当隐含层神经元个数设为25,模型的预测准确率平均为98.3%,最高可达100%。模型运行时间整体较短,除首次运行11.57 s以外,平均为1.28 s。ELM乳房形态识别模型的探究有利于提高乳房形态识别准确率,优化消费者穿着文胸的合体度,为文胸号型的细分和个性化定制提供理论参考。

猜你喜欢

文胸个数准确率
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
女性文胸如何穿
最强大脑
机洗女性文胸注意事项
文胸那些事
想一想
认识频数分布直方图