改进的主成分分析法在多响应优化中的应用*

2012-09-12张迎冬

组合机床与自动化加工技术 2012年11期

关键词：回归方程方差分析法

张迎冬，何桢

(天津大学管理与经济学部，天津 300072)

改进的主成分分析法在多响应优化中的应用*

张迎冬，何桢

(天津大学管理与经济学部，天津 300072)

提出了一种改进的主成分分析法，在解决多响应优化问题时考虑到模型的预测能力。主成分分析法是一种常用的多响应优化方法，为了在应用主成分分析法的过程中考虑到模型的预测能力，文章将回归方程拟合度R2系数结合到主成分分析中。与主成分分析法相比，该方法不仅能利用主成分得分将多个响应转化为单一响应，还能考虑到不同响应的预测能力。实例表明，用该方法得到的结果可体现出模型预测能力的影响，并且预测能力强的响应得到较大的改进。

质量工程;多响应优化;主成分分析法;预测能力

0 引言

试验设计旨在通过调整系统中的输入变量以分析输入变量与输出响应之间的关系，并使输出响应达到最优值。系统中只有一个输出响应的问题称为单响应优化问题，此类问题较易解决，通过回归方法以及一般的优化方法就能实现。然而，在现实的工业生产中会遇到有多个输出响应的试验设计问题，该类问题较难解决，这就是所谓的多响应优化问题。多响应优化是质量工程领域面临的主要问题之一。

多响应优化问题的目的是找到一组合理的输入变量，同时优化多个响应。但在实际问题中，多个响应变量可能会相互影响，导致多个响应变量不能同时达到最优，因此解决多响应优化问题就转变为如何找到一组输入变量，使所有响应变量尽可能的接近其最优值，以达到多个响应整体的最优而不是单个响应的最优。现阶段解决多响应优化问题的主要思路是通过降维技术将多响应问题转化为单响应问题。目前多响应优化方法主要有满意度函数法、广义距离法、损失函数法、概率法和主成分分析法等。

主成分分析法是解决多响应优化问题的常用方法之一，但其在应用过程中没有考虑到各响应回归方程的预测能力，本文将对加权主成分分析法进行改进，提出一种考虑预测能力的加权主成分分析法，并用该方法对文献中的实际问题进行分析。

1 主成分分析法

1.1 加权主成分分析法

主成分分析法可将p个相关的原始变量转化为k(k≤p)个无关的主成分，实现降维的目的。Su和Tong［1］、Antony［2］、钟晓芳［3］等提出了基于主成分分析的多响应优化方法，利用主成分分析法将p个输出响应(需对数据进行标准化处理以消除量纲的影响)转化为k(k≤p)个无关的主成分，并选取特征值大于1的主成分作为最终的优化指标。

Liao［4］指出该方法仍有两个主要的缺陷:第一，若特征值大于1的主成分大于一个，该问题仍然是一个多响应问题;第二，挑选出的主成分不能解释原变量的全部方差，造成信息的丢失。Liao［4］选取每个主成分的方差贡献率作为该主成分的权重，提出了一种基于加权主成分分析的多响应优化方法，该方法以主成分的综合得分，即加权主成分之和作为多响应绩效指标，综合考虑所有主成分，解决了上述的两个问题。

用Yj表示第j个响应的标准化信噪比(望大特性)，对Yj进行主成分分析，可将p(假设多响应问题中有p个输出响应)个响应转化为k(k≤p)个无关的主成分，即:

主成分的方差贡献率为该主成分所解释的方差占总方差的比例，反映各主成分的信息含量多少，其值为:

其中，Wq为第q个主成分的方差贡献率，λq为Y的协方差矩阵的第q个特征值。

Liao［4］选取每个主成分的方差贡献率作为该主成分的权重，计算k个主成分的加权和，得到主成分的综合得分，将多响应问题完全转化为单响应问题。定义MPI(Multi-response Performance Index，多响应绩效指标)为:

Liao［4］提出的加权主成分分析法完全将多响应问题转化为单响应优化问题，并解释了原问题的全部方差。Gauri和 Chakraborty［5］，Shih 和 Tzeng 等［6］进行实证研究，利用加权主成分分析法解决实际工业生产中的多响应问题，得到了理想的结果。

1.2 改进的方法

加权主成分分析法的优势在于其将复杂的多响应问题转化为求MPI最大值的单响应问题，同时通过所有主成分加权和的形式解释了原响应的全部方差。但其仍存在一定不足之处，在计算过程中并没有考虑到响应回归方程的拟合度，即模型的预测能力。本文将针对这一问题，对该模型进行改进。

Kim和Lin［7］将预测能力结合到满意度函数中，并指出回归方程的拟合度较高的响应对优化结果有较强的影响，因此在各响应回归方程的拟合度有显著差别时如若不考虑模型的预测能力将会对优化结果产生不利的影响。预测能力，即拟合度的度量可采用R2，R2－adj，均方误差等指标，为方便叙述，本文采用最为常用的R2来度量预测能力，其他指标的使用与R2相似。

考虑到信噪比本身的缺陷［8］，本文采用各响应值的均值作为分析数据，进而更好地分析各响应回归模型的预测能力。在多响应问题中，定义有p个响应变量，共进行m次试验，以yij表示第i个响应在第j次试验中的均值。为消除量纲的影响，对各响应均值进行标准化，得到标准化均值，如下:

其中，Yij表示标准化后的均值，μi和σi表示第i个响应的m个值(共进行m次试验)的平均值与标准差。

可见，ri在(0，1)之间，且r1+r2+… +rp=1。

ri表示第i个响应的预测能力，为了在主成分分析中考虑模型的预测能力，对原模型进行修改，将ri结合到主成分之中，如下所示:

其中，Zq－new表示结合了预测能力的第q个主成分。

在原始的主成分公式中，系数向量eq=(eq1，eq2，…，eqp)'为向量 Y=(Y1，Y2，…，YP)'的方差协方差矩阵的特征向量，特征向量为单位向量，选取特征向量作为系数向量保证了以下两个条件:

(1)确保该主成分的方差为最大值，且其值等于特征值，用公式表示为:

本文给出的主成分公式，如(6)式所示，主成分系数不再是特征向量，但在加权主成分分析中，采用主成分的方差贡献率作为各主成分的权重，即仍保持各主成分的方差值等于相应的特征值，且综合考虑全部主成分，能够解释原问题的全部方差，不破坏上述条件。

(2)确保各主成分之间相互独立，用公式表示为:

通过分析可知，改进后的主成分系数向量不是单位向量，不能确保各主成分之间一定相互独立。但当原问题中各响应间相关性较小时，该方法仍然适用。

Richard和Dean［9］指出，主成分系数向量 eq=(eq1，eq2，…，eqp)'中的每一个分量eqn的大小度量第n个变量对第q个主成分的重要程度。本文将R2系数融入到系数向量中，用ri表征第i个响应预测能力对主成分的影响，并最终影响可控变量组合的选取。

改进后的加权主成分分析法的MPI为:

通过(6)式和(9)式可以看出，最后的MPI值可完全转化为标准化均值的函数，即MPI=f(Y1，Y2，…，Yp)，预测能力的影响也会通过对系数向量的修改而最终转化到决策过程中，预测能力强的响应将会有较大的系数，优化时也会得到更多的侧重性。优化MPI值可获得最佳的可控变量组合，在考虑预测能力的同时使多响应问题整体效果达到最优。

本文提出的方法在加权主成分分析法的基础上结合了响应回归方程的R2系数，考虑了模型的预测能力。该方法存在着一定的局限性，如上所述，结合了R的主成分系数不能保证主成分之间恒为相互独立，但在原响应之间相关性较小时，该方法依然能发挥其优势:将多响应问题转化为单响应问题，解释原响应的全部方差，并考虑模型的预测能力。

2 应用实例

本文采用文献［6］中的案例进行分析。该试验研究金属惰气(MIG)电弧焊泡沫板的优化问题，共有两个响应，显微硬度和弯曲强度，两个响应均为望大特性，共受8个因子影响，分别为填充材料(A)、MIG流(B)、焊接速度(C)、MIG气临率(D)、工件差距(E)、MIG电弧焊角度(F)、槽角(G)和电极延伸长度(H)。其中只有填充材料(A)取两水平，其他因子均取三水平，进行田口L18(21*37)试验设计。试验设计安排及试验结果如表1所示。

表1 试验设计及响应均值表

(续表)

各响应的标准化均值均由Minitab软件得到，利用响应均值可得到两个响应的回归模型及R2值，如下所示:

由式(5)得到标准化的预测能力，r1=0.445，r2=0.555。

利用SPSS软件进行主成分分析，可得到主成分的特征值和特征向量矩阵，如表2所示。

表2 主成分分析表

由式(6)，可得到相应的两个主成分:

由式(9)，可得到改进后的多响应绩效指标MPI:

根据上式可计算出每次试验下的MPI值，如表3所示。

表3 MPI值表

(续表)

通过表3，可计算出各因子的主效应值，如表4所示。

表4 主效应值表

本例中，MPI值越大，质量特性越好，因此使MPI主效应最大的因子水平组合即为该因子的优化结果，由表4可看出，最优因子设置为:A2B3C1D2E2F3G3H2。将最优因子设置带入到回归方程中，可得到此时y1=62.946，y2=74.117。

用本文提出的方法所得的结果与文献［6］中的结果相比较，如表5所示。

表5 优化结果比较表

从上表可以看出，由于考虑了响应的预测能力，本例得到的最优因子设置有所不同，此时得到的y1值比加权主成分分析法得到的y1值小，而y2值变大，因为两响应同为望大特性，显然该结果对响应y2有较大的偏重性，较大的优化了y2。这是因为响应y2的预测能力较强(R2系数较大)，改进的主成分分析法突出了预测能力对优化结果的影响。在实际应用过程中，根据响应预测能力的相对重要程度及实验者的意愿，可对R2系数进行处理，扩大或缩小不同响应间的相对差距，以凸显各响应预测能力对优化结果的影响。

3 结束语

本文提出了一种改进的加权主成分分析法以解决质量工程中的多响应优化问题。在加权主成分分析法的基础上，该方法将R2系数结合到主成分分析中，考虑了模型的预测能力，并可通过变换R2系数的标准化方式以强调或削弱预测能力对优化结果的影响，在多个响应模型的预测能力有显著差异时该方法非常有意义。本文采用文献中的实例进行数据分析，通过分析可以看出，本文提出的方法较加权主成分分析法具有一定优势。

利用主成分分析法同时优化响应的均值和标准差，实现优化的稳健性是下一步研究的重点。

［1］Su C T，Tong L I.Multi-response robust design by principal component analysis［J］.Total Quality Management，1997，8(6):409-416.

［2］Antony J.Multi-response optimization in industrial experiments using Taguchi’s quality function and principal component analysis［J］.Quality and reliability engineering international，2000，16:3-8.

［3］钟晓芳，韩之俊.利用主成分分析对多质量特性的优化设计［J］. 南京理工大学学报，2003，27(3):301-304.

［4］Liao H C.Multi-response optimization using weighted principal component［J］.The International Journal of Advanced Manufacturing Technology，2006，27:720-725.

［5］Gauri S K，Chakraborty S.Optimization of multiple responses for WEDM processes using weighted principal components［J］.The International Journal of Advanced Manufacturing Technology，2009，40:1102-1110.

［6］Shih J S，Tzen Y F，Yang J B.Principal component analysis for multiple quality characteristics optimization of metal inert gas welding aluminum foam plate［J］.Materials and Design，2011(32):1253-1261.

［7］Kim K J，Lin D K J.Simultaneous optimization of mechanical properties of steel by maximizing exponential desirability functions［J］.Applied Statistics，2000，49(3):311-325.

［8］Nair V N.Taguchi’s parameter design:a panel discussion［J］，Technometrics，1992，34:127-161.

［9］Richard A.Johnson，Dean W.Wichern著，陆璇，叶俊，译.实用多元统计分析［M］.北京:清华大学出版社，2008.

Application of Improved Principal Component Analysis Method to the Multi-Response Optimization

ZHANG Ying-dong，HE Zhen
(College of Management and Economics，Tianjin University，Tianjin 300072，China)

An improved principal component analysis method，which takes into consideration the difference in the predictive ability among the responses is proposed.Principal component analysis method is a popular method for multi-response optimization.To consider the predictive ability，the proposed method applies R2coefficient which represents the degree of fit of the regression model to principal component analysis.Compared with the existing principal component analysis method，the proposed method can transform multi-response into single response，and consider the predictive ability.Case study shows that the results obtained through this method can reflect the impact of the predictive ability，the response with strong predictive ability is greatly improved.

quality engineering;multi-response optimization;principal component analysis;predictive ability

TH165;F406.3

1001-2265(2012)11-0097-04

2012-04-10

国家自然科学基金重点项目(70931004)

张迎冬(1986—)，男，河北张家口市人，天津大学管理与经济学部硕士研究生，主要研究方向为质量工程、工业工程，(E-mail)pauldd@126.com。

(编辑李秀敏)