粗集—遗传支持向量机模型在供应链绩效评价中的应用

2015-04-07武雯娟

湖北农业科学 2015年3期

武雯娟

摘要：将粗集-遗传支持向量机模型运用到供应链绩效评价中，首先利用粗集理论剔除影响供应链绩效评价的冗余因素，获得核心影响因素，再采用支持向量机对于提取得到的核心影响因素预测供应链绩效所处的级别。在支持向量机分类过程中，利用遗传算法对支持向量机算法的参数进行寻优，获得最佳参数模型，而后预测得到供应链绩效评价级别。最后，实例运用此模型进行了预测，并与只运用粗集-支持向量机进行预测的结果进行对比。结果表明，利用粗集-遗传支持向量机方法对供应链绩效评价级别的预测准确率更高，预测结果更符合实际，是一种科学可行的方法。

关键词：供应链；绩效评价；粗集理论；支持向量机；遗传算法

中图分类号：TP18 文献标识码：A 文章编号：0439-8114（2015）03-0733-05

DOI：10.14088/j.cnki.issn0439-8114.2015.03.059

Application of Rough Set GA-SVM Model in the Supply Chain Performance Evaluation

WU Wen-juan

（Department of Finance and Economics， Taian Vocational and Technical College， Taian 271000， Shandong， China）

Abstract： Rough set-genetic support vector machine（SVM） model was used for the performance evaluation of supply chain. Firstly， this paper used rough set theory to eliminate the redundant factors influencing the performance evaluation of supply chain， and got the core factors. Support vector machine（SVM） was then used to extract the core level of influing factors to predict the performance of the supply chain. In the process of support vector machine （SVM） classification， the genetic algorithm was used for the parameters optimization of support vector machine（SVM） algorithm. Optimal parameters of the model were obtained and then used to predict the level of supply chain performance evaluation. Finally， instances were forecasted by this model， and compared with the predic results by the only use of rough sets and support vector machine（SVM）. The results showed that the use of rough set-genetic support vector machine（SVM） method can predict higher accuracy level of the supply chain performance evaluation， and the predicted results are more realistic， thus being a scientific and feasible method.

Key words： supply chain； performance evaluation； rough set theory； SVM； GA

随着经济全球化，企业的经营环境发生了巨大的变化。越来越多的企业管理者已经意识到，未来的企业竞争将是供应链（Supply Chain，简称SC）与供应链之间的竞争，而不是企业之间的竞争。企业为了在市场竞争中始终处于有利地位，获得长期竞争优势及利益，就必须建立高效、安全、可靠的供应链系统，供应链系统可以各种辅助手段实现其一体化过程。

所谓供应链是指将产品和服务提供给最终消费者的所有环节的企业所构成的上下游产业一体化的体系。供应链管理是从系统的观点出发，通过对采购、制造、分销直至消费者的整个过程中的资金流、物流、信息流的协调，通过此种管理模式来满足消费者的要求及需求。然而只有对供应链系统中的各成员供应链绩效评价理论及其重要性的认识统一，才能让他们将对整个供应链系统的贡献度作为自己的考核目标，并将这些具体指标达成情况作为利益分配及任务分配的依据，如此才能使供应链的整体绩效切实得到提高。目前，将粗集-遗传支持向量机（GA-SVM）方法应用到供应链绩效评价领域的研究并不多见，本研究主要利用粗糙集理论剔除供应链绩效评价的冗余因素及指标，提取获得影响供应链绩效评价的核心因素，再运用对于小样本具有良好泛化能力的支持向量机来进行评价，支持向量机的评价过程中通过遗传算法来进行相关参数寻优操作[1，2]。

1 粗集理论

波兰学者Pawlak于1982年提出了粗糙集（RoughSet）理论，粗糙集理论就是在无需提供问题需要处理数据之外的任何其他先知信息，而是仅根据已知的数据剔除冗余信息，获得本质信息，分析得到知识的不完整程度，生成决策或分类的相关规则及准则，实现通过分类准则或规则对已知数据进行精简或约减，对于处理未确知和模糊数据具有良好的效果[3-5]。

1.1 信息系统

一个信息系统S通过下式表示：S=（U，A，V，f），其中U为论域，（U={x1，x2，……，xn}）由有限个研究对象组成；A=C∪D为属性集，其中C是条件属性集，D是决策属性集；V是值域；f是映射，对？坌a∈A，x∈U，实现关于属性a的值。

1.2 不可区分关系

粗糙集理论将知识和分类紧密联系起来，知识是对客观数据进行分类的能力，分类就是将差别的数据对象分析成为一类，它们之间的关系称之为不可分辨关系或等价关系，其中知识库可以用K=（U，R）表示，其中U是非空有限集，称之为论域，R是U上的一族等价关系。UΠR为R的所有等价类族。[X]R表示包含元素x∈U的R的等价类。若yyP？哿R且P≠？椎，则P中全部等价关系的交集也是一种等价关系，称为P上的不可区分关系，记为ind（p），[x]ind[]x=u■[x]R，P？哿R。

1.3 属性约简与核

定义1：假设S=（U，R）为信息系统，R是U上的等价关系族，x∈R，若U/IND（R）=U/IND（R-r），则称是R中可以被约简掉的知识，否则不可被约简掉。

定义2：对于任意r∈P（P？哿R），若其中的P都是不可被约简的，则其等价关系族P是独立的，否则认为P是相关的。

定义3：假定S=（U，R）为信息系统，如果子族PR满足下列条件：IND（P）=IND（R），而且P是独立的，则称P是R的一个约简。

如果P是R的约简，则P必须满足以下条件：①P独立；②P与R有相同的分类能力，即IND（P）=IND（R）。

定义4：假定S=（U，R）为信息系统，如果其中R不可约去的属性，则称做R是核属性，所有核属性构成的集合称为核集，记作Core（R），称Core（R）为R的核。

1.4 粗集的上、下近似及边界

定义1：给定知识库K=（U，R），X？哿U，称y■（X）={x|[x]R？哿X，？坌x∈U}为集合X的下近似，也称■（X）是X的R正域，记做POSR（X）；显然，X的R正域POSR（X）是由U中完全属于X的元素构成的集合。■（X）是一个确定性集合，它是由完全包含在X中的那些R的等价类（中的元素）构成的集合。即X的R正域 POSR（X）中的元素可被正确分类。

定义2：称BNR（X）=■（X）-■（X）为X的R边界域，称NEGR（X）=U-■（X）为X的负域。显见，负域中的元素由不能确定是否属于X的元素组成。

1.5 决策表的简化

对于决策表的条件属性进行化简，也就是对决策表的简化，简化的决策表具有与之前的决策表相同的决策等功能，不影响其核心功能的体现，只不过是简化后的决策表具有更少的条件属性，这样会提高决策和评价效率。因此，决策表的简化在实际应用领域中占有相当分量。换言之，在更少的条件下，获得同样的决策，使得利用一些相对之前更为简单的手段或条件就可以获得同样的决策或结果。决策表的简化步骤如下：（1）对决策表的条件属性进行约简，获得核心因素，也就是消去决策表中的某些列；（2）约简掉决策表中重复的某些行消去重复的行；（3）约简掉属性的冗余值。

本研究主要通过以上3个步骤对决策表进行属性约简，以期得到影响供应链绩效评价的主要因素或指标，约简掉冗余因素或指标，为下一步的供应链支持向量机评价奠定一个良好的基础。

2 遗传-支持向量机回归模型

2.1 支持向量机基本原理

SVM是基于结构风险最小化原则的方法，由于其是一个凸二次优化问题，从而保证能找到一个全局最优解，而且其能够较好地解决小样本、非线性、高维数等实际问题，问题的复杂程度不再简单地取决于维数高低，并且具有良好的泛化能力[6-8]。对于其凸二次优化问题，可以应用标准的拉格朗日乘子法进行优化求解。

假设训练样本为{（x1，y1），……（xi，yi）}，其中（xi∈Rm）是第i个学习样本的输入值，且为m维列向量，yi∈R为对应的目标值。可以建立如下形式的回归函数：

（y）i=fi（t）={wi，？渍i（t）}+bi （1）

式（1）中，{}表示内积运算，wi描述了函数fi（t）的复杂度，bi为常数。考虑到函数的复杂度和拟合误差，函数拟合问题等价于满足如下约束条件时

xi-{wi，？渍i（tl）}-bi=（？孜i）l （l=1，2，……，j）（2）

最小化代价泛函

Ri=■{wi，wi}+■C■[（？孜i）l]2 （3）

式（3）中，C为惩罚因子，？孜i为松弛变量。对于这个寻优问题，可以建立以下函数

Li（wi，bi，？孜i，αi）=■{wi，wi}+■C■[（？孜i）l]2+■（αi）l[{wi，？渍i（tl）}+bi+（？孜i）l-（xi）l] （4）

式（4）中，（αi）l为Lagrange乘子。考察式（2）所给函数极值存在条件，可以获得求解所有参数的一个方程组，并最终得到回归函数（1）的表达式为

fi（t）=■（αi）lKi（t，tl）+bi （5）

式（5）中，Ki（t，tl）为满足Mercer条件的支持向量机核函数。广泛应用一种核函数为径向基核函数

Ki（t，tl）=exp[-■] （6）

式（6）中，？滓i为xi的标准偏差。

当每个训练数据所对应的回归函数fi（t）均被确定后，可以得到回归函数为

Yt=■fi（t）=■[■（αi）lKi（t，tl）+bi] （7）

支持向量机回归模型中具有多个参数，易陷入局部最优，因此本研究利用具有全局寻优能力的遗传算法对其参数进行寻优。

2.2 遗传算法基本原理

遗传算法和传统搜索算法不同，它首先随机产生一组初始解，即“种群（Population）”，种群中的每一个个体，即问题的一个解向量，称为“染色体（Chromosome）”，开始搜索过程。这些染色体在后续迭代中不断进化，生成的下一代染色体称为“后代（Offspring）”。每一代中染色体的好坏可通过染色体的适应值（Fitness）来评价：适应值大的染色体被选择的几率高，相反，适应值小的染色体被选择的可能性小，被选择的染色体通过交叉（Crossover）和变异（Mutation）产生新的染色体，即后代；经过若干代之后，算法收敛于最好的染色体，该染色体很可能就是问题的最优解或近似最优解。遗传算法的运行步骤如下[9-15]：（1）随机产生初始种群popk；（2）以适应度函数对染色体进行评价；（3）按适应值高低选择染色体形成新种群newpopk；（4）通过交叉、变异操作产生新的染色体即后代offspring；（5）不断重复步骤（2）-（4），直到获得预定进化代数。

其迭代流程见图1所示。由上述步骤可看出，遗传算法主要由遗传运算（交叉和变异）和进化运算（选择）组成。

交叉运算是最主要的遗传运算，遗传算法的性能在很大程度上取决于所采用的交叉运算的性能。交叉运算同时对两个染色体操作，组合两者的特性产生新的后代。变异则是一种基本运算，它在染色体上自发产生随机变化。变异可以提供初始种群中不含有的基因，或找回选择过程中丢失的基因，为种群提供新的内容。

3 实证分析

设计任何评价指标体系都应遵循一些基本原则，因此，本研究结合供应链绩效评价的概念，根据目的性原则、科学性原则、系统性原则、经济性原则、定量与定性相结合的原则和通用性与发展性相结合原则这六个原则初步确定一个比较广泛的供应链绩效评价指标体系（表1）。同时，对评价指标代号及指标类型进行了标定。其中，极大型指标是指标值越大越好的指标，又称正向指标；极小型指标是指标值越小越好的指标，又称逆向指标。本研究应用这一指标体系对河北、山东、天津等地区的14条供应链进行调研，调查的实际数据请相关专家进行评分，其评分结果将作为支持向量机评价结果进行训练和检验，同时也作为和只运用支持向量机所得出的训练结果进行比较（表2）[1，2]。

3.1 粗集属性约简

把实测数据输入，把这些指标作为条件属性。对于供应链绩效评价结果根据所处情况分为五类（很好，较好、一般、不好、很不好），作为决策属性记为D{1，2，3，4，5}，

对决策表进行属性约简，根据粗集理论可以求出哪些是核心属性，哪些是冗余属性，由于属性约简算法比较复杂，采用VB6.0编程进行属性约简。属性约简后的指标体系见表2。此指标体系由于约简了冗余属性，提取了核心属性，为下一步利用支持向量机进行回归识别提供了比较好的基础。

把通过实际调研的数据输入约简后的决策表（表3）。

3.2 遗传-支持向量机回归模型的学习

支持向量机学习算法如下：

1）获取学习样本（xi，yi），i=1，2，……l，其中xi∈Rm，yi∈{1，-1}l对样本进行预处理。

2）选择进行非线性变换的核函数及对错分（误差）进行惩罚的惩罚因子C。

3）形成二次优化问题用优化方法。对于此优化问题中参数寻优，通过遗传算法获得，具体步骤如下：①确定遗传算法编码方式。采用十进制整数编码的遗传算法的群体中模式的数目，低阶并且适应度值在群体平均适应度值以上的模式在遗传算法迭代过程中将按指数增长率被采样。②生成初始种群。初始染色体的多少对遗传算法的搜索有影响，对支持向量机算法具有显著影响，为了优化模型往往需要对染色体参数进行适当优化。根据采集数据情况，确定初始种群染色体数目。③计算每个染色体的适应度值f（xi），xi为种群中第i个染色体；④累加所有染色体的适应度值sum=∑f（xi），同时记录对于每一个染色体的中间累加值S-mid，其中S为总数目；⑤产生一个随机数N，0

4）获得αi以及b的值，代入方程中，获得函数拟合的支持向量机。

5）将需预测或分类的数据代入支持向量机方程中获得结果。

本研究中所选评价指标作为供应链评价因素集，供应链绩效评价等级分为5级，目标输出对应以下5类：1、2、3、4、5。

利用表2中的前10数据作为训练样本，对于数据采用以下公式进行归一化处理，以减少各个因子不同量级对于回归效果的影响，并利用Matlab软件得出回归结果（图2）。

■=■ （7）

由图2可以看出拟合效果非常好，从而可以对剩下的4个进行识别，并与采用BP神经网络对10到14的样本进行评判的结果进行对比（表4）。

通过表4可见，基于粗集的支持向量机识别等级与支持向量机识别的等级除了编号12之外都一样，通过对编号12的数据进行进一步分析可以得出此供应链绩效等级更趋近于一般等级。

4 结论

本研究首先利用粗集理论提取出影响供应链绩效评价的核心因素，再使用支持向量机的方法进行模式识别，模式识别过程中，利用遗传算法对相关参数进行寻优操作，取得了良好的效果。由于支持向量机是基于小样本的分类及预测的模型。所以，在本研究实例所给样本极少的情况下做出了较好的预测。由于支持向量机方法是建立在有限样本下进行机器学习的通用方法，因此它在供应链绩效评价和分析中有广泛的应用前景。

参考文献：

[1] 王德财.基于支持向量机的供应链绩效评价方法研究[D].长沙：长沙理工大学，2006.

[2] 蔡炜凌.企业供应链项目的综合评价方法研究[D].河北保定：华北电力大学，2007.

[3] 曹庆奎，任向阳，刘琛，等.基于粗集-未确知测度模型的企业技术创新能力评价研究[J].系统工程理论与实践，2006，9（4）：67-72.

[4] 张文修，吴伟志.粗糙集理论与方法[M].北京：科学出版社，2003.

[5] 柯孔林，冯宗宪.基于粗糙集与遗传算法集成的企业短期贷款违约判别[J].系统工程理论与实践，2008，9（4）：27-34.

[6] BANERJEE M， CHAKRABORTY M K.A category for rough sets[J].Foundations of Computing and Decision Sciences，1993，18（3-4）：167-180.

[7] 李顺国，卢新元.基于粗糙集和SVM的工程项目投标风险研究[J].计算机工程与应用，2008，44（17）：224-227.

[8] 苏怀智，温志萍，吴中如.基于SVM理论的大坝安全预警模型研究[J]. 应用基础与工程科学学报，2009，17（1）：40-47.

[9] 赵洪波，冯夏庭.非线性位移时间序列预测的进化——支持向量机方法及应用[J].岩土工程学报，2003，25（4）：468-471.

[10] PETLEY D N， MANTOVANI F， BULMER M H， et al. The use of surface monitoring data for the interpretation of landslide movement patterns[J]. Geomorphology， 2005，66（1-4）：133-147.

[11] VALLEJO L E， SHETTIMA M. Creep crack propagation and the progressive failure of slopes[A]. In： Deformation and progressive failure in geomechanics[C]. London： Pergmon Press， 1997.

[12] BETTEN J. Creep mechanics[M]. 2nd ed. Berlin： Springer， 2005.

[13] MANDIC D P， GOLZ M， KUH A， et al. Signal processing techniques for knowledge extraction and information fusion[M]. Berlin：Springer，2007.

[14] KLIONSKI D M， ORESHKO N I， GEPPENER V V， et al. Applications of empirical mode decomposition for processing nonstationary signals[J]. Pattern Recognition and Image Analysis，2008，18（3）：390-399.

[15] LEE Y S， TSAKIRTZIS S， VAKAKIS A F， et al. Physics-based foundation for empirical mode decomposition[J]. AIAA Journal，2009，47（12）：2938-2963.