APP下载

基于支持向量机的物流管理质量评价模型的构建

2012-02-05郭晓晨姚宏亮

关键词:向量样本物流

郭晓晨,姚宏亮

(1.安徽工商职业学院工商管理系,安徽合肥231100;2.合肥工业大学计算机与信息学院,安徽合肥230009)

支持向量机方法是在统计学习理论的VC维理论和结构风险最小化原则的基础上,基于有限的样本信息在复杂性和学习能力之间找到最好的折衷来构建模型,以期获得最好的推广能力[1].目前支持向量机理论在模式分类,回归问题,生物信息技术等很多领域均得到了广泛的应用[2].

在物流信息系统的开发和建设中,现有的物流系统通常是基于工作流的设计方式,业务流程设计局限于个人管理经验,开发周期较短,不能充分考虑影响物流成功、节约物流成本的因素,导致在系统开发过程中无法利用原有的数据对现有的物流活动进行评价预测,造成数据上的浪费.如何在物流信息系统建设中充分调研参与物流运营的有关各方,分析各种风险因素,正确估算各因素影响力的大小,构建物流系统管理质量评价模型,实现物流管理效益最大化是亟待解决的问题.支持向量机方法可以在有限样本空间内得到已有信息下的最优解,通过合适的核函数和参数运用原空间中向量间的运算来替代高维特征空间中的内积运算,避免了高维空间中计算内积而带来的维数灾难,可以有效地利用于物流管理质量评价模型中多维评价指标的运算.

本文通过运用支持向量机理论的基本观点来发现物流管理系统中各项数据之间潜在的联系,并且从参数的优化与选择以及核函数的选择与构建两方面阐述了支持向量机的关键问题,结合支持向量机的特点构建了物流系统管理质量评价模型.

1 物流管理质量评价指标体系

在物流业务实施过程中,主要的参与对象为物流企业以及物流企业中各个岗位的工作人员.由于物流业务实施并不是由某个人员单独完成,而是由多个物流人员协作完成,所以在考虑人为因素的影响时仅对某个岗位的设置评价指标.因此,物流管理质量评价指标体系在设计的过程中就包含了两大影响因素:物流企业评价指标体系和物流个人评价指标体系.物流企业评价指标体系主要体现物流企业规模、物流业务开展的质量、物流服务质量等因素对物流管理质量的影响;物流个人评价指标体系主要体现某个岗位的员工学历、工作年限、工作状态和服务态度等因素对物流管理质量的影响.

基于上述原则,深入分析物流信息系统中能够对管理质量产生影响的各个因素,将物流信息系统管理质量评价指标体系分解为四个一级评价指标,分别为基本情况、人为因素、物流质量以及服务质量.通过对一级指标体系的细化,得到一个能够反映物流信息系统管理质量的本质的递阶层次结构的指标体系.

物流系统管理质量评价指标体系为:

基本情况:仓储质量X1、装卸设备数量X2、货运车辆质量X3、员工从业平均年限X4、大专以上学历比例X5.

人为因素:驾驶员从业年限X6、交通违章次数X7、行车事故率X8、道路拥堵次数X9、服务态度X10.

物流质量:配送正确率X11、按时交货率X12、商品完好率X13、包装完好率X14、回单完备率X15.

服务质量:提醒验货率X16、承诺兑现率X17、顾客投诉率X18、信用分值X19、服务创新率X20.

首先,要对阿姨加强职业认知的培训。在客户家工作时,阿姨绝对不是弱势的一方,而是强势的一方,是雇主不敢得罪的一方。雇主把自己最宝贵的孩子、家都交给阿姨了,怎么敢欺负阿姨呢。所以,要让阿姨认识到自己职业的价值,不要总认为雇主看不起自己,在家政服务的雇佣关系中,阿姨才是更强势的一方。

2 基于支持向量机的物流管理质量评价模型

确定了物流管理质量评价指标体系后,就需要考虑如何通过现有的数据构建物流管理质量评价模型.支持向量机方法对于多维指标的计算有着特有的优势,所以本文采用支持向量机来构建物流管理质量评价模型.通过对现有的物流信息系统的数据进行搜集、整理和归一化处理,制作出支持向量机的学习样本.

支持向量机的学习样本选取自某公司现在运行的物流管理信息系统中的数据,经过处理后得到150个样本,前140个为训练样本,后10个为测试样本.每个样本都涵盖有20个评价指标,显然,这是一个支持向量机20维非线性回归估计问题.我们首先对样本数据进行详细的对比分析,选择合适的核函数;然后利用核函数对样本数据进行计算、优化,选出最优的核参数和模型参数;最后根据核函数、核参数和模型参数构建出基于支持向量机的物流管理质量评价模型.

根据这个思路,我们首先选择适合评价模型的核函数.

2.1 核函数及参数选择

有一类模型的回归参数不是线性的,也不能通过转换的方法将其变为线性的参数.这类模型称为非线性回归模型.在许多实际问题中,回归函数往往是较复杂的非线性函数.在通过支持向量机的方法建立非线性回归模型的过程中,核函数的选择的正确与否将对回归分析具有很大的影响[3].我们选用高斯径向基核函数,又称RBF核函数,高斯径向基核函数的表达式为

在式(1)中σ为核参数,它代表的是函数在自变量方向上的宽度,即高斯核的均方差.高斯函数宽度是由参数σ表征的,而且σ和平滑程度的关系是非常简单的.σ越大,高斯函数的宽度就越宽,平滑程度就越好.通过调节平滑程度参数σ,可在图像特征过分模糊与平滑图像中由于噪声和细纹理所引起的过多的不希望突变量之间取得折衷.但σ过小会造成泛化能力变差,所以核参数σ是一个很重要的参数[4-5].除了核参数,支持向量机算法本身也有一些重要的参数,如:不敏感损失函数ε值和惩罚参数C,这些参数对支持向量机学习也有很大的影响[6].参数可以选择使用交叉验证方法,在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和.首先定义一个参数值,然后调整其他的参数值,直到试验误差减到不能减少为止,然后固定参数,调整其他一些参数,直到测试误差减到最小,即为最佳的参数选择[7].根据这一理论,结合物流系统评价指标中的20个二级指标,制定了物流系统质量评价训练样本集,如表1所示.

表1 物流系统质量评价训练样本集Tab.1 Training samples of logistics system quality evaluation

下面确定核参数σ、惩罚系数C和不敏感常数ε的最优值.

使用表1中的前140个样本作为训练集,后10个样本作为测试集,首先固定C=10,ε=0.01,逐渐调整σ的大小,直至测试的整体均方误差最小时得到的σ*即为其最优值;接着按照同样的方法依次调整调整值ε和C值,调整过程和各个步骤的性能函数MSE的值[8-9].

当固定C=10,ε=0.01时,MSE的值随着σ值从0.1向100逐渐增大呈现先递减后递增,当σ=20.4时,MSE达到最小值,因此σ的最优值为20.4;当C=10,σ=20.4时,MSE的变化趋势也是随着ε在区间[0.00000001,1]上的变化而呈现先减后增的趋势,当ε=0.65时MSE达到最小值,因此ε的最优值为0.013;

通过前两个步骤的调整已经得到了最优的σ和ε,因此,接下来固定σ=20.4,ε=0.65,考察随着C的变化MSE的变化趋势.

从整体上看,MSE随着C值的逐渐增大呈现出先增大后减小的变化趋势,但当C在区间[1,5000]上变化时,MSE的变化相对缓慢,在C=86周围的变化最为细微.这表明,在这种情况下惩罚参数值的影响不是很大,即C=86为最佳值.

表2中,MSE为模型整体评价效果的误差检验函数,MSE值越小表明对应的参数值越好;NSV为支持向量的数目.

综上所述,已经确定了核函数为径向基核函数(RBF),核参数为σ=20.4;惩罚参数C=86,不敏感系数ε=0.65.如表2所示.

表2 物流系统质量评价模型核函数及参数Tab.2 Kernel functions and parameters of logistics system qualitye valuation model

2.2 训练与测试

2.2.1 模型训练将表1中的前140个样本作为训练集,每个样本的20个评价指标的具体值作为输入向量,而在物流业务中的物流管理质量的评价值为训练目标向量;首先设定σ=20.4,C=86,ε=0.65,采用ε不敏感损失函数,选定核函数.用MATLAB编写好程序,将参数和样本输入到程序中.在MATLAB 2008环境下运行程序,耗时0.7 s,其中有113个支持向量,偏置b=0.0002376,因此得到支持向量回归模型.

其中xi为支持向量回归模型中的支持向量,x为待评物流信息系统管理质量指标值向量;(a−a)=mi为对应于支持向量的拉格朗日乘子,其中m1=0.04631,m3=-0.23516,m4=0.03196,m6=0.13291,m8=-0.13271,m9=0.00301,m12=0.10993,m14=0.03100.2.2.2模型测试为了验证物流管理质量评价模型的准确率,将训练样本集中的最后10个样本提取出来,建立测试样本集,此外,每个样本的20项评价指标的具体值作为输入向量,并列出物流管理的质量评价的训练目标向量.用MSE作为模型整体评价效果的误差检验函数,描述训练完成后模型的性能,MSE的大小表明得到的模型预测能力精度的高低[65,67].通过测试样本集的测试得到模型总体均方误为:MSE=1.12399e-5,表明模型的具有高精度的预测能力.样本测试结果及其与真实值的相对误差Error,如表3所示.

表3 物流系统质量评价测试结果与实际评测结果对比Tab.3 The contrast oftest results and practical evaluation results in logistics systemqualit yevaluation

通过表3可以看出,10个测试样本中相对误差最高为0.91%,最低为0.16%,平均相对误差为0.46%,没有一个测试样本的相对误差超过1%.这说明由径向基核函数(RBF),核参数为σ=20.4;惩罚参数C=86,不敏感系数ε=0.65构成的支持向量机评价模型具有良好的泛化性能.采用物流管理质量评价的评语集为:[高、较高、一般、较低、低],风险区间[0,1]上与之对应的质量水平值分别为:(0,0.2)、(0.2,0.4)、(0.4,0.6)、(0.6,0.8)、(0.8,1.0),分别代表五个质量等级.支持向量机模型输出的评价结果与实际评测结果一致.因此,支持向量机模型能够应用于物流信息系统管理质量评价,为物流信息系统管理优化提供决策依据.

3 结果分析

为了验证支持向量机质量评价模型,判断它在推广能力和训练效率方面的优越性,我们将支持向量机模型和贝叶斯网络模型在物流管理质量评价方面的结果进行对比分析.

神经网络模型的三层前馈网络,将影响物流管理质量的20个因素作为输入层的节点.除了20个节点外再选择25个隐藏的节点,隐藏节点使用双曲正切S函数作为传递函数.网络输出层的节点数数为1,输出层传输函数为线性函数.初始化每一层的连接权矩阵为0矩阵,其中最大的网络训练步骤为100000步,网络性能目标定为1e-5,动量常量为0.8,学习速率设定为0.02,每一步梯度下降1.5,两次显示之间实现150次训练.完成了以上完整的BP网络初始设置后,从表2中的数据中选择前140作为训练数据集,编写应用程序实现传统BP网络通过物流信息管理质量评价标准化的数据进行训练和学习.BP神经网络在13 min25 s的时间内完成了71483次的训练,达到了要求的精度.将后10组数据作为测试集,输入训练好的神经网络,计算出对比结果.

(1)泛化能力比较.从表4中,我们可以看到BP神经网络模型和支持向量机模型的评价结果,二者在评价结果上基本一致,但每个测试样本误差的区别也是很明显的.BP神经网络对训练数据拟合效果虽然已经达到一个很高的训练精度,但是测试误差明显高于支持向量机.这说明BP神经网络虽然能通过训练达到很高的精度,但是无法确保良好的泛化能力,产生了过学习的现象.

(2)训练效率比较.基于支持向量机的物流管理质量评价模型的训练为0.1 s,而BP神经网络是在13 min17 s内持续完成了73383次的训练才达到精度药酒.训练过程中BP神经网络的梯度下降趋势非常小,导致训练时间的延长,网络收敛速度非常慢.

表4 物流管理质量评价值及评价等级对比Tab.4 Contrast of the value and the rating in logistics management quality

4 小结

通过对物流系统中的的数据进行处理,得出物流管理质量评价指标.根据训练样本集构建出基于支持向量机理论的物流管理质量评价模型,通过模型可以分析公司基本情况、人为因素、物流质量以及服务质量四个分指标体系对单次物流活动效益的影响,并进一步将4个指标分别分解各自的下级指标,形成20个二级指标作为重点研究指标,考察其对公司效益的影响.并利用训练样本集和测试数据集对评价指标进行验证,并与BP网络进行对比测试,支持向量机测试误差小,训练效率高,可以应用于实践,为物流管理质量水平评价及决策系统的开发提供理论基础.

[1] 瓦普尼克.统计学习理论[M].许建华,张学工,译.北京:电子工业出版社,2009.

[2] Vapnik VN.The Nature of Statistical Learning Theory[M].New York:Springer Verlag,2000:125-151.

[3] Doumpos M,Zopunidis C.Additive support vector machines for pattern classification[J].IEEE Trans on Systems,Man and Cybernetics,Part B,2007,37(3):312-315.

[4] Jayadeva,Khem CR,Chandr AS.Twin support vector machines for pattern classification[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2007,29(5):905-910.

[5] 曾志强.支持向量分类机的训练与简化算法研究[D].杭州:浙江大学,2007.

[6] Wu ZL,Li C H,Joseph K,et al.Location estimation viASupport vector regression[J].IEEE Trans on Mobile Computing,2007,6(3):311-321.

[7] HaoP Y,ChangJ H.Fuzzyregression analysis bysupport vector learningapproach[J].IEEE Trans on Fuzzy Systems,2008,16(2):428-441.

[8] 李丽.工程项目全面风险管理的理论与方法研究[J].重庆建筑大学学报,2002,38(4):151-153.

[9] 尹志军,陈立文,王双正,等.我国工程项目风险管理进展研究[J].基建优化,2002,33(2):226-228.

猜你喜欢

向量样本物流
向量的分解
用样本估计总体复习点拨
聚焦“向量与三角”创新题
本刊重点关注的物流展会
“智”造更长物流生态链
推动医改的“直销样本”
企业该怎么选择物流
随机微分方程的样本Lyapunov二次型估计
向量垂直在解析几何中的应用
村企共赢的样本