基于反向精英保留和Levy变异的多目标鲸鱼优化算法
2021-08-06梁倩
梁倩
(哈尔滨商业大学,哈尔滨150028)
0 引言
多目标优化是多准则决策的一个领域,它是涉及多个目标函数同时优化的复杂问题,它更符合实际问题的需要。多目标优化不可能将所有的目标都达到最优值,需要再多个相互制约的目标之间做出最优决策。因此,对于多目标相关问题的研究十分必要。
鲸鱼优化算法的出现相对较早,因此对于鲸鱼优化算法的研究比较全面,包含方法的改进与应用。赵继民等人[1]将模糊神经PID控制器和优化算法进行结合,采用鲸鱼优化算法去优化神经网络的权值和偏差,降低了模糊神经网络的误差,将混合的模型用于PID控制器。实验数据显示,所提出的混合模型性能得到了良好的改善。郝晓弘等人[2]提出了一种混合策略改进的鲸鱼优化算法,将混沌映射产生初始种群,在迭代过程中改进了收敛因子和惯性权重,并且变异程度取决于适应度方差,阻止算法早熟收敛,研究数据表明,改进后的算法精度大大提升。伍铁斌等人[3]提出了一种基于指数函数收敛因子的改进的鲸鱼优化算法,在算法中加入了旋转操作的精英学习机制,并在其中加入了自适应变异策略,降低算法陷入局部最优的概率。经过验证,改进后的鲸鱼优化算法收敛速度加快,全局寻优能力得到强。孔芝等人[4]提出一种将自适应权重和改进搜索策略相结合的鲸鱼优化算法。在算法中,鲸鱼种群的变化会使得权重与搜索机制发生变化,以适应不同的鲸鱼种群。经仿真结果表明,所提出的算法在精度和收敛速度上有着显著优势。吴泽忠等人[5]结合对立学习策略、随机调整参数、正态变异操作等方法来改进鲸鱼优化算法,提出了一种基于改进螺旋更新位置模型的鲸鱼优化算法。对立学习策略对鲸鱼每次的进化速度得到改善,随机调整控制参数使鲸鱼发生突变,降低了算法陷入局部最优的风险,加入正态变异和改进螺旋更新方法增大了算法的全局搜索能力,数据结果表明,在单峰、多峰以及固定维数函数上,改进后的算法具有更强的普遍适应性和稳定性。闫旭等人[6]利用量子物理与优化策略改进鲸鱼优化算法,并将改进后的算法应用在作业车间调度的问题上。在仿真实验的结果上表明,相比于其他算法,所改进后的鲸鱼优化算法在寻优成功率上有较明显的改观。由以上文献可以看出,目前对于鲸鱼优化算法的研究仍然不够完善,例如多目标问题的研究不够深入。鲸鱼优化算法的搜寻机制在多目标领域应该也具有较高的应用价值,因此对于多目标鲸鱼优化算法的改进仍有许多工作要做。
为了解决鲸鱼优化算法本身的收敛速度慢,容易陷入局部最优的问题,本文对其进行了改进,提出了一种反向精英保留和Levy变异相结合的多目标算法。具体改进为:首先利用反向精英保留策略[7]对种群的初始化进行筛选,使得算法具有良好的初始分布;并且在种群的迭代过程中使用反向学习机制,能够扩大每次筛选的位置,加快收敛速度;其次引入了种群引导[8]的策略,将种群中最优的部分个体选择为领导者,其他个体根据这个领导者进行移动,为算法后期迭代产生均匀分布打下基础。在测试函数实验下,各项指标都表明改进后的算法有较强的寻优能力;最后在算法的迭代过程中加入了Levy变异[9]的策略,以避免过早的收敛于局部最优。
1 基本知识
1.1 多目标优化问题
一个具有n个维度的决策变量和M个维度的目标函数的问题就可以被描述为以下的模型:
其中,X=[ ]x1,x2,…,xn是一个n维空间中的决策变量,Y=[ ]y1,y2,…,ym是m维空间中的目标量,而[low1,low2,…,lown]和[ ]up1,up2,…,upn是分别是决策变量的下限和上限。
解x优于解y,在所有的目标函数上x都小于等于y,并且至少在一个目标函数上,x是严格优于y,记为x≺y。在解集合中,不存在任何一个解严格优于当前解,这样的解被称为帕累托最优解。由帕累托最优解构成的集合被称为帕累托最优解集。所有的帕累托最优解集所对应的目标函数值就是帕累托前沿。
1.2 鲸鱼优化算法
鲸鱼优化算法[10]的核心思想是鲸鱼捕食时按照某种规则进行位置的移动,最优鲸鱼对其他鲸鱼有引导的作用,并根据数学模型所提供的位置更新公式更新每头鲸鱼的位置。所有的鲸鱼进行移动后,更新相应位置的适应度值,当达到最终的迭代次数,迭代停止。
自然界中,鲸鱼群能够准确识别猎物的位置并包围它。而在解决实际问题中并不能预知最优的解,因此在鲸鱼优化算法中,总是将当前群体中的具有最优适应度的鲸鱼视为最优个体,群体中其他鲸鱼个体均向最优个体进行包围,其位置更新公式为:
其中,t代表当前迭代次数,Xbest(t)表示当前鲸鱼中最优鲸鱼的位置,X(t)=(x1,x2,x3,…,xd)代表当前候选鲸鱼的位置。A和C代表系数向量,定义为:
其中,r1和r2是[0,1]上的随机数。a为收敛因子,随着迭代次数线性从2递减到0。a的计算公式如下:
其中,tmax是最大迭代次数。
此外,鲸鱼的行为还包含螺旋更新这一阶段,这一行为用一下数学模型进行表示:
其中,D= |Xbest(t)-Xt|代表当前鲸鱼与最优鲸鱼的距离,b是螺旋程度的参数,l是[-1,1]之间的随机数。鲸鱼的包围猎物的行为可以分为以上两种,为了实现这两种行为的同时发生,引入P为发生概率,当产生的随机数大于P时,发生收缩包围;当随机数小于P时,发生螺旋更新行为,在优化过程中,P一般设置为0.5。
除了以上的包围食物的行为外,鲸鱼也可随机搜寻食物。在搜寻食物中,鲸鱼之间可根据相互之间的位置进行更新位置,数学模型表达为:
其中,Xrand(t)代表随机从鲸鱼中选择的个体单位。
鲸鱼优化算法的完整流程为:首先在搜索空间中随机生成N个鲸鱼的位置,之后进行种群的位置更新过程,根据当前种群中最优鲸鱼的位置或者随机选择的鲸鱼位置进行更新,之后再根据概率P选择是螺旋更新还是包围更新公式,直至整个算法的迭代次数完成或者达到停止条件。
2 反向精英保留和Levy变异的多目标鲸鱼优化算法(RLMOWOA)
2.1 帕累托等级排序
通过非支配排序将种群数为N的种群分类为分级的帕累托前沿。首先将种群中所有的帕累托前沿求出,标记帕累托前沿等级为1。之后将帕累托等级为1的个体忽略,在剩下的个体中求帕累托前沿,并记录帕累托等级记为2,之后循环进行,直至将所有的解都分类。通过引入帕累托等级[11]和拥挤度的计算,能够将所有的解进行排序,以便在种群混合时能够选择出较优的前N个解。
2.2 拥挤距离
用来描述非支配解分布的特征,以便选出帕累托最优集合中的10%的优质解。在帕累托解集中,每个非支配解都有一个拥挤距离,来表示离它最近的非支配解在各个目标函数维度上的距离之和。拥挤距离值越大说明离当前解最近的帕累托解位置较远,即帕累托解分布较为稀疏。相反,拥挤距离越小说明离当前解最近的帕累托解位置较近,也即帕累托解越密集。引入拥挤距离目的是可以通过当前帕累托最优解的分布情况来选择最优帕累托解,以引导种群向更均匀分布解进化。在帕累托前沿中的边界解中,拥挤距离被设定为inf,其他解的拥挤距离的计算公式如下:
其中,I[i-1].m表示非支配解集I中将第m个目标函数值进行排序后,仅次于该i解的第m维目标函数值,fmmax和fmmin分别表示第m个目标函数值的最大值和最小值。
2.3 反向精英保留机制
为了更好地学习反向学习机制,首先来解释反向点的概念,图1显示了a的反向点z。
图1 反向点
一维标量a的上下限分别是Zmax和Zmin,则称Zmin+Zmax-a为向量a的反向点。在高维向量中,每个维度均采用这种方法获得的点为反向点。在每次位置更新后,求出所有解的反向点,将所有的反向点种群和当前解种群混合。根据帕累托等级和拥挤距离选择前N个个体作为当前这一代的位置更新,优先选择帕累托最优解上的个体,当帕累托等级相同时选择位置比较稀疏的个体。本文不仅在种群初始化中应用反向学习机制,还将反向学习机制应用于鲸鱼的迭代更新过程。
2.4 Levy变异
Levy分布是法国著名数学家莱维提出的概率分布,在自然界中有许多的飞行动物的飞行轨迹都遵循Levy分布。在Levy分布的基础上产生了Levy飞行,它是一种长短步相间的飞行方式,这种随机的飞行方式使得飞行动物的运行轨迹范围加大,找到食物的概率也相应增加。目前这种变异方式已经广泛应用于各种优化领域,Levy变异的更新公式是:
其中,α是步长比例因子,xti代表第t代第i维的位置,⊕代表点对点乘法,Levy(β)代表服从参数为β的Levy分布的随机数。Levy的计算方法如下:
其中,u和v均服从正态分布,定义为:
β的取值范围一般是(1,3],本文中β取1.5。
2.5 种群引导
由于鲸鱼优化算法需要定义最优鲸鱼的位置作为领导者,引导其他的鲸鱼大致的移动方向,因此最优解的选取对于种群的进化至关重要。但是由于偶然性的存在,有时最优解的选择并不够合格,并且全局最优解只局限于某个固定的解比较片面,最优解应该是从多个较优解中随机选择。本文所提出的种群引导正是基于这样的目的,每次从帕累托等级为1的个体中选取10%作为最优解的集合,每个鲸鱼在向最优鲸鱼移动时从最优10%中随机选取一个作为目标,经过种群引导方式所获得的解拥有更均匀的分布。
2.6 算法流程
本文提出的算法为反向精英保留和Levy变异的多目标鲸鱼优化算法。首先通过反向精英保留制度来初始化种群,利用种群中帕累托解中的10%作为引导者进行位置更新,更新位置后的种群为候选种群,结合反向精英保留机制产生候选反向种群,混合候选种群和候选反向种群选择前N个个体作为子代解,并以一定的概率产生Levy变异,将最终产生的子代与父代混合,根据帕累托等级和拥挤度筛选出较优解进入下一代。此过程不断进行直至最大迭代次数。
算法1 RLMOWOA算法
输入:种群数量,最大迭代次数,突变概率。
输出:帕累托最优解。
步骤1初始化种群并计算反向点及其适应度值;
步骤2将初始种群与反向种群合并后计算帕累托等级和拥挤距离。根据帕累托等级和拥挤度选取前N个个体作为初始种群;
步骤3从帕累托前沿个体中选择10%作为种群引导;
步骤4将所有的鲸鱼根据条件进行位置更新,选择最优解为领导者时从10%中随机选择;
步骤5计算候选反向种群与当前候选种群混合后的拥挤度,根据帕累托等级和拥挤度选择前N个个体作为子代;
步骤6对种群中每个鲸鱼产生一个随机数,当随机数小于p时对该鲸鱼位置进行Levy变异;
步骤7将子代与父代进行合并,重新计算帕累托等级和拥挤距离,根据步骤2的筛选规则选择前N个个体进入下一代,以保证种群数量维持不变;
步骤8判断是否满足最大迭代次数,不满足最大迭代次数则重新执行步骤3-步骤8。
3 实验结果与分析
3.1 实验设置
为了进一步测试所提出的改进后的多目标鲸鱼优化算法,本文选取了四种算法与RLMOWOA进行比较,分别是多目标粒子群算法[12](MOPSO)、多目标布谷鸟算法[13](MOCS)、非支配快速排序遗传算法[14](NSGAⅡ),经典多目标鲸鱼优化(MOWOA)[15],在两个目标的测试函数ZDT1、ZDT3[16],以及三个目标函数的VNT2、VNT3[17]函数上进行测试。多个维度目标函数对于帕累托前言的求解带来的困难成几何倍数增长,无论是时间复杂度还是空间复杂度难度都会有所上升,但是实验数据表明MOWOA的表现依旧出色。实验环境为32位Win7系统,CPU为Intel Core i3 4170,内存为8GB,编程语言为MATLAB 2018a。每个算法独立运行25次并记录每个指标的均值与方差。
3.2 性能指标
(1)反转世代距离
反转世代距离(Inverted Generational Distance,IGD)[18]每个从真实帕累托前沿上获取的参考点到最近的算法所求得的解的距离的平均值。
其中,P为分布在真实帕累托前沿上的点的集合,|P|代表集合P中的点的个数,Q为算法获取的帕累托最优解的集合,d(v,Q)代表v到集合Q中的点的最小欧氏距离。当算法获得的解比较集中时,d(v,Q)的值较大,导致整个IGD值较大。当获得的解离帕累托真实前沿比较远时,求和之后的参考点到获得的解之间的距离之和则会相对较大。因此IGD能够同时评价多样性和收敛性。IGD值越小越说明算法所求的解离真实帕累托前沿越近或者解的分布越均匀。
(2)超体积指标
超体积指标(Hypervolume,HV)[19]算法获得的非支配解集与参照点围成的目标空间中区域的体积。
其中,δ表示Lebesgue测度,用来测量体积。|S|表示非支配解集的数目,vi表示参照点与解集中第i个解构成的超体积。HV值越大算法的综合性能越好。
3.3 实验结果与分析
(1)种群引导、Levy变异、反向精英保留机制的验证
为了进一步体现算法中引入种群引导,Levy变异和反向精英保留机制的作用,本文将所提出的算法与经典的多目标鲸鱼优化算法进行对比。在ZDT1、ZDT3和ZDT6测试函数上进行了实验,实验采用控制变量法,相同测试函数在不同的算法下的迭代次数相同,以便观察出所做出的改进对算法的提升。实验结果分别运行30次,取各个指标的均值进行比较,记引入种群引导改进的算法为PG-MOWOA,引入Levy变异改进的算法为L-MOWOA,引入反向精英保留机制的算法为R-MOWOA。在各对比图中,经典的多目标鲸鱼优化算法记为MOWOA。各实验结果对比图如图2-图4所示。
图2 种群引导的对比图
在ZDT3测试函数中,经典MOWOA在多次运行后的IGD和HV的均值分别是3.493E-01,5.004E-01,引入改进后的算法PG-MOWOA均值分别是6.112E-03、5.866E-01,种群引导对算法的提升效果十分明显。结合图2可以看出,未引入种群引导的经典MOWOA所求的帕累托前沿还未完全收敛于真实帕累托前言,并且所求帕累托前言之间的分布在左上角比较密集,右下相对稀疏。而PG-MOWOA所求的帕累托前沿分布均匀,这验证了种群引导对于多目标优化算的提升。
在ZDT6测试函数中,经典MOWOA的IGD和HV的均值分别是1.955E-02、3.731E-01,引入改进后的L-MOWOA的均值分别是3.879E-03、3.881E-01,Levy变异的引入使得各指标值都有了改善。从图3可以看出,L-MOWOA算法仍有部分点并未收敛于真实帕累托前言,这些点已经陷入局部最优,而Levy变异的引入完美的解决了这个问题,从而使算法的全局寻优能力得到大幅提升。
图3 Levy变异的对比图
在ZDT1的测试函数中,经典的MOWOA算法的IGD和HV的均值分别是2.546E-01、4.932E-01,引入改进后R-MOWOA算法的均值分别是6.728E-03、7.163E-01。从图4也可以看出,反向精英保留机制的引入对算法有着一定程度的提升。在算法中,反向精英保留机制不仅在种群初始化中引入,也在种群的更新迭代过程中得到应用。初始化时的引入使得算法的初始分布更加全面,便于种群的进化,迭代更新过程中的应用使算法每次搜索范围更广,加快了收敛的速度。
图4 反向精英保留机制的对比图
(2)与其他算法的比较
从IGD指标来看,RLMOWOA算法在ZDT系列测试函数上的表现比较好,在ZDT1上的IGD指标达到了4.895E-03,比其他算法性能高很多,并且方差也达到了最小值,为4.051E−04。在ZDT2上的表现也十分优秀,IGD均值为5.478E-03,方差也稳定在3.541E−04左右。RLMOWOA在三个目标函数值的VNT系列测试函数上的表现虽然达到了最优值,但性能提升并不大,在VNT2上的IGD指标为1.798E-02,相比于其他四种算法的提升就显得并不突出,但在VNT2上的方差较小,为7.371E−04,表现相对稳定。在VNT3上的IGD指标仅为4.401E-02,方差相对较大,仅有微弱的提升效果。总体来说,RLMOWOA相比于另外四种算法有着不错的优势。
从HV指标上来看,RLMOWOA算法在ZDT系列测试函数上的表现较好,在VNT系列测试函数上则表现平庸。经典MOWOA的HV在ZDT1上的均值达到了6.799E-01,而OPMOWOA均值方差分别是7.194E-01、4.246E−04,均值和方差均达到了更高的水平。并且在ZDT2上也有着同样的表现。可见RLMOWOA在MOWOA得基础上得到了显著的提升。在VNT2测试函数上,RLMOWOA算法并未达到最优,但是五种算法的指标值都相差不大,性能表现相近。这是由于不同的指标表现不同方面的性能,单纯的用HV指标来衡量算法的优劣不够充分,IGD的指标充分验证了这一点。在VNT3上,RLMOWOA的HV值达到了最大值,为1.842E-01,相比于其他算法提升也并不明显,但从稳定性上来看,RLMOWOA达到了最小,仅为6.274E−05,这种稳定的表现使得算法有一定的优势。
表1 IGD值
表2 HV值
ZDT3 VNT2 VNT3 4.518E-02±2.182E-02 2.017E-00±9.641E-02 1.838E-01±1.410E-04 2.147E-02±3.303E-02 2.033E-00±9.275E-03 1.840E-01±1.000E-04 5.790E-01±1.778E-02 2.038E-00±3.473E-03 1.841E-01±1.130E-04 5.319E-01±1.146E-01 2.015E-00±4.387E-02 1.839E-01±1.729E-04 5.830E-01±1.792E-04 1.983E-00±5.979E-02 1.842E-01±6.274E-05
4 结语
随着大数据时代的来临,多样化的信息数以万计的产生,多目标优化问题越来越多,各种约束条件越来越复杂,搜索空间也越来越大,这对多目标优化而言是一个巨大的挑战,也是一个发展的机遇。本文所提出的多目标鲸鱼优化算法将反向精英保留机制应用到产生初始解和迭代进化,将帕累托最优解集中的优质解用于种群的进化引导,再应用帕累托等级排序和拥挤度距离对种群进行排序,以便选出前N个个体维持种群数量的稳定,最后在鲸鱼捕食和移动的过程中增加Levy变异。研究数据结果表明,本文的RLMOWOA算法相对于其他四种算法在IGD和HV上都有着显著的优势,三种改进机制的引入极大改善了算法的全局寻优能力,证明了多目标鲸鱼优化算法有着较大的探索价值。未来的研究工作将从以下两个方面进行:①研究RLMOWOA与其他模型的结合,将多目标鲸鱼优化算法应用到模型中去改善其他模型的不足。②对多目标鲸鱼优化算法进行多方面的改进,使其适应未来更加复杂的多目标问题。