APP下载

工业互联网智能调度建模与方法研究综述

2022-08-11赖李媛君

计算机集成制造系统 2022年7期
关键词:任务调度云端调度

赖李媛君,张 霖,任 磊,王 凌

(1.北京航空航天大学 自动化科学与电气工程学院,北京 100191; 2.清华大学 自动化系,北京 100084)

0 引言

工业互联网是未来20年支撑中国经济社会繁荣发展的“新基建”之一,更是实现智能制造的重要基础[1-2]。习近平指出,工业互联网将加速中国新型工业化进程,为疫情阴霾笼罩下的世界经济创造新的发展机遇。《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》[3]提出要给予高端制造和智能制造大力关注,推动互联网、大数据、人工智能等与各产业的深度融合。2020年政府工作报告指出,在“互联网+工业”的基础上充分理解工业客户的应用场景和需求痛点,已成为中国制造企业转型升级的必然选择。

工业互联网的建设关键在于云端和边缘端资源协同互补地对工业现场进行全面感知与连接[4-5]。与传统网络化制造系统不同,复杂产品制造过程依赖于云端—边缘端—工业终端的多主体资源联动控制。云端能够提供普适的、随需应变的、集中的计算资源、存储资源和网络访问通道,接收大量工业过程相关的复杂解算任务、工业智能算法所需的大规模训练任务、工业过程分析、工业大数据存储与解析任务等[6-8];边缘端能够在工业终端附近的网络边缘侧提供分散的异构计算资源,缓解因大规模工业终端接入云端带来的高通信负载和计算负载,从而支撑近端数据采集、终端控制、过程监测、数据预处理、分布式决策与实时仿真等快速任务需求[9-11]。可见,云边协同计算旨在为复杂制造全流程提供具有自组织、快速响应和自主决策能力的近远端协同计算服务。

云端和边缘端资源的引入使得工业互联网的结构更加复杂,也为工业互联网中制造过程的任务调度带来了更大的挑战。传统网络化制造系统中,平台将分别针对分布式工业现场及其网络中的关联服务进行制造任务调度和计算服务调度[12-13]。而在工业互联网环境下,平台需要依据涌现的制造任务及其关联计算任务和海量数据通信的需求,一方面选择合适的分布式制造资源实现多产品生产,另一方面选择相关计算任务是否在云端或边缘端执行以及部署在哪一个计算资源运行,并配置相应的网络。这个过程中,制造任务之间存在着复杂的前驱后继关系,计算任务之间存在着复杂通信关系,且制造任务与计算任务间又存在着复杂交互关系,如实时交互、循环交互、数据依赖、数据同步等。如何对计算—制造混合任务进行快速合理的调度,是决定工业互联网能否高效运行的关键。

为此,本文针对Web of Science检索的工业互联网智能调度相关的近五年相关研究论文[14-120],将云端、边缘端和工业终端的任务分为4大类,并依据决策变量的不同和决策层级的不同探讨了工业互联网环境下的7大类基本调度问题及其组合问题,总结了主流的建模方法和调度算法,并探讨了它们的应用范围。依据工业互联网环境下智能调度所面临的5大类挑战,分析了挑战背后的根源,并总结了应对当前挑战可能的技术途径,为未来工业互联网智能调度研究提供技术参考。

1 工业互联网环境下的任务与基本调度问题

工业互联网主流架构可简化表示为图1,主要由云端、边缘端和分布于各地的工业终端组成。云端提供网络存储、海量计算资源池,实现平台集中控制功能;边缘端提供分布于各地基站或工业现场附近的分散异构计算资源,缓解云端负载压力,实现近端快速分散控制功能;工业终端接收工业互联网平台指派的用户需求和任务,运行过程不断向云端和边缘端发送数据,与云端和边缘端计算资源形成实时动态交互。这其中涉及计算任务、通信任务、制造任务和物流任务4大类型任务。

各任务在云—边—工业终端三端的分布关系如图2所示。计算任务主要由云端和边缘端执行,当工业终端具有一定计算能力时,也能承载小规模计算任务;由于三端资源交互密切,因此通信任务广泛存在于三端之间;而制造任务只能由工业终端设备执行;物流任务主要由分布于各地的制造任务协作生产带来,物流资源也可作为工业互联网工业终端资源的一种,因此,物流任务也仅存在于工业终端。三端资源各司其职,围绕4大类型任务形成松散灵活的协作模式。

针对这一场景,笔者团队调研了近五年Web of Science检索的围绕工业互联网各层次调度问题的100余篇研究论文,并依据论文分布对问题进行分解(如图3),图3左侧为云端、边缘端和工业终端的7类基本调度问题:计算任务卸载、计算任务调度、计算资源配置、网络资源配置、通信任务路由、制造任务调度、物流任务调度。

图3中间部分列举了各个问题的主要求解变量,若同时考虑多个变量因素,又会形成右侧表现的3类主要的云边协同混合任务调度问题:云边协同计算任务调度、云边协同网络资源配置、云—边—工业终端协同的计算—制造混合任务调度。

从问题分布层次来看,云端主要包含传统计算任务调度和计算资源配置,因为当前云架构下计算资源池中异构资源以较为统一的网络连接模式管理,所以,云架构下的网络资源调度在近五年研究较少。边缘端作为云端和工业终端联接的中间层,既需要管理工业终端和边缘端之间连接的有线网络或无线传感网络,又需要与云端计算资源连接进行数据传输,涉及了大量的异构网络资源配置、大量云端知识数据传输路由和工业终端数据上载,因此全面覆盖了计算任务卸载、计算任务调度、计算资源配置、网络资源配置和通信任务路由5种调度问题。工业终端的调度问题主要是传统制造任务和物流任务的调度,与传统网络化制造系统环境不同的是,制造任务和物流任务在执行过程中,承载任务的工业终端资源可能与云端或边缘端有数据通信,且存在工业现场监控、数据同步、远程知识提取或近端实时控制等关联的计算任务同步执行,因此制造任务的开始和结束时间约束、任务前驱后继约束将更复杂,工业终端资源的能力和能耗方面的计算方式也随之更复杂。

依据本文调研的100余篇论文分布情况,可发现7类基本问题在近五年工业互联网调度问题研究中的比例(如图4)。其中,计算任务卸载问题由边缘计算技术引入,在工业互联网环境下得到了广泛的关注,约30%的研究均关注于各类计算任务向云端或边缘端的卸载研究,包含配置任务卸载数量或任务卸载比例,决策任务是否卸载到云端或边缘端、或在具备计算能力的工业终端执行,选择卸载任务时间等。其次,约20%的研究关注于计算任务调度的研究,计算任务的调度涉及边缘端计算任务和云端计算任务,旨在选择执行计算任务的资源,是传统计算任务调度问题的一个扩充。与计算任务调度不同,计算资源配置主要集中于资源能力、服务、容器等配置,在工业互联网环境下,还扩展地包含配置执行任务的资源缓存、功率以及对服务和容器的再调度等,在有些研究工作中也包含计算任务调度。该方面研究占工业互联网智能调度研究的18%左右。由于边缘计算可以和运营商部署的5G网络以及软件定义网络(Software Defined Network, SDN)、网络功能虚拟化(Network Function Virtualization, NFV)等软件控制技术适配应用,在工业互联网环境下,为充分挖掘分布式计算的潜力,约18%的研究也聚焦于网络资源配置方面,旨在配置传输任务的网络切片,为任务配置虚拟化网络功能等。依据边缘端计算资源接收工业终端定时发送的现场数据,为加快传输效率,诸多研究也在网络资源配置方面引入了配置传输任务的采样频率、配置传输任务并行稳定传输的数据复制量、传输功率、传输时间戳和传输信道等。由于多层网络结构的形成,也有研究聚焦于通信任务的路由方面,但在工业互联网环境下这类调度问题的研究仅占4%左右。在工业互联网环境下智能调度的研究中,制造任务调度和物流任务调度的研究比例分别占7%和3%,主要在传统网络化制造环境中的制造过程调度和供应链调度问题基础上延伸,以选择执行任务的工业终端资源和选择监控与辅助当前制造任务的云端或边缘端计算资源为制造任务调度变量,以选择执行物流任务的车辆和路径为物流任务调度变量。

2 工业互联网基本调度问题建模

总结7类基本调度问题的目标、约束以及云—边—终端协同特性如表1所示,这些问题在传统云计算、边缘计算、以及网络化制造场景均被广泛研究过,但在工业互联网环境中因云—边—工业终端的协同特性,使得目标约束的计算方法发生了变化。三端协同特性在不同问题中的主要体现如表1第4列所示,其对目标和约束带来的主要影响项在表中加粗显示。

表1 工业互联网各类调度问题的目标、约束与特性

续表1

针对上述问题,工业互联网环境下的调度问题主要通过6类建模方法进行分析:数学规划模型(含整数规划模型和线性规划模型)[14-68,120]、非线性数学模型[69-83,111,115-119]、马尔科夫过程模型[84-92]、状态空间模型[93-102,112-114]、李雅普诺夫优化模型[103-106]、博弈模型[107-110]。

各类基本调度问题的研究所采用的主流建模方法映射情况如表2所示,主流建模方法的研究分布如图5所示。其中,计算任务卸载、计算任务调度与计算资源配置需求一般并行出现,也常常合并决策,已有较为成熟的数学规划模型可统一表示计算任务卸载、计算任务调度、计算资源配置3个基本问题的决策变量、约束和目标,因此在数学规划模型基础上进行分析的研究占比最多。针对这3个问题的基本建模方法较为常用的还有非线性数学模型,即使用连续或离散的变量表示决策变量,并采用非线性多峰目标函数和约束不等式表示问题的方法。此外,马尔科夫过程模型、状态空间模型、李雅普诺夫优化模型和博弈模型也纷纷被引入实现这3个问题不同角度的建模。现有研究中,前5种建模方法均被用于网络资源配置问题的分析,只有博弈模型还未发现被用于网络资源配置中。这可能是由于网络资源配置涉及网络参数较多,如网络切片、虚拟网络功能、传输功率、信道、带宽、时间戳等,各参数所属层次不同,网络不同层次参数间的耦合约束关系并非博弈决策关系。此外,通信任务路由在工业互联网环境下研究较少,主要基于传统通信路由模型扩展建模,因此,主流建模方法为数学规划模型。制造任务调度问题和物流任务调度问题在工业互联网环境下的建模也与传统建模大同小异,集中体现为数学规划模型、非线性数学模型。随着强化学习方法在这类问题中的应用,状态空间模型也被应用于这两个问题的建模中,将资源或任务作为智能体构建状态空间和运动空间。

表2 工业互联网环境下的基本调度问题采用的主流建模方法映射情况

3 工业互联网智能调度算法

基于前述六类模型,工业互联网智能调度方法可分为6类:数学规划算法[14,16,22,25,30,33-34,43,49,55,68,78,84,95,104,107,120]、启发式算法[19,21,23-24,27,35,37-38,40,65,98,103,115-119]、进化算法[17,31,36,46,53,59-60,62,66-67,69-71,75,80-81,96,111]、博弈算法[29,50,108-109]、强化学习算法[32,41,44-45,56-57,61,63,72,85-89,91-92,97,99-100,102,105,112-114]、机器学习算法[15,18,20,26]。

各类基本调度问题的研究所采用的主流建模方法映射情况如表3所示,主流建模方法的研究分布如图6所示。其中以强化学习算法的应用研究占比最多,占27%。该方面研究试图联合云端计算能力强、边缘端实时处理速度快的特征,设计线下训练与线上决策结合的方式对工业互联网环境下的计算任务、通信任务、制造任务和物流任务进行调度,并通过强化学习训练得到的智能体先验知识,对高动态场景进行快速决策响应。其次,进化算法(占比22%)、数学规划算法(占比21%)和启发式算法(占比21%)平分秋色,其中启发式算法和进化算法广泛应用于除通信路由外的6类基本问题中,而数学规划算法则大多应用到计算任务卸载、计算任务调度、计算资源配置、网络资源配置和通信任务路由中。在针对工业互联网环境下的制造任务调度和物流任务调度的近五年研究中,使用数学规划算法进行问题求解的较少。针对这类问题,现有研究常采用启发式算法、进化算法或强化学习算法进行求解。

表3 工业互联网环境下的基本调度问题采用的智能调度算法映射情况

相应地,博弈算法和机器学习算法在6类基本调度问题的研究中使用较少,但求解问题的角度较为新颖。其中,博弈算法主要用于计算任务卸载、计算任务调度、计算资源配置和制造任务调度中;机器学习算法主要引入到计算任务调度、计算资源配置两类问题。

4 工业互联网智能调度面临的挑战与主要发展途径

上述研究主要针对当前工业互联网环境下所面临的新挑战,对传统场景下的模型进行修改,试图更贴近于工业实际场景下任务和资源的运行模式,并运用和设计不同的智能调度算法提高决策质量和决策速度。总结来说,当前工业互联网智能调度面临以下5项挑战

(1)大规模 在云端、边缘端和工业终端的灵活协同模式下,工业互联网环境下分布制造资源、边缘端计算资源和云端计算资源数量急剧增大,计算任务、通信任务、制造任务和物流任务规模化涌现。任务规模可达数万计,工业互联网资源节点可达数千个,如何对万级任务进行快速调度,实现任务毫秒级响应,是工业互联网环境面临的首要挑战。

(2)高动态 工业互联网环境下的动态性主要体现在任务动态性,如计算任务动态涌现、通信任务延迟/丢包、制造/物流任务插入/变更/取消等;资源动态性,如云端和边缘端资源的动态占用状态、资源宕机、工业终端资源的临时维修维护、通信通道的堵塞与中断、物流通路的变更等;场景动态性,如工业生产线的重构、物流资源的替换、订单需求的变化等。这些动态特征大多通过区间数、模糊数或随机分布的方式在调度问题中体现,但实际场景的动态变化大都不服从上述3类分布,如何响应工业互联网环境下的急速变化,实现任务精准调度,是工业互联网环境面临的又一挑战。

(3)不确定 这里的不确定性主要体现在工业现场任务方面。当前面向工业互联网环境的智能调度研究仅考虑了执行时间固定的任务,并假设任务不能分割,任务前驱后继关系不变,且任务之间不存在循环执行或实时数据传输的关系,但实际工业现场并非如此。首先,工业现场的制造任务和物流任务不仅包含固定时间的自动执行任务,还包含大量人机协作任务,且人机协作任务通常伴随着实时现场监控数据的传输以及控制指令或操作步骤的调整。尤其是对定制化产品及其零部件来说,任务流程可变,人机协作性强,且具有诸多循环判定环境和实时数据传输环节,过程具有较强的不确定性,如何针对这些任务及其不确定性进行建模、分析、预测和调度,是实现精准调度亟待解决的一个问题。

(4)强耦合 强耦合指的是变量之间的耦合关系较强,主要体现在工业计算任务和工业制造任务之间的联系上。工业计算任务和工业制造任务之间主要存在紧密的数据传输,既包含从工业终端的定时数据采集,支撑现场监控、数字孪生模型同步构建与更新、云端知识学习、人工智能黑箱数据模型训练等;又包含从云端和边缘端的先验信息获取,如云端人工智能模型的部署和调用,云端知识的提取和应用,云端存储数据的获取与可视化分析,边缘端服务应用同步部署,边缘端实时控制指令发送等。这些任务联系,不仅增加了更复杂的任务开始时间、结束时间、等待时间的约束关系,带来了更多数据上行和下行传输负载,还大大增加了各个层次基本调度问题之间的耦合性,使得不同问题变量之间产生更强的隐性约束。在这种情况下,针对基本问题的单独决策就很容易失效,如何联合多个问题进行云—边—工业终端协同任务调度,又成为一个新的挑战。

(5)多目标 从表1可发现,工业互联网环境下7类基本调度问题均呈现多目标决策需求,当多个基本问题联合决策时,从任务运行效率、响应延时、能耗、成本、服务质量等方面的决策目标和评价指标必然会发生倍增,如何实现多个目标之间的平衡,也是当前研究讨论的热点之一。

表4总结了工业互联网各类调度问题主要应对的挑战。计算任务卸载、计算任务调度、网络资源配置和制造任务调度问题不可避免地面临着上述5项挑战。计算资源配置问题针对计算任务配置资源或服务,不确定性较小;通信任务路由问题聚焦固定网络结构下的传输通道和传输流程选择,还未充分涉及大规模、高动态、不确定和强耦合等挑战;而物流任务调度问题主要面临规模增大、动态场景需求以及决策目标增多的挑战,较少涉及不确定性和与其他层次决策变量的强耦合性。

表4 工业互联网各类调度研究应对挑战的情况

总地来说,未来工业互联网将面临数十万计超大规模任务和资源的调度与管理。由于云端、边缘端和工业终端的紧密连接,计算任务和制造任务的紧密耦合,单独对7大基本问题进行逐一决策显然不符合实际,这需要忽略任务之间的耦合关系,并加入诸多不符合现实的强假设约束来将各部分变量划分开,就容易得到不符合实际要求的决策方案。因此,未来工业互联网智能调度方面的研究必然是面向云—边—工业终端协同的计算—通信—制造任务的多目标动态调度问题,且问题中包含各自不确定性因素和变量强耦合关系。

针对变量大规模、场景高动态、任务不确定、变量强耦合的多目标优化调度问题,可以引入一些先进方法提升决策过程的速度和决策解的质量。

(1)应对大规模挑战的技术途径 首先,可引入并行化技术,将问题变量进行分解形成子问题,利用启发式调度算法、数学规划算法或进化算法进行子问题并行快速求解,再合并问题进行精优和微调[121];其次,可以运用代理模型,将大规模调度问题中耗时较长的目标函数计算和梯度计算利用代理模型替代,实现优化解的快速搜索[122-124];再者,可以使用自编码器等技术对耦合变量进行压缩求解,再展开回原问题进行精优调校[125];此外,还可以引入多任务学习思路[126-127],混合使用原目标函数和代理模型进行同步并行决策,一方面提高求解效率,另一方面能够补偿代理模型带来的精度误差。

(2)应对高动态挑战的技术途径 首先,可引入当前先进的基于进化迭代的动态优化算法[128-130],通过环境变化动态检测算法与解集快速变更方法结合,在环境发生动态变化时快速生成新的解集;其次,可以采用环境变化动态检测算法与深度强化学习结合的方式[131],在线下先对可能的动态场景生成大量解集并评估,实现深度强化学习模型的训练,再运用训练好的深度强化学习模型实现线上决策。在此基础上,还可引入基于增量式策略的强化学习算法[132],进一步响应未知动态环境,并实时对深度强化学习模型进行调校,进而快速给出动态环境下的决策方案。

(3)应对不确定性挑战的技术途径 针对决策过程不确定性因素的主流方法包含基于仿真的推演方法[133-135]、贝叶斯推理方法[136-137]、基于机器学习的预测方法和预优化方法[138-139]。具体地说,可根据任务流程的变化特性进行不确定性因素的概率建模,采用贝叶斯推理方法对不同情况发生的条件概率进行估计,再结合机器学习的预测方法对可变流程的发生时间和参数进行定位,最终选取合适的调度算法对当前预测的场景进行决策形成预优化方案。在方案执行过程中,再引入在线再调度方法修改方案适应场景的变化。

(4)应对强耦合挑战的技术途径 强耦合主要体现在不同类型问题直接的紧密耦合,因此,针对耦合性较强的问题最直观的方法是将多个问题合并建模,进行多层次一体化调度决策。一体化决策带来的问题又回归到大规模问题的求解,因此,既可沿用分解子问题并行寻优和归并精优的思想实现一体化快速决策,又可引入代理模型对一体化调度的目标函数进行简化,加速决策过程。此外,在建模方面,还可以充分运用李雅普诺夫优化模型与马尔科夫状态模型对变量进行解耦,再通过约束转化和约束消解方法对问题进行简化;在一体化决策过程方面,还可引入多智能体强化学习算法,设计多个耦合问题的智能体决策策略,在动态场景下进行多智能体强化学习模型的线下组合训练后投入线上实现快速决策。

(5)应对多目标的技术途径 针对目标函数大于3个的多目标优化问题,大多采用进化迭代流程延续优化指标(indicator)、分解的权重向量(decomposition-based weight)和帕累托(Pareto)前沿解集选择策略的设计[140-143],为选择多目标平衡的优秀前沿解集,可引入聚类方法选取较少的权重向量[144-146],依据权重向量选择前沿解集,由此简化迭代流程;也可结合简化的超体积(hypervolume)或IGD(inverted generational distance)等指标[147-151]结合多智能体强化学习方法[131]对解集进行快速排序。随着一体化调度决策目标函数数量的增大,也可采用基于机器学习或深度学习的方法[150,152]依据场景动态特性选取关键目标函数,对关键目标函数进行并行迭代优化,从而降低决策时间。

除了上述技术途径以外,还有许多聚焦设计人工智能算法与进化算法结合的方法,试图挖掘工业互联网智能多层次调度问题变量、约束和目标的精确简化表达,并实现调度解的快速寻优,在此不再赘述。

5 结束语

工业互联网智能调度问题涉及云端、边缘端和工业终端的计算任务、通信任务、制造任务和物流任务的多层次调度,是决定工业互联网平台运行效率的核心,具有大规模、高动态、不确定、强耦合、多目标的特点。本文调研了Web of Science相关的100余篇研究论文,总结了围绕工业互联网平台运行的7大类基本问题以及所涉及的云边协同特性,讨论了针对这些问题的6类主流建模方法和6类典型决策算法,以及这些方法的研究分布情况,并探讨了各类方法的主要应用范围,最终针对工业互联网环境下智能调度所面临的的5大挑战及其原因进行分析,给出了应对不同挑战的技术途径,为未来工业互联网智能调度问题的研究提供参考和新的思路。

猜你喜欢

任务调度云端调度
四海心连·云端汇聚
基于动态能量感知的云计算任务调度模型
在云端永生
云端之城
基于PEPA的云计算任务调度性能分析
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
电力调度自动化中UPS电源的应用探讨
基于强化学习的时间触发通信调度方法
基于动态窗口的虚拟信道通用调度算法
基于小生境遗传算法的相控阵雷达任务调度