APP下载

天基信息港的多源信息融合任务调度研究

2018-07-23,,,*,

中国空间科学技术 2018年3期
关键词:任务调度天基数据处理

,,,*,

1. 上海交通大学 区域光纤通信网与新型光通信系统国家重点实验室,上海 200240 2. 上海卫星工程研究所,上海 200240

天基信息港是一个具有数据中继和多源信息融合处理能力的全新天基网络节点概念[1-2],其在同步轨道搭建了统一的信息处理平台,具有数据转发、处理、存储等功能,能够向各类用户提供星上处理和数据中继的服务。天基信息港作为天基网络信息体系高轨节点的一种形态,可以是一个集成多类功能的大卫星或者由一簇在同步轨道上共位的模块化卫星组成。

多源信息融合是天基信息港的重要应用之一[3-4],天基信息港可以通过天线资源汇集各类的遥感卫星数据,并利用星上处理资源融合处理后分发,使得遥感卫星获取的数据不再需要直接或者间接由中继卫星传输到地面站进行处理和分发,减少了地面数据中心接收和分发数据的传输时间,实现了信息获取的有效性、准确性和高实时性[5]。

天基信息港的多源信息融合任务可划分为与各个数据源卫星相关的一组子任务,每个子任务包括数据传输阶段和数据处理阶段,分别需要占用天基信息港的天线资源和处理资源。基于以上分析,本文提出并研究了天基信息港的多源信息融合任务调度问题,即在满足天基信息港资源约束下,如何分配多源信息融合的子任务在天线资源和处理资源上的执行时间,使得多源信息融合任务的完成时间最小。

目前,还没有在星上实现多源信息融合任务调度或者卫星天线和处理资源联合调度的相关研究。当前有关星上资源调度的研究大多针对于中继卫星的资源调度[6-13],这些文献根据中继卫星天线资源的不同特征进行建模,并提出了多种算法进行求解,但相比较多源信息融合任务调度,没有考虑数据处理的过程。因为多源信息融合任务与数据处理相关,可以参考数据中心的计算任务调度研究,文献[14-15]对遥感数据处理任务的流程进行分析并建模求解,文献[16]研究了计算任务与通信联合调度的问题,但是它们的应用场景都是地面的数据处理中心,没有考虑到卫星时间窗的特点。

本文通过分析多源信息融合的任务流程及天基信息港的资源特征,首次提出了天基信息港的多源信息融合任务调度问题,并设计了多机循环插入(Multi-machine Circular Insertion,MCI)算法进行求解。仿真结果表明MCI算法能够有效减少任务完成时间。

互联网经济的迅猛发展,促使高等教育分化,高等院校培养学生的出口拓宽。应用型本科院校教学的重点除了给学生奠定科学基础,更重要的功能是培养学生的应用能力。数据库原理是计算机类专业的必修专业基础课,为学生进行信息化管理应用奠定基础。如何使学生将理论学习转化为应用技能提升是应用型本科教学的关注点,平顶山学院信息工程学院物联网工程专业以数据库原理课程教学为载体,探索了基于“学习成效”评价模式教学过程管理应用研究,以期通过全过程的学习评价、注重学习效果的评价方式提升学生自主学习的自觉性和提高创新思维的主动性。

1 天基信息港任务调度模型

1.1 天基信息港任务调度问题描述

不同种类卫星传感器获得的数据之间可以互补,例如光学成像卫星可以直观获得目标的外观形状等特征,但易受天气的影响;SAR卫星工作时不易受到天气等因素的影响,可以全天时、全气候对地观测,但是成像不直观。多源信息融合任务通过一个处理节点汇集多维度遥感数据,提取出各种数据不同特征并进行融合,以获得较单个数据更为准确的综合信息。当用户提出了任务需求后,天基信息港根据任务目标的属性、传感器特性,选择合适的数据源卫星。天基信息港实现多源信息融合的工作流程如图1所示,主要分为3个步骤:1)各类遥感卫星将获取的数据通过星间链路传输给天基信息港;2)天基信息港的可重配置计算处理资源[17]对获取的遥感数据进行特征提取、融合处理,将融合处理的中间数据存储在星上;3)天基信息港将用户可直接所用的信息数据传输给地面或者近地空的单位。

图1 天基信息港的工作流程Fig.1 Workflow of space-based information port

数据融合方法包括像素层、特征层及决策层。天基信息港在对传输数据进行处理时需要最大程度保留目标的特征信息,减少无效数据传输,本文中的多源信息融合任务设为特征层的数据融合。在天基信息港上实现特征层的遥感数据融合的流程包括数据传输,数据预处理和特征提取3个步骤[3,5],其中数据预处理和特征提取可以合并为数据处理阶段,如图2所示。遥感数据处理是典型的数据密集型计算,通过星上可重配置计算机可以对获取的遥感数据进行处理。同时在天基信息港上可以存储多种处理算法,通过软件重配置技术进行调用以满足不同的任务需求[17]。

在不考虑分布式计算的情况下,天基信息港有多个天线资源和一个处理资源。考虑任务的高时效性[5],调度目标是在满足约束条件下,将任务合理安排到各个资源上,并分配任务的执行时间,最小化任务总的完成时间。

图2 多源信息融合任务流程Fig.2 Task flow of multi-source information fusion

鉴于天基信息港任务调度问题的复杂性,为了简化问题,提出以下假设:1)不考虑多个不同轨位天基信息港下的分布式计算任务,即所有的数据处理任务集中在单个天基信息港上。2)执行多源信息融合任务前,数据源卫星已经获取了融合处理所需数据,即所有子任务在同一时刻均可开始。

舟山海域隶属宁波舟山港区,地处长江经济带与沿海运输国际航道交汇点,江海联运业务繁忙,水文条件复杂。沿岸水域流速大,流态多样,局部存在涡流和切变流。

对于完全搜索算法而言,算法时间复杂度太高,算法运行时间太长,不满足天基信息港任务高实时性的要求,因此,启发式算法更适应于该问题。对于流水车间调度,经典的NEH算法性能[21]较优,但是天基信息港任务调度问题在第一阶段为并行机且有时间窗的约束,NEH算法不再适用于天基信息港任务调度问题。本文针对天基信息港任务调度问题,提出启发式的MCI算法。

李彬,张俊瑞,马晨(2013)通过对上市公司研发支出资本化的会计处理进行研究,发现其存在调节盈余管理行为,导致企业披露的会计信息缺乏谨慎性和真实性增强不谨慎性风险,建议证监会加大市场监督力度和年报审核的严格性,政府部门应对企业业务相关性做出约束并提高业务和会计处理相关性要求。

图3 多源信息融合的子任务调度流程Fig.3 Multi-source information fusion subtask scheduling

需要满足的约束条件:1)任务在数据传输阶段有可见时间窗约束,天基信息港位于同步轨道,低轨道的用户卫星与天基信息港的数据传输只能建立在双方的可见范围内,即数据传输任务在天线资源上的调度时间必须在可见时间窗内,如图3所示。2)天线资源设为激光终端,多个天线资源传输能力相同,即数据传输任务调度在任意天线上的时间相同,每个天线资源同一时刻最多只能执行一个数据传输任务,任务在执行期间不可中断。3)处理资源为单个星上可重配置计算机,同一时间最多只能执行一个数据处理任务,且任务不可中断。4)遥感数据需要先传输再进行处理,多源信息融合子任务的数据处理阶段需要在其数据传输阶段完成之后才能执行,如图3所示。5)军事或者灾害应急这类任务要求必须全部完成,即多源信息融合的所有子任务必须完成。

1.2 参数说明

对文中出现的相关参数符号进行定义,如表1所示。

表1 参数符号定义

1.3 数学模型

基于上述问题描述和参数定义,天基信息港任务调度的数学模型如下:

MinCmax=max(hj|j∈J)

s.t.

过程1) 根据解序列π得到每个天线上任务排序,并按m=1~|M|依次取出天线m上排序的任务。

(2)高程控制测量:利用水准点2S01、2S02为起算点,采用拓普康自动安平水准仪按附合水准方法测量A、B、C点高程,并作为土方现状地面高程起算点。

(1)

(2)

由表5和表6可以看出A、B、C三个影响因素中,影响因素顺序为A>C>B。由表5的均值结果分析,因素A的优劣顺序为3>2>1;因素B的优劣顺序为3>2>1;因素C的优劣顺序为3>1>2。最终选择以A3B3C3为最佳水提工艺条件,即加10倍量水,煎煮3次,每次煎煮1.5 h。

m∈M

(3)

(ta-hb)(tb-ha)≤0,∀a,b∈J,a≠b

夹持器各结构参数的优化结果如表5所示,对于不同的R值,各结构参数优化结果均相同。当R=35 mm时,在约束Dp作用下运动杆4、杆5无法贴合圆柱以致无法包络夹持,需舍弃。优化前后夹持器夹持力对比如表6所示。其中,Foe为优化后夹持器的总输出力,Fce为优化前夹持器的总输出力。表6显示,包络夹持模式下优化后夹持力提升幅度随R增大而减少,但不低于10%,总体优化效果明显。

(4)

在以上模型中,目标函数Cmax是问题的优化目标,要求完成所有子任务的时间尽可能短,即最小化多源数据融合的完成时间。其中,约束1)表示数据传输任务调度时间必须在天线资源和用户星的可见时间窗内;约束2)表示对于每个子任务,其数据处理阶段需要其数据传输阶段完成之后才能开始执行;约束3)表示每个天线资源上数据传输任务调度的时间段之间不会发生冲突,即一条天线链路同一时刻只能执行一个数据传输任务;约束4)表示处理资源上数据处理任务调度的时间段之间不会发生冲突,即一个处理资源同一时刻只能执行一个数据处理任务。天基信息港根据处理任务类型、计算能力和数据量可以得到数据处理任务的时间,同样,根据天线传输速率和数据量可以得到数据传输的时间。

女医生姓库,我们都管她叫库医生。库医生说,现在床位很紧张,只能给我们临时加张床。并且还亲自领我们去了病房。王姐则抓紧时机,聊起了我的病情,问:库医生,是不是像我妹夫这种情况不多见吧?库医生说:气管异物常有,像这么长时间的好像还没听说过。王姐又问:那像我妹夫这种情况咱院应该能做吧?库医生说:蒋院长既然敢收,就应该能做。

1.4 调度原理

举例8个任务的调度情况,任务的数据传输时间依次取15、10、18、20、11、17、15、13个单位,数据处理时间依次取6、2、4、2、4、7、6、5个单位,每个任务在数据传输阶段只能在时间窗内调度,如图4所示,虚块在坐标轴上的位置表示任务的时间窗,实块在坐标轴上长度表示数据传输时间。

图4 任务的时间窗Fig.4 Task time windows

图5 不同的调度结果Fig.5 Different scheduling results

图5(a)(b)分别表示随机调度和最优调度的结果。通过对比可知因为时间窗的约束,在随机调度过程中,任务5、3、4之前都有空闲的资源时间没有被利用,因而最后导致任务总的完成时间要大于最优调度的结果。一方面,时间窗导致任务在数据传输阶段产生的空闲时间是影响调度结果的因素,另一方面因为是两阶段调度问题,所以任务在数据处理阶段的空闲时间也是影响最终结果的一个因素。当获取最优解时,任务在数据处理阶段的空闲时间最小,所以任务在数据传输阶段调度顺序的不同也会导致数据处理阶段空闲时间的不同,调度目标也可以看做是最小化数据处理阶段的空闲时间。

根据任务调度模型的定义,天基信息港的多源信息融合任务调度可看为复杂的两阶段混合流水车间调度问题,第一阶段为并行机,第二阶段为单机。本问题与两阶段混合流水车间调度问题不同的是在第一阶段的每个任务具有不同的可用时间窗的约束,因为两阶段混合流水车间调度问题已经证明是强NP-hard问题[18],而带有时间窗约束的两阶段混合流水车间调度具有更高复杂度,所以天基信息港任务调度问题为强NP-hard问题。

2 任务调度算法设计

设计算法的基本思路是通过合理安排数据传输任务和数据处理任务的调度顺序、分配数据传输任务对应的天线资源,使得完成所有子任务的时间最小。对于第二阶段为单机且无时间窗约束的两阶段混合车间调度问题,已证明在给定第一阶段的各个任务调度时间下,将第二阶段的任务按第一阶段的任务的完成时间递增排序进行调度,可得到第二阶段的最优调度[18],即第一阶段数据传输任务调度方案会直接影响第二阶段数据处理任务的调度方案。另外,不同于有不可用时间段约束的流水车间调度问题[19-20],在第一阶段每个任务具有不同的时间窗约束,因此在调度过程中会产生多个空闲时间段,调度算法需要尽量减少空闲的时间段。

根据以上分析,天基信息港任务调度问题具体描述如下:一个多源信息融合任务包括多个遥感卫星数据处理的子任务,每个子任务具有数据传输阶段和数据处理阶段,卫星数据需要先传输到天基信息港再进行处理,因此每个子任务需要顺序调度在天基信息港的天线资源和处理资源上。

MCI算法首先利用在多个天线资源上循环插入的方法获得任务的解序列,当得到任务的解序列后,按照基于时间窗的解序列调度策略进行求解,可以得到具体的调度方案。考虑到任务的解序列要覆盖所有的解空间,解序列需要表示在每个天线资源上分配的数据传输任务及每个天线资源上数据传输任务的排列顺序,即解序列{m1=(jk,…,jk*),m2=(js,…,js*),m3=(jr,…,jr*)}表示分别在天线资源1、2、3上按顺序分配任务jk到jk*,js到js*,jr到jr*。

栗战书委员长在讲话中着重指出:“要加强生态环境、社会主义核心价值观、社会民生等重点领域地方立法,努力从法治上增强人民群众的获得感、幸福感、安全感。”可以说,这一“着重指出”,即是在提示我们从事地方立法工作的同志,只有通过深入学习贯彻习近平总书记关于以人民为中心的立法理念,始终坚持把惠民作为其价值取向,做到地方立法工作紧紧围绕同级党委决策部署的重点、经济社会发展的难点、人民群众关心的热点展开,才能最大限度地凝聚社会共识,让最广大的人民群众享受到最充分的地方立法之红利。

2.1 基于时间窗的解序列调度策略

解序列调度策略过程如下:

过程2) 遍历已调度时间段,并取当前时间窗和已调度时间段的交集得到可用时间段,如果当前时间窗下没有足够长度时间段进行调度,则根据轨道信息更新用户的下一个时间窗并重复步骤2,如图6所示。

图6 时间窗约束下任务调度示意Fig.6 Task scheduling under time window constraint

过程3) 当有可用时间段进行调度,选择该天线资源上最早可用时间段进行调度,并将该时间段更新到已调度的时间段中。

过程4) 如果所有任务没有调度完,转过程1),否则转过程5)。

步骤6) 得到所有任务循环结束后的最终解序列π,并得到目标值Cmax。

2.2 MCI算法

结合上文提出的解序列调度策略下MCI算法的具体步骤如下(算法流程如图7所示)。

真之本质的转变的第二重意义就是“哲学”变成了“形而上学”。Philosophia从对sophia[精通、智慧]的热爱变成了“超越”存在者之阴影而“走向”存在者之理念的“形而上学”。最高的理念,善的理念,作为第一原因和最高原因,也被柏拉图和亚里士多德称为to theion[神],因此探究存在者之存在的形而上学不仅是存在论,也是神学。[5]235-236形而上学的“存在-神学”机制在柏拉图那里的发端处就已被预定。

步骤4) 根据k=2~n依次取出序列σ第k个任务,将其插入到解序列上所有可能插入的位置形成k+|M|-1个解序列(如{(j1,j2),∅,…,∅},{(j2,j1), ∅,…,∅},{(j1),(j2),…,∅},…,{(j1),∅,…,(j2)}),并根据解序列的调度策略计算Cmax,取最小Cmax时的解序列π。

步骤3) 取序列σ第一个任务分配在天线资源1上,得到初始解序列γ={(j1),∅,…,∅}。

步骤5) 将解序列π作为下次循环的初始解序列。如果k=n,转步骤4),否则转步骤6)。

过程5) 更新完所有任务的数据传输任务时间段后,对所有数据传输任务完成时间进行升序排序,并按排序对数据处理任务进行顺序调度,更新数据处理资源所用时间。

1.加强税法宣传,执法公开透明。要贯彻落实“放管服”改革政策,又要防止执法风险,就要及时做好政策宣传,把各项“放管服”改革列出的取消和保留税务行政许可审批项目清单,通过门户网站、办税公告栏、办税电子触摸显示屏、税企微信群和QQ群等形式及时向社会公布,及时公开税收政策和办税流程,做到公开公平公正执法,增大税收执法透明度,自觉接受社会监督,进一步提高纳税遵从度。

MCI算法在NEH算法思想的基础上,扩展到在多个机器上循环插入,并且加入了基于时间窗的解序列调度策略,使得本算法可以适用于天基信息港任务调度问题。

图7 MCI算法流程Fig.7 MCI algorithm flow chart

3 仿真试验及分析

3.1 仿真场景

考虑天基信息港在高轨节点上提供服务,用低轨用户卫星和中继卫星模拟天基信息港的运行场景。天基信息港采用中继卫星(TDRS-8)的轨道参数,用户卫星选择现有的低轨卫星,包括NOAA[22],YAOGAN[23]等低轨卫星。调度目标要求所有任务必须完成,如果仿真中规划时间窗的长度不够可能导致调度失败,因此在仿真时规划了一天内的时间窗,结合仿真的天线数、任务数和数传时间,可以保证任务一定完成。仿真时段设为2017-05-13 00:00:00至2017-05-14 00:00:00,根据天基信息港和用户卫星的轨道参数,通过卫星仿真软件STK计算出各用户卫星与天基信息港在一天内的可见时间窗。假设天基信息港有3个天线资源和1个处理资源,每个天线资源分别提供一条激光通信链路。

多源信息融合任务的子任务数量分别取5,10,15,20,25,30,考虑未来激光通信链路的带宽通信速率可达到Gbit/s,激光链路的建立时间在分钟级以上,遥感数据量从吉比特到太比特不等,假设数据传输阶段调度时间取[5,20] min的均匀分布,数据处理时间取[5/σ,20/σ] min的均匀分布,其中σ表示通信传输与计算的时间比值,分别取3×3/2,3,3×2/3来仿真低、中、高不同计算密集程度的任务。另外所有子任务的到达时间相同且随机选择为一天的零时。

3.2 仿真结果与分析

分别采用MCI算法、遗传算法[24]和列表调度[18](Johnson List,JL)算法并结合本文的解序列调度策略进行仿真试验。遗传算法在组合优化问题方面有着广泛的应用,对解进行编码表示为个体,将多个个体组成种群,通过解码得到每个个体的适应度,对种群的不断进化使得种群朝最优解方向移动。遗传算法的编码方式参考文献[24],解码方式为本文的解序列调度策略,适应度为问题的优化目标,设置仿真的交叉率为1,变异率为0.4,种群规模为40个,迭代次数为60。JL算法采用Johnson规则对所有任务排序,并按照排序通过列表调度规则进行两阶段调度。对于每组数据取30次仿真试验的平均值,结果如图8所示。

图8 不同算法下的任务完成时间Fig.8 Task completion time under different algorithms

在图8中,可以看到当σ取3×3/2,3的情况下,MCI算法和遗传算法下实现的任务完成时间明显小于JL算法,当σ取3×2/3的情况下,MCI算法和遗传算法下实现的任务完成时间与JL算法相差不大,此时用时间复杂度和运行时间更小的JL算法效果较优。即对于计算密集程度不高的任务,采用MCI算法及遗传算法可以明显减少任务的完成时间;对于计算密集程度高的任务,算法性能则效果不太明显,这主要因为第二阶段任务调度时间较长会使得第二阶段空闲时间较小,从而减少了第一阶段调度策略的影响。MCI算法相比于JL算法平均可以减少10.8%的任务完成时间。

表2取了在σ=3的情况下,任务从5到30个,每组仿真30组,总共180组仿真试验的平均运行时间和平均任务完成时间。由表2可知,MCI算法在平均任务完成时间方面明显优于JL算法,略差于遗传算法,但是其平均算法运行时间大约为遗传算法的1/20,即远小于遗传算法的运行时间。

为了进一步验证算法的有效性,将各种算法与通过完全搜索算法得出的最优解进行比较。考虑到完全搜索算法的时间复杂度太高,在σ=3×3/2,子任务数量为8的情况下,得到5次仿真试验的平均运行时间和平均任务完成时间。

仿真结果如表3所示,在任务数较少的情况下,MCI算法非常接近于最优解,且优于JL算法。在运行时间方面,通过完全搜索算法得到最优解在运行时间方面是不可取的,相比较而言,MCI算法的运行时间仅仅略差于JL算法且优于遗传算法。

(1)让幼儿幸福快乐地生活。让幼儿愿意并喜欢参加活动,能够在活动中获得积极的情感体验和愉悦的心情;在活动中有充分的自由、时间和空间,能积极表达自己的愿望和意见;能够在活动中分享自己的快乐,倾诉自己的烦恼,尝试与同伴一起解决困难并获得成就感。

要从根本上解决地名检索中的地理空间的层次结构特性和地名表达的模糊性,就必须结合地名描述、地理空间、计算机、网络等相关知识和技术,从整体上进行把握,构建基于地名本体的语义网实现基于语义的地名检索服务[2]。

表2 算法的平均运行时间和任务完成时间(σ=3)

表3 各算法与最优解进行比较(σ=3×3/2)

安德雷·利夫威尔指出[10]:“译者不仅能给他所译的原文以再生生命,他们还能决定给原文以什么样的生命,及如何让原文融合在目的语文学中。也就是说,他们已创造了并确实创造了一个他们时代的以及他们的读者认可的原文形象。”在此过程中,一个显著的特点就是译者的“二次创作”。因此,译者毫无疑问地担纲着主体地位,起着决定性的作用。

4 结束语

本文首次针对天基信息港研究了多源信息融合任务调度问题。根据多源信息融合的两阶段任务流程、天基信息港的资源约束、用户卫星可见时间窗约束,建立了天基信息港的任务调度模型,并基于该模型提出了一种启发式的MCI算法。根据仿真结果可知,相比于JL算法和遗传算法,MCI算法能够有效减小任务的完成时间及算法运行时间,验证了算法可以快速实现调度方案。天基信息港将会提供给用户多样化的服务,因此如何将多种不同类型的业务应用于天基信息港,将是今后需要继续研究的重点。另外目前对天基信息港的资源建模还不完善,只考虑了单一的处理资源和存储资源模型,未来可以根据星上的实际情况细化相关的资源模型。

猜你喜欢

任务调度天基数据处理
基于生产函数的云计算QoS任务调度算法
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
基于动态能量感知的云计算任务调度模型
国外天基大气甲烷监测任务最新发展
天基物联网关键技术及应用前景
基于低频功率数据处理的负荷分解方法
无人机测绘数据处理关键技术及运用
基于改进QFD方法的天基海洋侦察监视体系能力需求重要度排序算法研究
美国天基空间监视系统概述与分析
高层建筑沉降监测数据处理中多元回归分析方法的应用研究