APP下载

基于动态联盟的多Agent系统神经网络构架设计

2018-01-24

移动信息 2017年8期
关键词:盟主构架动态

王 琨

南京模拟技术研究所,江苏 南京 210000

引言

神经网络的泛化能力,即训练后的神经网络对测试样本或工作样本做出的正确反应的能力,是神经网络最重要的性能。对于不同类型的测试样本或工作样本,若是要训练出一个具有广泛适应能力的神经网络,必然会造成部分资源的浪费,所以如何设计出满足要求并消耗较少资源的神经网络,是当前神经网络领域研究的热点之一。

Agent的概念出现于 20世纪 70年代的人工智能(AI,Artificial Intelligence)中,80年代后期才成长起来。多Agent系统(MAS,Multi-Agent Systems)是指一些 Agent通过自主协作完成某些任务或实现某些目标的大型系统。MAS作为Agent相关技术的主要发展方向,在目前的广泛应用中受到了极大的关注和重视。MAS指的是由多个能力知识有限且状态不同的Agent所组成的Agent系统。这些成员Agent在一个大目标的驱使下,相互合作、相互服务,共同完成一个任务。其中,每个Agent都是完全独立自治的,不会干扰或影响其他Agent的目标及行为。

本文通过将动态联盟的 Agent系统设计原理引入神经网络的结构设计中,提出了基于动态联盟的多Agent系统的神经网络结构设计构架。该构架能够根据任务目标需求自适应动态更新神经网络的结构,并根据资源分配方式将神经网络分解成一些子神经网络,从而提高神经网络的适应性及优化资源使用率。

1 联盟式多Agent系统原理

单个 Agent由于本身知识和计算资源的有限性,导致其智能性受到限制。多个Agent组成的MAS是一个多Agent系统。多Agent系统成员之间通过相互协同、相互服务一起完成共同的任务,其中各 Agent系统成员的活动都具有完全的独立性和自治性,即其自身的行为和目标不会受到系统中其它成员的影响,MAS可以通过协商等方式处理各 Agent成员在目标和行为上的冲突和矛盾[1]。多个Agent间通过形成联盟来执行单个 Agent无法完成的任务,能够提高任务完成的成功率和执行的效率。在基于动态联盟的Agent系统中每一个 Agent单元都是可以通过触发事件成为联盟主导者的动态联盟发起者;而当任务完成后,联盟解散时每一个联盟发起者又会变成一个普通的Agent单元。正是通过这种以完成任务为目的、以临时结盟为方式的动态解决任务过程,使得系统拥有了更加有效的任务解决能力[2]。

基于联盟式的多Agent系统结构如图1所示,是在完全集中式与完全分布式的基础上形成的。每个联盟内部都是完全集中式,而联盟彼此之间的关系为完全分布式。假设表示多Agent系统的Agent集合,每个Agent所拥有的资源为,其中k表示系统资源的种类,表示Agent所拥有的第l种资源数量。为系统中待分配的任务集,表示任务分别对 k中资源的需求。联盟C的成员Agent所拥有的第l项资源的总和为,若对于任意满足,则联盟划分满足要求。

图1 基于联盟式的多Agent系统结构示意图

2 基于动态联盟的多 Agent系统神经网络构架设计

动态联盟的组成包括联盟盟主(Head of the Coalition,HC)和联盟盟员(Member of the Coalition,MC)两种成员角色。通常,盟主是唯一存在的,而多个盟员与唯一盟主相连。图 2给出了动态联盟的组成结构,M为联盟盟主,A、B、C、D为联盟成员,所有联盟成员都在盟主周围由盟主主导对相应事件做出响应。盟主在整个联盟中扮演着核心的角色,负责任务的分解、分配和成员的控制管理,还会对完成的任务信息进行融合和记录。盟员只是简单地接收任务、执行任务、提交结果。动态联盟的生命周期长短根据事件和任务的需求而定,联盟是由于事件或任务的出现而产生的,联盟的解散也是在任务被完成之后。动态联盟的生命周期包括了准备期、建立期、工作期和解散期。联盟的建立期和工作期是整个工作流程的核心运作时期,包含了盟主与盟员之间的大量通信协作。

图2 动态联盟结构示意图

多Agent系统神经网络构架如图3所示。在数据训练过程中,汇聚单元会监测数据的类型,盟主选择策略会对盟主的身份进行确定,接下来盟主会根据全局子网络节点的配置信息选择合适能力与数量的Agent子网络形成相关的联盟组织。联盟形成后根据数据类型以及相关子网络映射关系将相关数据发送给盟员节点,盟员节点获取数据并完成处理后传送给盟主节点,盟主节点在接收的各盟员节点信息后进行相关的数据融合、滤波分析、目标预测等处理最终将结果进行反馈。随着数据类型的变化,开始的联盟逐渐变得不再合适,这时会根据全局信息进行盟主的移位和新联盟的确认,整个流程是一个盟主确认、联盟组建、盟主移位、联盟再组建的循环过程,只有达到终止条件整个过程才会结束[3]。动态的联盟工作模式保证了子网络资源的有效利用。

图3 多Agent系统神经网络构架示意图

各子网络作为 Agent成员,对能够表征研究对象全部特征的训练样本进行训练,通过训练在各子网络内配置好隐节点。对于作为汇聚单元的子网络,根据各类训练样本训练得到各种联盟类型,从而根据输入数据的特征对子网络组成的联盟形式进行调整[4]。在训练相关子网络时,其他不相关子网络处于休眠状态,从而可以减小网络规模,提高训练速度,增添网络试试建模能力。动态联盟训练流程如图4所示。

图4 动态联盟训练流程示意图

3 结论

本文提出了基于动态联盟的多 Agent系统神经网络构架,该构架能够根据任务目标需求自适应动态更新神经网络的结构,并根据资源分配方式将神经网络分解成一些子神经网络,从而提高神经网络的适应性及优化资源使用率。

[1]何炎祥.Agent和多 Agent系统的设计与应用[M].武汉:武汉大学出版社,2001.

[2]施华传.多Agent系统中Agents联盟问题研究[D].合肥:合肥工业大学,2003.

[3]马巧云.基于多Agent系统的动态任务分配研究[D].武汉:华中科技大学,2006.

[4]孙家民.基于多Agent系统的网络协同控制研究[D].沈阳:沈阳理工大学,2017.

猜你喜欢

盟主构架动态
国内动态
碎石神掌
国内动态
国内动态
构架云中《金桥》 打造强势期刊
建筑安装造价控制核心要点构架
动态
大话三国志
高可靠全平台ICT超融合云构架的设计与实现
略论意象间的主体构架