分销赏收藏举报申诉 / 8

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于多种群协同进化的多逃逸者围捕任务分配.pdf

基于多种群协同进化的多逃逸者围捕任务分配.pdf

上传人：自信****多点

文档编号：2261038

上传时间：2024-05-24

格式：PDF

页数：8

大小：1.65MB

《基于多种群协同进化的多逃逸者围捕任务分配.pdf》由会员分享，可在线阅读，更多相关《基于多种群协同进化的多逃逸者围捕任务分配.pdf（8页珍藏版）》请在咨信网上搜索。

1、收稿日期:2023-02-23摇摇摇摇摇摇修回日期:2023-06-27基金项目:安徽省重点研究与开发计划(202004d07020011,202104d07020001);中央高校基本科研业务费专项资金项目(PA2020GDKC0015,PA2021GDSK0073,PA2021GDSK0074)作者简介:高子璇(1998-),女,硕士研究生,研究方向为多智能体协作、多机器人系统等;通信作者:张国富(1979-),男,教授,研究方向为多智能体系统、联盟博弈、演化计算等。基于多种群协同进化的多逃逸者围捕任务分配高子璇1,张国富1,2,3,4,苏兆品1,2,3,4,李摇磊1(1.合

2、肥工业大学计算机与信息学院,安徽合肥 230601;2.大数据知识工程教育部重点实验室(合肥工业大学),安徽合肥 230601;3.智能互联系统安徽省实验室(合肥工业大学),安徽合肥 230009;4.工业安全应急技术安徽省重点实验室(合肥工业大学),安徽合肥 230601)摘摇要:群机器人逃逸围捕一直是人工智能和机器人领域的研究热点之一。在面向多逃逸者时,如何为每个逃逸者高效地分配合适的机器人以完成协同围捕是一个难点问题。已有研究大都采用距离优先分配的策略,为每个逃逸者选择离它最近的一组机器人进行围捕,在逃逸者数量较多的情况下,难以实现围捕任务的均衡分配,降低了系统围捕的效率。为

3、此,提出了一种基于多种群协同进化的多逃逸者围捕任务分配算法。首先,构建了一种全方向的群机器人逃逸围捕任务分配数学模型;然后,基于遗传算法和多种群协同进化提出了一种多逃逸者围捕任务分配算法,设计了相应的编码方式、交叉和变异策略;最后,在开发的群机器人逃逸围捕仿真平台上测试了算法的有效性。对比实验结果表明,所提算法在完成围捕任务所耗费的步数上最多降低了 20%,围捕效率最大提高了 25%。关键词:群机器人逃逸围捕;多逃逸者任务分配;遗传算法;多种群协同进化;静态障碍物避障中图分类号:TP18摇摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇文章编号:1673-629X(2023)1

4、2-0185-08doi:10.3969/j.issn.1673-629X.2023.12.026Task Allocation of Multi-escapee Roundup Based on Multi-populationCoevolutionGAO Zi-xuan1,ZHANG Guo-fu1,2,3,4,SU Zhao-pin1,2,3,4,LI Lei1(1.School of Computer Science and Information Engineering,Hefei University of Technology,Hefei 230601,China;2.Key L

5、aboratory of Knowledge Engineering with Big Data(Hefei University of Technology),Ministry of Education,Hefei 230601,China;3.Intelligent Interconnected Systems Laboratory of Anhui Province(Hefei University of Technology),Hefei 230009,China;4.Anhui Province Key Laboratory of Industry Safety and Emerge

6、ncy Technology(Hefei University of Technology),Hefei 230601,China)Abstract:Swarm robot escape roundup has been one of the research hotspots in the field of artificial intelligence and robotics.Whenfacing multiple escapees,it is a difficult problem to efficiently assign the appropriate robots to each

7、 escapee to complete collaborativeroundup.Most of the researches have adopted the distance-first allocation strategy to select the nearest group of robots for each escapee,which makes it difficult to achieve a balanced distribution of the fencing task when the number of escapee is large and reduces

8、theefficiency of system fencing.To this end,a multi-escapee roundup task allocation algorithm based on the co-evolution of multipleswarms is proposed.Firstly,an all-directional swarm robot escape roundup task assignment mathematical model is constructed,and thena multi-escapee roundup task assignmen

9、t algorithm is proposed based on genetic algorithm and multiple swarm co-evolution,and the cor鄄responding coding methods,crossover and variation strategies are designed.Finally,the effectiveness of the proposed algorithm is testedon the developed swarm robot escape roundup simulation platform.Compar

10、ative experimental results show that the proposed algorithmreduces the number of steps consumed in completing the roundup task by up to 20%and improves the roundup efficiency by up to 25%.第 33 卷摇第 12 期2023 年 12 月摇摇摇摇摇摇摇摇摇摇计算机技术与发展COMPUTER TECHNOLOGY AND DEVELOPMENT摇摇摇摇摇摇摇摇摇

11、摇Vol.33摇 No.12Dec.摇 2023Key words:swarm robot escape roundup;multi-escapee task allocation;genetic algorithm;multi-population coevolution;staticobstacle avoidance0摇引摇言随着机器人在军事、工业领域中的应用,机器人追逃问题1-2已成为人工智能和机器人领域中的研究热点之一,其研究类型主要分为对单逃逸者的追逃问题和对多逃逸者的追逃问题。自 Isaacs3为两个参与者制定追逃策略以来,对单追捕-单逃逸者之间的博弈进行了详细的研究。单追捕

12、-单逃逸者的情况是一个零和博弈,可以用著名的贝尔曼方程4的扩展来解决。Jia 等5提出用连续时间马尔可夫决策过程(CTMDP)来解决一个追击者和一个逃逸者的追逃问题中的不确定性。Pan 等6提出了一种基于区域的中继追击方案,在追捕的过程中可以更换主动追击者,来使追击时间缩短。Kokolakis 等7提出了一种基于关键强化学习(RL)的算法用于在线学习,并在有限时间内学习追击策略,从而实现对逃逸者的有限时间捕获。在多追捕-单逃逸者的追逃问题中,Lin 等8研究了一类线性二次多追捕-单逃逸者微分对策,逃逸者实施传统的反馈纳什策略,而追捕者基于最佳可实现性能指标的新概念实施纳什策略。Kumkov 等

13、9为对象组的冲突互动制定了特殊的公式和方法来解决对象太多时相位向量的维数很高时带来的困难。近年来,现代交互多智能体系统推动了对多追捕-多逃逸者追逃问题的研究,该研究涉及到围捕任务的分配,主要解决如何分配若干个机器人进行协同围捕逃逸者的问题。围捕机器人在障碍物环境下的实时移动大多采用人工势场法10等来确定。在多追捕-多逃逸者的追逃问题的研究中,Stipanovic 等11通过将水平集函数定义为玩家的目标来确定确保捕获或规避的条件,提供了一种在具有多个参与者的追逃游戏中设计保证捕获或保证规避策略的方法。胡俊和朱庆保12为围捕任务的分配设计了一种“协商分配法冶,李瑞珍13沿用了“协商分配法冶并应用于

14、全方位的围捕系统中,但并没有在逃逸机器人数量较多的情境下进行更深入的实验与研究。徐望宝等14-15提出了一种基于人工力矩的自组织围捕方法,并设计了一种围捕机器人吸引点基于局部信息的确定与调整方法;文献16提出了一种链阵方法,计算复杂度高,围捕团队数目可以不相同并且可以随时加入或退出,在围捕者改变围捕目标后,围捕效率不够理想。高晓阳17提出了一种分配原则,使围捕机器人依次选择离自己最近的围捕点,丧失了对所有机器人一视同仁的公平性。张红强等18提出了一种基于围捕者面对多目标中心方向 180 度范围内的两最近邻进行任务分配的分配方法,减少运动距离和能量消耗。Lopez 等19设计了一种规则,围捕者先

15、选择距离自己最近的围捕点,如果两个围捕者有相同的最接近的逃逸者,将距离最短的围捕者的目标更改为其第二个最近的逃逸者,可以解决任务分配冲突的问题。陈铭治和朱大奇20将每个围捕者到逃逸者的预估时间编为矩阵,根据围捕一个逃逸者所需围捕者的数目计算该逃逸者被围捕所需的最短总时间,围捕者优先围捕具有最小预估时间的逃逸者。需要指出的是,上述已有研究大都采用距离优先分配的策略,在逃逸者数量较多的情况下,难以实现围捕任务的均衡分配,降低了系统围捕的效率。为此,该文在总结和分析前人工作的基础上,构建了一种全方向的群机器人逃逸围捕任务分配数学模型,然后基于遗传算法和多种群协同进化提出了一种多逃逸者围捕任务分配算法

16、,设计了相应的编码方式、交叉和变异策略。最后,在开发的群机器人逃逸围捕仿真平台上测试了算法的有效性。1摇问题描述群机器人多逃逸者围捕问题设定在二维受限环境,有 m 个围捕机器人,用 Q=q1,q2,qm 表示;有n 个逃逸机器人,用 P=p1,p2,pn 表示。对每个逃逸机器人 pi(i=1,2,n),存在一个以逃逸者当前位置为中心,感知距离 r 为半径建立的安全域,如图 1所示。在安全域边界上设定 e 个均匀分布的围捕点,每个围捕点由一个围捕机器人完成,当该逃逸机器人周围的所有围捕点均被围捕机器人占领时,认为该逃逸机器人被围捕成功,所有逃逸机器人均被围捕成功时,停止追逃行为,判定群机器人围

17、捕系统围捕成功。图 1摇安全域及 Fk示意图将每一个逃逸机器人看作一个围捕任务,则共有n 个任务,设任务集为 S=S1,S2,Sn,由图 1 可知,每个任务由 e 个围捕者共同完成。则围捕点的集合为 Si1,Si2,Sie,即任务 Si对应围捕点集合681摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 33 卷Si1,Si2,Sie。假设围捕机器人 qk(k=1,2,m)所对应的围捕点为 Sij(i=1,2,n;j=1,2,e),qk到 Sij的距离Fk如图 1 所

18、示,并表示为公式 1。Fk=(xk-xij)2+(yk-yij)2(1)其中,(xk,yk),(xij,yij)分别为围捕机器人 qk和对应围捕点 Sij在地图中对应的坐标。2摇基于多种群协同进化的多逃逸者围捕任务分配策略求解该文设计了一种基于多种群协同进化遗传算法来求解群机器人多逃逸者围捕任务的分配问题。为了保持种群的多样性,先初始化生成 D 个不同的编码组合,在每个组合里再将任务集合 S 进行合适的分组,一组代表一个种群,通过多种群协同进化的方式得到最终的分配方案,算法流程如图 2 所示。多种群协同进化遗传算法的过程如下:(1)随机生成 D 个不同的编码组合,在这些组合里,任务集顺序保持

19、一致,围捕者集合的顺序随机生成。(2)将每一个组合中的编码按同样的分组方式对编码进行划分分组,来保持合适的编码长度。(3)分组后的每一组为一个独立的种群,每个种群同时进行各自的初始化和交叉、变异、选择等操作。(4)将每个种群选择的最优解按分组顺序进行组合,得到最终解。(5)每个组合均可得到一个最终解,再选择 D 个组合中的最优解作为文中算法所得到的分配方案。该分配方案的适应度函数值的大小即为本次算法最终得到的目标函数值。1L11LD图 2摇基于多种群协同进化的任务分配算法流程2.1摇个体编码在任务数量多的情况下,若不进行分组直接使用遗传算法,则会导致基因位长度过长,产生的效果很差。首先将任

20、务集合 S=S1,S2,Sn 进行分组,假设每一组最多有 w 个任务,则任务组数 L=腋nw骎,任务数量少的情况下不用进行分组,直接将这些任务设为一组,建立一个种群就足够,即可表示为:若任务数目 n w,且不是 w 的整数倍,则 n 对 w 取余,余数自为一组。第 h(h=1,2,L)组的个体编码如图3 所示,每一个编码表示种群中的一个个体。第一行表示任务Sha(a=1,2,w),第二行表示围捕者 qhb(b=1,2,ew)。1hq2hq3hq4hqheq()h ewq.1hShwS图 3摇第 h 组个体编码示意图Sha(a=1,2,w)为任务集 S 中按顺序排序分配到各组中的任务,qhb(

21、b=1,2,ew)为围捕者集合 Q中随机选取的不重复围捕者。所有组的任务组合起来为一个完整的任务集 S,所有组的围捕者组合起来为781摇第 12 期摇摇摇摇摇摇摇摇摇摇摇高子璇等:基于多种群协同进化的多逃逸者围捕任务分配一个完整的围捕者集合 Q,如公式 2 所示。胰h=1,2,LSh1,Sh2,Shw=S胰h=1,2,Lqh1,qh2,qhew=Q(2)每一组的任务和围捕者均不会重复,即对 L 组中任意的两组 h1和 h2,都有如下约束条件:坌h1,h2沂1,2,LSh11,Sh12,Sh1w 疑 Sh21,Sh22,Sh2w=堙坌h1,h2沂1,2,Lqh11,qh1

22、2,qh1ew 疑 qh21,qh22,qh2ew=堙(3)L 个种群相互独立,各自进行交叉变异选择的过程,互不干扰。2.2摇种群初始化为了保持种群个体多样性,首先生成 D 个不同的组合,其中第一行编码为任务集 S 的顺序排列,第二行编码为围捕者集合 Q 的随机乱序排列。将生成的长序列划分为 L 个任务组,一组代表一个种群,每个种群由第二行编码的染色体信息形成 Z 个不同的个体,表示围捕任务的第一行编码初始化后保持不变。2.3摇适应度函数围捕机器人完成全部围捕任务所耗费的步长往往由距离围捕点最远的围捕机器人所决定,对于群机器人多逃逸者围捕的任务而言,任务分配的目标是使该距离越小越好,因此设

23、定适应度函数 Fit 为该编码个体中 Fk的最大值。Fit=max(Fk),摇 k=1,2,ew(4)适应度函数越小,围捕效果越好,在选择过程中选择适应度函数值更小的个体来进行下一次的交叉和变异。2.4摇交叉算子如图 4 所示,对每一个种群中所有个体各进行下述操作:相邻两个父代个体两两为一组进行交叉,每个父代个体均选择头部作为交叉点;设定 Cr沂0,1 为交叉概率,c饮rand(0,1),若满足 c 臆 Cr,则在其中的一个父代个体中随机选中一段基因位,然后插入到另一个父代个体的头部,另一个父代个体也选择相同位置的相同长度的基因段进行相同的操作;按照所需的基因位长度 ew 从前到后对重复或多

24、余的基因进行剔除。在文中的编码方式下,每个个体的基因位都是唯一且不可随意缺失的,只可移动位置。仅用普通的交叉算法使两个父代个体相互交换产生新个体,会导致个体中基因位的缺失或重复,因此采用上述交叉模式既可以保证这一编码特性,又可为种群提供不同的基因位置组合。1q6q2q3q7q8q12q14q17q24q4q20q24q4q20q1q14q8q1q14q8q1q6q2q3q7q8q12q14q17q24q4q20q24q4q20q1q6q2q3q7q8q12q14q17q24q4q20q1q14q8q1q6q2q3q7q8q12q14q17q24q4q20q1q14q8q1q2q8q14q17q

25、24q4q20q6q2q8q14q17q24q4q20q7q12q3q3q7q12q14q1q6qABAABB图 4摇交叉示意图2.5摇变异算子对每个父代个体和交叉产生的子代个体进行变异操作。以个体 C 为例,Cu和 Cv分别表示个体 C 的第 u个和第 v 个基因位,u 为个体中除 v 以外的随机位置,Gr 饮 rand(0,1),g 沂 0,1 为变异概率。若满足g 臆Gr,则互换 Cu和 Cv:Cu=Cu,Cv=Cv摇g GrCu=Cv,Cv=Cu摇g 臆Gr(5)2.6摇选择操作将初始种群与交叉变异后的进化种群组合在一起,按照适应度函数值由小到大进行排序,选取 Z 个最佳个体组成

26、新的初始种群继续进化,达到所设定的迭代次数 G 时停止进化。这样,每一代都保留了种群中的优良个体,促使种群持续探索更好的解。3摇机器人围捕方法和仿真平台3.1摇围捕方法机器人围捕过程如下:step1:构建围捕地图环境,随机生成障碍物和各机器人,相互之间不重合,并获取位置坐标。step2:根据逃逸者的坐标生成期望围捕点。step3:用多种群协同进化遗传算法选择最优任务分配策略。step4:各围捕机器人通过人工势场法确定运动方向。step5:每行走一步,更新各机器人位置信息。step6:判断所有围捕机器人是否到达对应的围捕点,若是,则围捕成功,围捕结束;若否,则继续进行围捕。3.2摇仿真平台

27、基于 Java 语言在 Windows 10 环境下开发了一个群机器人多逃逸者围捕仿真平台,如图 5 所示。所有881摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 33 卷机器人在二维平面内运动,撞到边界则更换运动方向,目标机器人的运动方向设为随机。目标安全域半径 r设为 20,设定 6 个围捕机器人围捕 1 个逃逸机器人。在受限的地图环境中,因为逃逸者永远逃离不出地图边界,因此将围捕者速度设为和逃逸者速度相等,设置所有机器人的运动步长 t 为 4。在设定好机器人的

28、初始位置和障碍物的位置后,打开仿真平台会在界面上显示每个个体的位置,其中小圆形表示围捕者,小三角形表示逃逸者,障碍物用大圆形和大三角形表示。然后各机器人开始运动,待围捕完成时,整个平台所有个体暂停运动,结束围捕。以 8 个逃逸者为例,来演示仿真平台从初始化生成到全部围捕任务结束的过程,即 n=8,m=48。障碍物个数设为 10,随机生成在地图中,并不与机器人位置重合。其中圆形障碍物 5 个,三角形障碍物 5 个。当所有逃逸机器人均被围住时,所有机器人才停止运动,围捕结束,围捕过程如图 5 所示。图 5摇仿真平台中围捕过程示意图4摇仿真实验与分析为了验证所提算法的有效性,结合第三节中的仿真平

29、台,首先给出初始参数设置,然后对比分析所提算法在目标函数上的优势,最后将设计的多种群协同优化遗传算法与算法 1 和算法 2 进行深入的对比分析。4.1摇参数设置对于多种群协同优化算法而言,不同参数的选取对其效果有着至关重要的影响。选取逃逸者数量 n 为16,且每组实验都保证除所要探求的参数不同,其他完全相同,每组均做 30 组实验求取目标函数平均值。表1 表示每组任务数 w、种群个体数 Z 和初始化时生成的编码组合数 D 对实验结果的影响,表 2 表示交叉概率 Cr、变异概率 Gr 对实验结果的影响。种群个体数和编码组合数过多也会增加算法计算量和复杂度,综合考虑,每组的任务数目 w 设为 4

30、,种群个体数 Z 设为100,编码组合数 D 设为10,交叉概率Cr 设为 0.9,变异概率 Gr 设为 0.3 较为合适。表 1摇不同参数下的目标函数均值w目标函数值Z目标函数值D目标函数值2793.5625799.612726.084675.9550710.644676.526837.8775689.066669.578723.61100681.698665.3710804.95125684.1410647.3012804.07150681.6112646.4214889.87175683.5414642.24981摇第 12 期摇摇摇摇摇摇摇摇摇摇摇高子璇等:基

31、于多种群协同进化的多逃逸者围捕任务分配表 2摇不同交叉、变异概率下的目标函数均值Cr=0.8Cr=0.85Cr=0.9Cr=0.95Gr=0.40713.69694.40683.03704.38Gr=0.35664.03653.92654.27670.80Gr=0.30652.34644.41640.93662.79Gr=0.25659.98658.52676.39662.12Gr=0.20694.90701.41678.42703.79摇摇图 6 表示在逃逸者数量 n 为 16 时,执行一次多种群协同优化算法的收敛曲线,在迭代次数达到 200 时算法进入非常稳定的状态,因此将遗传算法的

32、最大迭代次数 G 设为 200。图 6摇收敛曲线4.2摇目标函数对比为了保证实验的合理性,在不同的逃逸机器人数量下,分别做 10 组不同的机器人初始坐标下的实验,记录目标函数的值,每组记录 30 组数据,比较 3 种算法的效果。表 3 给出了 3 种算法在不同测试实例下的目标函数值(均值依标准差)。表 3摇不同分配算法下的目标函数值(均值依标准差)逃逸者数目 n算法 1算法 2文中算法2587.23 依 103.91687.51 依 170.79577.20 依 103.044838.93 依 69.02806.20 依 74.64607.67 依 42.816789.68 依

33、39.71695.18 依 74.19691.18 依 56.028826.45 依 68.31958.48 依 117.01625.71 依 37.0210803.17 依 41.69992.52 依 95.16691.94 依 26.1612856.95 依 53.371 056.17 依 93.88672.08 依 21.5014769.92 依 45.59981.37 依 52.48698.99 依 20.8716788.59 依 53.78986.82 依 85.05682.59 依 18.6618772.80 依 38.08995.55 依 57.91686.20 依 11.03摇

34、摇可以看出,在不同逃逸者数量的 9 个实例上,文中算法相比其他算法均获得了更小的目标函数值,可见文中算法能极大地缩短围捕机器人到对应围捕点的移动距离。标准差的大小随着 n 的增加逐渐降低,是因为随着逃逸者数目的增加,在有限的地图环境里各个机器人的分布逐渐密集,在每个区域内的机器人数量逐渐均衡,每种算法对不同初始坐标下的机器人所产生的目标函数越来越接近。算法 2 整体差于算法 1 与文中算法,在逃逸机器人数量为 2 时,算法 1 与文中算法形成的分配策略的目标函数差异不明显。随着 n 的增加,文中算法的优势逐渐体现出来,在逃逸者数目较多的情况下,文中算法能生成一个更优的分配策略,其对应的目标

35、函数值相比于其他两个算法均较小。4.3摇围捕步数对比以捕获所有逃逸者时围捕者的移动步数为指标,对于组建追捕团队采取文中算法和算法 1、算法 2 来测试 3 种策略对围捕结果的影响。4.3.1摇障碍物对围捕步数的影响设置逃逸者数量为 8,进行两组实验,一组是固定障碍物数量为 10,在障碍物位置越来越拥堵的情况下进行 10 次实验,结果如图 7(a)所示;另一组是障碍物数量从 6 增加到16,进行10 次实验,结果如图 7(b)所示。每次实验的围捕步数由 30 次不同机器人初始坐标下的实验结果取均值来获得。图 7摇障碍物对围捕步数的影响实验结果表明,在障碍物更拥堵的情况下,在某些091摇摇

36、摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 33 卷机器人行走到该障碍物区域时,机器人的避障行为增多,机器人移动的步数会略微增加,但障碍物的位置对实验结果并不会造成很大的影响,文中算法仍占优势。随着障碍物数量的增加,3 种算法下围捕机器人的移动步数均会略微增加,是因为障碍物数量越多,机器人进行的绕行就越多,会增加机器人的移动步数。4.3.2摇不同逃逸者数量下的围捕步数对比对不同逃逸者数量 n,在相同障碍物数量和位置下,采取人工势场法10避障,分别做 10 组不同机器人

37、初始坐标下的围捕实验,每组运行 30 次求均值,记录围捕机器人的最大移动步数。图 8 给出了对应的结果。图 8摇采用人工势场法,不同测试实例下的围捕步数摇摇文中算法在逃逸者数量从 4 增加到 14 的情况下,能够有效缩短围捕机器人系统的最大围捕步数。算法1 和算法 2 在本质上都是一种贪婪算法,其主要通过最小化围捕机器人与目标的距离来实现分配。贪婪行为机制使其行为选择是为了使自己的利益获得最大,团队成员之间没有协作,这样形成的分配策略非常不均衡。文中的任务分配策略通过遗传算法综合判断和选择不同团队可能性,形成合理的追捕团队,并考虑团队成员之间相互协调,提高捕获效率。相比算法 1 和算法

38、2,文中算法考虑了团队协作,避免了分配策略不均衡导致整体围捕效率降低的问题,表现更优。以上仿真实验证明,文中算法在不同初始化环境和不同障碍物势态下均有优势,完成同样的围捕任务下,与算法 1 相比围捕步数差最高可达约 60 步,与算法 2 相比围捕步数差最高可达约 90 步,有效地提高了围捕效率。在完成围捕任务所耗费的步数上比算法 1最多降低了约 15%,围捕效率最大提高了约 18%;比算法 2 最多降低了约 20%,围捕效率最大提高了约 25%。5摇结束语该文研究群机器人协同围捕多逃逸者问题,提出191摇第 12 期摇摇摇摇摇摇摇摇摇摇摇高子璇等:基于多种群协同进化的

39、多逃逸者围捕任务分配了一种基于多种群协同进化的多逃逸者围捕任务分配算法,根据该算法对目标函数进行优化,在理论上通过计算目标函数值来证明该算法的有效性,在仿真实验中通过对围捕步数的比较证明该算法的可行性,并在不同的仿真环境中进行实验,证明该算法的通用性。该算法实现了围捕任务的均衡分配,提高了整个群机器人围捕系统的围捕效率。在今后的研究工作中,如果障碍物不是静止而是处于运动状态,该如何避障进行路径规划,这将是下一步研究的重点内容。参考文献:1摇 ZENG X,YANG L,ZHU Y,et al.Comparison of two opti鄄mal guidance methods for the

40、 long-distance orbital pursuit-evasion gameJ.IEEE Transactions on Aerospace and E鄄lectronic Systems,2020,57(1):521-539.2摇 JAGAT A,SINCLAIR A J.Nonlinear control for spacecraftpursuit-evasion game using the state-dependent Riccati e鄄quation methodJ.IEEE Transactions on Aerospace and E鄄lectronic Syste

41、ms,2017,53(6):3032-3042.3摇ISAACS R.Differential games:a mathematical theory withapplications to warfare and pursuit,control and optimizationM.Hoboken:J.Wiley and Sons,1999.4摇PARRAS J,DEL V J,ZAZO S,et al.A new approach forsolving anti-jamming games in stochastic scenarios as pursuit-evasion gamesC/2

42、016 IEEE statistical signal processingworkshop(SSP).Palma de Mallorca:IEEE,2016:1-5.5摇 JIA S,WANG X,SHEN L.A continuous-time Markov deci鄄sion process-based method with application in a pursuit-eva鄄sion exampleJ.IEEE Transactions on Systems,Man,andCybernetics:Systems,2015,46(9):1215-1225.6摇 PAN T,YUA

43、N Y.A region-based relay pursuit scheme for apursuit evasion game with a single evader and multiplepursuersJ.IEEE Transactions on Systems,Man,and Cy鄄bernetics:Systems,2022,53(3):1958-1969.7摇 KOKOLAKIS N M T,VAMVOUDAKIS K G.Safety-awarepursuit-evasion games in unknown environments usinggaussian proce

44、sses and finite-time convergent reinforcementlearning J.IEEE Transactions on Neural Networks andLearning Systems,2022,33:1-14.8摇 LIN W,QU Z,SIMAAN M A.Nash strategies for pursuit-e鄄vasion differential games involving limited observationsJ.IEEE Transactions on Aerospace and Electronic Systems,2015,51

45、(2):1347-1356.9 摇KUMKOV S S,LEM魪NEC S,PATSKO V S.Zero-sumpursuit-evasion differential games with many objects:surveyof publicationsJ.Dynamic Games and Applications,2017,7:609-633.10 LI Y,TIAN B,YANG Y,et al.Path planning of robot basedon artificial potential field methodC/2022 IEEE 6th in鄄formation

46、technology and mechatronics engineering confer鄄ence(ITOEC).Chongqing:IEEE,2022:91-94.11 STIPANOVIC D M,MELIKYAN A,HOVAKIMYAN N.Guaranteed strategies for nonlinear multi-player pursuit-eva鄄sion gamesJ.International Game Theory Review,2010,12(1):1-17.12 胡摇俊,朱庆保.基于动态预测目标轨迹和围捕点的多机器人围捕算法J.电子学报,2011,39(1

47、1):2480-2485.13 李瑞珍,杨惠珍,萧丛杉.基于动态围捕点的多机器人协同策略J.控制工程,2019,26(3):510-514.14 徐望宝,祝超超,荣根熙.群机器人围捕多个入侵者的人工力矩方法J.控制工程,2021,28(1):99-105.15 徐望宝,陈雪波.一种基于人工力矩的动态队形控制方法J.控制理论与应用,2009,26(11):1232-1238.16 徐望宝,孙明炎.群机器人自组织围捕多个入侵者的链阵方法J.控制理论与应用,2023,40(1):94-102.17 高晓阳.基于改进人工势场法的自主机器人动态避障研究D.郑州:郑州大学,2020.18 张红强,吴亮红,

48、周摇游,等.复杂环境下群机器人自组织协同多目标围捕J.控制理论与应用,2020,37(5):1054-1062.19 LOPEZ V G,LEWIS F L,WAN Y,et al.Solutions for mul鄄tiagent pursuit-evasion games on communication graphs:fi鄄nite-time capture and asymptotic behaviorsJ.IEEE Trans鄄actions on Automatic Control,2019,65(5):1911-1923.20 陈铭治,朱大奇.FMM 与改进 GBNN 模型相结合的多AUV 实时围捕算法J.控制与决策,2020,35(12):2845-2854.291摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第 33 卷

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于多种协同进化逃逸围捕任务分配

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。