基于强化学习的通信受限环境多无人机协同策略|程进;胡寒栋;江业帆;张一博;丁季时雨|航天防务智能系统与技术科研重点实验室,北京 100144 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于强化学习的通信受限环境多无人机协同策略

文献摘要：

随着人工智能技术的发展,空域无人作战正由"单平台遥控"向"多平台协同"转变.多无人机协同作战任务具有非完全信息、通信受限、高实时、强动态等特点,给协同决策生成带来巨大挑战.针对通信受限环境中的多无人机协同决策问题,提出一种基于动态层级网络通信架构的通信强化学习协同策略,该策略能够显著减少无人机集群间的通信次数,同时准确传递其决策需要的信息,从而得到较优协同策略.针对多无人机协同围捕的典型任务场景,基于OpenAI平台对所提出的算法进行了仿真验证.结果表明,与传统强化学习算法相比,提出的通信强化学习策略可以显著减少无人机间的通信次数,同时在一定程度上避免潜在的信息欺骗问题.完成任务需要的平均通信次数相比于传统两两通信结构减少约77％,为实现通信受限环境中的多无人机协同任务提供技术支撑.

文献关键词：

强化学习;通信受限;无人系统集群;多智能体协同;人工智能

中图分类号：

[1] 航空、航天（V） / 航空（V2） / 各类型航空器（V27） / 无人驾驶飞机（V279）

[2] 无线电电子学、电信技术（TN） / 无线通信（TN92） / 波导通信、毫米波通信（TN928） / 移动通信（TN929.5）

[3] 无线电电子学、电信技术（TN） / 无线通信（TN92）

作者姓名：

程进;胡寒栋;江业帆;张一博;丁季时雨

作者机构：

航天科工集团智能科技研究院有限公司,北京 100144;航天防务智能系统与技术科研重点实验室,北京 100144;中国航天科工集团第二研究院,北京 100854

文献出处：

无人系统技术

引用格式：

[1]程进;胡寒栋;江业帆;张一博;丁季时雨-.基于强化学习的通信受限环境多无人机协同策略)[J].无人系统技术,2022(05):12-20

A类：

B类：

通信受限,受限环境,多无人机协同,协同策略,空域,无人作战,遥控,多平台协同,协同作战,作战任务,全信息,高实时,人机协同决策,决策问题,网络通信,通信架构,无人机集群,协同围捕,典型任务,任务场景,OpenAI,仿真验证,强化学习算法,学习策略,欺骗,完成任务,两通,通信结构,协同任务,无人系统集群,多智能体协同

AB值：

0.354136

相似文献

非死锁合同网协议驱动的多机分布式时序任务分配

曹严;龙腾;孙景亮;徐广通-北京理工大学宇航学院,北京100081;飞行器动力学与控制教育部重点实验室,北京100081;清华大学精密仪器系,北京100084

基于自适应变异遗传算法的多无人机航迹协同

张劼;李宁洲;张晓娟;卫晓娟-西京学院理学院,西安 710123;上海应用技术大学,上海 201418

带定位误差约束的多无人机快速协同航迹规划

顾伟;吴靖;李晟;赵啸宇-中国人民解放军第31113部队,江苏南京210018;军事科学院国防科技创新研究院,北京100091

基于信息共享的低能耗多无人机协同侦察方法

刘泽原;赵文栋;李艾静;刘存涛-陆军工程大学通信工程学院,江苏南京210000

基于对局迭代的无人机空战博弈研究