基于深度强化学习的无人艇集群博弈对抗|苏震;张钊;陈聪;刘殿勇;梁霄|大连海事大学船舶与海洋工程学院,辽宁大连 116026 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于深度强化学习的无人艇集群博弈对抗

文献摘要：

开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究.建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏.仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕.研究成果可为无人艇集群博弈对抗演练提供参考.

文献关键词：

无人艇集群;博弈对抗;深度强化学习;协同围捕

中图分类号：

[1] 航空、航天（V） / 航空（V2） / 各类型航空器（V27） / 无人驾驶飞机（V279）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

作者姓名：

苏震;张钊;陈聪;刘殿勇;梁霄

作者机构：

珠海云洲智能科技股份有限公司工业发展部,广东珠海 519080;大连海事大学船舶与海洋工程学院,辽宁大连 116026

文献出处：

兵器装备工程学报

引用格式：

[1]苏震;张钊;陈聪;刘殿勇;梁霄-.基于深度强化学习的无人艇集群博弈对抗)[J].兵器装备工程学报,2022(09):9-14

A类：

B类：

深度强化学习,无人艇集群,博弈对抗,动态博弈,协同围捕,决策研究,受距,对角,环境模型,策略网络,双评价,强化学习方法,解围,围捕策略,足协,基于距离,设计引导,奖励函数,红方,蓝方,演练

AB值：

0.30671

相似文献

利用强化学习开展比例导引律的导航比设计

李庆波;李芳;董瑞星;樊瑞山;谢文龙-上海机电工程研究所, 上海201109

基于共识主动性的群体机器人目标搜索与围捕

范衠;孙福赞;马培立;李文姬;石泽;王诏君;朱贵杰;李恪;辛斌-汕头大学电子系,广东,汕头 515063;汕头大学广东省数字信号与图像处理技术重点实验室,广东,汕头 515063;北京理工大学自动化学院,北京 100081;复杂系统智能控制与决策国家重点实验室,北京 100081

面向多目标参数整定的协同深度强化学习方法

罗森林;魏继勋;刘晓双;潘丽敏-北京理工大学信息与电子学院, 北京 100081

适用于无人机集群应急通信系统分簇路由协议

钟剑峰;王红军-国防科技大学电子对抗学院,合肥 230037

近海威胁目标威胁度评估与无人艇兵力分配

陈兴乐;黄炎焱;陈天德-南京理工大学自动化学院,南京 210094

基于量子粒子群优化的无人机攻防博弈决策

刘佳敏;吴庆宪;王玉惠;周大可-南京航空航天大学自动化学院,南京 211106

基于深度强化学习的体系设计空间探索方法

陈涛;林萌龙;陈洪辉;张萌萌-国防科技大学信息系统工程重点实验室,长沙 410073

面向无人艇雷达图像的连通区域标记改进算法

潘选任;王冬姣;叶家玮-华南理工大学土木与交通学院, 广东广州, 510640

基于神经网络状态估计器的高速AUV强化学习控制

郭可建;林晓波;郝程鹏;侯朝焕-中国科学院大学集成电路学院, 北京, 100049;中国科学院声学研究所, 北京, 100190

基于博弈论的无人艇探查策略研究

郭苗;徐琰锋;陈铢蕾-上海船舶电子设备研究所,上海,201108

水面无人艇系统架构设计与构建

韩玮;冯伟强;骆福宇-中国船舶集团有限公司系统工程研究院,北京 100094;中国人民解放军 92942 部队,北京 100000

基于改进粒子群算法的水面无人艇全局路径规划

林法君;李焰-海参军事训练中心北京 100036;海军工程大学兵器工程学院武汉 430000

基于高频算法的舰艇RCS仿真与特性分析

何昊天;吴玲;卢发兴-海军工程大学兵器工程学院武汉 430033

基于免疫遗传算法的无人艇任务分配研究

胡红波;曹璐-海装武汉局驻宜昌地区军事代表室宜昌 443003;中国船舶重工集团有限公司第七一〇研究所宜昌 443003

基于强化学习提升双GNSS测向精度方法研究

刘佳铭;段静玄;张学良;林静-海装上海局驻上海地区第五代表室上海 200135;中国舰船研究设计中心武汉 430064

无人艇避碰技术研究综述

姜登耀;苑明哲;刘继海;段勇-沈阳工业大学信息科学与工程学院沈阳 110870;广州工业智能研究院广州 510000;广州工业智能研究院院士专家工作站广州 510000

无人水下航行器编队控制研究现状及技术综述

杨洋;王征;胡致远;尹洋-海军工程大学电气工程学院武汉 430033

世界无人艇技术研发动态与作战使用分析

李伟;徐轩彬;郑振宇-海军大连舰艇学院大连 116018

基于IMM-PPO的无人机机动目标追踪

成旭明;丛玉华;欧阳权;王志胜-南京航空航天大学自动化学院,南京 210016

基于强化学习的无人机智能任务分配方法

费陈;郑晗;赵亮-武警士官学校基础部,杭州 311400

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。