典型文献
基于深度强化学习的无人艇集群博弈对抗
文献摘要:
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究.建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏.仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕.研究成果可为无人艇集群博弈对抗演练提供参考.
文献关键词:
无人艇集群;博弈对抗;深度强化学习;协同围捕
中图分类号:
作者姓名:
苏震;张钊;陈聪;刘殿勇;梁霄
作者机构:
珠海云洲智能科技股份有限公司 工业发展部,广东 珠海 519080;大连海事大学 船舶与海洋工程学院,辽宁 大连 116026
文献出处:
引用格式:
[1]苏震;张钊;陈聪;刘殿勇;梁霄-.基于深度强化学习的无人艇集群博弈对抗)[J].兵器装备工程学报,2022(09):9-14
A类:
B类:
深度强化学习,无人艇集群,博弈对抗,动态博弈,协同围捕,决策研究,受距,对角,环境模型,策略网络,双评价,强化学习方法,解围,围捕策略,足协,基于距离,设计引导,奖励函数,红方,蓝方,演练
AB值:
0.30671
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。