典型文献
无人机空战的竞争与双重深度强化学习机动对抗决策
文献摘要:
针对一对一无人机(unmanned aerial vehicle,UAV)空战格斗问题,提出了一种基于竞争与双重深度强化学习的机动对抗方法.建立UAV的状态转移机制和态势奖励模型,将空战态势分为4种基本类型,根据贝叶斯推理计算4种态势的概率,动态地选择不同的权重.在竞争深度Q网络(dueling-DQN)算法和双重深度Q学习网络(double-DQN)算法的基础上结合两者的优点,将网络的输出分为价值函数和优势函数两部分,并通过"双重网络"解耦动作的选择与价值的评估,提出dueling-double-DQN(DDDQN)算法,作为UAV的决策核心,提高了算法的收敛性,改善了Q值被过高估计的问题.仿真结果表明所提出的决策方法的有效性.
文献关键词:
无人机;空战决策;强化学习;竞争与双重网络
中图分类号:
作者姓名:
欧洋;徐扬;张金鹏;罗德林
作者机构:
厦门大学航空航天学院,福建 厦门 361102;西北工业大学民航学院,陕西 西安 710072;西北工业大学太仓长三角研究院,江苏 苏州 215400;中国空空导弹研究院,航空制导武器航空科技重点实验室,河南 洛阳 471009
文献出处:
引用格式:
[1]欧洋;徐扬;张金鹏;罗德林-.无人机空战的竞争与双重深度强化学习机动对抗决策)[J].厦门大学学报(自然科学版),2022(06):975-985
A类:
DDDQN,竞争与双重网络
B类:
深度强化学习,学习机,一对一,unmanned,aerial,vehicle,UAV,格斗,状态转移,转移机制,基本类型,贝叶斯推理,dueling,学习网络,double,价值函数,优势函数,解耦,收敛性,过高估计,决策方法,空战决策
AB值:
0.349058
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。