首站-论文投稿智能助手
典型文献
自主空战连续决策方法
文献摘要:
未来空战正朝着无人化、自主化方向发展,自主空战决策方法是未来空战的重要支撑手段之一.传统空战决策方法由于维度限制,存在无法处理连续动作与远视决策的问题.基于Actor-Critic方法提出空战连续决策的统一方法架构,依据空战训练经验对状态空间、动作空间、奖励及训练科目进行合理设计,测试多种连续动作空间强化学习算法在高不确定性空战场景下的学习效果并进行可视化验证.结果表明:基于本文提出的方法架构,可以实现连续动作下的远视价值寻优,智能体可以在复杂空战态势下做出最优决策,对随机机动飞行目标有较高的击杀率,且空战机动轨迹具有较高的合理性.
文献关键词:
自主空战;强化学习;人工智能;深度神经网络
作者姓名:
单圣哲;杨孟超;张伟伟;高传强
作者机构:
西北工业大学 航空学院,西安 710072;中国人民解放军93995部队,西安 710306
文献出处:
引用格式:
[1]单圣哲;杨孟超;张伟伟;高传强-.自主空战连续决策方法)[J].航空工程进展,2022(05):47-58
A类:
B类:
自主空战,决策方法,无人化,自主化,空战决策,支撑手段,远视,Actor,Critic,空战训练,状态空间,动作空间,训练科目,合理设计,强化学习算法,化验,智能体,最优决策,机动飞行,标有,击杀,战机,深度神经网络
AB值:
0.394066
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。