首站-论文投稿智能助手
典型文献
基于LSTM-PPO算法的无人作战飞机近距空战机动决策
文献摘要:
近距空战中环境复杂、格斗态势高速变化,基于对策理论的方法因数据迭代量大而不能满足实时性要求,基于数据驱动的方法存在训练时间长、执行效率低的问题.对此,提出了一种基于深度强化学习算法的UCAV近距空战机动决策方法.首先,在UCAV三自由度模型的基础上构建飞行驱动模块,形成状态转移更新机制;然后在近端策略优化算法的基础上加入Ornstein-Uhlenbeck随机噪声以提高UCAV对未知状态空间的探索能力,结合长短时记忆网络(LSTM)增强对序列样本数据的学习能力,提升算法的训练效率和效果.最后通过设计3组近距空战仿真实验,并与PPO算法作性能对比,验证所提方法的有效性和优越性.
文献关键词:
无人作战飞机;空战机动决策;深度强化学习;近谝策略伏化;长短时记忆网络
作者姓名:
丁维;王渊;丁达理;谢磊;周欢;谭目来;吕丞辉
作者机构:
空军工程大学航空工程学院,西安,710038
引用格式:
[1]丁维;王渊;丁达理;谢磊;周欢;谭目来;吕丞辉-.基于LSTM-PPO算法的无人作战飞机近距空战机动决策)[J].空军工程大学学报,2022(03):19-25
A类:
近谝策略伏化
B类:
PPO,无人作战飞机,近距,空战机动决策,中环,环境复杂,格斗,速变,法因,训练时间,执行效率,深度强化学习算法,UCAV,决策方法,三自由度,自由度模型,驱动模块,状态转移,更新机制,近端策略优化算法,Ornstein,Uhlenbeck,随机噪声,状态空间,探索能力,长短时记忆网络,训练效率,性能对比
AB值:
0.325023
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。