首站-论文投稿智能助手
典型文献
攻击角度约束下的分布式强化学习制导方法
文献摘要:
为提高导弹在攻击角度约束下对目标的打击效能,提出了一种基于深度确定性策略梯度算法的分布式强化学习制导策略.为了最大限度地减小攻击角度误差,设计了一种新的奖励函数,使导弹在满足视场角约束的同时,视线角向期望值收敛.此外,为了增强强化学习模型的泛化能力,提出了一种分布式探索策略,提高了模型训练过程中对环境的探索效率.仿真结果验证了所提出的分布式强化学习制导方法能够在固定攻击角度约束下实现对目标的精准打击.与传统制导律相比,所提制导方法的攻击角度误差更小,收敛速度更快.
文献关键词:
导弹制导;强化学习;攻击角度;梯度算法
作者姓名:
李博皓;安旭曼;杨晓飞;吴云洁;李国飞
作者机构:
北京航空航天大学虚拟现实技术与系统国家重点实验室,北京100191;北京航空航天大学大学自动化科学与电气工程学院,北京100191;飞行器控制一体化技术重点实验室,北京100191;西北工业大学航天学院,西安710072
文献出处:
引用格式:
[1]李博皓;安旭曼;杨晓飞;吴云洁;李国飞-.攻击角度约束下的分布式强化学习制导方法)[J].宇航学报,2022(08):1061-1069
A类:
视场角约束
B类:
攻击角度,角度约束,分布式强化学习,制导方法,深度确定性策略梯度算法,制导策略,角度误差,奖励函数,视线,线角,期望值,强强,泛化能力,探索策略,模型训练,训练过程,统制,制导律,提制,收敛速度,导弹制导
AB值:
0.280191
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。