典型文献
利用强化学习开展比例导引律的导航比设计
文献摘要:
为提升导弹的制导性能,在比例导引的基础上,分别利用蒙特卡洛强化学习和Q-learn-ing强化学习开展导航比的设计.采用蒙特卡洛强化学习的导航比设计方法,对导弹飞行过程进行粗略分段;利用Q-learning强化学习的导航比设计方法,用飞行时间、视线角速度、预计遭遇时间及目标特性等对制导环境进一步细分,根据环境和状态的变化,自适应地调整比例导引的导航比,以获得最佳的飞行制导策略.基于某型防空导弹,利用上述方法分别开展导航比设计,从全空域弹道库中随机抽取批量弹道进行仿真计算,并与传统经验设计进行对比分析.仿真结果表明,采用强化学习方法设计的导航比能够显著降低边界弹道的脱靶量,说明该设计方法能够切实提升导弹的制导拦截能力.
文献关键词:
比例导引;蒙特卡洛强化学习;Q-learning强化学习;导航比
中图分类号:
作者姓名:
李庆波;李芳;董瑞星;樊瑞山;谢文龙
作者机构:
上海机电工程研究所, 上海201109
文献出处:
引用格式:
[1]李庆波;李芳;董瑞星;樊瑞山;谢文龙-.利用强化学习开展比例导引律的导航比设计)[J].兵工学报,2022(12):3040-3047
A类:
蒙特卡洛强化学习
B类:
比例导引律,导航比,粗略,learning,飞行时间,视线,线角,角速度,目标特性,获得最佳,制导策略,防空导弹,全空域,弹道,随机抽取,仿真计算,传统经验,强化学习方法,方法设计,比能,脱靶量,拦截
AB值:
0.251923
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。