典型文献
基于无模型强化学习的雷达波束多阶段管理方法
文献摘要:
火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法.首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性.
文献关键词:
雷达波束管理;多阶段驻留时间优化;未知环境模型;Q学习
中图分类号:
作者姓名:
马智杰;王远航;姜家财;张天贤
作者机构:
电子科技大学信息与通信工程学院,成都611731;中国电子科技集团公司第十研究所,成都610036
文献出处:
引用格式:
[1]马智杰;王远航;姜家财;张天贤-.基于无模型强化学习的雷达波束多阶段管理方法)[J].现代雷达,2022(11):44-50
A类:
未知环境模型,雷达波束管理,多阶段驻留时间优化
B类:
无模型,强化学习,火控雷达,FCR,转发式,管理问题,马尔可夫决策过程,雷达探测,目标锁定,仿真验证
AB值:
0.119713
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。