典型文献
基于先验知识的多功能雷达智能干扰决策方法
文献摘要:
针对基于强化学习的多功能雷达干扰决策方法训练周期长、收敛慢的问题,本文提出了基于先验知识的多功能雷达智能干扰决策算法.所提算法使用了基于势能函数的收益塑造理论,利用先验知识设置收益函数,相比于传统算法,具有更快的收敛速率.利用先验知识加速算法收敛速率的方法对强化学习在多功能雷达干扰决策中的实际应用具有重要的意义,对于强化学习在其他领域的应用也具有很好的参考价值.
文献关键词:
雷达对抗;马尔可夫决策过程;强化学习;收益塑造;先验知识
中图分类号:
作者姓名:
朱霸坤;朱卫纲;李伟;杨莹;高天昊
作者机构:
航天工程大学电子光学工程系,北京101416;电子信息系统复杂电磁环境效应国家重点实验室,河南洛阳471032;航天工程大学研究生院,北京101416
文献出处:
引用格式:
[1]朱霸坤;朱卫纲;李伟;杨莹;高天昊-.基于先验知识的多功能雷达智能干扰决策方法)[J].系统工程与电子技术,2022(12):3685-3695
A类:
收益塑造
B类:
先验知识,多功能雷达,智能干扰,干扰决策,决策方法,强化学习,雷达干扰,方法训练,训练周期,决策算法,势能函数,传统算法,收敛速率,速算,雷达对抗,马尔可夫决策过程
AB值:
0.28976
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。