典型文献
一种基于深度强化学习的协同通信干扰决策算法
文献摘要:
针对协同电子战中跳频通信干扰协同决策难题,通过构建"整体优化、逐站决策"的协同决策模型,基于深度强化学习技术,设计了在Actor-Critic算法架构下融合优势函数的决策算法,并在奖励函数中嵌入专家激励机制以提高算法的探索能力,采用集中式训练方法优化决策网络,使算法能够输出资源利用率最高的干扰方案,并大幅提高决策效率.仿真结果表明,相比于现有智能决策算法,本文算法给出的干扰方案能够节约8%干扰资源,决策效率提高50%以上,具有较大实用价值.
文献关键词:
深度强化学习;通信干扰决策;干扰资源分配;优势函数;专家激励
中图分类号:
作者姓名:
宋佰霖;许华;齐子森;饶宁;彭翔
作者机构:
空军工程大学信息与导航学院,陕西西安710077
文献出处:
引用格式:
[1]宋佰霖;许华;齐子森;饶宁;彭翔-.一种基于深度强化学习的协同通信干扰决策算法)[J].电子学报,2022(06):1301-1309
A类:
通信干扰决策
B类:
深度强化学习,协同通信,决策算法,电子战,跳频通信,协同决策,整体优化,决策模型,学习技术,Actor,Critic,融合优势,优势函数,奖励函数,专家激励,探索能力,集中式,训练方法,方法优化,优化决策,出资,资源利用率,决策效率,智能决策,效率提高,干扰资源分配
AB值:
0.389853
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。