典型文献
基于快速强化学习的无线通信干扰规避策略
文献摘要:
针对无线通信环境中存在未知且动态变化的干扰,该文联合考虑通信信道接入和发射功率控制提出了基于快速强化学习的未知干扰规避策略,以确保通信收发端的可靠通信.将干扰规避问题建模为马尔可夫决策过程,其优化目标为在保证通信质量的前提下同时降低系统发射功率和减少信道切换次数.随后,提出一种赢或学习快速策略爬山(WoLF-PHC)学习方法的干扰规避方案,从而实现快速规避干扰的目的.仿真结果表明,在不同干扰模式下,所提WoLF-PHC算法的抗干扰性能、收敛速度均优于传统的随机选择方法和Q学习算法.
文献关键词:
干扰规避;赢或学习快速策略爬山;Q学习;马尔可夫决策
中图分类号:
作者姓名:
李芳;熊俊;赵肖迪;赵海涛;魏急波;苏曼
作者机构:
国防科技大学电子科学学院 长沙 410073;湖南大学电气与信息工程学院 长沙 410082;北京跟踪与通信技术研究所 北京 100094
文献出处:
引用格式:
[1]李芳;熊俊;赵肖迪;赵海涛;魏急波;苏曼-.基于快速强化学习的无线通信干扰规避策略)[J].电子与信息学报,2022(11):3842-3849
A类:
赢或学习快速策略爬山
B类:
强化学习,通信干扰,干扰规避,规避策略,无线通信环境,文联,通信信道,发射功率控制,未知干扰,保通,收发,发端,可靠通信,马尔可夫决策过程,优化目标,通信质量,下同,WoLF,PHC,抗干扰性能,收敛速度,随机选择,选择方法
AB值:
0.329728
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。