典型文献
基于多智能体强化学习的大规模灾后用户分布式覆盖优化
文献摘要:
为了快速恢复大规模受灾用户的应急通信服务,针对接入用户数量众多导致的业务差异性和动态性显著、集中式算法难以扩展等问题,提出了一种基于多智能体强化学习的分布式智简覆盖优化架构.在网络特征层中,设计了考虑用户业务差异性的分布式k-sums分簇算法,每个无人机基站从用户需求出发,原生简约地调整局部网络结构,并筛选簇中心用户特征作为多智能体强化学习神经网络的输入状态.在轨迹调控层中,设计了多智能体最大熵强化学习(MASAC)算法,无人机基站作为智能节点以"分布式训练?分布式执行"的框架调控自身飞行轨迹,并融合集成学习和课程学习技术提升了训练稳定性和收敛速度.仿真结果表明,所提分布式k-sums分簇算法在平均负载效率和分簇均衡性方面优于k-means算法,基于MASAC的无人机基站轨迹调控算法能够有效减小通信中断的发生频率、提升网络的频谱效率,效果优于现有的强化学习方法.
文献关键词:
应急通信;覆盖优化;多智能体强化学习;分布式训练
中图分类号:
作者姓名:
许文俊;吴思雷;王凤玉;林兰;李国军;张治
作者机构:
北京邮电大学人工智能学院,北京 100876;重庆邮电大学超视距可信信息传输研究所,重庆 400065;北京邮电大学信息与通信工程学院,北京 100876
文献出处:
引用格式:
[1]许文俊;吴思雷;王凤玉;林兰;李国军;张治-.基于多智能体强化学习的大规模灾后用户分布式覆盖优化)[J].通信学报,2022(08):1-16
A类:
MASAC
B类:
多智能体强化学习,用户分布,覆盖优化,快速恢复,受灾,应急通信,通信服务,接入用户,用户数量,集中式,网络特征,sums,分簇算法,无人机基站,用户需求,简约,整局,簇中心,用户特征,在轨,最大熵,智能节点,分布式训练,飞行轨迹,合集,集成学习,课程学习,学习技术,技术提升,收敛速度,提分,负载效率,均衡性,means,通信中断,发生频率,频谱效率,强化学习方法
AB值:
0.360037
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。