典型文献
基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计
文献摘要:
空天地一体化通信作为未来6G的发展方向,很好地弥补了当前无线通信覆盖不足的弊端.该文提出一种基于多智能体强化学习(MARL)的多无人机(Multi-UAV)辅助通信算法,在用户与无人机(UAVs)构成的混合博弈模式下求解纳什均衡近似解,解决了动态环境下UAVs轨迹设计、多维资源调度以及用户接入策略联合优化问题.结合马尔可夫博弈概念建模该连续决策过程,以集中训练分布式执行(CTDE)机制,将近端策略优化(PPO)算法扩展到多智能体领域.针对离散与连续共存的动作空间设计了两种策略输出模式,并且结合Beta策略改进实现,最后通过仿真实验验证了算法的有效性.
文献关键词:
多无人机辅助通信;多智能体强化学习;混合博弈;纳什均衡
中图分类号:
作者姓名:
吴官翰;贾维敏;赵建伟;高飞飞;姚敏立
作者机构:
火箭军工程大学 西安 710038;中国酒泉卫星发射中心 酒泉 735000;清华大学 北京 100084
文献出处:
引用格式:
[1]吴官翰;贾维敏;赵建伟;高飞飞;姚敏立-.基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计)[J].电子与信息学报,2022(03):940-950
A类:
多无人机辅助通信,多维资源调度,CTDE
B类:
多智能体强化学习,混合博弈,通信系统设计,空天地一体化,一体化通信,6G,无线通信,通信覆盖,MARL,Multi,UAVs,纳什均衡,近似解,动态环境,轨迹设计,用户接入,接入策略,联合优化,优化问题,马尔可夫,概念建模,决策过程,将近,近端策略优化,PPO,动作空间,空间设计,出模,Beta
AB值:
0.341808
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。