首站-论文投稿智能助手
典型文献
基于强化学习的无人机基站多播通信系统的飞行路线在线优化
文献摘要:
针对无人机(UAV)基站(BS)多播通信系统的通信时延最小化问题,该文提出飞行路线在线优化算法.在该系统中无人机基站向多个地面用户同时发送公共信息,其中每次通信任务中地面用户位置是随机的.为了保证地面用户能够接收完整的公共信息以及考虑到无人机的能量有限性,该文以最小化无人机基站完成通信任务的平均时间为目标.首先将问题转化成一个马尔可夫决策过程(MDP);然后把通信时延引入到动作价值函数中;最后提出使用Q-Learning算法对无人机飞行路线进行学习和在线优化,从而实现平均通信时延最小化.仿真结果显示,与其他基准方案相比,该文所提方案能够有效地为无人机多播通信系统飞行路线实现在线优化,并有效降低通信任务的完成时间.
文献关键词:
无人机基站;飞行路线在线优化;强化学习
作者姓名:
张广驰;严雨琳;崔苗;陈伟;张景
作者机构:
广东工业大学信息工程学院 广州 510006;广东省环境地质勘查院 广州 510080;中国电子科学研究院 北京 100043
文献出处:
引用格式:
[1]张广驰;严雨琳;崔苗;陈伟;张景-.基于强化学习的无人机基站多播通信系统的飞行路线在线优化)[J].电子与信息学报,2022(03):969-975
A类:
飞行路线在线优化
B类:
强化学习,无人机基站,多播,通信系统,UAV,BS,通信时延,时延最小化,在线优化算法,发送,公共信息,用户位置,收完,有限性,问题转化,转化成,马尔可夫决策过程,MDP,作价,价值函数,出使,Learning,无人机飞行,完成时间
AB值:
0.264823
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。