基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计|吴官翰;贾维敏;赵建伟;高飞飞;姚敏立|中国酒泉卫星发射中心酒泉 735000 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计

文献摘要：

空天地一体化通信作为未来6G的发展方向,很好地弥补了当前无线通信覆盖不足的弊端.该文提出一种基于多智能体强化学习(MARL)的多无人机(Multi-UAV)辅助通信算法,在用户与无人机(UAVs)构成的混合博弈模式下求解纳什均衡近似解,解决了动态环境下UAVs轨迹设计、多维资源调度以及用户接入策略联合优化问题.结合马尔可夫博弈概念建模该连续决策过程,以集中训练分布式执行(CTDE)机制,将近端策略优化(PPO)算法扩展到多智能体领域.针对离散与连续共存的动作空间设计了两种策略输出模式,并且结合Beta策略改进实现,最后通过仿真实验验证了算法的有效性.

文献关键词：

多无人机辅助通信;多智能体强化学习;混合博弈;纳什均衡

中图分类号：

[1] 航空、航天（V） / 航空（V2） / 各类型航空器（V27） / 无人驾驶飞机（V279）

[2] 无线电电子学、电信技术（TN） / 无线通信（TN92） / 波导通信、毫米波通信（TN928） / 移动通信（TN929.5）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

作者姓名：

吴官翰;贾维敏;赵建伟;高飞飞;姚敏立

作者机构：

火箭军工程大学西安 710038;中国酒泉卫星发射中心酒泉 735000;清华大学北京 100084

文献出处：

电子与信息学报

引用格式：

[1]吴官翰;贾维敏;赵建伟;高飞飞;姚敏立-.基于多智能体强化学习的混合博弈模式下多无人机辅助通信系统设计)[J].电子与信息学报,2022(03):940-950

A类：

多无人机辅助通信,多维资源调度,CTDE

B类：

多智能体强化学习,混合博弈,通信系统设计,空天地一体化,一体化通信,6G,无线通信,通信覆盖,MARL,Multi,UAVs,纳什均衡,近似解,动态环境,轨迹设计,用户接入,接入策略,联合优化,优化问题,马尔可夫,概念建模,决策过程,将近,近端策略优化,PPO,动作空间,空间设计,出模,Beta

AB值：

0.341808

相似文献

基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法

张涛;张文涛;代凌;陈婧怡;王丽;魏倩茹-西北工业大学软件学院,陕西西安710065

基于多智能体深度强化学习的分布式协同干扰功率分配算法

饶宁;许华;蒋磊;宋佰霖;史蕴豪-空军工程大学信息与导航学院,陕西西安710077

无人机辅助通信中基于用户轨迹的无线资源和航迹优化

郎磊;王荆宁;王一;赵子涛-中国电子科技集团公司第五十四研究所,河北石家庄 050081;通信网信息传输与分发技术国家重点实验室,河北石家庄 050081

基于多智能体强化学习的大规模灾后用户分布式覆盖优化

许文俊;吴思雷;王凤玉;林兰;李国军;张治-北京邮电大学人工智能学院,北京 100876;重庆邮电大学超视距可信信息传输研究所,重庆 400065;北京邮电大学信息与通信工程学院,北京 100876

基于DRL的无人机辅助边缘计算服务质量优化

敬乐天;贾向东;曹肖攀;万妮妮;殷家祥-西北师范大学计算机科学与工程学院,甘肃兰州730070;南京邮电大学江苏省无线通信重点实验室,江苏南京210003;中电万维信息技术有限责任公司中电万维研究院,甘肃兰州730030

基于深度强化学习的多域联合干扰规避

潘筱茜;张姣;刘琰;王杉;陈海涛;赵海涛;魏急波-国防科技大学电子科学学院,湖南长沙 410073;中国人民解放军91428部队,浙江宁波 315456

NOMA物联网下多UAV辅助MEC系统的资源分配

李海翠;刁宪邦;张校晨;尚志会;杨莲新-中国人民解放军陆军工程大学通信工程学院,南京211100;国防科技大学电子科学学院,长沙410003

多无人机协作的认知通信网络中能/谱效折中优化

黄仰超;谷奕龙;胡航;程国兵;韩蕙竹;安琪-空军工程大学信息与导航学院,西安710077;空军工程大学研究生院,西安710077

面向数据采集的多无人机协同节能部署方法

袁进;王海;秦蓁;李艾静-中国人民解放军陆军工程大学通信工程学院,南京 210007

基于POMDP的多机无源传感器协同任务规划

马玲;左燕;彭冬亮;任金磊-杭州电子科技大学自动化学院, 浙江杭州 310018;中国运载火箭技术研究院, 北京 100076

关于建立低空空域无线立体通信网络的探讨

陈爽-河北石云网络科技有限公司,河北石家庄 050030

面向边缘智能的车联网通信和计算资源联合管理策略

赵庶源;佘锋;李道勋;朱永东;冯远静-之江实验室,浙江杭州311121;吉利汽车研究院,浙江宁波315000;浙江工业大学,浙江杭州310000

认知无人机辅助边缘通信的能效优化

谷奕龙;宋旻旻;黄仰超-空军工程大学研究生院,陕西西安710077;中国人民解放军93166部队,北京100010;空军工程大学信息与导航学院,陕西西安710077

智能轨道交通中无线通信技术应用与展望

张青苗;赵军辉;张丹阳;吴遥;董翰智-华东交通大学信息工程学院,江西南昌330013;北京交通大学电子信息工程学院,北京100044

面向复杂任务的多无人机协同计算资源分配与优化

郭鸿志;王宇涛;王佳黛;刘家佳-西北工业大学网络空间安全学院,陕西西安710072

MEC计算卸载与资源分配联合智能优化方案

杜梅;周军华;李敦桥;陈士钊;魏翼飞-北京邮电大学电子工程学院, 北京100876;北京市复杂产品先进制造工程研究中心北京市仿真中心,北京100854;贵州航天控制技术有限公司, 贵阳550009;宁波中湾科技有限公司,宁波315400

数字孪生辅助UAV网络计算卸载优化

缪家辉;郑镐;谢正昊;赖健鑫;蒋丽-广东工业大学物联网信息技术广东省重点实验室,广州510006

无人机辅助通信的密集无线网络MAC协议

杨欣;毛雅淇;王伶-西北工业大学电子信息学院,陕西西安710072

面向多目标救援的通信受限无人机集群分布式策略

俞汉清;林艳;贾林琼;李强;张一晋-南京理工大学电子工程与光电技术学院,江苏南京 210094;东南大学移动通信国家重点实验室,江苏南京 210096;鹏城实验室,广东深圳 518000

基于多智能体深度强化学习的多域协同抗干扰方法研究

张彪;汪西明;徐逸凡;李文;韩昊;刘松仪;陈学强-陆军工程大学通信工程学院,江苏南京 210007;国防科技大学信息通信学院,湖北武汉 430010

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。