典型文献
云边协同下基于多智能体强化学习的任务卸载策略
文献摘要:
针对智能移动终端设备的资源有限性和未来网络架构需要云边协同能力等问题,提出了一种基于多智能体强化学习的任务卸载策略,通过部署Cybertwin智能体为用户设备所需卸载的任务合理分配资源,在保证终端设备的服务质量(QoS)要求的同时,最小化整个计算网络的总成本.首先联合设计Cybertwin智能服务代理、计算任务分配以及网络通信与算力等多维异构资源配置构建随机对策的马尔可夫博弈过程(MGP),使执行总延迟和总能耗之和最小.其次考虑到需要处理随机时变网络与动态资源请求的高维连续动作空间,采用了一种基于多智能体双延迟深度确定策略梯度(MATD3)的深度强化学习协同框架求解.仿真实验结果表明:与常见的单智能体学习算法和启发式方案相比,本文提出的MATD3方法具有较好的性能,在平均执行成本方面分别降低了 25.61%和35.79%,在任务卸载率上分别提高了 39.13%和77.76%.
文献关键词:
云边协同;多智能体强化学习;任务卸载;资源分配
中图分类号:
作者姓名:
刘雨晖;陈宁江;何子琦
作者机构:
广西大学计算机与电子信息学院,广西南宁530004;广西智能数字服务工程技术研究中心,广西南宁530004;广西高校并行分布与智能计算重点实验室,广西南宁530004
文献出处:
引用格式:
[1]刘雨晖;陈宁江;何子琦-.云边协同下基于多智能体强化学习的任务卸载策略)[J].广西大学学报(自然科学版),2022(06):1563-1574
A类:
Cybertwin,MATD3
B类:
云边协同,同下,多智能体强化学习,任务卸载,卸载策略,智能移动终端,终端设备,有限性,未来网络,网络架构,协同能力,用户设备,合理分配,分配资源,QoS,计算网络,总成本,智能服务,任务分配,网络通信,算力,多维异构,异构资源,马尔可夫,MGP,总延迟,总能耗,机时,时变网络,动态资源,请求,高维,动作空间,深度确定,定策,策略梯度,深度强化学习,协同框架,启发式,载率,资源分配
AB值:
0.427693
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。