首站-论文投稿智能助手
典型文献
基于启发式深度Q学习的多机器人任务分配算法
文献摘要:
针对多机器人任务分配方法在环境复杂性增加时出现的维度灾难问题,本文提出了一种基于启发式深度Q学习的多机器人多任务分配算法.采用神经网络代替传统强化学习中的Q值,避免了强化学习在高维度空间下的状态-动作空间的局限性问题;将轨迹池引入深度Q学习算法中启发动作的选择策略,提高了算法的收敛速度;在动作选择决策之中引入动态探索因子,保证算法对环境中的未知空间的充分探索,进而提高算法的学习效率.通过实验证明:基于启发式深度Q学习的任务分配算法成功缓解了复杂环境下多机器人多任务分配的维度灾难问题,通过实验对比,证明基于启发式深度Q学习的任务分配算法在收敛速度和任务分配结果方面存在明显的提升.
文献关键词:
任务分配;神经网络;强化学习;Q值;高纬度;启发式深度Q学习;维度灾难;动态探索
作者姓名:
张子迎;陈云飞;王宇华;冯光升
作者机构:
嘉应学院 计算机学院,广东 梅州514015;哈尔滨工程大学 计算机与科学技术学院,黑龙江 哈尔滨150001
引用格式:
[1]张子迎;陈云飞;王宇华;冯光升-.基于启发式深度Q学习的多机器人任务分配算法)[J].哈尔滨工程大学学报,2022(06):857-864
A类:
B类:
启发式,多机器人,分配算法,分配方法,环境复杂性,加时,维度灾难,多任务分配,强化学习,高维度,度空间,动作空间,选择策略,收敛速度,动态探索,学习效率,复杂环境,实验对比,高纬度
AB值:
0.257935
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。