FAILED
首站-论文投稿智能助手
典型文献
基于PER-PDDPG的无人机路径规划研究
文献摘要:
针对未知复杂环境下的多无人机路径规划问题,提出了一种基于优先经验回放的并行深度确定性策略梯度(PER-PDDPG)算法.首先,该算法在传统深度强化学习算法和匈牙利算法的基础上,结合了优先经验回放机制与多智能体经验共享的特点,提高了经验的获取效率,并使高价值经验能够被更加充分的多次利用.其次,算法将针对单无人机的PER-DDPG算法并行拓展到多无人机中,使得算法的网络结构相对于传统多智能体强化学习算法更加简洁高效.仿真结果表明,该方法可以灵活应用于不同数量的无人机群中,并且相较于传统的多智能体强化学习算法拥有更快的收敛速度以及更高的收敛奖励均值,有效提升了在未知复杂环境下的多无人机路径规划效果.
文献关键词:
无人机;路径规划;深度强化学习;并行DDPG;优先经验回放
作者姓名:
乔哲;黎思利;王景志;符小卫
作者机构:
西北工业大学电子信息学院,西安 710072;航空工业沈阳飞机设计研究所体系部,沈阳 110035
文献出处:
引用格式:
[1]乔哲;黎思利;王景志;符小卫-.基于PER-PDDPG的无人机路径规划研究)[J].无人系统技术,2022(06):12-23
A类:
PDDPG
B类:
PER,无人机路径规划,规划研究,复杂环境,多无人机,规划问题,优先经验回放,深度确定性策略梯度,深度强化学习算法,匈牙利算法,经验回放机制,高价值,多次利用,单无人机,多智能体强化学习算法,简洁高效,无人机群,收敛速度
AB值:
0.213868
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。