首站-论文投稿智能助手
典型文献
基于改进DQN算法的复杂海战场路径规划方法
文献摘要:
为了有效地解决海战场环境下多舰艇的追踪目标问题,以多智能体(舰艇)为研究对象,提出一种基于改进的Deep Q-Network(DQN)算法的路径规划方法.DQN算法结合多智能体的强化学习环境特性,在传统DQN算法的基础上,添加一个结构相同、参数不同的网络,分别对Q实际值和估计值进行更新来实现价值函数的收敛.此外,该方法使用经验回放和目标网络双参数更新机制,有效地解决了神经网络训练误差大、泛化能力差和训练不稳定等问题.实验结果表明,与传统的算法相比,提出的方法能够更快地适应复杂多变的多类型海战场环境,避障能力提高两倍多,并且在环境中能够获得更高的训练奖励.
文献关键词:
深度Q网络;强化学习;多智能体;路径规划;目标追踪
作者姓名:
郁洲;毕敬;苑海涛
作者机构:
北京工业大学信息学部,北京 100124;北京航空航天大学自动化科学与电气工程学院,北京 100191
引用格式:
[1]郁洲;毕敬;苑海涛-.基于改进DQN算法的复杂海战场路径规划方法)[J].智能科学与技术学报,2022(03):418-425
A类:
B类:
DQN,海战场,路径规划方法,战场环境,舰艇,多智能体,Deep,Network,强化学习,学习环境,环境特性,估计值,实现价值,价值函数,使用经验,经验回放,目标网,双参数,参数更新,更新机制,神经网络训练,泛化能力,多类型,避障,能力提高,两倍,目标追踪
AB值:
0.395045
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。