典型文献
基于改进Q-Learning的路径规划算法
文献摘要:
Q-Learning是一种经典的强化学习算法.然而,它存在着收敛速度慢的缺点,而且由于存在着一定概率的探索,该算法可能会浪费很多时间.为解决这些问题,在Q-learning基础上引入初始化Q表格,同时提出"探索引导"方法.仿真实验结果表明,该改进可以减少训练次数,加快收敛速度,例如在Gym库中的悬崖寻路场景中,改进的方法能缩短30%的训练次数.
文献关键词:
强化学习;Q-Learning;路径规划
中图分类号:
作者姓名:
张小月;韩尚君;陶青川;余艳梅
作者机构:
四川大学电子信息学院,成都 610065
文献出处:
引用格式:
[1]张小月;韩尚君;陶青川;余艳梅-.基于改进Q-Learning的路径规划算法)[J].现代计算机,2022(02):67-72
A类:
B类:
Learning,路径规划算法,强化学习算法,收敛速度,速度慢,learning,初始化,表格,索引,少训练,快收敛,如在,Gym,悬崖,寻路
AB值:
0.482632
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。