典型文献
改进强化学习算法在AGV路径规划中的应用研究
文献摘要:
物流AGV小车的路径规划问题受到了广大学者的关注,传统的强化学习的Q-learning路径规划算法为了平衡探索与利用问题,在智能体的动作选择策略中引入一个探索因子的概率值ε,由于每次都选择最大的Q值函数的状态-动作对,这导致整个过程的收敛速度放慢且结果不稳定.为了解决探索和利用之间的矛盾,文章提出一种改进的动态调整探索因子ε策略,即在强化学习的不同阶段选择不同的探索因子ε值.通过仿真实验及实物实验后,证明了改进后的强化学习算法的收敛速度较快且收敛结果的稳定性也得到了提升.
文献关键词:
AGV小车;路径规划;强化学习;Q-learning算法;探索策略
中图分类号:
作者姓名:
韩召;韩宏飞;于会敏;王延忠
作者机构:
辽宁科技学院 电气与自动化学院,辽宁 本溪117004;株洲中车时代电气股份有限公司,湖南 株洲412000;北京航空航天大学 机械工程及自动化学院,北京100191
文献出处:
引用格式:
[1]韩召;韩宏飞;于会敏;王延忠-.改进强化学习算法在AGV路径规划中的应用研究)[J].辽宁科技学院学报,2022(06):22-25,44
A类:
B类:
强化学习算法,AGV,小车,规划问题,learning,路径规划算法,探索与利用,利用问题,智能体,动作选择策略,值函数,收敛速度,放慢,探索策略
AB值:
0.346963
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。