首站-论文投稿智能助手
典型文献
改进深度确定性策略梯度的决策算法研究
文献摘要:
为解决无人驾驶路径规划过程中的决策控制问题,文章针对深度确定性策略梯度算法在未知环境中随着搜索空间的增大,出现训练效率低、收敛不稳定等缺点,提出了基于奖励指导的改进算法.首先在每回合内采用基于奖励的优先级经验回放,减少深度确定性策略梯度算法随机探索的盲目性,提高智能车学习效率.然后在回合间基于奖励筛选优秀轨迹,便于指导智能车对复杂空间的探索,得到稳定的控制策略.最后,在开源智能驾驶仿真环境进行仿真.实验结果表明改进后的深度确定性策略梯度算法性能优于原来的算法,训练效率和收敛稳定性均得到有效提升.
文献关键词:
路径规划;决策控制;深度确定性策略梯度;奖励指导;优先经验回放
作者姓名:
陈建文;张小俊;张明路
作者机构:
河北工业大学 机械工程学院,天津 300400
文献出处:
引用格式:
[1]陈建文;张小俊;张明路-.改进深度确定性策略梯度的决策算法研究)[J].汽车实用技术,2022(01):28-31
A类:
奖励指导
B类:
进深,决策算法,算法研究,决无,无人驾驶,路径规划,划过,决策控制,控制问题,深度确定性策略梯度算法,未知环境,搜索空间,训练效率,改进算法,回合,优先级经验回放,盲目性,高智能,智能车,学习效率,选优,复杂空间,开源,智能驾驶,驾驶仿真,仿真环境,算法性能,优先经验回放
AB值:
0.268192
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。