FAILED
首站-论文投稿智能助手
典型文献
基于改进TD3的自动驾驶车道保持决策方法
文献摘要:
本文提出基于改进TD3算法的车道保持端到端决策新方案.首先,构建多数据融合TD3算法框架,感知自主车辆运动学数据信息和视觉图像信息来提升算法的稳定性.并且结合注意力机制思想细化图像特征,使得算法关注重要道路信息,以此增强算法可解释性.其次,综合考虑驾驶的安全性、舒适性和效率性因素设计了指导型奖励函数,以引导智能体学到更加类人的驾驶策略.最后,采用分类与高价值优先级经验回放方法,以提高样本利用率和加快算法收敛速度.借助TORCS仿真平台,设计了多组对比实验,以验证所提方法的有效性和可行性;并且通过多个场景的仿真测试,验证了改进TD3算法的整体性能优于TD3算法.
文献关键词:
深度强化学习;车道保持;TD3;多数据融合;注意力机制;经验回放
作者姓名:
田康;于镝;李擎;张宏昌;吴迎年;范玲玲
作者机构:
北京信息科技大学自动化学院,北京 100192;清华大学自动化学院,北京 100084
引用格式:
[1]田康;于镝;李擎;张宏昌;吴迎年;范玲玲-.基于改进TD3的自动驾驶车道保持决策方法)[J].北京交通大学学报,2022(05):84-94
A类:
TORCS
B类:
TD3,自动驾驶,车道保持,决策方法,端到端决策,新方案,多数据融合,自主车辆,车辆运动学,视觉图像,图像信息,注意力机制,图像特征,要道,增强算法,可解释性,舒适性,效率性,奖励函数,智能体,学到,驾驶策略,高价值,优先级经验回放,本利,收敛速度,仿真平台,仿真测试,整体性能,深度强化学习
AB值:
0.39051
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。