典型文献
基于异构融合特征的深度强化学习自动驾驶决策方法
文献摘要:
在自动驾驶决策方法中,传统模块化方法受限制于数据集的广泛性,基于强化学习的方法难以在高输入维度且动作空间连续的情况下有效学习.为了解决上述问题,提出了一种基于异构融合特征的深度强化学习自动驾驶决策方法,首先使用适量驾驶数据预训练图像降维网络,然后将降维后得到的图像特征和车辆状态特征进行异构融合作为强化学习的输入,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)强化学习框架,通过为自动驾驶量身定制的综合了速度、方向盘角度、车辆位置、碰撞等信息的奖励函数有效引导学习,结合经验池回放技术和目标网络技术提高训练收敛速度.所提方法有效缩短了训练时间,并可在复杂城市环境下保持较高的稳定性与鲁棒性.
文献关键词:
深度强化学习;自动驾驶;异构融合特征;DDPG;奖励函数
中图分类号:
作者姓名:
冯天;石朝侠;王燕清
作者机构:
南京理工大学计算机科学与工程学院 南京 210094;南京晓庄学院信息工程学院 南京 211171
文献出处:
引用格式:
[1]冯天;石朝侠;王燕清-.基于异构融合特征的深度强化学习自动驾驶决策方法)[J].计算机与数字工程,2022(09):1929-1934
A类:
异构融合特征
B类:
深度强化学习,自动驾驶决策,决策方法,模块化方法,受限制,广泛性,动作空间,有效学习,预训练,训练图像,图像特征,深度确定性策略梯度,Deep,Deterministic,Policy,Gradient,DDPG,过为,量身定制,方向盘,奖励函数,有效引导,引导学习,经验池,回放,目标网,技术提高,提高训练,收敛速度,训练时间,复杂城市环境
AB值:
0.343313
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。