典型文献
考虑驾驶员特性的个性化跟驰控制策略研究
文献摘要:
为提高车辆自主跟驰功能的个性化程度, 使之能适应不同驾驶员的驾驶风格, 提高乘员对自动驾驶功能的接受度, 提出了一种基于深度强化学习的个性化跟驰控制策略. 首先基于模拟驾驶试验平台进行驾驶员在环试验,获取真实驾驶员跟驰数据. 根据车辆跟驰动力学, 建立了连续动作空间决策模型. 构建了基于 Actor-Critic 的深度强化学习架构, 并综合考虑跟驰过程的安全性、 舒适性和宜人性设计了奖励函数, 通过双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient, TD3)对决策模型进行训练. 基于CARLA模拟器的仿真结果表明, 本研究提出的个性化跟驰控制策略在保证车辆自主跟驰过程稳定性和安全性的前提下, 其决策结果更接近驾驶员驾驶习性.
文献关键词:
自主跟驰;个性化;深度强化学习;奖励函数
中图分类号:
作者姓名:
任玥;邹博文;尹旭;刘学高;梁新成
作者机构:
西南大学 工程技术学院,重庆 400715;西南大学 人工智能学院,重庆 400715;重庆长安汽车软件科技有限公司 智能控制室,重庆 401120
文献出处:
引用格式:
[1]任玥;邹博文;尹旭;刘学高;梁新成-.考虑驾驶员特性的个性化跟驰控制策略研究)[J].西南大学学报(自然科学版),2022(03):12-19
A类:
自主跟驰
B类:
驾驶员,跟驰控制,控制策略研究,高车,驾驶风格,乘员,自动驾驶功能,接受度,深度强化学习,模拟驾驶试验,试验平台,车辆跟驰,动作空间,空间决策,决策模型,Actor,Critic,学习架构,舒适性,宜人性,奖励函数,双延迟深度确定性策略梯度,Twin,Delayed,Deep,Deterministic,Policy,Gradient,TD3,对决,CARLA,模拟器,保证车辆,过程稳定性,习性
AB值:
0.393393
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。