首站-论文投稿智能助手
典型文献
基于自学习和监督学习混合驱动的智能汽车跟驰控制策略
文献摘要:
随着人工智能技术的不断进步,越来越多的数据驱动方法被用于解决智能汽车跟驰控制问题,基于此,提出一种自学习和监督学习混合驱动的跟驰控制策略,实现拟人化的高性能跟驰控制.首先,基于实车试验平台采集跟驰数据,将跟驰控制问题建模为马尔可夫决策过程,利用深度强化学习中的深度确定性策略梯度建立自学习跟驰控制策略,基于长短期记忆网络对马尔可夫决策过程的状态转移进行建模,根据历史数据对未来状态进行预测,利用高斯混合回归和连续隐式马尔可夫模型建立具有人类驾驶人特性的跟驰参考模型并将其引入强化学习架构中.提出一种自学习和监督学习的混合架构,通过引入人类驾驶人跟驰参考模型引导强化学习正确学习人类驾驶人特性,提升策略拟人性;通过对马尔可夫决策过程状态转移建模使策略进行加速度决策时能够考虑跟驰过程的状态随机性.最后利用实车跟驰数据进行策略验证,对提出策略和监督学习策略的跟驰控制性能进行对比并给出一系列量化评价指标.研究结果表明:所提出策略在跟踪前车速度和保持理想跟驰距离上具有超越人类驾驶人的表现,并有效降低了跟驰过程中的加速度冲击,在保证跟驰安全性、跟踪性、舒适性的同时具备较好的拟人性.
文献关键词:
汽车工程;跟驰控制;自学习;监督学习;深度强化学习;数据驱动
作者姓名:
赵健;宋东鉴;朱冰;刘斌;陈志成;张培兴
作者机构:
吉林大学汽车仿真与控制国家重点实验室,吉林长春 130025;中国第一汽车集团有限公司智能网联开发院,吉林长春 130011
文献出处:
引用格式:
[1]赵健;宋东鉴;朱冰;刘斌;陈志成;张培兴-.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略)[J].中国公路学报,2022(03):55-65
A类:
B类:
自学习,监督学习,混合驱动,智能汽车,跟驰控制,数据驱动方法,控制问题,拟人化,实车试验,试验平台,马尔可夫决策过程,深度强化学习,深度确定性策略梯度,长短期记忆网络,状态转移,历史数据,高斯混合回归,隐式,马尔可夫模型,驾驶人,参考模型,学习架构,混合架构,模型引导,拟人性,过程状态,随机性,学习策略,控制性能,量化评价,前车,车速,越人,舒适性,汽车工程
AB值:
0.232215
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。