首站-论文投稿智能助手
典型文献
基于离线强化学习的交叉口生态驾驶控制
文献摘要:
针对传统强化学习算法在现实场景下训练难以实现的问题,提出一种基于离线强化学习的自适应车辆交叉口生态驾驶控制策略.首先,将车辆油耗与行驶距离作为复合奖励函数的一部分,构造了V2 I(vehicle-to-infrastructure)下的车辆交叉口马尔可夫决策过程.通过在SUMO仿真软件中利用GLOSA系统收集少量训练数据,基于BCQ(batch-constrained deep Q-learning)算法进行离线训练,解决了离线数据与真实场景下分布偏移的问题.将模型部署在仿真环境,实验结果表明,在单交叉口与多交叉口情景,几乎不牺牲车辆机动性的前提下,能耗经济性可以分别提升25.14%和11.49%.此外,对不同V2I通信距离进行分析,发现随着通信距离的增加,算法控制效果与稳定性均有所提升,为工程实践提供了借鉴.
文献关键词:
智能交通系统;信号交叉口;生态驾驶;离线强化学习
作者姓名:
张健;姜夏;史晓宇;程健;郑岳标
作者机构:
东南大学江苏省城市智能交通重点实验室,南京211189;东南大学交通学院,南京211189;西藏大学工学院,拉萨850000;南京莱斯信息技术股份有限公司,南京210000
引用格式:
[1]张健;姜夏;史晓宇;程健;郑岳标-.基于离线强化学习的交叉口生态驾驶控制)[J].东南大学学报(自然科学版),2022(04):762-769
A类:
GLOSA,BCQ
B类:
离线强化学习,生态驾驶,驾驶控制,强化学习算法,现实场景,难以实现,油耗,奖励函数,vehicle,infrastructure,马尔可夫决策过程,SUMO,统收,训练数据,batch,constrained,deep,learning,离线训练,离线数据,真实场景,模型部署,仿真环境,单交,机动性,V2I,通信距离,算法控制,智能交通系统,信号交叉口
AB值:
0.37085
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。