首站-论文投稿智能助手
典型文献
基于深度强化学习的无信号灯交叉路口车辆控制
文献摘要:
利用深度强化学习技术实现无信号灯交叉路口车辆控制是智能交通领域的研究热点.现有研究存在无法适应自动驾驶车辆数量动态变化、训练收敛慢、训练结果只能达到局部最优等问题.文中研究在无信号灯交叉路口,自动驾驶车辆如何利用分布式深度强化方法来提升路口的通行效率.首先,提出了一种高效的奖励函数,将分布式强化学习算法应用到无信号灯交叉路口场景中,使得车辆即使无法获取整个交叉路口的状态信息,只依赖局部信息也能有效提升交叉路口的通行效率.然后,针对开放交叉路口场景中强化学习方法训练效率低的问题,使用了迁移学习的方法,将封闭的8字型场景中训练好的策略作为暖启动,在无信号灯交叉路口场景继续训练,提升了训练效率.最后,提出了一种可以适应所有自动驾驶车辆比例的策略,此策略在任意比例自动驾驶车辆的场景中均可提升交叉路口的通行效率.在仿真平台Flow上对TD3强化学习算法进行了验证,实验结果表明,改进后的算法训练收敛快,能适应自动驾驶车辆比例的动态变化,能有效提升路口的通行效率.
文献关键词:
自动驾驶;无信号灯交叉路口;深度强化学习;V2X
作者姓名:
欧阳卓;周思源;吕勇;谭国平;张悦;项亮亮
作者机构:
河海大学计算机与信息学院 南京211100;江苏智能交通及智能驾驶研究院 南京210019
文献出处:
引用格式:
[1]欧阳卓;周思源;吕勇;谭国平;张悦;项亮亮-.基于深度强化学习的无信号灯交叉路口车辆控制)[J].计算机科学,2022(03):46-51
A类:
无信号灯交叉路口
B类:
深度强化学习,车辆控制,学习技术,智能交通,交通领域,自动驾驶车辆,辆数,数量动态,局部最优,优等,中研,强化方法,通行效率,奖励函数,分布式强化学习,强化学习算法,算法应用,取整,状态信息,局部信息,强化学习方法,方法训练,训练效率,迁移学习,字型,练好,略作,仿真平台,Flow,TD3,算法训练,V2X
AB值:
0.207991
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。