典型文献
基于深度强化学习的交通信号控制方法
文献摘要:
针对基于深度强化学习的交通信号控制方法存在难以及时更新交叉口信号控制策略的问题,提出基于改进深度强化学习的单交叉口交通信号控制方法. 构建新的基于相邻采样时间步实时车辆数变化量的奖励函数,以及时跟踪并利用交叉口交通状态动态的变化过程. 采用双网络结构提高算法学习效率,利用经验回放改善算法收敛性. 基于SUMO的仿真测试结果表明,相比传统控制方法和深度强化学习方法,所提方法能明显缩短交叉口车辆平均等待时间和平均排队长度,提高交叉口通行效率.
文献关键词:
交通信号控制;深度强化学习;奖励函数;经验回放
中图分类号:
作者姓名:
刘智敏;叶宝林;朱耀东;姚青;吴维敏
作者机构:
浙江理工大学 信息学院,浙江 杭州 310018;嘉兴学院 信息科学与工程学院,浙江 嘉兴 314001;浙江大学 工业控制技术国家重点实验室,智能系统与控制研究所,浙江 杭州 310027
文献出处:
引用格式:
[1]刘智敏;叶宝林;朱耀东;姚青;吴维敏-.基于深度强化学习的交通信号控制方法)[J].浙江大学学报(工学版),2022(06):1249-1256
A类:
B类:
深度强化学习,交通信号控制,信号控制方法,新交,交叉口,口信,进深,单交,口交,采样时间,时间步,辆数,变化量,奖励函数,交通状态,变化过程,双网络,学习效率,经验回放,收敛性,SUMO,仿真测试,强化学习方法,平均等待时间,排队长度,通行效率
AB值:
0.322078
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。