典型文献
多指标优化的深度强化学习单交叉口信号控制
文献摘要:
针对目前交叉口信号灯的控制方法无法有效的应对实时变化的交通状态.该算法提出多指标优化的深度强化学习单交叉口信号控制,以共同优化多指标来定义奖惩函数,动作的选择策略为贪心策略,其中探索率以固定的频率进行余弦衰减,在足够多的探索未知动作的基础上也保证了更好的收敛结果,最后使用SUMO仿真平台对该算法的控制效果进行验证.结果表明,该算法相比固定配时方案和感应控制方案,能够更有效的降低交叉口车辆的延误时间、排队长度、停车次数3项指标,具有更好的适用性跟有效性.
文献关键词:
交通信号控制;卷积神经网络;深度强化学习;多指标优化;DQN算法;SUMO仿真
中图分类号:
作者姓名:
任安虎;任洋洋;王瑶
作者机构:
西安工业大学电子信息工程学院 西安 710021
文献出处:
引用格式:
[1]任安虎;任洋洋;王瑶-.多指标优化的深度强化学习单交叉口信号控制)[J].国外电子测量技术,2022(10):104-111
A类:
B类:
多指标优化,深度强化学习,学习单,单交,交叉口,口信,信号灯,实时变化,交通状态,奖惩,选择策略,略为,贪心策略,余弦,探索未知,SUMO,仿真平台,时方,感应控制,控制方案,延误时间,排队长度,停车次数,交通信号控制,DQN
AB值:
0.341555
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。