典型文献
基于Q学习的智能交通信号灯优化
文献摘要:
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经过卷积网络层进行特征提取,以捕捉更精确、完整的交叉口信息.分别基于相位切换策略和马尔科夫决策过程型(Markov decision process,MDP)动作策略,利用SUMO交通仿真软件进行模拟训练.结果表明,与传统的定时定序信号灯控制策略相比,相位切换策略下车辆的平均等待时间减少了约45%,而MDP动作策略下减少了约78%.
文献关键词:
自适应交通信号控制;Q学习;相位切换;马尔科夫决策过程
中图分类号:
作者姓名:
宋国治;苏鹏博;刘畅;陈玉格
作者机构:
天津工业大学 计算机科学与技术学院 天津 300387
文献出处:
引用格式:
[1]宋国治;苏鹏博;刘畅;陈玉格-.基于Q学习的智能交通信号灯优化)[J].郑州大学学报(理学版),2022(05):57-63
A类:
相位切换
B类:
智能交通,交通信号灯,学习发展,D3QN,智能体,交通状态,状态集,交叉口,二维矩阵,矩阵图,图经,卷积网络,网络层,层进,口信,切换策略,马尔科夫决策过程,Markov,decision,process,MDP,SUMO,交通仿真,模拟训练,信号灯控制,下车,平均等待时间,自适应交通信号控制
AB值:
0.390363
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。