典型文献
基于深度强化学习的无信号交叉口车辆协同控制算法
文献摘要:
针对未来智慧城市智能网联汽车通过无信号交叉口的通行效率问题,本文基于深度强化学习提出了一种渐进式价值期望估计的多智能体协同控制算法(PVE-MCC).设计了基于渐进式学习的价值期望估计策略,通过动态改变价值期望学习目标,保证值函数网络渐进式地持续学习,避免策略网络陷入局部最优解,并将该策略与泛化优势估计算法结合,提升算法收敛精度和稳定性.其次,以通行效率、安全性和舒适性为优化目标,设计了多目标奖励函数来提高多智能体协同控制的综合性能.此外,无信号交叉口易出现的"死锁"现象给多车协同控制带来了巨大的挑战,针对这一问题,基于链表环形检测算法设计了启发式的"死锁"检测-破解干预策略,实现对"死锁"环的提前检测和破解,进一步保障交通通行的安全性.最后,本文搭建了双向六车道无信号交叉口场景的仿真实验平台,进行功能和性能验证.实验结果表明,PVE-MCC算法比现有方案提高交通流量30.47%,单车效率提升了95.56%,舒适性提升了53.82%.
文献关键词:
智能交通;协同控制;强化学习;无信号交叉口;智能网联汽车
中图分类号:
作者姓名:
蒋明智;吴天昊;张琳
作者机构:
北京邮电大学,人工智能学院,北京100876
文献出处:
引用格式:
[1]蒋明智;吴天昊;张琳-.基于深度强化学习的无信号交叉口车辆协同控制算法)[J].交通运输工程与信息学报,2022(02):14-24
A类:
B类:
深度强化学习,无信号交叉口,车辆协同控制,控制算法,智慧城市,智能网联汽车,通行效率,效率问题,渐进式,多智能体协同,PVE,MCC,估计策略,变价,学习目标,值函数,持续学习,策略网络,局部最优解,估计算法,收敛精度,舒适性,优化目标,奖励函数,死锁,多车协同控制,链表,检测算法,算法设计,启发式,干预策略,通通,六车,车道,仿真实验平台,性能验证,交通流量,单车,智能交通
AB值:
0.319332
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。