首站-论文投稿智能助手
典型文献
基于强化学习的干线信号混合协同优化方法
文献摘要:
交通拥堵已成为很多大中城市普遍存在的社会问题.信号控制作为缓堵保畅的重要措施之一,愈发受到社会关注.信号优化手段可分为模型驱动和数据驱动两类,且随着交通大数据的不断充实,基于强化学习的数据驱动方法日益成为新兴发展方向.然而,现有数据驱动类研究主要偏重于决策模型设计,缺乏对智能体结构的探讨;同时,在多路口协同方面多采用分布式策略,忽略了智能体之间信息交互,无法保障区域层面的整体最优性.为此,本文以干线信号为对象,构建一种多智能体混合式协同决策的信号优化方法.首先,针对交通状态的多样性、异构性及数据不均衡性,设计分布训练-分区记忆的单智能体决策模型,并优化状态空间和回报函数,界定单路口控制的最佳方案;其次,融合分布式和集中式学习的模型优势设计多智能体交互方法,在单路口分布式控制的基础上,设置中心智能体评价局部智能体的决策行为并反馈附加回报以调整局部智能体的决策模型,实现干线多信号的协同运行.最后,搭建仿真平台完成效果测试与算法对比.结果表明:新方法与独立优化和分布式协同相比,在支路交通流基本不受影响的前提下,干线停车次数分别降低了14.8%和13.6%,具有更好的控制效果.
文献关键词:
智能交通;协同决策;深度强化学习;智能体设计;中心智能体
作者姓名:
马东方;陈曦;吴晓东;金盛
作者机构:
浙江大学,海洋传感与网络研究所,杭州310058;公安部,交通管理科学研究所,江苏无锡214151
引用格式:
[1]马东方;陈曦;吴晓东;金盛-.基于强化学习的干线信号混合协同优化方法)[J].交通运输系统工程与信息,2022(02):145-153
A类:
中心智能体
B类:
干线,协同优化,交通拥堵,大中城市,信号控制,信号优化,优化手段,模型驱动,交通大数据,数据驱动方法,兴发,偏重于,决策模型,模型设计,多路口,分布式策略,信息交互,保障区域,最优性,多智能体,协同决策,交通状态,异构性,数据不均衡,不均衡性,状态空间,定单,集中式,交互方法,分布式控制,决策行为,加回,报以,整局,多信号,协同运行,仿真平台,算法对比,分布式协同,同相,支路,交通流,停车次数,智能交通,深度强化学习,智能体设计
AB值:
0.433485
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。