首站-论文投稿智能助手
典型文献
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
文献摘要:
深度Q学习网络(DQN)因具有强大的感知能力和决策能力而成为解决交通信号灯配时问题的有效方法,然而外部环境扰动和内部参数波动等原因导致的参数不确定性问题限制了其在交通信号灯配时系统领域的进一步发展.基于此,提出了一种DQN与扩展卡尔曼滤波(EKF)相结合(DQN-EKF)的交通信号灯配时方法.以估计网络的不确定性参数值作为状态变量,包含不确定性参数的目标网络值作为观测变量,结合过程噪声、包含不确定性参数的估计网络值和系统观测噪声构造EKF系统方程,通过EKF的迭代更新求解,得到DQN模型中的最优真实参数估计值,解决DQN模型中的参数不确定性问题.实验结果表明:DQN-EKF配时方法适用于不同的交通环境,并能够有效提高车辆的通行效率.
文献关键词:
深度Q学习网络(DQN);感知能力;决策能力;交通信号灯配时系统;参数不确定性;扩展卡尔曼滤波(EKF)
作者姓名:
吴兰;吴元明;孔凡士;李斌全
作者机构:
河南工业大学 电气工程学院, 郑州 450001;郑州铁路职业技术学院 电气工程学院, 郑州 450001
引用格式:
[1]吴兰;吴元明;孔凡士;李斌全-.基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法)[J].北京航空航天大学学报,2022(08):1353-1363
A类:
交通信号灯配时系统
B类:
深度强化学习,扩展卡尔曼滤波,配时方法,学习网络,DQN,感知能力,决策能力,而外,环境扰动,参数不确定性,EKF,不确定性参数,参数值,状态变量,目标网,观测变量,过程噪声,系统观,迭代更新,实参,参数估计,估计值,交通环境,高车,通行效率
AB值:
0.20471
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。