典型文献
基于POMDP的电梯群控调度策略
文献摘要:
针对电梯群组系统的随机性和复杂性,以离散事件动态系统和分布式部分可观马尔可夫决策过程为理论基础,将电梯群组的调度问题建模为基于事件驱动的部分可观马尔可夫决策模型,并利用多智能体强化学习算法求解最优调度策略.仿真实验结果表明,所提出的事件驱动Dec-POMDP调度模型不仅能够较好地描述电梯群组系统环境中的不确定性,而且能够避免维度灾难带来的策略优化难题,所得到的最优策略具有较好的调度性能.
文献关键词:
电梯群控系统;离散事件动态系统;马尔可夫决策过程;强化学习
中图分类号:
作者姓名:
彭诚;姚进发;董正山
作者机构:
合肥职业技术学院汽车工程学院,安徽 合肥238010;锐捷网络股份有限公司研究院,福建 福州350002;闽江学院数学与数据科学学院(软件学院) ,福建 福州350108
文献出处:
引用格式:
[1]彭诚;姚进发;董正山-.基于POMDP的电梯群控调度策略)[J].闽江学院学报,2022(05):104-111
A类:
电梯群组
B类:
POMDP,群控调度,调度策略,随机性,离散事件动态系统,部分可观马尔可夫决策过程,调度问题,事件驱动,决策模型,多智能体强化学习算法,最优调度,Dec,调度模型,维度灾难,策略优化,最优策略,略具,电梯群控系统
AB值:
0.256857
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。