首站-论文投稿智能助手
典型文献
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法
文献摘要:
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则.基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数.先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序.之后再设计启发式规则,消解列车在车站和区间的运行冲突.以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序.以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解.结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案.
文献关键词:
高速铁路;列车运行调整;人工智能;强化学习;蒙特卡罗树搜索
作者姓名:
王荣笙;张琦;张涛;王涛;丁舒忻
作者机构:
中国铁道科学研究院研究生部,北京 100081;中国铁道科学研究院集团有限公司通信信号研究所,北京 100081;中国铁道科学研究院集团有限公司国家铁路智能运输系统工程技术研究中心,北京 100081
文献出处:
引用格式:
[1]王荣笙;张琦;张涛;王涛;丁舒忻-.基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法)[J].中国铁道科学,2022(05):146-156
A类:
B类:
蒙特卡罗树搜索,智能调整,调整方法,应急处置效率,列车运行图,晚点,MCTS,RL,离线训练,训练模型,强化学习方法,发车,车次,次序,决策方法,冲突消解,启发式规则,高速铁路列车,列车运行调整,整数,建强,学习环境,状态集,状态转移概率,奖励函数,树结构,出列,再设计,解列,车站,上列,时间最短,在线调整,各次,次列车,京沪高速铁路,路北,京南,泰安,先服,CPLEX,求解器,调整方案
AB值:
0.288797
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。