典型文献
专家监督的SAC强化学习重载列车运行优化控制
文献摘要:
重载列车是我国大宗商品运输的重要方式,因载重大、车身长、线路复杂等因素导致重载列车的控制变得困难.本文将列车运行过程分为启动牵引、巡航控制、停车制动3个阶段,基于多质点重载列车纵向动力学模型,考虑常用空气制动,利用(SAC)强化学习方法,结合循环神经网络对专家经验数据进行行为克隆,并将克隆出的专家策略对强化学习训练进行监督,训练了一种新的智能驾驶操控策略.本文的策略可以高效学习驾驶经验数据,不断从学习中提高目标奖励,得到最优控制策略.仿真结果表明:本文所提的控制策略比未受专家模型监督的强化学习算法更优,奖励提升的周期更快,并能获得更高的奖励,训练出的控制器运行效果更加高效、稳定.
文献关键词:
重载列车;强化学习;行为克隆;专家策略
中图分类号:
作者姓名:
杨辉;王禹;李中奇;付雅婷;谭畅
作者机构:
华东交通大学电气与自动化工程学院,江西南昌330013;江西省先进控制与优化重点实验室,江西南昌330013
文献出处:
引用格式:
[1]杨辉;王禹;李中奇;付雅婷;谭畅-.专家监督的SAC强化学习重载列车运行优化控制)[J].控制理论与应用,2022(05):799-808
A类:
B类:
SAC,重载列车,列车运行,运行优化,优化控制,大宗商品,载重,车身,身长,控制变,巡航控制,停车制动,多质点,纵向动力学模型,空气制动,强化学习方法,循环神经网络,专家经验,经验数据,行行,行为克隆,专家策略,学习训练,智能驾驶,操控,高效学习,驾驶经验,最优控制,强化学习算法,练出,运行效果
AB值:
0.385982
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。