专家监督的SAC强化学习重载列车运行优化控制|杨辉;王禹;李中奇;付雅婷;谭畅|江西省先进控制与优化重点实验室,江西南昌330013 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

专家监督的SAC强化学习重载列车运行优化控制

文献摘要：

重载列车是我国大宗商品运输的重要方式,因载重大、车身长、线路复杂等因素导致重载列车的控制变得困难.本文将列车运行过程分为启动牵引、巡航控制、停车制动3个阶段,基于多质点重载列车纵向动力学模型,考虑常用空气制动,利用(SAC)强化学习方法,结合循环神经网络对专家经验数据进行行为克隆,并将克隆出的专家策略对强化学习训练进行监督,训练了一种新的智能驾驶操控策略.本文的策略可以高效学习驾驶经验数据,不断从学习中提高目标奖励,得到最优控制策略.仿真结果表明:本文所提的控制策略比未受专家模型监督的强化学习算法更优,奖励提升的周期更快,并能获得更高的奖励,训练出的控制器运行效果更加高效、稳定.

文献关键词：

重载列车;强化学习;行为克隆;专家策略

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 自动化技术、计算机技术（TP） / 自动化技术及设备（TP2） / 自动化系统（TP27） / 自动控制、自动控制系统（TP273）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

作者姓名：

杨辉;王禹;李中奇;付雅婷;谭畅

作者机构：

华东交通大学电气与自动化工程学院,江西南昌330013;江西省先进控制与优化重点实验室,江西南昌330013

文献出处：

控制理论与应用

引用格式：

[1]杨辉;王禹;李中奇;付雅婷;谭畅-.专家监督的SAC强化学习重载列车运行优化控制)[J].控制理论与应用,2022(05):799-808

A类：

B类：

SAC,重载列车,列车运行,运行优化,优化控制,大宗商品,载重,车身,身长,控制变,巡航控制,停车制动,多质点,纵向动力学模型,空气制动,强化学习方法,循环神经网络,专家经验,经验数据,行行,行为克隆,专家策略,学习训练,智能驾驶,操控,高效学习,驾驶经验,最优控制,强化学习算法,练出,运行效果

AB值：

0.385982

相似文献

基于多智能体强化学习的乳腺癌致病基因预测

刘健;顾扬;程玉虎;王雪松-地下空间智能控制教育部工程研究中心徐州221116;中国矿业大学信息与控制工程学院徐州221116

基于GPR和深度强化学习的分层人机协作控制

金哲豪;刘安东;俞立-浙江工业大学信息工程学院杭州 310023

基于逆向强化学习的纵向自动驾驶决策方法

高振海;闫相同;高菲-吉林大学,汽车仿真与控制国家重点实验室,长春 130022

基于场景动力学和强化学习的自动驾驶边缘测试场景生成方法

李江坤;邓伟文;任秉韬;王文奇;丁娟-北京航空航天大学交通科学与工程学院,北京 100191;浙江天行健智能科技有限公司,嘉兴 314000

基于强化学习的变电站巡检路径规划算法

马松玲;陈起源;康佳欢-西安建筑科技大学机电工程学院,陕西西安710000

基于ANFIS的多因素PSO_BP_PID算法在列车防冒进中的研究

姜俊彤;李鸿;苏醒-长沙理工大学电气与信息工程学院湖南长沙410114

基于对称交替方向乘子法的单列车最优运行控制

马山;汤超宇;马骏峰;彭涛-中南大学自动化学院,湖南长沙 410083

基于多智能体强化学习的社交网络舆情增强一致性方法

谢光强;许浩然;李杨;陈广福-广东工业大学计算机学院, 广东广州 510006

基于自适应RBF观测器的列车输出反馈控制

刘杨;谭志勇;初宪武;王新屏;王运明;乌干其其格-大连交通大学自动化与电气工程学院,辽宁大连116028;中车大连有限公司海外事业部,辽宁大连116022

基于改进深度强化学习的倒立摆控制器设计

王雨轩;陈思溢;黄辉先-湘潭大学自动化与电子信息学院,湖南湘潭411105

基于优化强化学习的多智能体编队最优控制

张海峰;简燕红;王宏刚;崔琪-国家电网有限公司大数据中心,北京100052

基于改进A2C目标驱动的室内无地图导航方法

王彦臻;胡晗;李文倩;袁士博;和望利-华东理工大学信息科学与工程学院,上海200237;华东理工大学能源化工过程智能制造教育部重点实验室,上海200237

高速列车数据驱动无模型自适应容错控制

王海;刘根锋;侯忠生-北京交通大学电子信息工程学院,北京100044;青岛大学自动化学院,山东青岛266071

基于深度强化学习的微电网在线优化调度

季颖;王建辉-东北大学信息科学与工程学院,沈阳110004

基于强化学习的地铁站空调系统节能控制

焦焕炎;冯浩东;魏东;冉义兵;胡朝文-北京建筑大学电气与信息工程学院,北京100044;建筑大数据智能处理方法研究北京市重点实验室,北京100044;北京兴创置地房地产开发有限公司,北京102600

人群环境中基于深度强化学习的移动机器人避障算法

孙立香;孙晓娴;刘成菊;靖文-盐城工业职业技术学院智能制造学院,江苏盐城 224005;同济人工智能(苏州)研究院,江苏苏州 215131;同济大学电子与信息工程学院,上海 201804

智能微调的混合动力汽车能量管理策略研究

赖晨光;庞玉涵;胡博;杨小青;张苏男;黄志华-重庆理工大学汽车零部件制造及检测技术教育部重点实验室,重庆 400054;重庆理工大学车辆工程学院,重庆 400054

基于强化学习的四足机器人牵引运动控制研究

秦建军;孟圆;曹钰;江磊;苏波-北京建筑大学机电与车辆工程学院, 北京 100044;北京市建筑安全监测工程技术研究中心, 北京 100044;中国北方车辆研究所, 北京 100072

基于数据不平衡下的高速列车小幅蛇行预测方法

宁云志;宁静;李艳萍;陈春俊-西南交通大学机械工程学院成都610031

基于强化学习的艾灸机器人温度控制策略研究

张博;黄山;张浛芮;李应昆;涂海燕-四川大学电气工程学院成都610065;四川省成都市第五人民医院康复医学科成都611130;四川省成都中医药大学附属医院针灸康复科成都610072

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。