首站-论文投稿智能助手
典型文献
面向多目标参数整定的协同深度强化学习方法
文献摘要:
多目标控制参数联合优化整定是自动化系统保持高效、稳定运行的关键问题,强化学习常用于建立自动化调参智能体,代替人工完成参数整定.针对现有方法使用固定权重将多个优化目标线性组合为单目标,训练具有固定调参知识的单智能体模型,导致实际目标关系受环境影响与先验不符时,智能体无法感知并做出适应性决策调整,限制参数整定效果的问题,提出一种面向多目标参数整定的协同深度强化学习方法.该方法利用离线仿真学习目标整定知识建立多个Double-DQN智能体,在线建立整定效果反馈,感知目标实际关系并调整智能体协同策略,实现有效的多目标参数整定.列车自动驾驶参数整定实验结果表明,方法对停车误差、舒适度两个目标整定效果良好,能自适应不同车轨性能且可持续优化,实用价值大.
文献关键词:
参数整定;多目标;强化学习;自动化系统;协同
作者姓名:
罗森林;魏继勋;刘晓双;潘丽敏
作者机构:
北京理工大学信息与电子学院, 北京 100081
引用格式:
[1]罗森林;魏继勋;刘晓双;潘丽敏-.面向多目标参数整定的协同深度强化学习方法)[J].北京理工大学学报,2022(09):969-975
A类:
B类:
参数整定,深度强化学习,强化学习方法,多目标控制,控制参数,数联,联合优化,自动化系统,代替人工,固定权重,优化目标,目标线,线性组合,单目标,定调,智能体模型,先验,决策调整,限制参数,法利,离线仿真,真学习,学习目标,Double,DQN,效果反馈,实际关系,智能体协同,协同策略,列车自动驾驶,停车,两个目标,同车,持续优化
AB值:
0.394145
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。