典型文献
基于强化学习的一类具有输入约束非线性系统最优控制
文献摘要:
针对部分系统存在输入约束和不可测状态的最优控制问题,本文将强化学习中基于执行–评价结构的近似最优算法与反步法相结合,提出了一种最优跟踪控制策略.首先,利用神经网络构造非线性观测器估计系统的不可测状态.然后,设计一种非二次型效用函数解决系统的输入约束问题.相比现有的最优方法,本文提出的最优跟踪控制方法不仅具有反步法在处理n阶系统跟踪问题上的优势,而且保证了所有虚拟控制器均为最优,同时,该方法可以简化控制器设计过程.最后,基于李雅普诺夫稳定性理论,证明了闭环系统中的所有信号一致最终有界.通过仿真结果验证该方法的有效性.
文献关键词:
输入约束;不可测状态;最优控制;强化学习;反步法
中图分类号:
作者姓名:
罗傲;肖文彬;周琪;鲁仁全
作者机构:
广东工业大学广东省智能决策与协同控制重点实验室,广东广州510006
文献出处:
引用格式:
[1]罗傲;肖文彬;周琪;鲁仁全-.基于强化学习的一类具有输入约束非线性系统最优控制)[J].控制理论与应用,2022(01):154-164
A类:
B类:
强化学习,输入约束,非线性系统,系统最优,分系统,不可测状态,最优控制问题,评价结构,最优算法,反步法,最优跟踪,跟踪控制,非线性观测器,二次型效用函数,约束问题,跟踪问题,虚拟控制器,控制器设计,李雅普诺夫稳定性理论,闭环系统,终有,有界
AB值:
0.323669
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。