典型文献
基于优化强化学习的多智能体编队最优控制
文献摘要:
针对一类非线性多智能体系统的编队控制问题,设计了基于优化强化学习的最优控制策略.首先,通过设计分布式多智能体性能指标函数获得了多智能体的分布式哈密顿-雅可比.贝尔曼(HJB)方程.利用优化强化学习的方法来求解HJB方程,从而获得最优控制策略,其中评价网络和执行网络分别用于逼近系统的性能指标函数和最优控制策略.与传统强化学习方法相比,所提方法避免了通过基于HJB方程估计误差平方的梯度下降法来获得神经网络的权重更新律的过程,从而简化了控制器设计.然后,通过李雅普诺夫理论证明了闭环控制系统的稳定性.最后,通过仿真实验验证了所提控制方法的有效性.
文献关键词:
多智能体;最优编队控制;强化学习;神经网络
中图分类号:
作者姓名:
张海峰;简燕红;王宏刚;崔琪
作者机构:
国家电网有限公司大数据中心,北京100052
文献出处:
引用格式:
[1]张海峰;简燕红;王宏刚;崔琪-.基于优化强化学习的多智能体编队最优控制)[J].控制工程,2022(12):2316-2321
A类:
最优编队控制
B类:
多智能体编队,最优控制,非线性多智能体系统,控制问题,哈密顿,雅可比,贝尔曼,HJB,执行网络,逼近,强化学习方法,估计误差,梯度下降法,权重更新,控制器设计,李雅普诺夫理论,闭环控制系统
AB值:
0.244785
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。