首站-论文投稿智能助手
典型文献
基于神经网络状态估计器的高速AUV强化学习控制
文献摘要:
随着海洋研究与开发的日益扩大,高速自主水下航行器(AUV)作为重要的无人水下工作平台受到广泛关注.然而由于其模型具有多输入多输出、强耦合欠驱动以及强非线性特性,因此依赖精确模型的传统控制方法在实际应用中常受到限制.针对此问题,文中提出一种不依赖精确模型的强化学习位姿控制器,该控制器通过姿态环和位置环的配合不仅可以实现高速AUV的快速姿态稳定,还可以更快地完成下潜到指定深度的动作;同时,为了降低获取用于训练强化学习控制器数据的成本,结合神经网络技术提出了一种改进的高速AUV状态估计器,该估计器可以在已知当前时刻AUV的状态以及所受控制量的情况下估计出下一时刻的状态,从而为强化学习控制方法提供大量的训练数据.仿真实验结果表明,估计器达到了较高的估计精度,基于神经网络状态估计器训练得到的强化学习控制器可以完成原AUV的平稳快速控制,从而验证了所提方法的可行性及有效性.
文献关键词:
自主水下航行器;强化学习;神经网络;状态估计
作者姓名:
郭可建;林晓波;郝程鹏;侯朝焕
作者机构:
中国科学院大学 集成电路学院, 北京, 100049;中国科学院 声学研究所, 北京, 100190
引用格式:
[1]郭可建;林晓波;郝程鹏;侯朝焕-.基于神经网络状态估计器的高速AUV强化学习控制)[J].水下无人系统学报,2022(02):147-156
A类:
B类:
网络状态,状态估计器,AUV,强化学习,学习控制,海洋研究,研究与开发,自主水下航行器,工作平台,多输入多输出,强耦合,欠驱动,强非线性,非线性特性,受到限制,不依,位姿控制,姿态环,位置环,姿态稳定,下潜,潜到,定深,取用,神经网络技术,受控,控制量,出下,训练数据,估计精度,练得,快速控制
AB值:
0.33008
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。