典型文献
自适应学习率的增量强化学习飞行控制
文献摘要:
针对预先设定学习率的增量强化学习(IRL)飞行控制律失败率较高,并且无法适应飞行器大范围动力学特性变化下的稳定控制问题,提出一种自适应学习率的增量强化学习(ALRIRL)控制方法.首先,基于小波分析方法构造控制系统稳定度评价函数,用于评估控制器稳定度.然后,基于梯度下降法设计学习率在线迭代计算方法,以提升强化学习控制器的收敛性.最后,通过随机初始状态及随机动压变化下蒙特卡洛打靶试验和数学仿真来验证ALRIRL算法,仿真结果表明提出的方法能够根据参考状态跟踪误差振荡情况自适应调整学习率参数,实现飞行姿态稳定跟踪控制,提高强化学习飞行控制器的成功率.该方法减轻了 IRL飞行控制算法对预先设定学习率超参数的依赖,拓宽了 IRL在飞行器大范围动力学参数变化情况下的应用.
文献关键词:
自适应学习率;小波分析;飞行控制;增量强化学习
中图分类号:
作者姓名:
刘俊辉;单家元;荣吉利;郑雄
作者机构:
北京理工大学宇航学院,北京100081;北京理工大学飞行器动力学与控制教育部重点实验室,北京100081;中国运载火箭技术研究院,北京100076
文献出处:
引用格式:
[1]刘俊辉;单家元;荣吉利;郑雄-.自适应学习率的增量强化学习飞行控制)[J].宇航学报,2022(01):111-121
A类:
增量强化学习,ALRIRL,在线迭代计算方法
B类:
自适应学习率,定学,飞行控制律,失败率,飞行器,动力学特性,稳定控制,控制问题,于小波,小波分析方法,构造控制,系统稳定,稳定度,评价函数,梯度下降法,设计学习,学习控制,收敛性,初始状态,动压,蒙特卡洛,打靶,数学仿真,参考状态,状态跟踪,跟踪误差,自适应调整,学习率参数,飞行姿态,姿态稳定,稳定跟踪控制,飞行控制器,控制算法,超参数,动力学参数,参数变化
AB值:
0.30831
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。