典型文献
基于强化学习的冲压发动机飞行器爬升段轨迹优化控制
文献摘要:
冲压发动机飞行器爬升过程中发动机性能随飞行状态时变,且易受动力性能偏差、气动偏差和风干扰的耦合影响,传统的方法难以给出能量最优的爬升段轨迹解.针对该问题,提出了一种基于强化学习的轨迹优化控制方法.首先构建了基于近端策略优化(PPO)的强化学习任务模型,将轨迹优化问题转化为基于状态给出最优动作策略的强化学习问题,提出了对未到达目标区域样本赋予广义距离奖励的方法来解决奖励稀疏性问题;通过在控制器训练中引入初值采样来降低初值敏感性;提出了将线性扩张状态观测器(LESO)与强化学习相结合的方法,通过对干扰进行观测和补偿提升控制器抗干扰能力.仿真结果表明,采用所提出的算法后,终端约束误差缩小了60%,可为复杂环境下的冲压发动机轨迹优化控制提供参考.
文献关键词:
冲压发动机;轨迹优化;强化学习;线性扩张状态观测器
中图分类号:
作者姓名:
周国峰;严大卫;梁卓
作者机构:
南京航空航天大学 航空学院,南京 210016;中国运载火箭技术研究院,北京 100076
文献出处:
引用格式:
[1]周国峰;严大卫;梁卓-.基于强化学习的冲压发动机飞行器爬升段轨迹优化控制)[J].中国惯性技术学报,2022(01):135-140
A类:
B类:
强化学习,冲压发动机,飞行器,爬升段,轨迹优化,升过,发动机性能,受动,动力性能,风干扰,耦合影响,能量最优,优化控制方法,近端策略优化,PPO,学习任务,任务模型,优化问题,问题转化,学习问题,目标区域,稀疏性,来降,初值敏感性,线性扩张状态观测器,LESO,抗干扰能力,终端约束,复杂环境
AB值:
0.308407
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。