首站-论文投稿智能助手
典型文献
融合强化学习和进化算法的高超声速飞行器航迹规划
文献摘要:
由于高超声速飞行器的复杂特性,对其进行航迹规划是一项非常困难的任务.本文针对高超声速飞行器巡航段,提出了一种将无模型的强化学习和交叉熵方法相结合的在线航迹规划算法.本文将航迹规划问题建模为环境信息缺失程度不同的马尔可夫决策过程,利用(PPO)算法在建立的飞行环境模拟器中离线训练智能体,并通过提高智能体的动作在时间上的相关性来保证航迹的曲率平滑.交叉熵方法则以已训练的智能体由观测到的状态给出的动作作为一种先验知识,进一步在线优化规划策略.实验结果表明了本文的方法可以生成曲率平滑的航迹,在复杂的飞行环境中具有较高的成功率,并且可以泛化到不同的飞行环境中.
文献关键词:
强化学习;深度强化学习;高超声速飞行器;航迹规划
作者姓名:
池海红;周明鑫
作者机构:
哈尔滨工程大学智能科学与工程学院,黑龙江哈尔滨150001
文献出处:
引用格式:
[1]池海红;周明鑫-.融合强化学习和进化算法的高超声速飞行器航迹规划)[J].控制理论与应用,2022(05):847-856
A类:
飞行环境模拟
B类:
进化算法,高超声速飞行器,巡航,无模型,交叉熵,熵方法,航迹规划算法,规划问题,环境信息,信息缺失,马尔可夫决策过程,PPO,模拟器,离线训练,智能体,高智能,曲率,先验知识,在线优化,优化规划,规划策略,深度强化学习
AB值:
0.218247
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。