典型文献
                多约束强化学习最优智能滑翔制导方法
            文献摘要:
                    为提升复杂飞行任务下滑翔制导的自主性,提出一种基于最优制导与强化学习的多约束智能滑翔制导策略.引入三维最优制导以满足终端经纬度、高度以及速度倾角约束.提出基于侧向正弦机动的速度控制策略,研究考虑机动飞行的终端速度解析预测方法.针对速度控制中机动幅值无法离线确定的问题,研究基于强化学习的智能调参方法.该方法基于终端速度设计状态空间,以机动幅值设计动作空间,设计综合终端速度误差与滑翔制导任务的回报函数,采用Q-Learning实现机动幅值的智能调整.仿真结果表明,智能滑翔制导方法能够高精度满足终端多种约束,并能有效提升复杂任务下的自主决策能力.
                文献关键词:
                    滑翔飞行;最优制导;智能调参;强化学习;Q-Learning
                中图分类号:
                    作者姓名:
                    
                        朱建文;赵长见;李小平;包为民
                    
                作者机构:
                    西安电子科技大学空间科学与技术学院,西安 710126;中国运载火箭技术研究院,北京 100076;中国航天科技集团公司,北京 100048
                文献出处:
                    
                引用格式:
                    
                        [1]朱建文;赵长见;李小平;包为民-.多约束强化学习最优智能滑翔制导方法)[J].国防科技大学学报,2022(04):116-124
                    
                A类:
                
                B类:
                    多约束,强化学习,制导方法,最优制导,制导策略,经纬度,倾角约束,侧向,正弦,速度控制,机动飞行,终端速度,离线,智能调参,状态空间,动作空间,速度误差,Learning,智能调整,复杂任务,自主决策能力,滑翔飞行
                AB值:
                    0.353356
                相似文献
                
            机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。