多约束强化学习最优智能滑翔制导方法|朱建文;赵长见;李小平;包为民|中国运载火箭技术研究院,北京 100076 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

多约束强化学习最优智能滑翔制导方法

文献摘要：

为提升复杂飞行任务下滑翔制导的自主性,提出一种基于最优制导与强化学习的多约束智能滑翔制导策略.引入三维最优制导以满足终端经纬度、高度以及速度倾角约束.提出基于侧向正弦机动的速度控制策略,研究考虑机动飞行的终端速度解析预测方法.针对速度控制中机动幅值无法离线确定的问题,研究基于强化学习的智能调参方法.该方法基于终端速度设计状态空间,以机动幅值设计动作空间,设计综合终端速度误差与滑翔制导任务的回报函数,采用Q-Learning实现机动幅值的智能调整.仿真结果表明,智能滑翔制导方法能够高精度满足终端多种约束,并能有效提升复杂任务下的自主决策能力.

文献关键词：

滑翔飞行;最优制导;智能调参;强化学习;Q-Learning

中图分类号：

[1] 武器工业（TJ） / 火箭、导弹（TJ7） / 导弹（TJ76） / 制导与控制（TJ765） / 制导（TJ765.3）

[2] 武器工业（TJ） / 火箭、导弹（TJ7） / 导弹（TJ76） / 制导与控制（TJ765）

[3] 自动化技术、计算机技术（TP） / 自动化技术及设备（TP2） / 自动化系统（TP27） / 自动控制、自动控制系统（TP273）

作者姓名：

朱建文;赵长见;李小平;包为民

作者机构：

西安电子科技大学空间科学与技术学院,西安 710126;中国运载火箭技术研究院,北京 100076;中国航天科技集团公司,北京 100048

文献出处：

国防科技大学学报

引用格式：

[1]朱建文;赵长见;李小平;包为民-.多约束强化学习最优智能滑翔制导方法)[J].国防科技大学学报,2022(04):116-124

A类：

B类：

多约束,强化学习,制导方法,最优制导,制导策略,经纬度,倾角约束,侧向,正弦,速度控制,机动飞行,终端速度,离线,智能调参,状态空间,动作空间,速度误差,Learning,智能调整,复杂任务,自主决策能力,滑翔飞行

AB值：

0.353356

相似文献

终端角度约束制导及制导控制一体化方法综述

赵斌;梁乐成;蒋瑞民;周军-西北工业大学精确制导与控制研究所,西安710072

拦截大气层内机动目标的深度强化学习制导律

邱潇颀;高长生;荆武兴-哈尔滨工业大学航天工程系,哈尔滨150001

一种不依赖剩余时间估计的巡航导弹多约束制导律

王宁宇;王小刚;白瑜亮;崔乃刚;李瑜-哈尔滨工业大学航天学院,哈尔滨150001;北京空天技术研究所,北京100074

天线罩误差下基于ADP的机动目标拦截制导策略

郭建国;胡冠杰;郭宗易;王国庆-西北工业大学精确制导与控制研究所,西安710072;中国运载火箭技术研究院研发部,北京100076

攻击角度约束下的分布式强化学习制导方法

李博皓;安旭曼;杨晓飞;吴云洁;李国飞-北京航空航天大学虚拟现实技术与系统国家重点实验室,北京100191;北京航空航天大学大学自动化科学与电气工程学院,北京100191;飞行器控制一体化技术重点实验室,北京100191;西北工业大学航天学院,西安710072

高超声速机动目标天基跟踪鲁棒性滤波方法

魏世君;翟光;孙一勇;毕幸子;汪宏昇-北京理工大学宇航学院,北京100081;中国科学院微小卫星创新研究院,上海201203;中国运载火箭技术研究院研究发展部,北京100076

大气层内固体火箭多约束鲁棒三维能量管理制导

刘飞;王松艳;杨明;晁涛-哈尔滨工业大学航天学院控制与仿真中心,哈尔滨150001

落角与视场约束制导控制一体化策略

郭宗易;杨晓宏;胡冠杰;郭建国;王国庆-西北工业大学航天学院精确制导与控制研究所,西安710072;中国运载火箭技术研究院研发部,北京100076

基于伪谱凸优化和L1罚函数的弹道规划方法研究

王庆海;陈琦;王中原;尹秋霖-南京理工大学能源与动力工程学院,江苏南京210094

大交会角约束下非线性系统三维能量最优制导律

祝月;徐俊艳;王晓东;宋勋;王蒙一-北京电子工程总体研究所,北京 100854

一种改进的带角度约束最优制导律

李贵栋;陆海英;李志维;韦世顺;张欧-江南机电设计研究所,贵州贵阳 550009

滑翔制导炮弹气动-弹道综合优化方法

赵璇;常思江;张哲玮;赵林林-南京理工大学能源与动力工程学院,南京 210094;中国兵器工业试验测试研究院,陕西华阴 714204;辽沈工业集团有限公司,沈阳 110045

高超声速滑翔飞行器协同轨迹规划方法

王新宇;梁学智;施锐;张栋-西北工业大学航天学院, 西安 710072;中国船舶集团有限公司系统工程研究院, 北京 100081

阻力和升力加速度指令快速解析与跟踪制导

刘刚-中国运载火箭技术研究院, 北京100076

多飞行器突防打击一体化微分对策制导律设计

程涛;周浩;董晓飞;陈万春-北京航空航天大学宇航学院,北京100083;复杂系统控制与智能协同技术重点实验室,北京100074;北京航空航天大学自动化科学与电气工程学院,北京100083

基于凸优化和LQR的火箭返回轨迹跟踪制导

吴杰;张成;李淼;熊芬芬-北京理工大学宇航学院, 北京 100081;北京特种机电研究所, 北京 100012

基于解析解的小范围高频率机动飞行器制导律设计

彭科科;刘国群-中国兵器工业集团航空弹药研究院有限公司, 哈尔滨,150000;哈尔滨工业大学航天学院, 哈尔滨,150001

基于智能图搜索的滑翔式高超声速飞行器路径规划方法

张文敏;王剑颖-中山大学航空航天学院,深圳,518106

临近空间高速目标拦截策略设计

孙兴龙;马克茂;姜宇;侯振乾-哈尔滨工业大学航天学院,黑龙江哈尔滨 150001;上海机电工程研究所,上海 201109

带终端角度约束的双闭环末制导律研究

高伯伦;李剑;刘瑞恒;吕硕;张晓宇;张庆振-北京航空航天大学自动化科学与电气工程学院,北京 100083;北京九天翱翔科技有限公司,北京 100191

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。