攻击角度约束下的分布式强化学习制导方法|李博皓;安旭曼;杨晓飞;吴云洁;李国飞|北京航空航天大学大学自动化科学与电气工程学院,北京100191 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

攻击角度约束下的分布式强化学习制导方法

文献摘要：

为提高导弹在攻击角度约束下对目标的打击效能,提出了一种基于深度确定性策略梯度算法的分布式强化学习制导策略.为了最大限度地减小攻击角度误差,设计了一种新的奖励函数,使导弹在满足视场角约束的同时,视线角向期望值收敛.此外,为了增强强化学习模型的泛化能力,提出了一种分布式探索策略,提高了模型训练过程中对环境的探索效率.仿真结果验证了所提出的分布式强化学习制导方法能够在固定攻击角度约束下实现对目标的精准打击.与传统制导律相比,所提制导方法的攻击角度误差更小,收敛速度更快.

文献关键词：

导弹制导;强化学习;攻击角度;梯度算法

中图分类号：

[1] 电工技术（TM） / 输配电工程、电力网及电力系统（TM7） / 电力系统的调度、管理、通信（TM73）

[2] 武器工业（TJ） / 火箭、导弹（TJ7） / 导弹（TJ76） / 制导与控制（TJ765）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

作者姓名：

李博皓;安旭曼;杨晓飞;吴云洁;李国飞

作者机构：

北京航空航天大学虚拟现实技术与系统国家重点实验室,北京100191;北京航空航天大学大学自动化科学与电气工程学院,北京100191;飞行器控制一体化技术重点实验室,北京100191;西北工业大学航天学院,西安710072

文献出处：

引用格式：

[1]李博皓;安旭曼;杨晓飞;吴云洁;李国飞-.攻击角度约束下的分布式强化学习制导方法)[J].宇航学报,2022(08):1061-1069

A类：

视场角约束

B类：

攻击角度,角度约束,分布式强化学习,制导方法,深度确定性策略梯度算法,制导策略,角度误差,奖励函数,视线,线角,期望值,强强,泛化能力,探索策略,模型训练,训练过程,统制,制导律,提制,收敛速度,导弹制导

AB值：

0.280191

相似文献

基于终端滑模的打击时间与打击角度约束制导律

郝文欣;宋斌;王鹏宇;朱东方;李传江-哈尔滨工业大学航天学院,哈尔滨 150001;上海宇航系统工程研究所,上海 201108;上海航天控制技术研究所,上海 201109

基于DDPG的三维重建模糊概率点推理

李雷;徐浩;吴素萍-宁夏大学信息工程学院银川750021

一种改进的带角度约束最优制导律

李贵栋;陆海英;李志维;韦世顺;张欧-江南机电设计研究所,贵州贵阳 550009

多弹分布式时间协同非奇异制导方法

杨小艳;张金鹏;马慧敏;宋申民-哈尔滨工业大学航天学院,哈尔滨 150001;航空制导武器航空科技重点实验室,河南洛阳 471009

基于脉冲发动机特性的多弹协同制导律设计

潘辉;张振林;郭超-中国空空导弹研究院,河南洛阳 471009;西北工业大学航天学院,西安 710072

基于积分滑模的自适应固定时间协同制导律

高计委;张金鹏;高刚;何金刚;徐兴元-河南科技大学,河南洛阳 471000;中国空空导弹研究院,河南洛阳 471009;航空制导武器航空科技重点实验室,河南洛阳 471009

考虑攻角约束的导弹制导控制一体化设计

吴笛;王心明;何金刚;张金鹏;李世华-东南大学自动化学院,南京 210096;中国空空导弹研究院,河南洛阳 471009

远程空空导弹角度约束增程弹道制导律研究

张喜豪;张金鹏;沈欣-中国空空导弹研究院,河南洛阳 471009;航空制导武器航空科技重点实验室,河南洛阳 471009;空装驻洛阳地区第一军事代表室,河南洛阳 471009

面向高机动目标拦截任务的空空导弹制导方法综述

纪毅;王伟;张宏岩;范军芳;豆登辉;裴培-北京信息科技大学自动化学院,北京 100192;北京信息科技大学高动态导航技术北京市重点实验室,北京 100192;北京理工大学宇航学院,北京 100081;北京理工大学无人机自主控制技术北京市重点实验室,北京 100081;西安现代控制技术研究所,西安 710065

任意时间收敛碰撞角约束制导律设计

刘远贺;谢年好;欧阳海;黎克波-国防科技大学空天科学学院,长沙 410072;空天任务智能规划与仿真湖南省重点实验室,长沙 410072

基于深度强化学习的空间机械臂柔顺捕获控制方法研究

文闻;周元子;周晓东;陶东-北京控制工程研究所,北京100094;精密转动和传动机构长寿命技术北京市重点实验室,北京100094

考虑目标主动防御的空地弹药微分对策制导

李俊贤;范军芳-北京信息科技大学高动态导航技术北京市重点实验室,北京 100000

阻力和升力加速度指令快速解析与跟踪制导

刘刚-中国运载火箭技术研究院, 北京100076

多飞行器突防打击一体化微分对策制导律设计

程涛;周浩;董晓飞;陈万春-北京航空航天大学宇航学院,北京100083;复杂系统控制与智能协同技术重点实验室,北京100074;北京航空航天大学自动化科学与电气工程学院,北京100083

基于DDPG算法的变体飞行器自主变形决策

桑晨;郭杰;唐胜景;王肖;王子瑶-北京理工大学宇航学院,北京100081;中国运载火箭技术研究院,北京100076

基于凸优化和LQR的火箭返回轨迹跟踪制导

吴杰;张成;李淼;熊芬芬-北京理工大学宇航学院, 北京 100081;北京特种机电研究所, 北京 100012

基于多智能体强化学习的轨道追逃博弈方法

许旭升;党朝辉;宋斌;袁秋帆;肖余之-上海宇航系统工程研究所,上海201109;西北工业大学航天学院,陕西西安710109

弱模型依赖通用智能姿态控制技术

邵会兵;詹韬;付京博-北京控制与电子技术研究所,北京 100038

考虑弹体柔性振荡的全捷联导引头制导信息提取

霍俊鑫;卢晓东;姚雨晗-西北工业大学航天学院,西安,710072;北京电子工程总体研究所,北京,100854

带终端角度约束的双闭环末制导律研究

高伯伦;李剑;刘瑞恒;吕硕;张晓宇;张庆振-北京航空航天大学自动化科学与电气工程学院,北京 100083;北京九天翱翔科技有限公司,北京 100191

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。