基于无模型强化学习的雷达波束多阶段管理方法|马智杰;王远航;姜家财;张天贤|中国电子科技集团公司第十研究所,成都610036 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于无模型强化学习的雷达波束多阶段管理方法

文献摘要：

火控雷达(FCR)工作时常常面临转发式干扰的挑战,考虑二者间多阶段对抗场景,针对未知环境模型下雷达波束多阶段管理问题,提出了一种基于无模型强化学习的波束驻留时间优化方法.首先,建立了未知环境模型下的马尔可夫决策过程,用于多阶段波束驻留时间优化,为了评价雷达探测的性能,以FCR对目标锁定时间的期望为评价标准;然后,为克服未知环境模型的挑战,提出了一种面向多阶段波束驻留时间优化的强化学习框架,并在此基础上提出了一种基于Q学习的驻留时间优化方法;最后,通过数值仿真验证了该方法的有效性.

文献关键词：

雷达波束管理;多阶段驻留时间优化;未知环境模型;Q学习

中图分类号：

[1] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[2] 无线电电子学、电信技术（TN） / 雷达（TN95） / 雷达设备、雷达站（TN957） / 雷达接收设备（TN957.5） / 雷达信号检测处理（TN957.51）

[3] 无线电电子学、电信技术（TN） / 雷达（TN95） / 雷达：按体制分（TN958）

作者姓名：

马智杰;王远航;姜家财;张天贤

作者机构：

电子科技大学信息与通信工程学院,成都611731;中国电子科技集团公司第十研究所,成都610036

文献出处：

引用格式：

[1]马智杰;王远航;姜家财;张天贤-.基于无模型强化学习的雷达波束多阶段管理方法)[J].现代雷达,2022(11):44-50

A类：

未知环境模型,雷达波束管理,多阶段驻留时间优化

B类：

无模型,强化学习,火控雷达,FCR,转发式,管理问题,马尔可夫决策过程,雷达探测,目标锁定,仿真验证

AB值：

0.119713

相似文献

基于快速强化学习的无线通信干扰规避策略

李芳;熊俊;赵肖迪;赵海涛;魏急波;苏曼-国防科技大学电子科学学院长沙 410073;湖南大学电气与信息工程学院长沙 410082;北京跟踪与通信技术研究所北京 100094

基于类单边带时间调制阵列宽带通信的优化方法

刘冬平;杨柳;夏雨;陈靖峰;金荣洪-上海交通大学电子工程系,上海200240

米波MIMO雷达波束空间精确最大似然算法

陈胜;赵永波;庞晓娇;胡毅立;曹成虎-西安电子科技大学雷达信号处理国家重点实验室,陕西西安710071

基于FDA-MIMO雷达的主瓣SMSP干扰空时域联合抑制方法

赵英健;田波;王春阳;宫健;谭铭;周长霖-空军工程大学防空反导学院,陕西西安710051;国防科技大学信息通信学院,湖北武汉430010

基于马尔可夫的多功能雷达认知干扰决策建模研究

朱霸坤;朱卫纲;李伟;杨莹;高天昊-航天工程大学电子光学工程系,北京101416;电子信息系统复杂电磁环境效应国家重点实验室,河南洛阳471032;航天工程大学研究生院,北京101416

基于先验知识的多功能雷达智能干扰决策方法

朱霸坤;朱卫纲;李伟;杨莹;高天昊-航天工程大学电子光学工程系,北京101416;电子信息系统复杂电磁环境效应国家重点实验室,河南洛阳471032;航天工程大学研究生院,北京101416

一种相位域低积分旁瓣雷达波形优化方法

王鑫海;王超宇;张宁;陈伟-中国船舶重工集团公司第七二四研究所南京 211153

基于波形优化和天线位置选择的MIMO雷达波束扫描算法研究

范文;蔚保国;陈镜;张航;李淳泽-中国电子科技集团公司第五十四研究所石家庄 050081;卫星导航系统与装备技术国家重点实验室石家庄 050081;西北工业大学电子信息学院西安 710072

基于交替方向惩罚法的低精度量化MIMO雷达恒模波形设计方法

万环;余显祥;全智;廖斌-深圳大学电子与信息工程学院深圳 518060;电子科技大学信息与通信工程学院成都 611731

面向目标跟踪的机载组网雷达辐射参数与航迹规划联合优化算法

时晨光;王奕杰;代向荣;周建江-南京航空航天大学雷达成像与微波光子技术教育部重点实验室南京 210016

WSN中基于强化学习的能效优化任务处理机制

张明杰;朱江-重庆邮电大学通信与信息工程学院,移动通信教育部工程研究中心,移动通信技术重庆市重点实验室,重庆400065

GEO SAR中精确的面目标回波仿真方法

常法光;李德鑫;董臻-国防科技大学电子科学学院,湖南长沙410073

基于深度强化学习的多域联合干扰规避

潘筱茜;张姣;刘琰;王杉;陈海涛;赵海涛;魏急波-国防科技大学电子科学学院,湖南长沙 410073;中国人民解放军91428部队,浙江宁波 315456

一种基于K-means聚类的跳频信号快速检测方法

侯范;姚志成;杨剑;李昱婷;王自维-火箭军工程大学导弹工程学院,西安 710025

5G异构网络中基于熵权TOPSIS的小区预切换方法

陈发堂;杨玲;贾俊文;杜海涛;粟栗-重庆邮电大学通信与信息工程学院,重庆400065;中国移动通信集团公司研究院,北京100053

阵面机械轴误差对相控阵雷达测角精度影响分析与验证

唐晓雷;王索建-南京电子技术研究所,南京210039

分布式MIMO雷达时间与阵面资源自适应调度算法

杨力萍;廖可非;欧阳缮-桂林电子科技大学信息与通信学院, 广西桂林 541004;桂林电子科技大学卫星导航定位与位置服务国家地方联合工程研究中心, 广西桂林 541004

二维相控阵雷达波束空间扫描计算与分析

郑东卫;白亚莉-西安电子工程研究所西安 710100;西安昆仑工业(集团)有限责任公司西安 710043

相控阵雷达动平台波束稳定建模与仿真分析

廖育富;游斌相;任午龙;马婕-四川九洲空管科技有限责任公司四川绵阳 621000;国家空管监视与通信系统工程技术研究中心四川绵阳 621000

航天器轨道追逃博弈多阶段强化学习训练方法

袁利;耿远卓;汤亮;黄煌-北京控制工程研究所,北京 100094;空间智能控制技术重点实验室,北京 100094

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。