典型文献
基于强化学习的多目标点航关联方法
文献摘要:
针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning,RL)方法为基础,提出了一种基于Q学习的多目标点迹-航迹关联方法.首先,根据整个过程中目标的运动状态,建立马尔可夫决策过程(Markov Decision Process,MDP)模型.其次,利用各状态间的相关程度构成策略函数,选择准确的动作,并设定相应的奖励函数.最后,考虑杂波密集时虚假量测难以分辨,结合目标先验信息,增加了Q表再学习环节,进一步优化关联精度.仿真结果表明,在非机动和强机动两种环境下,该方法都能准确地关联到目标的量测,具有较好的点迹-航迹关联性能.
文献关键词:
多目标点迹-航迹关联;强化学习;MDP模型;策略函数;Q表再学习
中图分类号:
作者姓名:
丁国胜;蔡民杰
作者机构:
南京电子技术研究所,江苏 南京 210039
文献出处:
引用格式:
[1]丁国胜;蔡民杰-.基于强化学习的多目标点航关联方法)[J].指挥控制与仿真,2022(02):43-48
A类:
B类:
强化学习,多目标点,关联方法,杂波环境,点迹,航迹关联,Reinforcement,Learning,RL,运动状态,立马,马尔可夫决策过程,Markov,Decision,Process,MDP,构成策略,策略函数,奖励函数,波密,先验信息,再学习,学习环节,非机动,强机动
AB值:
0.38758
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。