典型文献
基于改进强化学习的无人机规避决策控制算法
文献摘要:
针对当前无人机常用的"建图+规划"避障方法依赖于地图,构图模型参数适应性不强等问题,将无人机自主避障问题转化为强化学习框架下的决策控制问题,提出基于改进强化学习的无人机规避决策控制算法,并设计了适用于无人机导航避障控制任务的D3QN结构.实验结果表明,所设计的D3QN结构相比经典DQN结构可提升约25% 的训练效率,经过训练之后的D3QN网络能根据视觉信息做出可靠的规避控制决策,能用于指导无人机在未知无图等典型场景中进行无碰撞的探索飞行或导航飞行.
文献关键词:
视觉避障;强化学习;马尔可夫决策;深度Q网络
中图分类号:
作者姓名:
Tajmihir Islam Teethi;卢虎;闵欢;卞志昂
作者机构:
空军工程大学信息与导航学院,陕西西安710077
文献出处:
引用格式:
[1]Tajmihir Islam Teethi;卢虎;闵欢;卞志昂-.基于改进强化学习的无人机规避决策控制算法)[J].探测与控制学报,2022(03):68-73
A类:
B类:
强化学习,决策控制,控制算法,建图,避障方法,构图,图模型,自主避障,问题转化,控制问题,无人机导航,导航避障,避障控制,D3QN,DQN,训练效率,经过训练,视觉信息,控制决策,无图,典型场景,视觉避障,马尔可夫决策
AB值:
0.434564
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。