首站-论文投稿智能助手
典型文献
基于深度强化学习的端到端无人机避障决策
文献摘要:
针对传统无人机避障算法需要构建离线三维地图以及速度控制不连续、速度方向选择受限的.问题,基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)的深度强化学习算法,对无人机连续型动作输出的端到端避障决策方法展开研究.建立了基于DDPG算法的端到端决策控制模型,该模型可以根据感知得到的连续状态信息输出连续控制变量即无人机避障动作;在UE4+Airsim的平台下进行了训练验证表明该模型可以实现端到端的无人机避障决策,与数据来源相同的三维向量场直方图(three dimensional vector field histogram,3DVFH)避障算法模型进行了对比分析,实验表明DDPG算法对无人机的避障轨迹有更好的优化效果.
文献关键词:
无人机;避障;DDPG;强化学习
作者姓名:
张云燕;魏瑶;刘昊;杨尧
作者机构:
西北工业大学电子信息学院,陕西西安 710072;西北工业大学航天学院,陕西西安 710072;西北工业大学无人系统技术研究院,陕西西安 710072
引用格式:
[1]张云燕;魏瑶;刘昊;杨尧-.基于深度强化学习的端到端无人机避障决策)[J].西北工业大学学报,2022(05):1055-1064
A类:
UE4+Airsim,3DVFH
B类:
无人机避障,避障算法,离线,速度控制,方向选择,择受,深度确定性策略梯度,deep,deterministic,policy,gradient,DDPG,深度强化学习算法,连续型,决策方法,端到端决策,决策控制,控制模型,状态信息,信息输出,连续控制,控制变量,台下,数据来源,向量场,直方图,three,dimensional,vector,field,histogram,算法模型,优化效果
AB值:
0.388129
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。