首站-论文投稿智能助手
典型文献
融合LSTM和PPO算法的移动机器人视觉导航
文献摘要:
为提高移动机器人在无地图情况下的视觉导航能力,提升导航成功率,提出了一种融合长短期记忆神经网络(long short term memory,LSTM)和近端策略优化算法(proximal policy optimization,PPO)算法的移动机器人视觉导航模型.首先,该模型融合LSTM和PPO算法作为视觉导航的网络模型;其次,通过移动机器人动作,与目标距离,运动时间等因素设计奖励函数,用以训练目标;最后,以移动机器人第一视角获得的RGB-D图像及目标点的极性坐标为输入,以移动机器人的连续动作值为输出,实现无地图的端到端视觉导航任务,并根据推理到达未接受过训练的新目标.对比前序算法,该模型在模拟环境中收敛速度更快,旧目标的导航成功率平均提高17.7%,新目标的导航成功率提高23.3%,具有较好的导航性能.
文献关键词:
近端策略优化算法;长短期记忆神经网络;视觉导航
作者姓名:
张仪;冯伟;王卫军;杨之乐;张艳辉;朱子翰;谭勇
作者机构:
中国科学院深圳先进技术研究院 深圳518055;中国科学院大学 北京100049;广东省机器人与智能系统重点实验室 深圳 518055;上海诺倬力机电科技有限公司 上海 200000
引用格式:
[1]张仪;冯伟;王卫军;杨之乐;张艳辉;朱子翰;谭勇-.融合LSTM和PPO算法的移动机器人视觉导航)[J].电子测量与仪器学报,2022(08):132-140
A类:
B类:
PPO,移动机器人,机器人视觉,视觉导航,长短期记忆神经网络,long,short,term,memory,近端策略优化算法,proximal,policy,optimization,航模,模型融合,标距,运动时间,设计奖,奖励函数,第一视角,RGB,标点,动作值,端到端,端视,理到,未接,受过,前序,模拟环境,收敛速度,导航性
AB值:
0.335712
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。