首站-论文投稿智能助手
典型文献
人群环境中基于深度强化学习的移动机器人避障算法
文献摘要:
为了控制移动机器人在人群密集的复杂环境中高效友好地完成避障任务,本文提出了一种人群环境中基于深度强化学习的移动机器人避障算法.首先,针对深度强化学习算法中值函数网络学习能力不足的情况,基于行人交互(crowd interaction)对值函数网络做了改进,通过行人角度网格(angel pedestrian grid)对行人之间的交互信息进行提取,并通过注意力机制(attention mechanism)提取单个行人的时序特征,学习得到当前状态与历史轨迹状态的相对重要性以及对机器人避障策略的联合影响,为之后多层感知机的学习提供先验知识;其次,依据行人空间行为(human spatial behavior)设计强化学习的奖励函数,并对机器人角度变化过大的状态进行惩罚,实现了舒适避障的要求;最后,通过仿真实验验证了人群环境中基于深度强化学习的移动机器人避障算法在人群密集的复杂环境中的可行性与有效性.
文献关键词:
深度强化学习;人机共融;行人空间行为;移动机器人避障
作者姓名:
孙立香;孙晓娴;刘成菊;靖文
作者机构:
盐城工业职业技术学院智能制造学院,江苏盐城 224005;同济人工智能(苏州)研究院,江苏苏州 215131;同济大学电子与信息工程学院,上海 201804
文献出处:
引用格式:
[1]孙立香;孙晓娴;刘成菊;靖文-.人群环境中基于深度强化学习的移动机器人避障算法)[J].信息与控制,2022(01):107-118
A类:
行人空间行为
B类:
群环,移动机器人避障,避障算法,复杂环境,深度强化学习算法,中值,值函数,网络学习能力,行人交互,crowd,interaction,angel,pedestrian,grid,交互信息,注意力机制,attention,mechanism,时序特征,习得,历史轨迹,相对重要性,避障策略,联合影响,多层感知机,先验知识,human,spatial,behavior,奖励函数,人机共融
AB值:
0.285897
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。