首站-论文投稿智能助手
典型文献
基于改进Q学习的机械臂实时障碍规避方法
文献摘要:
为了提高实时机械臂规避障碍物的适应性,提出一种基于改进Q学习的控制规避方法.首先,利用深度增强学习对机械臂动作给予奖励和惩罚,并通过深度神经网络学习特征表示.然后,采用状态和动作集合以及环境迁移概率矩阵定义马尔科夫决策过程;同时,将归一化优势函数与Q学习算法相结合,以支持在连续空间中定义的机器人系统.实验结果表明:所提方法解决了Q学习收敛速度慢的缺点,实现了高性能机械臂的实时避障,有助于实现人机安全共存.
文献关键词:
机械臂;马尔科夫决策;深度增强学习;Q学习;归一化优势函数
作者姓名:
吴戴燕;刘世林
作者机构:
安徽六安技师学院 机电工程系,安徽 六安 237001;安徽工程大学 电子工程学院,安徽 芜湖 241000
文献出处:
引用格式:
[1]吴戴燕;刘世林-.基于改进Q学习的机械臂实时障碍规避方法)[J].台州学院学报,2022(06):13-20
A类:
归一化优势函数
B类:
机械臂,障碍规避,规避方法,高实时,障碍物,制规,深度增强学习,深度神经网络,神经网络学习,学习特征,特征表示,义马,马尔科夫决策过程,连续空间,机器人系统,收敛速度,速度慢,实时避障
AB值:
0.305165
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。