典型文献
基于深度强化学习的机械臂控制快速训练方法
文献摘要:
人工智能在机器人控制中得到广泛应用,机器人控制算法也逐渐从模型驱动转变为数据驱动.深度强化学习算法可在复杂环境中感知并决策,能够解决高维度和连续状态空间下的机械臂控制问题.然而,目前深度强化学习中数据驱动的训练过程非常依赖计算机GPU算力,且训练时间成本较大.提出基于深度强化学习的先简化模型(2D模型)再复杂模型(3D模型)的机械臂控制快速训练方法.采用深度确定性策略梯度算法代替机械臂传统控制算法中的逆运动学解算方法,直接通过数据驱动的训练过程控制机械臂末端到达目标位置,从而减小训练时间成本.同时,对于状态向量和奖励函数形式,使用不同的设置方式.将最终训练得到的算法模型在真实机械臂上进行实现和验证,结果表明,其控制效果达到了分拣物品的应用要求,相比于直接在3D模型中的训练,能够缩短近52%的平均训练时长.
文献关键词:
机械臂;位置控制;人工智能;深度强化学习;深度确定性策略梯度算法
中图分类号:
作者姓名:
赵寅甫;冯正勇
作者机构:
西华师范大学电子信息工程学院,四川南充637009
文献出处:
引用格式:
[1]赵寅甫;冯正勇-.基于深度强化学习的机械臂控制快速训练方法)[J].计算机工程,2022(08):113-120
A类:
训练时间成本
B类:
机械臂控制,快速训练,训练方法,机器人控制,控制算法,模型驱动,深度强化学习算法,复杂环境,高维度,状态空间,控制问题,训练过程,GPU,算力,简化模型,2D,复杂模型,深度确定性策略梯度算法,逆运动学,解算方法,接通,过程控制,控制机,目标位置,状态向量,奖励函数,设置方式,练得,算法模型,分拣,应用要求,接在,位置控制
AB值:
0.283593
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。