典型文献
基于强化学习的四足机器人牵引运动控制研究
文献摘要:
针对四足机器人在拖拽运动控制中高度依赖于动力学模型精确度的问题,提出一种基于双延迟深度确定性策略梯度算法(twin delayed deep deterministic policy gradient,TD3)的四足机器人拖拽运动的控制方法.通过分析四足机器人拖拽模型,建立其拖拽运动的训练环境;采用TD3算法搭建四足机器人拖拽运动控制模型,通过MATLAB Simulation R2022的运动仿真,验证该控制器的可行性,并对实验数据进行对比分析.结果表明:在无拖拽且缺少先验知识条件下,采用该控制策略达到稳态的时间比采用深度确定性策略梯度算法(deep deterministic poli-cy gradient,DDPG)的控制策略所用训练周期缩短了2/3;在加载0.4 kg拖拽重物的条件下,该控制策略下的四足机器人平均速度下降幅度较小,各关节扭矩平稳顺滑,姿态角在可控范围内.
文献关键词:
深度强化学习;四足机器人;拖拽运动;TD3
中图分类号:
作者姓名:
秦建军;孟圆;曹钰;江磊;苏波
作者机构:
北京建筑大学 机电与车辆工程学院, 北京 100044;北京市建筑安全监测工程技术研究中心, 北京 100044;中国北方车辆研究所, 北京 100072
文献出处:
引用格式:
[1]秦建军;孟圆;曹钰;江磊;苏波-.基于强化学习的四足机器人牵引运动控制研究)[J].重庆理工大学学报,2022(12):80-91
A类:
拖拽运动,R2022
B类:
四足机器人,运动控制,双延迟深度确定性策略梯度算法,twin,delayed,deep,deterministic,policy,gradient,TD3,控制模型,Simulation,运动仿真,先验知识,DDPG,训练周期,重物,人平,平均速度,关节扭矩,顺滑,姿态角,深度强化学习
AB值:
0.203489
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。