典型文献
基于改进TD3算法的机械臂智能规划方法研究
文献摘要:
针对某卫星搭载的4自由度机械臂轨迹规划问题,提出了一种基于改进的双延迟深度确定性策略梯度(TD3)算法的智能规划方法.该方法采用分阶段训练策略,在预训练阶段,采用了目标位置引导联合TD3算法进行轨迹优化的混合规划策略,训练结束后规划算法能够在机械臂关节空间对任意起点、终点进行速度轨迹的自主规划.这种目标引导机制减少了训练时不必要的探索,在一定程度上解决了高维动作空间中学习效率低下的问题.在二次训练阶段,首先通过示教获得一条无碰撞的安全参考轨迹,然后在训练过程中不断对这条轨迹进行模仿,使得最终算法输出的轨迹具备避障能力.
文献关键词:
避障规划;目标引导;轨迹示教;双重训练
中图分类号:
作者姓名:
张强;文闻;周晓东;刘维惠;初晓昱
作者机构:
北京控制工程研究所,北京 100190
文献出处:
引用格式:
[1]张强;文闻;周晓东;刘维惠;初晓昱-.基于改进TD3算法的机械臂智能规划方法研究)[J].智能科学与技术学报,2022(02):223-232
A类:
双重训练
B类:
TD3,智能规划,规划方法,搭载,机械臂轨迹,轨迹规划,规划问题,双延迟深度确定性策略梯度,分阶段,阶段训练,训练策略,预训练,训练阶段,目标位置,轨迹优化,规划策略,划算,关节空间,行速,自主规划,目标引导,引导机制,不必要,高维,动作空间,学习效率,全参考,训练过程,这条,避障规划,轨迹示教
AB值:
0.449378
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。