典型文献
基于渐进式神经网络的多任务强化学习算法
文献摘要:
介绍了目前有关机器人强化学习和多任务学习的方法和成果.针对现有的强化学习算法在现实环境中采样效率低下和难以进行多任务学习的问题.提出一种基于渐进式神经网络的强化学习(PNNRL)算法.先根据现实原始图像,创建一个包含了现实中重要信息的高效模拟环境,在模拟环境中训练得到一个策略模型,然后基于渐进式神经网络,将模拟环境中训练得到的策略迁移到现实环境中,实现在加快模型收敛速度和数据采样效率的同时,还实现仿真域到现实域的策略迁移和避免了因为迁移学习造成的灾难性遗忘.结合机器人作业任务实验结果显示,PNNRL算法可以有效解决强化学习采样效率低的问题,并且利用渐进式神经网络的特性还可以做到多任务学习.最后对机器人多任务学习的研究前景做了展望.
文献关键词:
强化学习;渐进式神经网络;灾难性遗忘;策略迁移;多任务学习
中图分类号:
作者姓名:
苏萌韬;曾碧
作者机构:
广东工业大学计算机学院,广州 510006
文献出处:
引用格式:
[1]苏萌韬;曾碧-.基于渐进式神经网络的多任务强化学习算法)[J].机电工程技术,2022(11):21-25
A类:
PNNRL
B类:
渐进式神经网络,强化学习算法,关机器,多任务学习,现实环境,采样效率,原始图像,一个包,重要信息,高效模拟,模拟环境,练得,策略迁移,收敛速度,数据采样,迁移学习,灾难性遗忘,作业任务,研究前景
AB值:
0.232919
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。