典型文献
基于课程学习的深度强化学习研究综述
文献摘要:
作为解决序贯决策的机器学习方法,强化学习采用交互试错的方法学习最优策略,能够契合人类的智能决策方式.基于课程学习的深度强化学习是强化学习领域的一个研究热点,它针对强化学习智能体在面临高维状态空间和动作空间时学习效率低、难以收敛的问题,通过抽取一个或多个简单源任务训练优化过程中的共性知识,加速或改善复杂目标任务的学习.论文首先介绍了课程学习的基础知识,从四个角度对深度强化学习中的课程学习最新研究进展进行了综述,包括基于网络优化的课程学习、基于多智能体合作的课程学习、基于能力评估的课程学习、基于功能函数的课程学习.然后对课程强化学习最新发展情况进行了分析,并对深度强化学习中的课程学习的当前存在问题和解决思路进行了总结归纳.最后,基于当前课程学习在深度强化学习中的应用,对课程强化学习的发展和研究方向进行了总结.
文献关键词:
强化学习;深度学习;深度强化学习;课程学习;迁移学习
中图分类号:
作者姓名:
林泽阳;赖俊;陈希亮
作者机构:
陆军工程大学 指挥控制工程学院,江苏 南京 210007
文献出处:
引用格式:
[1]林泽阳;赖俊;陈希亮-.基于课程学习的深度强化学习研究综述)[J].计算机技术与发展,2022(11):16-23
A类:
B类:
课程学习,深度强化学习,学习研究,序贯决策,机器学习方法,试错,方法学,最优策略,智能决策,学习领域,临高,高维,状态空间,动作空间,学习效率,性知识,目标任务,基础知识,最新研究进展,网络优化,多智能体,能力评估,功能函数,最新发展,解决思路,迁移学习
AB值:
0.292604
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。