典型文献
小样本场景下的强化学习研究综述
文献摘要:
根据小样本问题背景,将小样本场景分成两类,第一类场景追求更专业的性能,第二类场景追求更通用的性能.一般在知识泛化过程中,不同的场景对知识载体的需求有着明显的倾向性.针对小样本学习方法,以知识载体的角度,将其分为使用过程性知识的方法和使用陈述性知识的方法,再讨论该分类下的小样本强化学习算法.最后,从理论和应用等方面提出了可能的发展方向,以期为后续研究提供参考.
文献关键词:
强化学习;小样本学习;元学习;迁移学习;终身学习;知识泛化
中图分类号:
作者姓名:
王哲超;傅启明;陈建平;胡伏原;陆悠;吴宏杰
作者机构:
苏州科技大学电子与信息工程学院,江苏 苏州215009;苏州科技大学江苏省建筑智慧节能重点实验室,江苏 苏州215009;苏州科技大学苏州市移动网络技术与应用重点实验室,江苏 苏州215009
文献出处:
引用格式:
[1]王哲超;傅启明;陈建平;胡伏原;陆悠;吴宏杰-.小样本场景下的强化学习研究综述)[J].南京师范大学学报(工程技术版),2022(01):86-92
A类:
知识泛化
B类:
本场,学习研究,小样本问题,问题背景,第一类,第二类,知识载体,倾向性,小样本学习,过程性,陈述性知识,再讨,强化学习算法,元学习,迁移学习,终身学习
AB值:
0.336108
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。