首站-论文投稿智能助手
典型文献
TransPath:一种基于深度迁移强化学习的知识推理方法
文献摘要:
基于深度强化学习(Reinforcement Learning,RL)的知识推理旨在推理缺失事实并补全知识图谱,RL智能体在知识图谱上搜索路径,并基于路径进行事实预测和链接预测.由于具有良好的性能和可解释性,基于深度RL的知识推理方法近几年迅速成为研究热点.然而,对于特定实体来说,动作空间中存在大量的无效动作,RL智能体常常会因选择无效动作而终止游走,所以路径挖掘的成功率很低.为了解决无效动作的问题,本文提出一种基于深度迁移强化学习的知识推理方法—TransPath,在目标任务之外增加了单步游走选择有效动作的源任务.首先在源任务上训练单步游走,帮助RL智能体学会选择有效动作,然后迁移到目标推理任务上进行路径搜索训练,提高路径挖掘的成功率.在数据集FB15K-237和NELL-995上的对比实验结果表明,本文方法不仅大幅提升了路径搜索的成功率,而且在大多数推理任务中性能优于同类方法.
文献关键词:
知识推理;强化学习;迁移学习;深度学习;路径搜索
作者姓名:
崔员宁;李静;陈琰;陆正嘉
作者机构:
南京航空航天大学计算机科学与技术学院,南京211106;国网上海市电力公司信息通信公司,上海200000
引用格式:
[1]崔员宁;李静;陈琰;陆正嘉-.TransPath:一种基于深度迁移强化学习的知识推理方法)[J].小型微型计算机系统,2022(03):536-543
A类:
TransPath
B类:
深度迁移,知识推理,推理方法,深度强化学习,Reinforcement,Learning,RL,失事,补全,智能体,搜索路径,行事,事实预测,链接预测,可解释性,速成,动作空间,游走,决无,目标任务,单步,路径搜索,提高路径,FB15K,NELL,迁移学习
AB值:
0.332035
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。