首站-论文投稿智能助手
典型文献
融合实体外部知识的远程监督关系抽取方法
文献摘要:
远程监督关系抽取旨在从无结构化的文本当中发现关系事实,它对许多下游任务有着非常重要的意义.虽然远程监督可以自动地生成大量带标签的训练样本,但是自动标注的过程不可避免地会遇到噪声数据的问题.当前的许多研究工作主要把关注点放在降噪的过程当中,尝试通过选择出正确的句子来生成更有效的包级别特征表示.但是在文本语料之外,还存在着大量与实体相关的外部知识没有被充分利用,而这些知识能够帮助模型更好地理解实体之间的关系.基于这一观察,提出了 一种新颖的远程监督关系抽取方法,该方法通过利用外部知识图谱当中的结构化知识和文本语料中的语义知识,设计了一种实体知识感知的词嵌入表示方法,来丰富句子级别的特征表达能力.实验结果表明,在2个版本的大规模"纽约时报"基准数据集上,该方法都明显优于其他方法.此外,还通过对比实验进一步探索了2个版本的数据集所存在的差异,其中无实体交集的数据集能够更有效地反映模型性能.
文献关键词:
关系抽取;远程监督;知识表示;词嵌入;门控机制
作者姓名:
高建伟;万怀宇;林友芳
作者机构:
北京交通大学计算机与信息技术学院,北京 100044
引用格式:
[1]高建伟;万怀宇;林友芳-.融合实体外部知识的远程监督关系抽取方法)[J].计算机研究与发展,2022(12):2794-2802
A类:
B类:
外部知识,远程监督关系抽取,无结,本当,多下,训练样本,自动标注,会遇,噪声数据,把关,关注点,降噪,来生,特征表示,语料,一观,结构化知识,语义知识,体知,知识感知,词嵌入表示,表示方法,句子级,特征表达,表达能力,纽约时报,基准数据集,其他方法,交集,模型性能,知识表示,门控机制
AB值:
0.367951
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。