典型文献
基于预训练模型和图卷积网络的中文短文本实体链接
文献摘要:
短文本实体链接由于缺乏主题信息,只能依靠局部短文本信息和知识库.现有方法主要通过计算局部短文本和候选实体之间的相似度完成候选实体集的排序,但并未显式地考虑局部短文本和候选实体在文本交互上的关联性.针对上述问题,该文提出短文本交互图(STIG)的概念和一个双步训练方案,利用BERT提取局部短文本和候选实体间的多粒度特征,并在短文本交互图上使用图卷积机制.此外,为了缓解均值池化使图卷积发生退化的问题,该文提出一个将交互图中各节点特征和边信息压缩成稠密向量的方法.在CCKS2020短文本实体链接数据集上的实验验证了所提方法的有效性.
文献关键词:
实体链接;BERT;图卷积神经网络
中图分类号:
作者姓名:
郭世伟;马博;马玉鹏;杨雅婷
作者机构:
中国科学院新疆理化技术研究所,新疆乌鲁木齐830011;中国科学院大学,北京100049;新疆理化技术研究所新疆民族语音语言信息处理实验室,新疆乌鲁木齐830011
文献出处:
引用格式:
[1]郭世伟;马博;马玉鹏;杨雅婷-.基于预训练模型和图卷积网络的中文短文本实体链接)[J].中文信息学报,2022(12):104-114
A类:
B类:
预训练模型,图卷积网络,短文本,实体链接,文本信息,知识库,显式,STIG,一个双,训练方案,BERT,多粒度特征,池化,节点特征,边信息,信息压缩,压缩成,稠密,CCKS2020,图卷积神经网络
AB值:
0.279527
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。