典型文献
基于特征编码和图嵌入的姓名消歧方法
文献摘要:
针对作者姓名歧义问题,提出基于特征编码和图嵌入的作者姓名消歧方法.该方法首先利用word2vec模型对文档的属性特征进行编码从而构建文档的表征向量,然后采用图自动编码器将文档关系编码至文档向量中,聚类相似文档.为进一步提升聚类结果的准确性,使用图嵌入的方法将文档关系网络和作者关系网络的拓扑结构信息引入文档向量,进一步聚集相关文档.该方法同时利用文档的属性特征以及多个关系网络的信息,通过无监督学习的方法寻找文档表征向量,实现良好的姓名消歧效果.在真实作者数据集AMiner上的测试结果表明,该方法显著优于目前几个其他基于图网络的方法.
文献关键词:
姓名消歧;图神经网络;聚类方法;特征提取;图嵌入
中图分类号:
作者姓名:
马莹莹;吴幼龙;唐华
作者机构:
上海科技大学信息科学与技术学院,上海201210;中国科学院上海微系统与信息技术研究所,上海200050;中国科学院大学,北京100049
文献出处:
引用格式:
[1]马莹莹;吴幼龙;唐华-.基于特征编码和图嵌入的姓名消歧方法)[J].中国科学院大学学报,2022(03):360-368
A类:
B类:
特征编码,图嵌入,歧义问题,作者姓名消歧,word2vec,属性特征,建文,自动编码器,文档关系,关系网络,拓扑结构,结构信息,无监督学习,真实作者,AMiner,法显,图网络,图神经网络,聚类方法
AB值:
0.287479
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。