典型文献
融合领域特征的科技学术会议语义相似性计算方法
文献摘要:
针对目前的语义文本相似度计算方法难以准确估计科技学术会议语义相似性的问题,提出了一种融合领域特征的科技学术会议语义相似度计算方法(siamese-BERT semantic similarity calculation algorithm fused with domain feature,SBFD).通过实体识别和关键词抽取等方式获取会议的领域特征信息,将其作为特征与会议信息共同输入到基于变换器的双向编码器表示网络(bidirectional encoder representations from transformers,BERT)中,采用孪生网络(Siamese Network)的结构解决BERT的各向异性的问题,并对网络的输出进行池化和标准化,利用余弦相似度计算两个会议之间的相似程度.实验结果表明SBFD方法在不同数据集上都取得了较好的效果,斯皮尔曼相关系数有一定程度的提高.
文献关键词:
科技学术会议;深度学习;自然语言处理;语义学习;知识抽取;语义相似度;预训练模型;孪生网络
中图分类号:
作者姓名:
于润羽;李雅文;李昂
作者机构:
北京邮电大学智能通信软件与多媒体北京市重点实验室,北京100876;北京邮电大学经济管理学院,北京 100876
文献出处:
引用格式:
[1]于润羽;李雅文;李昂-.融合领域特征的科技学术会议语义相似性计算方法)[J].智能系统学报,2022(04):737-743
A类:
科技学术会议,语义文本相似度,SBFD
B类:
合领,语义相似性,相似性计算,文本相似度计算,语义相似度,siamese,BERT,semantic,similarity,calculation,algorithm,fused,domain,feature,实体识别,关键词抽取,特征信息,与会,变换器,双向编码器表示,bidirectional,encoder,representations,from,transformers,孪生网络,Siamese,Network,各向异性,出进,池化,余弦相似度,相似程度,斯皮尔曼相关系数,自然语言处理,语义学习,知识抽取,预训练模型
AB值:
0.37629
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。