首站-论文投稿智能助手
典型文献
一种增强的多粒度特征融合语义匹配模型
文献摘要:
语义匹配作为自然语言处理任务中重要的一环,直接制约问答系统、信息检索等任务的效率.针对现有语义模型大多只以词为基本语义单元进行注意力交互,较少考虑中文中的词边界模糊和字符信息获取不足而带来的语言颗粒度对整体建模忽略的问题,提出一种增强的多粒度特征融合语义匹配模型EMGFM.首先结合BERT模型和word2vec以获得增强的字符向量表示,然后从字、词、句三种粒度进行注意力的交互,并对交互结果进行加权融合,以突出不同交互信息对整体建模的贡献.为减少交互过程中产生的信息损失,通过构造差异性来对交互信息进行信息增强.最后通过最大池化、平均池化两种方式获得文本的最终语义表示以进行匹配度的计算.该模型在CCKS问句匹配大赛中文数据集上达到了87%的正确率,相比于一些语义匹配的经典模型准确率均有提升,证明该方法确实能有效提升问句语义匹配的准确性.
文献关键词:
语义匹配;语言颗粒度;Siamese网络;可分解注意力机制;BERT模型
作者姓名:
尚福华;蒋毅文;曹茂俊
作者机构:
东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318
引用格式:
[1]尚福华;蒋毅文;曹茂俊-.一种增强的多粒度特征融合语义匹配模型)[J].计算机技术与发展,2022(07):28-33
A类:
语言颗粒度,EMGFM,可分解注意力机制
B类:
多粒度特征融合,合语,语义匹配,匹配模型,配作,自然语言处理,问答系统,信息检索,语义模型,多只,力交互,词边界,边界模糊,字符,信息获取,整体建模,BERT,word2vec,向量表示,加权融合,交互信息,少交,信息损失,构造差异性,信息增强,最大池化,平均池化,两种方式,匹配度,CCKS,问句,中文数据集,上达,模型准确率,Siamese
AB值:
0.354786
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。