典型文献
融合字注释的文本分类模型
文献摘要:
针对传统文本特征表示方法无法充分解决一词多义的问题,构建了一种融合字注释的文本分类模型.首先,借助现有中文字典,获取文本由字上下文选取的字典注释,并对其进行Transformer的双向编码器(BERT)编码来生成注释句向量;然后,将注释句向量与字嵌入向量融合作为输入层,并用来丰富输入文本的特征信息;最后,通过双向门控循环单元(BiGRU)学习文本的特征信息,并引入注意力机制突出关键特征向量.在公开数据集THUCNews和新浪微博情感分类数据集上进行的文本分类的实验结果表明,融合BERT字注释的文本分类模型相较未引入字注释的文本分类模型在性能上有显著提高,且在所有文本分类的实验模型中,所提出的BERT字注释_BiGRU_Attention模型有最高的精确率和召回率,能反映整体性能的F1-Score则分别高达98.16%和96.52%.
文献关键词:
一词多义;字注释;基于Transformer的双向编码器;双向门控循环单元;注意力机制;文本分类
中图分类号:
作者姓名:
杨先凤;赵家和;李自强
作者机构:
西南石油大学计算机科学学院,成都610500;四川师范大学影视与传媒学院,成都610066
文献出处:
引用格式:
[1]杨先凤;赵家和;李自强-.融合字注释的文本分类模型)[J].计算机应用,2022(05):1317-1323
A类:
B类:
字注释,文本分类,分类模型,文本特征表示,表示方法,一词多义,字典,上下文,Transformer,双向编码器,BERT,来生,句向量,字嵌入,嵌入向量,向量融合,输入层,特征信息,双向门控循环单元,BiGRU,学习文本,注意力机制,关键特征,特征向量,公开数据集,THUCNews,新浪微博,情感分类,分类数据,实验模型,Attention,精确率,召回率,整体性能,Score
AB值:
0.351591
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。