典型文献
基于融合特征的长文本分类方法
文献摘要:
为解决当前长文本分类算法仅采用全局目标向量作为文本句向量表示,忽略文本明显的语义特征问题,提出一种基于融合特征的长文本分类模型.该模型采用BERT训练词向量表示文本,按照长文本的分层结构进行文本划分,在句向量生成中融合卷积最大池化的特征向量和BERT句向量作为局部文本的最终句向量.最后,通过双向长短期记忆网络提取文本的全局信息,并引入注意力机制关注重点,进行文本分类.提出的分割注意力长文融合模型有效地关注了文本语义特征,获得了较好的分类性能.该模型在海事海商长文数据集和复旦大学中文文本分类语料库2个数据集上进行的文本分类实验表明,该模型相对于基准模型具有更优的表现.
文献关键词:
长文本分类;BERT;注意力机制;CNN;Bi-LSTM
中图分类号:
作者姓名:
鲍闯;乔杰;李海斌;冯姣;李鹏
作者机构:
南京信息工程大学 电子与信息工程学院, 南京 210044;浙江海洋大学 信息工程学院, 浙江 舟山 316022
文献出处:
引用格式:
[1]鲍闯;乔杰;李海斌;冯姣;李鹏-.基于融合特征的长文本分类方法)[J].重庆理工大学学报,2022(09):128-136
A类:
B类:
融合特征,长文本分类,文本分类方法,分类算法,句向量,向量表示,特征问题,分类模型,BERT,词向量,分层结构,最大池化,特征向量,双向长短期记忆网络,全局信息,注意力机制,关注重点,分割注意力,融合模型,文本语义特征,分类性能,海事,海商,复旦大学,中文文本分类,语料库,Bi
AB值:
0.309231
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。