首站-论文投稿智能助手
典型文献
基于多模型融合的开源情报文本分类方法
文献摘要:
为了提升开源情报文本分类性能,提出了一种基于多模型融合的中文新闻文本分类方法.利用结合TextRank提取关键句的方法完成文本预处理,利用词向量技术完成长文本的分布式表示;使用等长卷积进行文本局部特征抽取,引入短路连接的思想,将抽取结果送入结合自注意力的双向长短时记忆网络(SA-LSTM)生成文本的序列特征;另外,抽取结果经过最大池化层进行特征压缩后直接输出,将二者融合实现新闻长文本分类.使用自制的中文新闻文本数据集进行试验,试验结果表明,与TextCNN、RCNN和DPCNN等主流文本分类模型相比,该方法具有更高分类准确率,验证了该方法在新闻文本分类上的有效性.
文献关键词:
开源情报;文本分类;多模型融合
作者姓名:
郭文强;张志政
作者机构:
东南大学网络空间安全学院 南京 211189;东南大学计算机科学与工程学院 南京 211189
引用格式:
[1]郭文强;张志政-.基于多模型融合的开源情报文本分类方法)[J].指挥信息系统与技术,2022(03):44-51
A类:
B类:
多模型融合,开源情报,报文,文本分类方法,分类性能,中文新闻,新闻文本分类,TextRank,关键句,成文,文本预处理,用词,词向量,等长,长卷,本局,局部特征,特征抽取,短路,送入,自注意力,双向长短时记忆网络,SA,序列特征,最大池化,层进,特征压缩,长文本分类,文本数据,TextCNN,RCNN,DPCNN,分类模型,分类准确率
AB值:
0.372884
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。