首站-论文投稿智能助手
典型文献
融合上下文特征和BERT词嵌入的新闻标题分类研究
文献摘要:
[目的/意义]随着社交媒体的发展,各类新闻数量激增,舆情监测处理越来越重要,高效精确的识别舆情新闻可以帮助有关部门及时搜集跟踪突发事件信息并处理,减小舆论对社会的影响.本文提出一种融合BERT、TEXTCNN、BILSTM的新闻标题文本分类模型,充分考虑词嵌入信息、文本特征和上下文信息,以提高新闻标题类别识别的准确率.[方法/过程]将使用BERT生成的新闻标题文本向量输入到TEXTCNN提取特征,将TEXTCNN的结果输入到BILSTM捕获新闻标题上下文信息,利用softmax判断分类结果.[结果/结论]研究表明,本文提出的融合了基于语言模型的BERT、基于词向量TEXTCNN和基于上下文机制BILSTM三种算法的分类模型在准确率、精确率、召回率和F1值均达到了 0.92以上,而且具有良好的泛化能力,优于传统的文本分类模型.[创新/局限]本文使用BERT进行词嵌入,同时进行特征提取和捕获上下文语义,模型识别新闻类别表现良好,但模型参数较多向量维度较大对训练设备要求较高,同时数据类别只有10类,未对类别更多或类别更细化的数据进行实验.
文献关键词:
文本分类;新闻标题;BERT词嵌入;TEXTCNN;BILSTM
作者姓名:
范昊;何灏
作者机构:
武汉大学信息管理学院,湖北武汉430072
文献出处:
引用格式:
[1]范昊;何灏-.融合上下文特征和BERT词嵌入的新闻标题分类研究)[J].情报科学,2022(06):90-97
A类:
TEXTCNN
B类:
上下文特征,BERT,词嵌入,新闻标题,分类研究,社交媒体,新闻数量,激增,舆情监测,并处,BILSTM,文本分类,分类模型,文本特征,上下文信息,题类,文本向量,提取特征,softmax,语言模型,词向量,精确率,召回率,泛化能力,上下文语义,模型识别,新闻类,向量维度,训练设备,备要,数据类别
AB值:
0.305539
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。