典型文献
融入新闻标题信息的新闻文本与评论的语义相似度计算方法
文献摘要:
针对预训练模型在处理新闻这种长文本时会截断一部分文本,导致文本信息缺失的问题,提出一种在融入新闻标题信息基础上将TextRank算法、隐含Dirichlet分布主题模型与预训练模型相结合的方法构建模型,并将该模型与其他语义相似度计算方法进行对比.结果表明,该模型准确率为82.46%,召回率为87.43%,精确率为82.68%,F1值为84.99%,取得了最优结果,从而有效提高了新闻文本与评论的语义相似度计算性能.
文献关键词:
语义相似度;预训练模型;隐含Dirichlet分布;新闻评论
中图分类号:
作者姓名:
李伊仝;王红斌;程良
作者机构:
昆明理工大学信息工程与自动化学院,昆明650504;昆明理工大学城市学院,昆明650051
文献出处:
引用格式:
[1]李伊仝;王红斌;程良-.融入新闻标题信息的新闻文本与评论的语义相似度计算方法)[J].吉林大学学报(理学版),2022(06):1399-1406
A类:
B类:
新闻标题,新闻文本,语义相似度,相似度计算,预训练模型,长文,分文,文本信息,信息缺失,信息基础,上将,TextRank,Dirichlet,主题模型,构建模型,模型准确率,召回率,精确率,新闻评论
AB值:
0.3217
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。