典型文献
基于半监督学习的中文社交文本事件聚类方法
文献摘要:
面向社交媒体的事件聚类旨在根据事件特征实现短文本聚类.目前,事件聚类模型主要分为无监督模型和有监督模型.无监督模型聚类效果较差,有监督聚类模型依赖大量标注数据.基于此,该文提出了一种半监督事件聚类模型(SemiEC),该模型在小规模标注数据的基础上,利用LSTM表征事件,并基于线性模型计算文本相似度,进行增量聚类.然后,利用增量聚类产生的标注数据对模型再训练,结束后对不确定样本再聚类.实验表明,SemiEC的性能相比基准模型有较大提升.
文献关键词:
社交媒体事件聚类;增量聚类;文本相似度
中图分类号:
作者姓名:
郭恒睿;王中卿;朱巧明;李培峰
作者机构:
苏州大学 计算机科学与技术学院,江苏 苏州 215006
文献出处:
引用格式:
[1]郭恒睿;王中卿;朱巧明;李培峰-.基于半监督学习的中文社交文本事件聚类方法)[J].中文信息学报,2022(02):152-159
A类:
SemiEC,社交媒体事件聚类
B类:
半监督学习,文社,本事,聚类方法,事件特征,征实,短文本聚类,聚类模型,无监督,有监督,小规模,线性模型,文本相似度,增量聚类,比基
AB值:
0.250475
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。