典型文献
基于突发词对主题模型改进算法的微博热点话题发现研究
文献摘要:
[研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果.[研究方法]首先,通过引入微博传播值、词项H指数和词对突发概率,从文档层面和词语层面进行特征选择,解决数据稀疏和高维度的问题.其次,通过双向长短期记忆(BiLSTM)训练词语之间的关系,结合词语的逆文档频率作为词对的先验知识,考虑了词之间的关系,解决忽略词之间关系的问题.再次,利用基于密度的方法自适应选择BBTM的最优话题数目,解决了传统的主题模型需要人工指定话题数目的问题.最后,利用真实微博数据集在热点话题发现准确度、话题质量、一致性三个方面进行验证.[研究结论]实验表明,BiLSTM-HBBTM在多种评价指标上都优于对比模型,实验结果验证了所提模型的有效性及可行性.
文献关键词:
热点话题发现;主题模型;微博;短文本;BiLSTM;BBTM;Word2Vec
中图分类号:
作者姓名:
向卓元;吴玉;陈浩;张芙玮
作者机构:
中南财经政法大学信息与安全工程学院 武汉 430073
文献出处:
引用格式:
[1]向卓元;吴玉;陈浩;张芙玮-.基于突发词对主题模型改进算法的微博热点话题发现研究)[J].情报杂志,2022(01):104-112
A类:
热点话题发现,BBTM,HBBTM
B类:
词对主题模型,模型改进,改进算法,研究目的,数据稀疏,BiLSTM,入微,词项,文档,词语,特征选择,高维度,双向长短期记忆,先验知识,基于密度,自适应选择,微博数据,对比模型,短文本,Word2Vec
AB值:
0.219468
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。