首站-论文投稿智能助手
典型文献
基于融合文本主题模型的学者兴趣挖掘研究
文献摘要:
在学者兴趣标签的抽取研究中,因学术数据具有非结构化、稀疏性特征,经常会导致分类效果不理想.本文通过融合Latent Dirichlet Allocation和改进的Doc2vec算法得到一种新的结合主题向量和文档向量表示的融合模型,对学者兴趣标签进行研究,通过加权投票法集成策略融合模型最终得到兴趣标签的评分.为了评估算法的有效性,对几种相关方法做了性能比较,实验结果表明,通过融合加权方法生成的学者数据标签优于其他方法.
文献关键词:
兴趣标签;用户画像;文本模型;集成学习;相似度计算
作者姓名:
陈锋;夏骄雄
作者机构:
上海理工大学光电信息与计算机工程学院,上海 200093;上海大学计算机工程与科学学院;上海市教育科学研究院
文献出处:
引用格式:
[1]陈锋;夏骄雄-.基于融合文本主题模型的学者兴趣挖掘研究)[J].计算机时代,2022(09):31-35
A类:
文本模型
B类:
文本主题,主题模型,兴趣标签,学术数据,非结构化,稀疏性,分类效果,Latent,Dirichlet,Allocation,Doc2vec,主题向量,文档,向量表示,融合模型,加权投票,投票法,集成策略,策略融合,评估算法,相关方法,性能比较,数据标签,其他方法,用户画像,集成学习,相似度计算
AB值:
0.522993
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。