典型文献
融合BERT与LDA的在线课程评论关键词提取方法
文献摘要:
为了高效提取高度集中、覆盖范围广和差异性明显的慕课网用户评论关键词,文中提出一种融合BERT和LDA?TextRank的关键词提取方法.实现关键词提取的第一步是获取候选关键词,在获得候选关键词之前需对爬取的课程评语进行预处理,再通过BERT模型训练得到慕课网在线评语的词向量;然后利用LDA主题模型得到候选关键词的主题分布;最后结合TextRank算法计算各主题的关系词及生成评论文本的词主题挖掘.基于此,文中利用BERT文本表示方法,能够更好地联系不同词语之间的相关性;在传统的LDA主题抽取模型的基础上结合TextRank方法,并在节点运算中通过迭代算法计算各词的得分,将权值的转移概率作为词语之间的相似度,使得关键词提取性能得到了提升.实验结果表明,与传统方法相比,所提方法的困惑程度值明显降低,证实了该方法的有效性.
文献关键词:
在线课程评论;关键词提取;语义分析;文本挖掘;相似度计算;结果分析
中图分类号:
作者姓名:
尼格拉木·买斯木江;艾孜尔古丽·玉素甫
作者机构:
新疆师范大学 计算机科学技术学院,新疆 乌鲁木齐 830054;新疆师范大学 计算机科学技术学院 国家语言资源监测与研究少数民族语言中心,北京 100814
文献出处:
引用格式:
[1]尼格拉木·买斯木江;艾孜尔古丽·玉素甫-.融合BERT与LDA的在线课程评论关键词提取方法)[J].现代电子技术,2022(06):99-104
A类:
在线课程评论
B类:
BERT,LDA,关键词提取,高效提取,高度集中,覆盖范围,慕课,用户评论,TextRank,实现关键,第一步,选关,爬取,评语,模型训练,练得,词向量,主题模型,主题分布,算法计算,关系词,评论文本,主题挖掘,文本表示,表示方法,词语,主题抽取,取模,迭代算法,权值,转移概率,语义分析,文本挖掘,相似度计算
AB值:
0.387771
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。