首站-论文投稿智能助手
典型文献
基于Hellinger距离与词向量的终身机器学习主题模型
文献摘要:
与传统的机器学习方法相比,终身机器学习能够有效利用知识库中积累的知识来提高当前学习任务的学习效果.然而经典的终身主题模型(LT M)在领域选择时缺乏偏向性,且在计算目标词的相似性时不能充分利用目标词的上下文信息.从词语和主题选择的角度提出改进模型HW-LTM,利用Word2vec词向量的余弦相似度和主题之间的Hellinger距离寻找相似度较大的词语和领域,实现在迭代学习中对词语和领域的更优选择和更有效的知识获取,同时通过预加载词向量相似度矩阵的方式解决词向量余弦距离的重复计算问题,利用Hellinger距离计算主题相似度,加快模型收敛速度.在京东商品评论数据集上的实验结果表明,H W-LT M模型表现优于基线主题挖掘模型,相比LTM模型,其topic coherence指标提升48,耗时缩短43.75%.
文献关键词:
终身机器学习;主题模型;Hellinger距离;词向量;领域选择
作者姓名:
雷恒林;古兰拜尔·吐尔洪;买日旦·吾守尔;曾琪
作者机构:
新疆大学 信息科学与工程学院,乌鲁木齐 830046
文献出处:
引用格式:
[1]雷恒林;古兰拜尔·吐尔洪;买日旦·吾守尔;曾琪-.基于Hellinger距离与词向量的终身机器学习主题模型)[J].计算机工程,2022(11):89-95
A类:
终身机器学习
B类:
Hellinger,词向量,学习主题,主题模型,机器学习方法,知识库,学习任务,领域选择,择时,偏向性,上下文信息,词语,主题选择,改进模型,HW,LTM,Word2vec,余弦相似度,迭代学习,知识获取,预加载,相似度矩阵,余弦距离,距离计算,主题相似度,收敛速度,京东,商品评论,评论数据,主题挖掘,挖掘模型,topic,coherence,指标提升
AB值:
0.424635
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。