首站-论文投稿智能助手
典型文献
面向服务聚类的短文本优化主题模型
文献摘要:
为了获取高质量的隐式主题结果,提高服务聚类精度,解决服务描述文档文本短带来的语义稀疏性与噪声问题,提出词向量与噪声过滤优化的词对主题模型(BTM-VN).该模型以词对为基础,拓展服务描述文档,获取额外的语义信息,设计利用主题分布信息进行代表词对概率计算的策略,通过在采样过程中计算代表词对矩阵,提高代表词对在当前主题的权重,降低噪声词对服务描述文档主题获取的干扰.利用词向量筛选待训练的词对集合,减少共现意义低的词对组合,解决词对主题模型耗时较长的问题.使用优化的密度峰值聚类算法对经BTM-VN训练后的服务主题分布矩阵进行聚类.实验结果表明,基于BTM-VN的服务聚类方法在3种聚类评价指标上的表现均优于传统的服务聚类算法.
文献关键词:
服务聚类;主题模型;短文本优化;代表词对;词向量
作者姓名:
陆佳炜;郑嘉弘;李端倪;徐俊;肖刚
作者机构:
浙江工业大学计算机科学与技术学院,浙江杭州310023;中国计量大学机电工程学院,浙江杭州310018
引用格式:
[1]陆佳炜;郑嘉弘;李端倪;徐俊;肖刚-.面向服务聚类的短文本优化主题模型)[J].浙江大学学报(工学版),2022(12):2416-2425,2444
A类:
短文本优化,代表词对
B类:
面向服务,服务聚类,隐式,聚类精度,文档,语义稀疏,稀疏性,噪声问题,词向量,噪声过滤,词对主题模型,BTM,VN,语义信息,设计利用,主题分布,分布信息,概率计算,中计,低噪声,用词,使用优化,密度峰值聚类算法,服务主题,分布矩阵,聚类方法,聚类评价指标
AB值:
0.326843
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。