典型文献
基于句向量和卷积神经网络的文本聚类研究
文献摘要:
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,提出了一种基于句向量(Doc2vec)和卷积神经网络(convolutional neural networks,CNN)的文本特征提取方法用于文本聚类.首先利用Doc2vec模型把训练数据集中的文本转换成句向量,充分考虑文档词排列顺序和语义;然后利用CNN提取文本的深层语义特征,解决特征维度高的问题,得到能够用于聚类的文本特征向量;最后使用k-means算法进行聚类.实验结果表明,在爬取的搜狗新闻数据上,该文本聚类模型的准确率达到了0.776,F值指标达到了0.780,相比其他文本聚类模型均有所提高.
文献关键词:
卷积神经网络(CNN);Doc2vec;文本表示;文本聚类
中图分类号:
作者姓名:
贾君霞;王会真;任凯;康文
作者机构:
兰州交通大学 电子与信息工程学院,兰州 730070;国电甘肃新能源有限公司,兰州 730070
文献出处:
引用格式:
[1]贾君霞;王会真;任凯;康文-.基于句向量和卷积神经网络的文本聚类研究)[J].计算机工程与应用,2022(16):123-128
A类:
B类:
句向量,文本聚类,聚类研究,时文,文档,排列顺序,Doc2vec,convolutional,neural,networks,文本特征提取,训练数据集,文本转换,转换成,深层语义,语义特征,够用,特征向量,means,爬取,搜狗,新闻数据,聚类模型,标达,文本表示
AB值:
0.360117
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。