典型文献
基于特征词配对的德语文本聚类方法研究
文献摘要:
[目的/意义]提出一种适用于德语文本处理的文本相似度计算方法,填补了国内外德语文本聚类研究的空缺.[方法/过程]通过词语提取和特征词选择将每个德语文本表示为一个特征词的集合,寻找集合间配对的特征词对,由特征词对的匹配度得到文本间的相似度.[结果/结论]基于多个德语数据集的实验结果表明,相比于已有方法,本文提出的基于特征词配对的德语文本聚类方法提升了约5%的NMI值和约6%的Purity值.基于特征词配对的相似度计算方法能够保留更多的文本信息,从而进一步提升德语文本聚类的性能.
文献关键词:
德语;文本聚类;特征词;文本相似度
中图分类号:
作者姓名:
简梓炜;于娟
作者机构:
福州大学经济与管理学院 福建福州 350108
文献出处:
引用格式:
[1]简梓炜;于娟-.基于特征词配对的德语文本聚类方法研究)[J].情报探索,2022(09):86-93
A类:
B类:
特征词,德语,文本聚类,聚类方法,文本处理,文本相似度计算,聚类研究,空缺,词语,词选,文本表示,匹配度,NMI,和约,Purity,文本信息
AB值:
0.266548
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。