典型文献
5G环境下高校图书馆自媒体平台多标签文本分类方法研究
文献摘要:
[目的/意义]由于自媒体平台中的多标签文本具有高维性和不平衡性,导致文本分类效果较差,因此通过研究5G环境下高校图书馆自媒体平台多标签文本分类方法对解决该问题具有重要意义.[方法/过程]本文首先通过对采集的5G环境下高校图书馆自媒体平台多标签文本进行预处理,包括无意义数据去除、文本分词以及去停用词等;然后采用改进主成分分析方法进行多标签文本降维处理,利用向量空间模型实现文本平衡化处理;最后以处理后的文本为基础,采用Adaboost和SVM两种算法构建文本分类器,实现多标签文本分类.[结果/结论]实验结果表明,本文拟定的自媒体平台标签文本分类方法可以使汉明损失降低,F1值提高,多标签文本分类效果好,且耗时较低,具有可靠性.[创新/局限]由于本研究中的数据集数量不够多,所以在测试和验证方面,得出的结果具有一定局限性.因此在未来研究中期望利用更为丰富的数据库,对所设计的方法做出进一步的改进与创新.
文献关键词:
5G高校图书馆;自媒体平台;多标签文本;分类;降维;平衡化处理
中图分类号:
作者姓名:
程雅倩;黄玮;金晓祥;贾佳
作者机构:
湖北理工学院图书馆,湖北黄石435003;湖北工业大学经济与管理学院,湖北武汉430070;武汉科技大学图书馆,湖北武汉430080;湖北中医药大学图书馆,湖北武汉430070
文献出处:
引用格式:
[1]程雅倩;黄玮;金晓祥;贾佳-.5G环境下高校图书馆自媒体平台多标签文本分类方法研究)[J].情报科学,2022(02):155-161
A类:
B类:
高校图书馆,自媒体平台,多标签文本分类,文本分类方法,高维性,不平衡性,分类效果,无意义,文本分词,停用,用词,主成分分析方法,降维处理,向量空间模型,模型实现,平衡化处理,Adaboost,建文,分类器,拟定,台标,汉明,定局,出进,改进与创新
AB值:
0.196865
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。