首站-论文投稿智能助手
典型文献
余弦定理在新闻分类中的应用
文献摘要:
针对当前新闻文本需要人工进行分类的不足,提出了一种基于余弦定理对文本进行自动分类的方法.通过网络爬虫技术爬取大量不同类别的新闻文本,从而建立文本库.使用TF-IDF技术对文本库进行分类别关键词提取,统计得出不同类别新闻的关键词.将需要判断类别的文本关键词和统计得出的类别关键词分别生成特征向量,通过余弦定理进行相似度计算,从而得出文本的类别.该方法结果准确、性能高效,为新闻文本自动分类提供了一种新思路.
文献关键词:
文本分类;关键词提取;TF-IDF;余弦定理;特征向量;相似度计算
作者姓名:
卜磊
作者机构:
南京国图信息产业有限公司,江苏南京210003
文献出处:
引用格式:
[1]卜磊-.余弦定理在新闻分类中的应用)[J].电脑知识与技术,2022(24):75-76
A类:
类别关键词
B类:
余弦定理,新闻文本,工进,网络爬虫技术,爬取,文本库,TF,IDF,分类别,关键词提取,文本关键词,特征向量,相似度计算,文本自动分类,文本分类
AB值:
0.266328
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。