典型文献
面向新闻文本的特征提取方法研究与实现
文献摘要:
文中研究对于中文的新闻文本分类过程中如何进行文本特征提取的问题.新闻文本数据是嵌在各种网页中的,因为其句子较长,来源广泛,内容驳杂的特点,传统特征提取方法不能达到很好的效果.文中提出一种新的分类能力指数用于特征选择,并对TF-IDF算法做出改进用于加权计算.经实验验证,文中改进算法比原特征选择、权重计算算法有更高的准确性.
文献关键词:
计算技术;新闻文本;特征选择;权重计算
中图分类号:
作者姓名:
李志强;王玉玫
作者机构:
华北计算技术研究所,北京100083
文献出处:
引用格式:
[1]李志强;王玉玫-.面向新闻文本的特征提取方法研究与实现)[J].信息技术,2022(01):80-83,89
A类:
B类:
研究与实现,中研,新闻文本分类,分类过程,文本特征提取,文本数据,网页,句子,驳杂,传统特征,能力指数,特征选择,TF,IDF,进用,改进算法,权重计算,计算算法,计算技术
AB值:
0.433669
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。