典型文献
基于支持向量机的短文本分类方法
文献摘要:
针对短文本具有特征稀疏、不规范、主题不明确等特点,提出一种有效的基于支持向量机的短文本分类方法.由于汉语中依存语法分析准确率和时间效率不高的问题,针对客户文本咨询的特点,在对短文本分类时,本文并未对句子进行依存语法的分析,而是主要使用句法特征进行分析,找出文本的子串和子序列形成候选特征集,之后利用信息增益、互信息、卡方统计3种特征选择方法进行有效特征选择,最后采用支持向量机方法进行文本分类.将本文所提的模型应用于一组真实数据,实验结果表明,平均正确率可达到84.19%,从而验证该分类方法的鲁棒性和有效性.
文献关键词:
支持向量机;文本分类;半监督学习;特征选择
中图分类号:
作者姓名:
赵延平;王芳;夏杨
作者机构:
北京交通大学信息中心,北京 100044
文献出处:
引用格式:
[1]赵延平;王芳;夏杨-.基于支持向量机的短文本分类方法)[J].计算机与现代化,2022(02):92-96
A类:
B类:
短文本分类,文本分类方法,具有特征,特征稀疏,依存语法,语法分析,时间效率,效率不高,对句,句子,句法特征,子串,子序列,征集,信息增益,互信息,卡方统计,特征选择,选择方法,有效特征,支持向量机方法,模型应用,真实数据,半监督学习
AB值:
0.328139
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。