典型文献
                基于支持向量机的短文本分类方法
            文献摘要:
                    针对短文本具有特征稀疏、不规范、主题不明确等特点,提出一种有效的基于支持向量机的短文本分类方法.由于汉语中依存语法分析准确率和时间效率不高的问题,针对客户文本咨询的特点,在对短文本分类时,本文并未对句子进行依存语法的分析,而是主要使用句法特征进行分析,找出文本的子串和子序列形成候选特征集,之后利用信息增益、互信息、卡方统计3种特征选择方法进行有效特征选择,最后采用支持向量机方法进行文本分类.将本文所提的模型应用于一组真实数据,实验结果表明,平均正确率可达到84.19%,从而验证该分类方法的鲁棒性和有效性.
                文献关键词:
                    支持向量机;文本分类;半监督学习;特征选择
                中图分类号:
                    
                作者姓名:
                    
                        赵延平;王芳;夏杨
                    
                作者机构:
                    北京交通大学信息中心,北京 100044
                文献出处:
                    
                引用格式:
                    
                        [1]赵延平;王芳;夏杨-.基于支持向量机的短文本分类方法)[J].计算机与现代化,2022(02):92-96
                    
                A类:
                
                B类:
                    短文本分类,文本分类方法,具有特征,特征稀疏,依存语法,语法分析,时间效率,效率不高,对句,句子,句法特征,子串,子序列,征集,信息增益,互信息,卡方统计,特征选择,选择方法,有效特征,支持向量机方法,模型应用,真实数据,半监督学习
                AB值:
                    0.328139
                相似文献
                
            机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。