首站-论文投稿智能助手
典型文献
基于集成学习和代价敏感的类别不平衡数据分类算法
文献摘要:
在数据分类分析中,一些特别的类别里往往存在更重要的信息.提出一种基于集成学习,欠采样和代价敏感的类别不平衡数据分类算法(USCensemble),来解决传统算法处理类别不平衡数据分类任务时难以正确识别少数类样本的问题.该算法首先运用EasyEnsemble的算法结构,在前一组数据训练完毕后,运用欠采样方法选取权重大的多数类样本,并将其与少数类样本结合为临时训练数据以此平衡数据集并进行下一轮训练.同时赋予少数类样本更大的错分代价,快速提高错误分类的少数类的样本权重,降低多数类的样本权重,使算法更倾向少数类的正确分类,达到对少数类样本正确识别的目的.在10个u c i的数据集生成的分类任务上进行了对比实验,实验结果表明,该算法能更好地识别少数类样本.
文献关键词:
类别不平衡数据;分类;集成学习;欠采样;代价敏感
作者姓名:
贺指陈
作者机构:
广东工业大学数学与统计学院 广东 广州 510520
文献出处:
引用格式:
[1]贺指陈-.基于集成学习和代价敏感的类别不平衡数据分类算法)[J].信息记录材料,2022(01):18-22
A类:
USCensemble
B类:
集成学习,代价敏感,类别不平衡数据,不平衡数据分类,分类算法,分类分析,欠采样,传统算法,分类任务,少数类,EasyEnsemble,算法结构,数据训练,完毕,采样方法,训练数据,平衡数据集,轮训,错分,误分类,样本权重,正确分类,本正,数据集生成
AB值:
0.309336
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。