首站-论文投稿智能助手
典型文献
自适应插值与特征压缩的小样本数据分类研究
文献摘要:
大数据的类别不平衡与维度爆炸问题严重影响着算法的预测效率和分类精度.因此,提出了一种基于插值与特征压缩的大数据分类方法ASE-RFXT.改进ADASYN(adaptive synthetic sampling approach)的插值中心,减少了噪声的引入,改善了少数类样本的分布.改进ReliefF(特征权重法),并将它与集成算法XGDT(extreme gradient dart tree)结合对特征进行并行加权,减少了权重受异常值的影响,使得评估更加准确.利用特征之间的相关性过滤低权重冗余特征,以XGDT的分类精度为评价指标通过SFS(sequential forward selection)压缩特征.实验结果表明ASE-RFXT方法可以降低特征维度,节约训练时间,提高不平衡小样本数据的分类精度.
文献关键词:
极限梯度提升;特征选择;自适应采样;特征加权
作者姓名:
孙永明;杨进
作者机构:
上海理工大学 理学院,上海 200093
引用格式:
[1]孙永明;杨进-.自适应插值与特征压缩的小样本数据分类研究)[J].计算机工程与应用,2022(01):106-112
A类:
RFXT,XGDT,dart
B类:
特征压缩,小样本数据,数据分类,分类研究,类别不平衡,问题严重,分类精度,分类方法,ASE,ADASYN,adaptive,synthetic,sampling,approach,少数类,ReliefF,特征权重,权重法,集成算法,extreme,gradient,tree,异常值,冗余特征,SFS,sequential,forward,selection,训练时间,极限梯度提升,特征选择,自适应采样,特征加权
AB值:
0.458251
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。