FAILED
首站-论文投稿智能助手
典型文献
基于典型数据集的数据预处理方法对比分析
文献摘要:
针对多种数据预处理方式及其组合如何提升模型拟合效果这一问题,基于UCI Machine Learning Repository典型数据集,分别利用20种变量处理方式和4种变量选择方法对数据预处理,并对模型拟合效果对比分析,分别考查了多种数据预处理方式及其组合对常见分类模型和回归模型的影响.通过对实验结果的分析讨论,提出一种启发式算法,根据数据特征、模型特点以及研究问题种类等信息推荐数据预处理方法.在更广泛的数据集上的实验结果表明,该算法所推荐的数据预处理方法可以一定程度上提升模型拟合效果,节省手工选取数据预处理方法的开销.
文献关键词:
数据预处理;正态化;归一化;哑变量;方差分析;卡方检验;互信息;Copula熵
作者姓名:
李颜平;吴刚
作者机构:
南开大学 统计与数据科学学院, 天津300071;东北大学 计算机科学与工程学院,沈阳110004
引用格式:
[1]李颜平;吴刚-.基于典型数据集的数据预处理方法对比分析)[J].沈阳工业大学学报,2022(02):185-192
A类:
B类:
数据预处理方法,方法对比,预处理方式,模型拟合,拟合效果,UCI,Machine,Learning,Repository,变量选择,选择方法,效果对比,考查,分类模型,分析讨论,启发式算法,数据特征,模型特点,研究问题,信息推荐,推荐数,开销,正态化,哑变量,卡方检验,互信息,Copula
AB值:
0.419248
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。