典型文献
员工流失的影响因素分析与预测
文献摘要:
文章采用高维数据变量筛选的方法对衡量员工离职的诸多因素进行统计分析,并对员工离职情况进行了预测.分别使用了由Cui等(2015)提出的MV(Mean of Variance)方法和LASSO方法对高维数据进行变量筛选,选出了与员工离职相关较为密切的的变量进入分类模型.为保证模型预测结果的准确性,文章选择了支持向量机、随机森林、XGBoost以及Logistic模型四种机器学习模型对员工离职情况进行预测.在100次的实验中,相比于另外的7种组合模型方法,MV变量选择下的随机森林模型的平均分类准确率最高,达到95.43%.通过改变训练集与验证集的比例、抽取80%样本数据、增加随机扰动三种方式来验证上述实验结果,发现仍然是MV方法下的随机森林的平均分类准确率最高,且该组合模型具有较好的稳健性能.
文献关键词:
员工离职;MV方法;LASSO;支持向量机;随机森林;XGBoost
中图分类号:
作者姓名:
王冠鹏;秦双燕;崔恒建
作者机构:
首都师范大学数学科学学院,北京100048
文献出处:
引用格式:
[1]王冠鹏;秦双燕;崔恒建-.员工流失的影响因素分析与预测)[J].系统科学与数学,2022(06):1616-1632
A类:
B类:
员工流失,高维数据,变量筛选,员工离职,离职情况,Cui,MV,Mean,Variance,LASSO,分类模型,文章选择,XGBoost,机器学习模型,组合模型,模型方法,变量选择,随机森林模型,平均分,分类准确率,训练集,验证集,随机扰动,该组
AB值:
0.332739
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。