典型文献
面向不平衡数据集的汽车零部件质量预测
文献摘要:
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法.先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进行过采样权重计算;根据设定的过采样比和类簇权重,在少数类簇中进行过采样数据生成.使用MCDC-MF-SMOTE过采样方法生成汽车零部件质检的平衡数据集,并采用随机森林排序制造特征的重要性,对分类模型LightGBM、XGBoost、SVM和MNB进行Stacking集成来预测不合格品.与随机抽检相比,该方法对不合格产品的检出率提高了约63%.
文献关键词:
数据不平衡;质量预测;密度聚类;集成学习
中图分类号:
作者姓名:
李敏波;董伟伟
作者机构:
复旦大学软件学院,上海,200433;复旦大学上海市数据科学重点实验室,上海,200433
文献出处:
引用格式:
[1]李敏波;董伟伟-.面向不平衡数据集的汽车零部件质量预测)[J].中国机械工程,2022(01):88-96
A类:
MCDC,过采样权重
B类:
不平衡数据集,汽车零部件,质量预测,质检,不合格品,品数,基于密度,密度聚类,多工序,MF,SMOTE,采样方法,少数类,样本分布,权重计算,采样数据,数据生成,分类模型,LightGBM,XGBoost,MNB,Stacking,抽检,检相,数据不平衡,集成学习
AB值:
0.309927
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。