典型文献
面向代码演化的集成软件缺陷预测模型
文献摘要:
不同版本的软件缺陷之间存在一定的关联性,在面向演化项目的缺陷预测方面通常通过构建预测模型,以历史版本缺陷数据为输入,对后续版本的缺陷进行预测,但普遍存在缺陷预测性能较差的问题.针对该问题,提出了一种面向代码演化的集成软件缺陷预测模型,通过选择与缺陷相关联的代码度量元以及版本间的演化度量元,由决策树(J48)、逻辑回归(LR)、神经网络(NN)、朴素贝叶斯(NB)各自迭代产生分类器,结合Adaboost集成学习方法,使其在训练分类器时更关注每一轮的错分元组,得到不同的预测集成模型.在PROMISE软件数据集上实验表明,针对代码演化问题,集成后的模型比单一的机器学习模型在精确度、召回率、F1和AUC上分别都提高了 20.3%、44.9%、43.4%、45.3%,其中基于J48分类器的集成模型预测性能最好,比基于LR、NN、NB分类器的集成模型在AUC指标上平均提高7.7%、4.6%、8.0%,与近年来面向演化项目的缺陷预测技术对比,结果表明本文中集成方法更有效.
文献关键词:
机器学习;集成学习;软件缺陷预测;代码演化
中图分类号:
作者姓名:
高添;郭曦
作者机构:
华中农业大学信息学院,湖北武汉430070
文献出处:
引用格式:
[1]高添;郭曦-.面向代码演化的集成软件缺陷预测模型)[J].武汉大学学报(理学版),2022(03):279-288
A类:
代码演化
B类:
软件缺陷预测,缺陷预测模型,缺陷数据,续版,陷进,存在缺陷,预测性能,相关联,代码度量,度量元,决策树,J48,逻辑回归,LR,NN,朴素贝叶斯,NB,分类器,Adaboost,集成学习方法,错分,元组,集成模型,PROMISE,件数,机器学习模型,召回率,比基,预测技术,技术对比,中集,集成方法
AB值:
0.31736
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。