首站-论文投稿智能助手
典型文献
一种采用对抗学习的跨项目缺陷预测方法
文献摘要:
跨项目缺陷预测(cross-project defect prediction,CPDP)已经成为软件工程数据挖掘领域的一个重要研究方向,它利用其他项目的缺陷代码来建立预测模型,解决了模型构建过程中的数据不足问题.然而源项目和目标项目的代码文件之间存在着数据分布的差异,导致跨项目预测效果不佳.基于生成式对抗网络(generative adversarial network,GAN)中的对抗学习思想,在鉴别器的作用下,通过改变目标项目特征的分布,使其接近于源项目特征的分布,从而提升跨项目缺陷预测的性能.具体来说,提出的抽象连续生成式对抗网络(abstract continuous generative adversarial network,AC-GAN)方法包括数据处理和模型构建两个阶段:(1)首先将源项目和目标项目的代码转换为抽象语法树(abstract syntax tree,AST)的形式,然后以深度优先方式遍历抽象语法树得出节点序列,再使用连续词袋模型(continuous bag-of-words model,CBOW)生成词向量,依据词向量表将节点序列转化为数值向量;(2)处理后的数值向量被送入基于GAN网络结构的模型进行特征提取和数据迁移,然后使用二分类器来判断目标项目代码文件是否有缺陷.AC-GAN方法在15组源-目标项目对上进行了对比实验,实验结果表明了该方法的有效性.
文献关键词:
跨项目缺陷预测;生成式对抗网络;连续词袋模型;抽象语法树
作者姓名:
邢颖;钱晓萌;管宇;章世豪;赵梦赐;林婉婷
作者机构:
北京邮电大学 人工智能学院, 北京 100876;北京邮电大学 现代邮政学院(自动化学院), 北京 100876
文献出处:
引用格式:
[1]邢颖;钱晓萌;管宇;章世豪;赵梦赐;林婉婷-.一种采用对抗学习的跨项目缺陷预测方法)[J].软件学报,2022(06):2097-2112
A类:
跨项目预测,连续词袋模型
B类:
对抗学习,跨项目缺陷预测,cross,project,defect,prediction,CPDP,软件工程,工程数据,构建过程,不足问题,源项,目标项目,数据分布,生成式对抗网络,generative,adversarial,network,GAN,学习思想,鉴别器,项目特征,具体来说,abstract,continuous,AC,代码转换,抽象语法树,syntax,tree,AST,深度优先,遍历,节点序,bag,words,model,CBOW,成词,词向量,送入,数据迁移,二分类,分类器
AB值:
0.342959
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。