FAILED
首站-论文投稿智能助手
典型文献
迭代式的深度PU学习与类别先验估计框架
文献摘要:
近年来,深度学习在诸多任务上展现了优异的性能,其一般基于海量数据并采用有监督的学习方式,依赖于完整的数据标签信息.然而在现实应用场景中,收集大量标签往往成本高昂.因此,如何利用未经充分标注的数据进行学习成为了当下的主要挑战.二分类问题中的从正例和无标签(Positive-Unlabeled,PU)样本数据进行学习,简称PU学习,即为其一.当前主流的PU学习算法需要准确无误的类别先验知识,但实际上类别先验通常难以获得,需要估计.已有的类别先验估计算法则主要面向传统的机器学习分类器进行设计,无法直接运用在大规模数据集上,因而不利于发挥深度学习在大规模数据集上的优势.为克服以上问题,本文提出了一个基于无监督混合模型的迭代式深度PU学习与类别先验估计框架.它利用了深度神经网络对正例和负例给出的预测分数具有不同的分布这一特性,使用双高斯成分的混合模型近似拟合预测分数的混合分布.其中,各个高斯分量分别代表了正类和负类的条件概率分布,混合权重系数代表了类别先验.结合半监督学习中的平均教师和温度锐化技术,所提框架在类别先验未知以及数据缺失负例监督的条件下,估计类别先验的同时进行PU数据上的深度学习,二者相互促进.在基准数据集MNIST、Fashion-MNIST、CIFAR-10和实际应用数据集Alzheimer上的实验结果验证了所提框架的有效性,准确率分别为94.66%、95.16%、89.98%和73.20%,该结果不仅超越了现有基于类别先验估计的PU学习算法,更可与基于真实类别先验的最前沿算法相媲美.
文献关键词:
PU学习;类别先验估计;半监督学习;弱监督学习;深度学习
作者姓名:
赵昀睿;许倩倩;姜阳邦彦;黄庆明
作者机构:
中国科学院大学计算机科学与技术学院 北京 101408;中国科学院计算技术研究所智能信息处理重点实验室 北京 100190;中国科学院信息工程研究所信息安全国家重点实验室 北京 100093;中国科学院大学网络空间安全学院 北京 100049;中国科学院大学大数据挖掘与知识管理重点实验室 北京 101408;鹏城实验室 广东深圳 518055
文献出处:
引用格式:
[1]赵昀睿;许倩倩;姜阳邦彦;黄庆明-.迭代式的深度PU学习与类别先验估计框架)[J].计算机学报,2022(12):2667-2686
A类:
类别先验估计,负例监督
B类:
迭代式,PU,多任务,海量数据,有监督,学习方式,数据标签,标签信息,现实应用,高昂,主要挑战,二分类问题,正例,无标签,Positive,Unlabeled,即为,准确无误,先验知识,难以获得,估计算法,计算法则,机器学习分类器,接运,大规模数据集,无监督,混合模型,深度神经网络,数具,双高斯,混合分布,条件概率分布,混合权重,权重系数,数代,半监督学习,锐化,数据缺失,基准数据集,MNIST,Fashion,CIFAR,应用数据,Alzheimer,最前沿,相媲美,弱监督学习
AB值:
0.297232
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。