首站-论文投稿智能助手
典型文献
基于DECORATE集成学习与置信度评估的Tri-training算法
文献摘要:
Tri-training是一种基于分歧的半监督学习算法,同时利用了半监督学习和集成学习机制.Tri-training能有效地利用少量有标记样本和大量无标记样本,通过分类器间的相互协同和迭代来提升模型性能.但是在已标记样本量不足的情况下,Tri-training生成的初始分类器训练不足,并且在分类器间协同标记的过程中可能产生误标记的噪声数据.针对上述问题,提出了 一种结合DECORATE集成学习、多样性度量与置信度评估的协同学习算法.该算法基于DECORATE集成学习方法,通过添加差异化的人工样本和标记来训练多种偏好的基分类器,以提升分类泛化能力.该算法还基于JS散度对分类器进行多样性度量和筛选,以最大化基分类器多样性,同时在迭代过程中基于标签传播算法对伪标记样本进行置信度评估,以减少噪声数据.在UCI数据集上进行了分类实验,结果表明,相比Tri-training算法及其改进算法,所提算法具有更高的分类准确率和F1分数.
文献关键词:
基于分歧的半监督学习;集成学习;置信度评估;多样性度量
作者姓名:
王宇飞;陈文
作者机构:
四川大学网络空间安全学院 成都610065
文献出处:
引用格式:
[1]王宇飞;陈文-.基于DECORATE集成学习与置信度评估的Tri-training算法)[J].计算机科学,2022(06):127-133
A类:
DECORATE,基于分歧的半监督学习
B类:
置信度评估,Tri,training,学习机制,无标记,模型性能,样本量,误标记,噪声数据,多样性度量,协同学习,集成学习方法,基分类器,泛化能力,JS,散度,标签传播算法,伪标记样本,UCI,改进算法,分类准确率
AB值:
0.220559
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。