首站-论文投稿智能助手
典型文献
分类任务中标签噪声的研究综述
文献摘要:
近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃.模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力.为了降低成本,出现了众包、自动化系统等方法标注训练数据.但是,这些标注方法往往会产生大量错误标注,即标签噪声.另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染.训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加.因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义.通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析.
文献关键词:
机器学习;分类系统;数据标注;模型复杂度;标签噪声
作者姓名:
佟强;刁恩虎;李丹;谌彤童;刘旭红;刘秀磊
作者机构:
北京材料基因工程高精尖创新中心(北京信息科技大学), 北京100101;北京信息科技大学, 数据与科学情报分析研究所, 北京100101;北京跟踪与通信技术研究所, 北京100094;北京信息科技大学,网络文化与数字传播北京市重点实验室, 北京100192
文献出处:
引用格式:
[1]佟强;刁恩虎;李丹;谌彤童;刘旭红;刘秀磊-.分类任务中标签噪声的研究综述)[J].科学技术与工程,2022(31):13626-13635
A类:
B类:
分类任务,中标,标签噪声,分类系统,标签数据,费时费力,降低成本,众包,自动化系统,训练数据,标注方法,错误标注,编码错误,训练过程,处理不当,模型复杂度,机器学习算法,部署成本,近几年来,数据标注
AB值:
0.326938
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。