首站-论文投稿智能助手
典型文献
视觉弱监督学习研究进展
文献摘要:
视觉理解,如物体检测、语义和实例分割以及动作识别等,在人机交互和自动驾驶等领域中有着广泛的应用并发挥着至关重要的作用.近年来,基于全监督学习的深度视觉理解网络取得了显著的性能提升.然而,物体检测、语义和实例分割以及视频动作识别等任务的数据标注往往需要耗费大量的人力和时间成本,已成为限制其广泛应用的一个关键因素.弱监督学习作为一种降低数据标注成本的有效方式,有望对缓解这一问题提供可行的解决方案,因而获得了较多的关注.围绕视觉弱监督学习,本文将以物体检测、语义和实例分割以及动作识别为例综述国内外研究进展,并对其发展方向和应用前景加以讨论分析.在简单回顾通用弱监督学习模型,如多示例学习(multiple instance learning,MIL)和期望—最大化(expectation-maximization,EM)算法的基础上,针对物体检测和定位,从多示例学习、类注意力图机制等方面分别进行总结,并重点回顾了自训练和监督形式转换等方法;针对语义分割任务,根据不同粒度的弱监督形式,如边界框标注、图像级类别标注、线标注或点标注等,对语义分割研究进展进行总结分析,并主要回顾了基于图像级别类别标注和边界框标注的弱监督实例分割方法;针对视频动作识别,从电影脚本、动作序列、视频级类别标签和单帧标签等弱监督形式,对弱监督视频动作识别的模型与算法进行回顾,并讨论了各种弱监督形式在实际应用中的可行性.在此基础上,进一步讨论视觉弱监督学习面临的挑战和发展趋势,旨在为相关研究提供参考.
文献关键词:
弱监督学习;目标定位;目标检测;语义分割;实例分割;动作识别
作者姓名:
任冬伟;王旗龙;魏云超;孟德宇;左旺孟
作者机构:
哈尔滨工业大学,哈尔滨 150001;天津大学,天津 300350;北京交通大学,北京 100091;西安交通大学,西安 710049
引用格式:
[1]任冬伟;王旗龙;魏云超;孟德宇;左旺孟-.视觉弱监督学习研究进展)[J].中国图象图形学报,2022(06):1768-1798
A类:
视觉理解
B类:
弱监督学习,学习研究,物体检测,实例分割,人机交互,自动驾驶,深度视觉,性能提升,视频动作识别,数据标注,耗费,时间成本,习作,有效方式,讨论分析,多示例学习,multiple,instance,learning,MIL,expectation,maximization,EM,检测和定位,注意力图,自训练,语义分割,不同粒度,边界框,分割方法,对视,脚本,动作序列,单帧,模型与算法,目标定位,目标检测
AB值:
0.263974
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。