视觉弱监督学习研究进展|任冬伟;王旗龙;魏云超;孟德宇;左旺孟|天津大学,天津 300350 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

视觉弱监督学习研究进展

文献摘要：

视觉理解,如物体检测、语义和实例分割以及动作识别等,在人机交互和自动驾驶等领域中有着广泛的应用并发挥着至关重要的作用.近年来,基于全监督学习的深度视觉理解网络取得了显著的性能提升.然而,物体检测、语义和实例分割以及视频动作识别等任务的数据标注往往需要耗费大量的人力和时间成本,已成为限制其广泛应用的一个关键因素.弱监督学习作为一种降低数据标注成本的有效方式,有望对缓解这一问题提供可行的解决方案,因而获得了较多的关注.围绕视觉弱监督学习,本文将以物体检测、语义和实例分割以及动作识别为例综述国内外研究进展,并对其发展方向和应用前景加以讨论分析.在简单回顾通用弱监督学习模型,如多示例学习(multiple instance learning,MIL)和期望—最大化(expectation-maximization,EM)算法的基础上,针对物体检测和定位,从多示例学习、类注意力图机制等方面分别进行总结,并重点回顾了自训练和监督形式转换等方法;针对语义分割任务,根据不同粒度的弱监督形式,如边界框标注、图像级类别标注、线标注或点标注等,对语义分割研究进展进行总结分析,并主要回顾了基于图像级别类别标注和边界框标注的弱监督实例分割方法;针对视频动作识别,从电影脚本、动作序列、视频级类别标签和单帧标签等弱监督形式,对弱监督视频动作识别的模型与算法进行回顾,并讨论了各种弱监督形式在实际应用中的可行性.在此基础上,进一步讨论视觉弱监督学习面临的挑战和发展趋势,旨在为相关研究提供参考.

文献关键词：

弱监督学习;目标定位;目标检测;语义分割;实例分割;动作识别

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

作者姓名：

任冬伟;王旗龙;魏云超;孟德宇;左旺孟

作者机构：

哈尔滨工业大学,哈尔滨 150001;天津大学,天津 300350;北京交通大学,北京 100091;西安交通大学,西安 710049

文献出处：

中国图象图形学报

引用格式：

[1]任冬伟;王旗龙;魏云超;孟德宇;左旺孟-.视觉弱监督学习研究进展)[J].中国图象图形学报,2022(06):1768-1798

A类：

视觉理解

B类：

弱监督学习,学习研究,物体检测,实例分割,人机交互,自动驾驶,深度视觉,性能提升,视频动作识别,数据标注,耗费,时间成本,习作,有效方式,讨论分析,多示例学习,multiple,instance,learning,MIL,expectation,maximization,EM,检测和定位,注意力图,自训练,语义分割,不同粒度,边界框,分割方法,对视,脚本,动作序列,单帧,模型与算法,目标定位,目标检测

AB值：

0.263974

相似文献

双域级联决策和协作标注自提升的鲁棒弱监督语义分割

缪佩翰;包翠竹;高佳;李玺-浙江工商大学计算机与信息工程学院杭州 310018;山西大学自动化与软件学院太原 030013;浙江大学计算机科学与技术学院杭州 310058

面向单幅图像的逼真3D人脸重建方法

包永堂;周鹏飞;齐越-山东科技大学计算机科学与工程学院青岛 266590;北京航空航天大学虚拟现实技术与系统全国重点实验室北京 100191;北京航空航天大学青岛研究院青岛 266100;鹏程实验室深圳 518055

面向小样本情感分类任务的弱监督对比学习框架

卢绍帅;陈龙;卢光跃;管子玉;谢飞-西安邮电大学通信与信息工程学院西安 710121;西安电子科技大学计算机科学与技术学院西安 710071;西安电子科技大学前沿交叉研究院西安 710071

弱监督学习下的三维点云模型簇协同分割

杨军;雷喜文-兰州交通大学电子与信息工程学院,兰州 730070;兰州交通大学测绘与地理信息学院,兰州 730070

基于深度学习的行人重识别综述