首站-论文投稿智能助手
典型文献
图像指代分割研究综述
文献摘要:
图像指代分割作为计算机视觉与自然语言处理交叉领域的热点问题,其目的是根据自然语言描述在图像中分割出相应的目标区域.随着相关深度学习技术的成熟和大规模数据集的出现,这项任务引起了研究者的广泛关注.本文对图像指代分割算法的发展进行了梳理和分析.首先根据多模态信息的编码解码方式,将现有图像指代分割算法分成基于多模态信息融合和基于多尺度信息融合两类进行了系统阐述,重点介绍了基于CNN-LSTM框架的方法、结构复杂的模块化方法和基于图的方法;然后,对用于图像指代分割任务的典型数据集和主流评价指标进行了总结与统计;之后,通过实验综合比较了现有的图像指代分割模型之间的性能差异并进一步验证了各种模型的优缺点.最后,对这一领域现有方法中存在的问题进行讨论分析,并对未来的发展方向进行了展望,表明了针对复杂的指代描述,需要通过多步、显式的推理步骤来解决图像指代分割问题.
文献关键词:
指代分割;图像语义分割;深度学习;卷积神经网络
作者姓名:
邱爽;赵耀;韦世奎
作者机构:
北京交通大学信息科学研究所,北京100044;现代信息科学与网络技术北京市重点实验室,北京100044
文献出处:
引用格式:
[1]邱爽;赵耀;韦世奎-.图像指代分割研究综述)[J].信号处理,2022(06):1144-1154
A类:
指代分割
B类:
割作,计算机视觉,自然语言处理,交叉领域,割出,目标区域,深度学习技术,大规模数据集,分割算法,编码解码,多模态信息融合,多尺度信息,模块化方法,分割模型,性能差异,讨论分析,多步,显式,图像语义分割
AB值:
0.226129
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。