典型文献
视觉问答中的模型分析与展望
文献摘要:
随着深度学习在图像处理和自然语言处理等领域的迅速发展,基于图像处理和自然语言处理的视觉问答任务也受到了越来越多的关注.通过对近年来视觉问答相关的大量模型进行分析,将视觉问答模型划分为模态融合模型,注意力机制模型,模块化模型,基于外部知识的模型,处理语言先验的模型及关系推理的模型等.总结分析了视觉问答技术最新进展及现有方法的局限性,对视觉问答技术的未来发展方向进行展望并给出了一些可行的建议.
文献关键词:
视觉问答;外部知识;语言先验;深度学习
中图分类号:
作者姓名:
王雪枫;张雪松;王峰;石方宇;赵佳
作者机构:
阜阳师范大学 计算机与信息工程学院,安徽 阜阳 236037
文献出处:
引用格式:
[1]王雪枫;张雪松;王峰;石方宇;赵佳-.视觉问答中的模型分析与展望)[J].阜阳师范大学学报(自然科学版),2022(02):76-84
A类:
语言先验
B类:
视觉问答,自然语言处理,模态融合,融合模型,注意力机制模型,外部知识,关系推理,最新进展,对视
AB值:
0.195839
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。