典型文献
面向跨模态数据协同分析的视觉问答方法综述
文献摘要:
协同分析和处理跨模态数据一直是现代人工智能领域的难点和热点,其主要挑战是跨模态数据具有语义和异构鸿沟.近年来,随着深度学习理论和技术的快速发展,基于深度学习的算法在图像和文本处理领域取得了极大的进步,进而产生了视觉问答(visual question answering,VQA)这一课题.VQA系统利用视觉信息和文本形式的问题作为输入,得出对应的答案,核心在于协同理解和处理视觉、文本信息.因此,对VQA方法进行了详细综述,按照方法原理将现有的VQA方法分为数据融合、跨模态注意力和知识推理3类方法,全面总结分析了VQA方法的最新进展,介绍了常用的VQA数据集,并对未来的研究方向进行了展望.
文献关键词:
跨模态数据;深度学习;视觉问答;数据融合;跨模态注意力;知识推理
中图分类号:
作者姓名:
崔政;胡永利;孙艳丰;尹宝才
作者机构:
北京工业大学信息学部,北京 100124
文献出处:
引用格式:
[1]崔政;胡永利;孙艳丰;尹宝才-.面向跨模态数据协同分析的视觉问答方法综述)[J].北京工业大学学报,2022(10):1088-1099
A类:
B类:
跨模态数据,数据协同,协同分析,视觉问答,方法综述,现代人,人工智能领域,主要挑战,异构鸿沟,深度学习理论,文本处理,visual,question,answering,VQA,视觉信息,文本形式,同理,文本信息,方法原理,数据融合,跨模态注意力,知识推理,最新进展
AB值:
0.34417
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。