典型文献
图像与问题双引导注意力机制视觉问答算法
文献摘要:
针对视觉问答任务中问题特征与图像特征缺乏交互推理关系的问题,提出了图像与问题双引导注意力机制视觉问答算法.模型结构主要由问题特征注意力模块、图像特征注意力模块、问题与图像双引导注意力模块、特征融合模块4部分构成.该算法先针对问题特征和图像特征分别使用自我注意力机制实现特征的自我加强,然后引入图像与问题双引导注意力机制,最后使用线性分类器分类输出.在VQA V2.0数据集上实验验证,该算法表现出较好的性能,准确率达到70.98%.
文献关键词:
视觉问答;交互推理;双引导注意力机制;自我注意
中图分类号:
作者姓名:
陈婷;王玉德;任志伟;杨昊;高张弛
作者机构:
曲阜师范大学,山东 曲阜 273165
文献出处:
引用格式:
[1]陈婷;王玉德;任志伟;杨昊;高张弛-.图像与问题双引导注意力机制视觉问答算法)[J].通信技术,2022(01):36-42
A类:
双引导注意力机制,交互推理
B类:
视觉问答,对视,图像特征,推理关系,模型结构,特征注意力模块,特征融合模块,和图像,自我注意,分类器,VQA,V2
AB值:
0.212479
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。