典型文献
基于Transformer的细粒度图像中文描述
文献摘要:
针对图像中文描述中传统循环神经网络(RNN)结构不利于生成长句、缺乏细节语义信息的问题,提出一种用Transformer多头注意力(multi-head attention,MHA)网络,融合粗粒度的全局特征和细粒度的区域目标实体特征方法.该方法通过多尺度特征的融合,使图像注意力更易聚焦于细粒度的目标区域,得到更具细粒度语义特征的图像表示,从而有效改善了图像描述.在数据集ICC上使用多种评价指标进行验证,结果表明,该模型在各项指标上均取得了更好的图像描述效果.
文献关键词:
图像中文描述;细粒度特征;多头注意力
中图分类号:
作者姓名:
肖雄;徐伟峰;王洪涛;苏攀;高思华
作者机构:
华北电力大学(保定)计算机系,河北保定071003;中国民航大学计算机科学与技术学院,天津300300
文献出处:
引用格式:
[1]肖雄;徐伟峰;王洪涛;苏攀;高思华-.基于Transformer的细粒度图像中文描述)[J].吉林大学学报(理学版),2022(05):1103-1112
A类:
图像中文描述
B类:
Transformer,循环神经网络,RNN,长句,语义信息,多头注意力,multi,head,attention,MHA,粗粒度,全局特征,区域目标,实体特征,多尺度特征,目标区域,细粒度语义,语义特征,图像描述,ICC,细粒度特征
AB值:
0.38183
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。