首站-论文投稿智能助手
典型文献
基于知识辅助的图像描述生成
文献摘要:
为给定图像自动生成符合人类感知的描述语句是人工智能的重要任务之一.大多数现有的基于注意力的方法均探究语句中单词和图像中区域的映射关系,而这种难以预测的匹配方式有时会造成2种模态间不协调的对应,从而降低描述语句的生成质量.针对此问题,本文提出一种文本相关的单词注意力来提高视觉注意力的正确性.这种特殊的单词注意力在模型序列地生成描述语句过程中强调不同单词的重要性,并充分利用训练数据中的内部标注知识来帮助计算视觉注意力.此外,为了揭示图像中不能被机器直接表达出来的隐含信息,将从外部知识图谱中抽取出来的知识注入到编码器—解码器架构中,以生成更新颖自然的图像描述.在MSCOCO和Flickr30k图像描述基准数据集上的实验表明,本方法能够获得良好的性能,并优于许多现有的先进方法.
文献关键词:
图像描述生成;内部知识;外部知识;单词注意力;知识图谱;强化学习
作者姓名:
李志欣;苏强
作者机构:
广西多源信息挖掘与安全重点实验室(广西师范大学),广西 桂林541004
引用格式:
[1]李志欣;苏强-.基于知识辅助的图像描述生成)[J].广西师范大学学报(自然科学版),2022(05):418-432
A类:
单词注意力
B类:
基于知识,知识辅助,图像描述生成,自动生成,描述语,语句,和图像,中区,映射关系,难以预测,匹配方式,视觉注意力,训练数据,部标,表达出来,隐含信息,外部知识,编码器,解码器,MSCOCO,Flickr30k,基准数据集,内部知识,强化学习
AB值:
0.307521
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。