首站-论文投稿智能助手
典型文献
基于双注意模型的图像描述生成方法研究
文献摘要:
现有图像描述生成方法的注意模型通常采用单词级注意,从图像中提取局部特征作为生成当前单词的视觉信息输入,缺乏准确的图像全局信息指导.针对这个问题,提出基于语句级注意的图像描述生成方法,通过自注意机制从图像中提取语句级的注意信息,来表示生成语句所需的图像全局信息.在此基础上,结合语句级注意和单词级注意进一步提出了双注意模型,以此来生成更准确的图像描述.通过在模型的中间阶段实施监督和优化,以解决信息间的干扰问题.此外,将强化学习应用于两阶段的训练来优化模型的评估度量.通过在MSCOCO和Flickr30K两个基准数据集上的实验评估,结果表明本文提出的方法能够生成更加准确和丰富的描述语句,并且在各项评价指标上优于现有的多种基于注意机制的方法.
文献关键词:
图像描述生成;编码器-解码器架构;单词级注意;语句级注意;双注意模型;强化学习
作者姓名:
卓亚琦;魏家辉;李志欣
作者机构:
桂林理工大学理学院,广西桂林541004;广西师范大学广西多源信息挖掘与安全重点实验室,广西桂林541004
文献出处:
引用格式:
[1]卓亚琦;魏家辉;李志欣-.基于双注意模型的图像描述生成方法研究)[J].电子学报,2022(05):1123-1130
A类:
双注意模型,单词级注意,语句级注意
B类:
图像描述生成,生成方法,局部特征,视觉信息,信息输入,全局信息,自注意机制,成语,合语,来生,实施监督,干扰问题,强化学习,学习应用,两阶段,MSCOCO,Flickr30K,基准数据集,实验评估,描述语,编码器,解码器
AB值:
0.243504
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。