典型文献
体现用户意图和风格的图像描述生成
文献摘要:
现有的图像描述模型大多不能根据用户的意图和用语风格生成个性化的描述.针对这一问题,本文提出一种能体现用户意图和风格的个性化图像描述方法.首先,构建一个关于场景中目标、目标属性以及目标间关系的结构图,通过该图来控制用户所希望表达的目标对象、目标属性以及各目标之间的相互关系;然后,在编码器中加入多关系图卷积神经网络对场景的上下文信息进行编码,并利用图流动注意力来控制描述的侧重点;最后,在生成语句时加入用户风格控制模块,即利用关键词搜索生成包含性别、年龄、受教育程度等信息的用户画像,并结合该画像来控制风格生成器,提取对应的风格样式,最终生成体现用户意图和风格的个性化图像描述.在MSCOCO和FlickrStyle数据集上的实验结果表明,所提出的方法能较好地生成个性化和多样性图像描述语句.
文献关键词:
图像描述;用户画像;细粒度场景控制;风格控制;注意力机制
中图分类号:
作者姓名:
王宇航;张灿龙;李志欣;王智文
作者机构:
广西多源信息挖掘与安全重点实验室(广西师范大学), 广西 桂林541004;广西科技大学 计算机科学与通信工程学院, 广西 柳州545006
文献出处:
引用格式:
[1]王宇航;张灿龙;李志欣;王智文-.体现用户意图和风格的图像描述生成)[J].广西师范大学学报(自然科学版),2022(04):91-103
A类:
多关系图,风格控制,FlickrStyle,细粒度场景控制
B类:
现用,用户意图,图像描述生成,图像描述模型,语风,目标属性,结构图,在编,编码器,关系图卷积神经网络,上下文信息,侧重点,成语,语句,控制模块,关键词搜索,受教育程度,用户画像,合该,生成器,风格样式,终生,成体,MSCOCO,描述语,注意力机制
AB值:
0.289712
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。