体现用户意图和风格的图像描述生成|王宇航;张灿龙;李志欣;王智文|广西科技大学计算机科学与通信工程学院, 广西柳州545006 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

体现用户意图和风格的图像描述生成

文献摘要：

现有的图像描述模型大多不能根据用户的意图和用语风格生成个性化的描述.针对这一问题,本文提出一种能体现用户意图和风格的个性化图像描述方法.首先,构建一个关于场景中目标、目标属性以及目标间关系的结构图,通过该图来控制用户所希望表达的目标对象、目标属性以及各目标之间的相互关系;然后,在编码器中加入多关系图卷积神经网络对场景的上下文信息进行编码,并利用图流动注意力来控制描述的侧重点;最后,在生成语句时加入用户风格控制模块,即利用关键词搜索生成包含性别、年龄、受教育程度等信息的用户画像,并结合该画像来控制风格生成器,提取对应的风格样式,最终生成体现用户意图和风格的个性化图像描述.在MSCOCO和FlickrStyle数据集上的实验结果表明,所提出的方法能较好地生成个性化和多样性图像描述语句.

文献关键词：

图像描述;用户画像;细粒度场景控制;风格控制;注意力机制

中图分类号：

[1] 一般工业技术（TB） / 工业通用技术与设备（TB4） / 工业设计（TB47） / 产品设计（TB472）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

作者姓名：

王宇航;张灿龙;李志欣;王智文

作者机构：

广西多源信息挖掘与安全重点实验室(广西师范大学), 广西桂林541004;广西科技大学计算机科学与通信工程学院, 广西柳州545006

文献出处：

广西师范大学学报（自然科学版）

引用格式：

[1]王宇航;张灿龙;李志欣;王智文-.体现用户意图和风格的图像描述生成)[J].广西师范大学学报（自然科学版）,2022(04):91-103

A类：

多关系图,风格控制,FlickrStyle,细粒度场景控制

B类：

现用,用户意图,图像描述生成,图像描述模型,语风,目标属性,结构图,在编,编码器,关系图卷积神经网络,上下文信息,侧重点,成语,语句,控制模块,关键词搜索,受教育程度,用户画像,合该,生成器,风格样式,终生,成体,MSCOCO,描述语,注意力机制

AB值：

0.289712

相似文献

基于双注意模型的图像描述生成方法研究

卓亚琦;魏家辉;李志欣-桂林理工大学理学院,广西桂林541004;广西师范大学广西多源信息挖掘与安全重点实验室,广西桂林541004

基于多重注意结构的图像密集描述生成方法研究

刘青茹;李刚;赵创;顾广华;赵耀-燕山大学信息科学与工程学院秦皇岛066004;河北省信息传输与信号处理重点实验室秦皇岛066004;北京交通大学信息科学研究所北京100044

基于显著性特征提取的图像描述算法

王鑫;宋永红;张元林-西安交通大学软件学院西安710049;西安交通大学人工智能学院西安710049

基于会话推荐的动态层次意图建模

张梦菲;郭诚;潘茂;金佳琪;辛增卫;方金云;陈树肖-中国科学院计算技术研究所北京100190;中国科学院大学北京100190;国防大学联合作战学院石家庄050084

基于无采样协作知识图网络的推荐系统

蒋雯静;熊熙;李中志;李斌勇-成都信息工程大学网络空间安全学院,成都610255;先进密码技术与系统安全四川省重点实验室(成都信息工程大学),成都610225;四川大学空天科学与工程学院,成都610065

基于层次结构感知的细粒度实体分类方法

谢斌红;李书宁;张英俊-太原科技大学计算机科学与技术学院,太原 030024

基于细粒度视觉特征和知识图谱的视觉故事生成算法

李朦朦;江爱文;龙羽中;宁铭;彭虎;王明文-江西师范大学计算机信息工程学院,江西南昌 330022;九江学院计算机与大数据科学学院,江西九江 332005

基于图卷积网络的特定方面情感分析

闫金凤;邵新慧-东北大学理学院,辽宁沈阳 110000

问题引导的空间关系图推理视觉问答模型

兰红;张蒲芬-江西理工大学信息工程学院,赣州 341000

结合多层级解码器和动态融合机制的图像描述

姜文晖;占锟;程一波;夏雪;方玉明-江西财经大学信息管理学院,南昌 330032

引入语义匹配和语言评价的跨语言图像描述

张静;郭丹;宋培培;李坤;汪萌-合肥工业大学计算机与信息学院,合肥 230601;大数据知识工程教育部重点实验室(肥工业大学),合肥 230601;智能互联系统安徽省实验室(合肥工业大学),合肥 230601

深度学习汉字生成与字体风格迁移综述

王晨;吴国华;姚晔;任一支;王秋华;袁理锋-杭州电子科技大学网络空间安全学院, 杭州 310018

一种基于层次化R⁃GCN的会话情绪识别方法

赖河蒗;李玲俐;胡婉玲;颜学明-华南师范大学计算机学院,广州 510631;广东司法警官职业学院信息管理系,广州 510520;广东外语外贸大学信息科学与技术学院,广州 510006

基于用户意图的微博文本生成技术研究

高永兵;黎预璇;高军甜;马占飞-内蒙古科技大学信息工程学院,内蒙古包头 014010;包头师范学院信息工程系,内蒙古包头 014010

基于图注意力网络的方面级别文本情感分析

施荣华;金鑫;胡超-中南大学计算机学院,长沙 410083;中南大学大数据研究院,长沙 410083

基于知信图卷积神经网络的开放域知识图谱自动构建模型

孙亚茹;杨莹;王永剑-公安部第三研究所,上海 201204

基于动态语义记忆网络的长尾图像描述生成

刘昊;杨小汕;徐常胜-中国科学院自动化研究所模式识别国家重点实验室,北京100190

文本信息辅助图像差异描述生成

陈玮婧;王维莹;金琴-中国人民大学信息学院, 北京100872

基于注意力机制和编码-解码架构的施工场景图像描述方法

农元君;王俊杰;陈红;孙文涵;耿慧;李书悦-中国海洋大学工程学院,山东青岛 266100

基于视觉关系推理与上下文门控机制的图像描述

陈巧红;裴皓磊;孙麒-浙江理工大学信息学院,浙江杭州 310018

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。