首站-论文投稿智能助手
典型文献
融合BERT与AttnGAN的文本生成图像方法
文献摘要:
针对文本生成图像任务中文本信息与生成图像的语义一致性,以及图像细节模糊、图像要素空间搭配合理性问题,提出了融合BERT文本编码模型和AttnGAN生成对抗网络模型的文本生成图像方法.首先,在文本与图像语义一致性训练中,借助预训练BERT模型对文本进行句、字级别的特征编码,充分利用其在NLP任务中的优秀文本编码与强泛化能力深度匹配文本语义和图像区域的特征一致性;然后,在图像生成网络的第一阶段图像生成模块之前添加空间注意力模块,提高最终生成图像的语义一致性和空间位置的布局合理性.融合优化后的模型所生成的图像相比原AttnGAN模型,IS指标提升了0.17,FID指标降低了1.15,整体视觉效果更加细腻逼真,模型成功地在阿里天池服装数据集上应用,表明其具有良好的跨领域生成能力.
文献关键词:
文本生成图像;bert预训练模型;AttnGAN模型;空间注意力;语义一致性
作者姓名:
何儒汉;贺凯凯;陈常念;张自力;陈佳
作者机构:
武汉纺织大学纺织服装智能化湖北省工程研究中心,武汉430200;武汉纺织大学计算机与人工智能学院,武汉430200
文献出处:
引用格式:
[1]何儒汉;贺凯凯;陈常念;张自力;陈佳-.融合BERT与AttnGAN的文本生成图像方法)[J].中国科技论文,2022(03):260-268
A类:
AttnGAN
B类:
BERT,文本生成图像,文本信息,语义一致性,图像要素,文本编码,生成对抗网络,特征编码,NLP,泛化能力,深度匹配,文本语义,和图像,图像生成,生成网络,第一阶段,成模,空间注意力,注意力模块,终生,空间位置,布局合理,所生,IS,指标提升,FID,视觉效果,加细,细腻,逼真,阿里,天池,服装数据,跨领域,生成能力,bert,预训练模型
AB值:
0.364335
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。