首站-论文投稿智能助手
典型文献
结合年龄监督和人脸先验的语音-人脸图像重建
文献摘要:
针对语音-人脸图像重建方法缺乏来自不同维度的监督约束及未利用人脸先验信息,导致生成图像和真实图像相似度不高的问题,提出结合年龄监督和人脸先验信息的语音-人脸图像重建方法.通过预训练的年龄评估模型为当前数据集扩充年龄数据,弥补来自年龄监督信息的缺乏.通过语音-人脸图像跨模态身份匹配方法,为给定语音检索接近真实人脸的面部图像,将得到的图像作为人脸先验信息使用.该方法通过定义结合交叉熵损失和对抗损失的联合损失函数,从年龄感、低频内容和局部纹理等方面均衡提升重建图像质量.基于数据集Voxceleb 1,通过人脸检索实验的方式进行测试,与当前主流方法进行比较和分析.结果表明,该方法能有效提升生成图像与真实图像的相似度,所生成的图像具有更好的主客观评价结果.
文献关键词:
深度学习;图像重建;卷积神经网络;生成对抗网络;人脸先验信息
作者姓名:
何立;庞善民
作者机构:
西安交通大学 软件学院,陕西 西安 710049
引用格式:
[1]何立;庞善民-.结合年龄监督和人脸先验的语音-人脸图像重建)[J].浙江大学学报(工学版),2022(05):1006-1016
A类:
Voxceleb
B类:
人脸图像,图像重建,重建方法,不同维度,人脸先验信息,成图,图像相似度,预训练,年龄评估,数据集扩充,监督信息,跨模态,匹配方法,定语,面部图像,信息使用,交叉熵损失,联合损失函数,升重,重建图像,图像质量,人脸检索,主流方法,所生,主客观评价,生成对抗网络
AB值:
0.311
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。