首站-论文投稿智能助手
典型文献
基于矢量量化生成对抗网络的老电影音频增强算法研究
文献摘要:
电影经历了百余年的历史,一些记录老电影音频的感光胶片由于受到时间侵蚀和人为损坏,产生了霉斑、划痕等痕迹,导致还音时出现了背景噪声,影响听感.目前国内外针对老电影的音频修复主要依靠人工,工作量大、修复周期长.深度学习的发展使机器在音频修复方面代替人工成为可能.本文将基于生成对抗网络的语音增强模型SEGAN应用于老电影音频修复当中,并结合老电影音频的噪声特点对模型进行改进.在判别器中加入矢量量化层以匹配生成器性能,在生成器中加入频域损失,使降噪后的音频在频域上与干净音频更加相似.实验结果表明,本文提出的方法能够进一步提高老电影音频的降噪效果,各客观评价指标均有所提升.
文献关键词:
老电影;音频修复;语音增强;背景噪声
作者姓名:
王童;王雨田;王晖;张勤
作者机构:
中国传媒大学媒介音视频教育部重点实验室,北京 100024
文献出处:
引用格式:
[1]王童;王雨田;王晖;张勤-.基于矢量量化生成对抗网络的老电影音频增强算法研究)[J].现代电影技术,2022(04):31-37
A类:
音频增强,音频修复,SEGAN
B类:
矢量量化,化生成,生成对抗网络,老电影,影音,增强算法,算法研究,百余年,感光,胶片,霉斑,划痕,痕迹,背景噪声,听感,修复周期,代替人工,语音增强,增强模型,判别器,生成器,频域,干净,降噪效果,客观评价指标
AB值:
0.264315
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。