典型文献
基于生成对抗网络的音频补偿方法
文献摘要:
为解决音频补偿存在可修复片段长度较短、修复对象局限于高重复性音频和采用语谱图所带来的逆变换失真等问题,提出了针对长语音补偿的新生成对抗网络.新网络模型以原始语音作为输入输出信号,解决传统基于语谱图方法的局限性.首先,采用前后文编解码器作为生成器,提高对信号时域空白间隙周围可用内容的利用率;其次,将语音特征提取模块加入鉴别器,通过学习前后文内容中音高、音素特征,有效提升训练效率和生成质量.结果表明:与现有多个算法进行对比,提出的生成对抗网络具有良好的语音补偿性能,可修复间隙长度达256 ms.进一步通过变速扩展音频长度,针对扩展语音新模型可稳定修复长达500 ms的语音间隙.
文献关键词:
音频补偿;生成对抗网络;前后文编解码器;语音特征提取
中图分类号:
作者姓名:
王杰;观元升;胡文林
作者机构:
广州大学 电子与通信工程学院,广东 广州 510006;中国铁路设计集团有限公司 城市轨道交通数字化建设与测评技术国家工程实验室,天津 300308
文献出处:
引用格式:
[1]王杰;观元升;胡文林-.基于生成对抗网络的音频补偿方法)[J].陕西师范大学学报(自然科学版),2022(06):39-48
A类:
音频补偿,前后文编解码器,语音特征提取
B类:
生成对抗网络,补偿方法,段长度,语谱图,逆变换,失真,长语音,新网,输入输出,输出信号,生成器,取模,鉴别器,中音,音高,音素,训练效率,补偿性,ms,变速,长达
AB值:
0.21592
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。