典型文献
基于声纹嵌入的语音增强算法
文献摘要:
频域语音增强算法在高信噪比的条件下有明显的降噪效果,而在低信噪比条件下频域语音增强算法的性能会大幅下降.针对这个问题,将基于声纹的掩码应用到频域语音增强网络,利用声纹的先验信息,提升网络对说话人和噪声的区分度.另外,为了进一步改善频域语音算法在低信噪比条件下的性能,提出基于映射的声纹嵌入语音增强算法,避免了可能因采用掩模方案造成的语音失真问题.实验结果表明,在引入相同声纹信息时,基于映射的声纹嵌入语音增强网络在低信噪比条件下的增强性能表现更好,特别是在改善语音失真方面优势明显.相较于基于掩模的声纹掩码网络,基于映射的声纹嵌入网络在PESQ、STOI和SSNR这三项指标上分别实现了6.40%、1.46%和24.84%的相对提升.
文献关键词:
语音增强;低信噪比;声纹嵌入;掩码;映射
中图分类号:
作者姓名:
高戈;曾邦;王霄;尹文兵;陈怡
作者机构:
武汉大学 国家多媒体软件工程技术研究中心,武汉430072;华中师范大学 计算机学院,武汉430077
文献出处:
引用格式:
[1]高戈;曾邦;王霄;尹文兵;陈怡-.基于声纹嵌入的语音增强算法)[J].计算机应用研究,2022(03):688-692
A类:
声纹嵌入,SSNR
B类:
语音增强,增强算法,频域,高信噪比,降噪效果,低信噪比,掩码,先验信息,说话,区分度,掩模,失真,真问题,同声,增强性能,入网,PESQ,STOI,这三项
AB值:
0.235334
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。