典型文献
联合精确比值掩蔽与深度神经网络的单通道语音增强方法
文献摘要:
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法.该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确.实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显.
文献关键词:
中图分类号:
作者姓名:
柏浩钧;张天骐;刘鉴兴;叶绍鹏
作者机构:
重庆邮电大学通信与信息工程学院信号与信息处理重庆市重点实验室 重庆 400065
文献出处:
引用格式:
[1]柏浩钧;张天骐;刘鉴兴;叶绍鹏-.联合精确比值掩蔽与深度神经网络的单通道语音增强方法)[J].声学学报,2022(03):394-404
A类:
B类:
掩蔽,深度神经网络,单通道语音增强,增强方法,有监督,纯净,幅度谱,增强效果,效果影响,ARM,DNN,法利,谱归一化,归一化互相关,互相关系数,时频域,声幅,估计目标,联合优化,区分性,数代,均方误差,MSE,函数提升,语音质量,质量评估,PESQ,STOI,多语,抑制效果
AB值:
0.341553
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。