典型文献
时频掩码优化的两阶段语音增强算法
文献摘要:
针对传统深度神经网络语音增强算法未区分在不同信噪比环境中去噪的侧重点,同时考虑到预测相位信息对于语音增强的重要性,提出了时频掩码优化的两阶段语音增强算法.第一阶段将带噪语音的幅度谱特征输入深度神经网络进行训练,预测得到干净语音幅度谱和噪声幅度谱;第二阶段通过信噪比信息估计增益系数,以控制残留噪声和语音失真之间的平衡;同时,计算带噪语音和纯净语音的相位偏差来协助预测语音频谱,将增益系数和相位偏差引入时频掩码函数,优化网络训练模型,以更好地预测纯净语音幅度谱.实验结果表明,相比优化前的算法,该方法增强后语音的语音质量感知指标平均提高0.22,语音可懂度指标平均提高0.027,更好地去除了噪声,降低了语音失真.
文献关键词:
语音增强;深度神经网络;时频掩码;信噪比信息;增益系数
中图分类号:
作者姓名:
郑莉;李鸿燕
作者机构:
太原理工大学信息与计算机学院,山西榆次030600
文献出处:
引用格式:
[1]郑莉;李鸿燕-.时频掩码优化的两阶段语音增强算法)[J].电子设计工程,2022(04):17-21
A类:
时频掩码
B类:
两阶段,语音增强,增强算法,深度神经网络,去噪,侧重点,相位信息,第一阶段,幅度谱,谱特征,干净,声幅,第二阶段,信噪比信息,信息估计,增益系数,失真,纯净,相位偏差,音频,网络训练,训练模型,方法增强,后语,语音质量,质量感知,语音可懂度
AB值:
0.291714
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。