典型文献
基于RefineNet的端到端语音增强方法
文献摘要:
为提高神经网络对语音信号时域波形的直接处理能力,提出了一种基于RefineNet的端到端语音增强方法.本文构建了一个时频分析神经网络,模拟语音信号处理中的短时傅里叶变换,利用RefineNet网络学习含噪语音到纯净语音的特征映射.在模型训练阶段,用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility,STOI)与信源失真比(Source to distortion ratio,SDR)融入到训练的损失函数.在与具有代表性的传统方法和端到端的深度学习方法的对比实验中,本文提出的算法在客观评价指标上均取得了最好的增强效果,并且在未知噪声和低信噪比条件下表现出更好的抗噪性.
文献关键词:
语音增强;端到端;RefineNet;多目标联合优化;深度神经网络
中图分类号:
作者姓名:
蓝天;彭川;李森;钱宇欣;陈聪;刘峤
作者机构:
电子科技大学信息与软件工程学院 成都610054;中电科大数据研究院有限公司 贵阳550008
文献出处:
引用格式:
[1]蓝天;彭川;李森;钱宇欣;陈聪;刘峤-.基于RefineNet的端到端语音增强方法)[J].自动化学报,2022(02):554-563
A类:
B类:
RefineNet,端到端,语音增强,增强方法,高神,时域波形,处理能力,时频分析,拟语,语音信号处理,短时傅里叶变换,网络学习,纯净,特征映射,模型训练,训练阶段,多目标联合优化,训练策略,Short,objective,intelligibility,STOI,信源,失真,Source,distortion,ratio,SDR,损失函数,深度学习方法,客观评价指标,增强效果,低信噪比,抗噪性,深度神经网络
AB值:
0.454922
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。