首站-论文投稿智能助手
典型文献
基于卷积循环网络与非局部模块的语音增强方法
文献摘要:
现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想.针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法.通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进行深层特征提取,从而充分利用语音信号的幅值信息以及相位信息.在编码端和解码端的卷积层中加入非局部模块,在提取语音序列关键特征的同时,抑制无用特征,并引入门控循环单元网络捕捉语音序列间的时序相关性信息.在ST-CMDS中文语音数据集上实验结果表明,与未处理的含噪语音相比,使用文中方法生成的增强语音质量和可懂度平均提升了61%和7.93%.
文献关键词:
语音增强;深度神经网络;卷积循环网络;非局部模块;监督学习;门控循环单元;幅值谱;相位谱
作者姓名:
李辉;景浩;严康华;徐良浩
作者机构:
河南理工大学 物理与电子信息学院,河南 焦作454000;河南理工大学 电气工程与自动化学院,河南 焦作454000
文献出处:
引用格式:
[1]李辉;景浩;严康华;徐良浩-.基于卷积循环网络与非局部模块的语音增强方法)[J].电子科技,2022(03):8-15
A类:
B类:
卷积循环网络,非局部模块,语音增强,增强方法,深度神经网络,相位谱,谱学,语音质量,编解码网络,语音信号,深层特征,相位信息,在编,卷积层,音序,关键特征,无用,入门,门控循环单元网络,时序相关性,ST,CMDS,语音数据,未处理,中方,监督学习,幅值谱
AB值:
0.304638
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。