首站-论文投稿智能助手
典型文献
一种用于因果式语音增强的门控循环神经网络
文献摘要:
传统基于深度学习的语音增强方法为了提高网络对带噪语音的建模能力,通常采用非因果式的网络输入,由此导致了固定时延问题,使得语音增强系统实时性较差.提出一种用于因果式语音增强的门控循环神经网络CGRU,以解决实时语音增强系统中的固定时延问题并提高语音增强性能.为了更好地建模带噪语音信号的相关性,网络单元在计算当前时刻的输出时融合上一时刻的输入与输出.此外,采用线性门控机制来控制信息传输,以缓解网络训练过程中的过拟合问题.考虑到因果式语音增强系统对实时性要求较高,在CGRU网络中采用单门控的结构设计,以降低网络的结构复杂度,提高系统的实时性.实验结果表明,CGRU网络在增强后的语音感知质量、语音客观可懂度、分段信噪比指标上均优于GRU、SRNN、SRU等传统网络结构,在信噪比为0 dB的条件下,CGRU的平均语音感知质量和平均语音客观可懂度分别达到2.4和0.786.
文献关键词:
门控循环神经网络;固定时延;因果式语音增强;语音质量;语音可懂度
作者姓名:
李江和;王玫
作者机构:
桂林理工大学 信息科学与工程学院,广西 桂林 541006
文献出处:
引用格式:
[1]李江和;王玫-.一种用于因果式语音增强的门控循环神经网络)[J].计算机工程,2022(11):77-82
A类:
因果式语音增强,固定时延,SRNN
B类:
门控循环神经网络,增强方法,建模能力,时延问题,增强系统,CGRU,增强性能,语音信号,网络单元,输入与输出,门控机制,控制信息,信息传输,网络训练,训练过程,过拟合,单门,结构复杂度,语音感知,感知质量,SRU,dB,语音质量,语音可懂度
AB值:
0.246221
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。