典型文献
一种用于实时语音增强的卷积准循环网络
文献摘要:
为了在保证实时性的前提下,进一步提高深度神经网络的语音增强性能,提出一种用于实时语音增强的卷积准循环网络.该网络采用因果形式的输入,只利用含噪语音当前帧及过去帧的时频域特征,以满足实时语音增强方法的输入要求;基于准循环神经网络对含噪语音时间维度上的相关性进行建模,利用其对含噪语音序列的并行处理能力,提高网络模型的计算效率;同时使用卷积层改进准循环神经网络在隐层对含噪语音频率维度特征的计算方式,使网络模型能够更好地利用含噪语音相邻频带之间的局部相关性,提高网络模型的语音增强性能.实验结果表明,与基于准循环神经网络的语音增强方法相比,基于卷积准循环网络的语音增强方法不仅提高了语音增强性能,还降低了网络模型的参数量;与其他语音增强方法相比,卷积准循环网络在保证因果形式输入的前提下,有效地抑制了背景噪声对目标语音的干扰、降低了 目标语音的失真程度,拥有更好的语音增强性能.最后,在不同计算平台上验证了基于卷积准循环网络的语音增强方法的实时性.
文献关键词:
语音增强;准循环神经网络;卷积神经网络;实时性
中图分类号:
作者姓名:
时云龙;袁文浩;胡少东;娄迎曦
作者机构:
山东理工大学计算机科学与技术学院,山东淄博255000
文献出处:
引用格式:
[1]时云龙;袁文浩;胡少东;娄迎曦-.一种用于实时语音增强的卷积准循环网络)[J].西安电子科技大学学报(自然科学版),2022(03):183-190
A类:
B类:
语音增强,循环网络,高深,深度神经网络,增强性能,果形,时频域特征,增强方法,准循环神经网络,时间维度,音序,并行处理,处理能力,计算效率,卷积层,音频,维度特征,计算方式,邻频,频带,局部相关,参数量,背景噪声,目标语,失真程度,计算平台
AB值:
0.231352
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。