典型文献
结合注意力机制的改进U-Net网络在端到端语音增强中的应用
文献摘要:
设计了一个适用于端到端语音增强的改进的U-Net (Attention Dilated Convolution U-Net,ADC-U-Net)网络模型.与基线U-Net网络相比,一方面通过加入空洞卷积减小由采样带来的信息损失;另一方面引入了注意力机制结构,结合了含噪语音更多的上下文信息,提取更深层次和更丰富的特征信息.与传统语音增强方法相比,所提模型无需提取特征、对特征去噪、重构语音3个步骤,避免了对显性特征的依赖,转而由网络模型通过多层次多尺度学习获得隐性特征.用多个主客观指标对增强语音的质量和可懂度进行了评价.实验数据显示所提算法在噪声抑制能力和对噪声的适应度方面均表现出良好的性能,与基线U-Net网络及其它模型相比,展示了良好的语音质量和可懂度.
文献关键词:
中图分类号:
作者姓名:
武瑞沁;陈雪勤;俞杰;王丽荣;赵鹤鸣
作者机构:
苏州大学电子信息学院 苏州 215006
文献出处:
引用格式:
[1]武瑞沁;陈雪勤;俞杰;王丽荣;赵鹤鸣-.结合注意力机制的改进U-Net网络在端到端语音增强中的应用)[J].声学学报,2022(02):266-275
A类:
B类:
注意力机制,Net,端到端,语音增强,Attention,Dilated,Convolution,ADC,空洞卷积,样带,信息损失,上下文信息,特征信息,增强方法,提取特征,去噪,转而,多尺度学习,隐性特征,主客观,客观指标,噪声抑制,抑制能力,适应度,语音质量
AB值:
0.446782
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。