典型文献
基于A-DResUnet的语音增强方法
文献摘要:
为了更精确地从语谱图中提取特征信息,提出了一种基于A-DResUnet的语音增强方法.A-DResUnet模型在ResUnet模型的基础上融合了空洞卷积,提升捕获语音上下文信息的能力;同时在编码器中加入卷积注意力模块(CBAM),提高对噪声谱图特征的关注.实验结果表明,与模型输出目标为干净语音语谱图相比,用噪声谱图作为模型输出目标时,该模型对未知噪声具有更强的分离能力;相较ResUnet模型,提出的A-DResUnet模型减少了语音细节信息的损失;对比基于DNN、GAN的语音增强方法,PESQ平均提升了22.81%、33.11%,STO1平均提升了 9.62%、15.33%,为复杂环境下的语音增强提供了一种更有效的方法.
文献关键词:
语音增强;语谱图;模型输出目标;空洞卷积;卷积注意力模块
中图分类号:
作者姓名:
李吉祥;倪旭昇;颜上取;邹孝;钱盛友
作者机构:
湖南师范大学物理与电子科学学院 长沙 410081
文献出处:
引用格式:
[1]李吉祥;倪旭昇;颜上取;邹孝;钱盛友-.基于A-DResUnet的语音增强方法)[J].电子测量与仪器学报,2022(10):131-137
A类:
DResUnet,模型输出目标,STO1
B类:
语音增强,增强方法,语谱图,提取特征,特征信息,空洞卷积,上下文信息,在编,编码器,卷积注意力模块,CBAM,噪声谱,声谱图,干净,细节信息,比基,DNN,GAN,PESQ,复杂环境
AB值:
0.233342
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。