首站-论文投稿智能助手
典型文献
U-net网络中融合多头注意力机制的单通道语音增强
文献摘要:
在低信噪比和突发背景噪声条件下,已有的深度学习网络模型在单通道语音增强方面效果并不理想,而人类可以利用语音的长时相关性对不同的语音信号形成综合感知.因此刻画语音的长时依赖关系有助于改进低信噪比和突发背景噪声下的增强性能.受该特性的启发,提出一种融合多头注意力机制和U-net深度网络的增强模型TU-net,实现基于时域的端到端单通道语音增强.TU-net网络模型采用U-net网络的编解码层对带噪语音信号进行多尺度特征融合,并利用多头注意力机制实现双路径Transformer,用于计算语音掩模,更好地建模长时相关性.该模型在时域、时频域和感知域计算损失函数,并通过加权组合损失函数指导训练.仿真实验结果表明,TU-net在低信噪比和突发背景噪声条件下增强语音信号的语音质量感知评估(PESQ)、短时客观可懂度(STOI)和信噪比增益等多个评价指标都优于同类的单通道增强网络模型,且保持相对较少的网络模型参数.
文献关键词:
作者姓名:
范君怡;杨吉斌;张雄伟;郑昌艳
作者机构:
陆军工程大学研究生院 南京 210007;陆军工程大学指挥控制工程学院 南京 210007;火箭军士官学校测试控制系 青州 262500
文献出处:
引用格式:
[1]范君怡;杨吉斌;张雄伟;郑昌艳-.U-net网络中融合多头注意力机制的单通道语音增强)[J].声学学报,2022(06):703-716
A类:
B类:
net,多头注意力机制,单通道语音增强,低信噪比,背景噪声,噪声条件,深度学习网络,语音信号,综合感知,此刻,画语,依赖关系,增强性能,深度网络,增强模型,TU,端到端,编解码,多尺度特征融合,双路径,Transformer,掩模,模长,时频域,组合损失函数,指导训练,语音质量,质量感知,感知评估,PESQ,STOI,信噪比增益,通道增强
AB值:
0.332193
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。