典型文献
多尺度卷积的时频域语音分离方法研究
文献摘要:
在进行混合语音分离时,信号时域特征的深度学习语音分离性能优于频域特征.但目前时域特征的语音分离方法在真实噪声环境下的鲁棒性较差,且单一时域特征对分离模型的性能存在局限性.因此,提出一种基于Conv-TasNet网络的多特征语音分离方法,融合频域特征与时域特征,提高数据的多维信息.为了进一步提高分离网络性能,引入多尺度卷积块,提高网络对特征的提取能力.在包含真实噪声的实验环境下,所提方法与Conv-TasNet模型和最新的时频域融合语音分离基线模型相比,性能分别提高了 0.91和0.52 dB,有效提升了语音分离的性能及鲁棒性.
文献关键词:
语音分离;特征融合;多尺度卷积;时频域特征
中图分类号:
作者姓名:
贾林锋;吴黎明;温腾腾;廖禹韬;高梓皓
作者机构:
广东工业大学机电工程学院 广州 510006
文献出处:
引用格式:
[1]贾林锋;吴黎明;温腾腾;廖禹韬;高梓皓-.多尺度卷积的时频域语音分离方法研究)[J].电子测量与仪器学报,2022(11):134-140
A类:
TasNet
B类:
语音分离,分离方法,混合语,时域特征,习语,分离性能,真实噪声,噪声环境,Conv,多特征,离网,网络性能,多尺度卷积块,特征的提取,实验环境,基线模型,dB,特征融合,时频域特征
AB值:
0.223851
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。