首站-论文投稿智能助手
典型文献
基于改进循环生成对抗神经网络的语音增强
文献摘要:
为克服基于生成对抗网络的语音增强技术存在成对语音样本缺乏的问题,提出改进的循环一致性生成对抗网络(CycleGAN)的不成对数据生成模型.通过引入 2-1-2D CNN 生成器和PatchGAN鉴别器,使改进的CycleGAN-2-1-2D模型能更有效地学习语音样本多维度的特征,并大大缩短了训练时长.选取LibriT TS语料库中的部分纯净语音作为训练集 A,从语料库中选取其他样本加3种类型的噪声作为训练集 B,训练集A 和训练集B作为CycleGAN-2-1-2D模型的输入参数.设置 CycleGAN-2D 和 NM F(nonnegative matrix factorization)的语音增强模型作为CycleGAN-2-1-2D模型的对照试验,通过仿真试验对3种模型生成的语音质量进行评估.研究数据表明:相较于 NMF 模型,CycleGAN-2-1-2D 模型生成的语音质量有了较大的提升;相较于CycleGAN-2D模型,CycleGAN-2-1-2D模型对女声的增强效果有明显提升.
文献关键词:
语音增强;深度神经网络;循环生成对抗网络;非平行数据
作者姓名:
徐珑婷;田娩鑫;魏郅林
作者机构:
东华大学信息科学与技术学院,上海201620
引用格式:
[1]徐珑婷;田娩鑫;魏郅林-.基于改进循环生成对抗神经网络的语音增强)[J].东华大学学报(自然科学版),2022(05):70-76
A类:
不成对数据,LibriT,非平行数据
B类:
生成对抗神经网络,语音增强,增强技术,技术存在,样本缺乏,循环一致性生成对抗网络,CycleGAN,数据生成,生成模型,2D,生成器,PatchGAN,鉴别器,地学,习语,大大缩短,TS,语料库,纯净,训练集,输入参数,nonnegative,matrix,factorization,增强模型,对照试验,仿真试验,模型生成,语音质量,研究数据,NMF,女声,增强效果,深度神经网络,循环生成对抗网络
AB值:
0.340335
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。