典型文献
基于CBHG的Mel谱精细结构重建
文献摘要:
在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量.基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络.该后处理网络通过对解码输出的Mel谱进行分析并预测其缺失的精细结构,最后将这些精细结构叠加到解码输出的Mel谱中以生成细化后的Mel谱,从而提高合成语音的质量.实验结果表明,提出的后处理网络有效恢复了Mel谱在解码过程中丢失的精细结构,同时通过结合高性能、高效率的HiFi-GAN声码器,最终合成语音的平均主观意见分(Mean Opinion Score,MOS)达到4.10,相比基线提升了0.26.
文献关键词:
语音合成;CBHG;Mel谱;后处理网络;Tacotron 2;HiFi-GAN
中图分类号:
作者姓名:
唐君;张连海;李嘉欣
作者机构:
信息工程大学,河南郑州450001
文献出处:
引用格式:
[1]唐君;张连海;李嘉欣-.基于CBHG的Mel谱精细结构重建)[J].信息工程大学学报,2022(02):135-140
A类:
CBHG,后处理网络
B类:
Mel,精细结构,数语,语音合成,合成系,合成语音,Tacotron,真实数据,解码,HiFi,GAN,声码,码器,Mean,Opinion,Score,MOS,比基
AB值:
0.278877
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。