首站-论文投稿智能助手
典型文献
基于前向注意力机制的长句子语音合成方法
文献摘要:
针对基于注意力机制的序列到序列模型在合成长句子语音时出现的漏读、重读问题,根据前向算法提出了前向注意力机制,其利用前一时刻的注意力得分平滑当前异常得分.在此基础上,进一步提出了带约束的前向注意力机制,通过引入约束因子自适应平滑当前异常得分.实验结果表明,提出的前向注意力机制能够有效解决长句子语音合成中出现的漏读、重读问题,并具有更快的收敛速度和较好的稳定性,同时带约束的前向注意力机制又能够控制合成语音的速度,提高其自然度,在MOS得分上,相比基线模型Tacotron2,有2.5%左右的提升.
文献关键词:
前向注意力机制;序列到序列;自适应平滑;语音合成
作者姓名:
田泽佳;门豪;卓奕炜;刘宇
作者机构:
武汉邮电科学研究院,湖北武汉430074;南京烽火天地通信科技有限公司,江苏南京210019
文献出处:
引用格式:
[1]田泽佳;门豪;卓奕炜;刘宇-.基于前向注意力机制的长句子语音合成方法)[J].电子设计工程,2022(18):86-90
A类:
前向注意力机制,Tacotron2
B类:
长句,句子,语音合成,合成方法,序列到序列模型,重读,前向算法,自适应平滑,收敛速度,控制合成,合成语音,自然度,MOS,比基,基线模型
AB值:
0.247881
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。