典型文献
韵律增强型汉语语音合成系统
文献摘要:
端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音.当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音.然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于汉语时,合成音频存在较为严重的韵律问题,如断句或停顿不恰当、自然度差等.为此,结合汉语的语言特性和韵律特性,提出一种神经网络端到端韵律增强型汉语语音合成系统,该系统使用从预训练Bert模型中提取的多层次上下文特征增强端到端汉语语音合成系统的输入.在汉语语音合成公开数据集上的实验结果表明,与当前主流的端到端语音合成系统相比,该韵律增强型汉语语音合成系统可以生成更加自然且富有表现力的语音.
文献关键词:
文语转换;语音合成;汉语;韵律增强;Bert模型;TTS
中图分类号:
作者姓名:
牛芳;吾守尔·斯拉木
作者机构:
新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;新疆多语种信息技术实验室,新疆 乌鲁木齐 830046;新疆多语种信息技术研究中心,新疆 乌鲁木齐 830046
文献出处:
引用格式:
[1]牛芳;吾守尔·斯拉木-.韵律增强型汉语语音合成系统)[J].现代电子技术,2022(13):87-92
A类:
韵律增强,文语转换
B类:
增强型,汉语语音,语音合成,合成系,端到端,TTS,音素,序列生成,成语,近似于,罗马字母,音频,断句,停顿,自然度,语言特性,和韵,预训练,Bert,上下文特征,特征增强,公开数据集,表现力
AB值:
0.247565
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。