韵律增强型汉语语音合成系统|牛芳;吾守尔·斯拉木|新疆多语种信息技术实验室,新疆乌鲁木齐 830046 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

韵律增强型汉语语音合成系统

文献摘要：

端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音.当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音.然而,中文的文本不同于这类以罗马字母为基础的语言(如英语),直接将端到端语音合成框架应用于汉语时,合成音频存在较为严重的韵律问题,如断句或停顿不恰当、自然度差等.为此,结合汉语的语言特性和韵律特性,提出一种神经网络端到端韵律增强型汉语语音合成系统,该系统使用从预训练Bert模型中提取的多层次上下文特征增强端到端汉语语音合成系统的输入.在汉语语音合成公开数据集上的实验结果表明,与当前主流的端到端语音合成系统相比,该韵律增强型汉语语音合成系统可以生成更加自然且富有表现力的语音.

文献关键词：

文语转换;语音合成;汉语;韵律增强;Bert模型;TTS

中图分类号：

[1] 无线电电子学、电信技术（TN） / 通信（TN91） / 电声技术和语音信号处理（TN912） / 语音信号处理（TN912.3）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 语言、文字（H） / 语言学（H0） / 语义学、语用学、词汇学、词义学（H03） / 语义学、语用学（H030）

作者姓名：

牛芳;吾守尔·斯拉木

作者机构：

新疆大学信息科学与工程学院,新疆乌鲁木齐 830046;新疆多语种信息技术实验室,新疆乌鲁木齐 830046;新疆多语种信息技术研究中心,新疆乌鲁木齐 830046

文献出处：

现代电子技术

引用格式：

[1]牛芳;吾守尔·斯拉木-.韵律增强型汉语语音合成系统)[J].现代电子技术,2022(13):87-92

A类：

韵律增强,文语转换

B类：

增强型,汉语语音,语音合成,合成系,端到端,TTS,音素,序列生成,成语,近似于,罗马字母,音频,断句,停顿,自然度,语言特性,和韵,预训练,Bert,上下文特征,特征增强,公开数据集,表现力

AB值：

0.247565

相似文献

面向多模态情感分析的双模态交互注意力

包广斌;李港乐;王国雄-兰州理工大学计算机与通信学院,兰州 730050

基于残差网络和门控卷积网络的语音识别研究

朱学超;张飞;高鹭;任晓颖;郝斌-内蒙古科技大学信息工程学院,内蒙古包头 014000

基于Transformer-ESIM注意力机制的多模态情绪识别

徐志京;高姗-上海海事大学信息工程学院,上海 201306

一种基于多通道WDRC算法的护耳语音处理加速器

刘作旭;陈霏-天津大学微电子学院,天津300072;深圳清华大学研究院,广东深圳518057

基于字符区域感知的端到端车牌识别方法

李岩;舒言;范晓焓;宿汉辰;李斌阳-国际关系学院网络空间安全学院, 北京 100191;哈尔滨工业大学计算机科学与技术学院, 黑龙江哈尔滨 150006

一种利用SE-Res2Net的合成语音检测系统

梁超;高勇-四川大学电子信息学院,四川成都 610065

时频掩码优化的两阶段语音增强算法

郑莉;李鸿燕-太原理工大学信息与计算机学院,山西榆次030600

一种基于双向LSTM的语音情感识别模型

程适;骆晓宁;李冬城;要趁红-西安建筑科技大学信息与控制工程学院,陕西西安710399

基于卷积循环网络与非局部模块的语音增强方法

李辉;景浩;严康华;徐良浩-河南理工大学物理与电子信息学院,河南焦作454000;河南理工大学电气工程与自动化学院,河南焦作454000

基于深度学习的方言语音识别模型构建

郝焕香-嘉兴南洋职业技术学院,浙江嘉兴314001

基于深度学习的中文情感语音合成方法

王智;刘银华-青岛大学自动化学院未来研究院,山东青岛266071

基于音频信号识别的英语翻译器准确性校正方法

谢丹;殷超-西安交通工程学院,西安710000;马来西亚玛拉工业大学,马来西亚·雪兰莪40450;陕西师范大学,西安710000;西安市铁一中学,西安710000

脸由音生:语音驱动的静动态人脸生成方法

赵璐璐;陈雁翔;赵鹏铖;朱玉鹏;盛振涛-合肥工业大学计算机与信息学院,合肥 230009

基于生成对抗网络的情感对话回复生成

李凯伟;马力-西北大学网络和数据中心,西安 710127;西安邮电大学计算机学院,西安 710121

基于多模态注意力机制的跨模态哈希网络

吴吉祥;鲁芹;李伟霄-齐鲁工业大学(山东省科学院)计算机科学与技术学院,济南 250000;中移动信息技术有限公司内审部,北京 100000

具有双向增强特征结构的U型肺结节分割网络

黄新;郭晓敏-桂林电子科技大学电子工程与自动化学院,广西桂林 541004;广西自动检测技术与仪器重点实验室,广西桂林 541004

基于前向注意力机制的长句子语音合成方法

田泽佳;门豪;卓奕炜;刘宇-武汉邮电科学研究院,湖北武汉430074;南京烽火天地通信科技有限公司,江苏南京210019

一种高性能频率合成系统国产化设计

张银红;胡晓凯;胡皓云-同方电子科技有限公司,江西九江,332005

一种用于实时语音增强的卷积准循环网络

时云龙;袁文浩;胡少东;娄迎曦-山东理工大学计算机科学与技术学院,山东淄博255000

数据择优合成在气象卫星路径分集中的应用

张宝-国家卫星气象中心北京气象卫星地面站北京100094

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。