基于声纹嵌入的语音增强算法|高戈;曾邦;王霄;尹文兵;陈怡|华中师范大学计算机学院,武汉430077 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于声纹嵌入的语音增强算法

文献摘要：

频域语音增强算法在高信噪比的条件下有明显的降噪效果,而在低信噪比条件下频域语音增强算法的性能会大幅下降.针对这个问题,将基于声纹的掩码应用到频域语音增强网络,利用声纹的先验信息,提升网络对说话人和噪声的区分度.另外,为了进一步改善频域语音算法在低信噪比条件下的性能,提出基于映射的声纹嵌入语音增强算法,避免了可能因采用掩模方案造成的语音失真问题.实验结果表明,在引入相同声纹信息时,基于映射的声纹嵌入语音增强网络在低信噪比条件下的增强性能表现更好,特别是在改善语音失真方面优势明显.相较于基于掩模的声纹掩码网络,基于映射的声纹嵌入网络在PESQ、STOI和SSNR这三项指标上分别实现了6.40％、1.46％和24.84％的相对提升.

文献关键词：

语音增强;低信噪比;声纹嵌入;掩码;映射

中图分类号：

[1] 无线电电子学、电信技术（TN） / 通信（TN91） / 电声技术和语音信号处理（TN912） / 语音信号处理（TN912.3） / 语音增强（TN912.35）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 无线电电子学、电信技术（TN） / 通信（TN91） / 电声技术和语音信号处理（TN912） / 语音信号处理（TN912.3）

作者姓名：

高戈;曾邦;王霄;尹文兵;陈怡

作者机构：

武汉大学国家多媒体软件工程技术研究中心,武汉430072;华中师范大学计算机学院,武汉430077

文献出处：

计算机应用研究

引用格式：

[1]高戈;曾邦;王霄;尹文兵;陈怡-.基于声纹嵌入的语音增强算法)[J].计算机应用研究,2022(03):688-692

A类：

声纹嵌入,SSNR

B类：

语音增强,增强算法,频域,高信噪比,降噪效果,低信噪比,掩码,先验信息,说话,区分度,掩模,失真,真问题,同声,增强性能,入网,PESQ,STOI,这三项

AB值：

0.235334

相似文献

面向人脑功能划分的人工水母搜索优化算法

赵学武;王红梅;刘超慧;李玲玲;薄树奎;冀俊忠-郑州航空工业管理学院智能工程学院,郑州 450046;北京工业大学信息学部计算机学院,北京 100124

基于多尺度知识学习的深度鲁棒水印算法

樊缤;李智;高健-贵州大学计算机科学与技术学院,贵阳 550025

基于端到端的蒙古语异形同音词声学建模方法

陈艳;李图雅;马志强;谢秀兰;王洪彬-内蒙古工业大学数据科学与应用学院,内蒙古呼和浩特 010080;内蒙古工业大学内蒙古自治区基于大数据的软件服务工程技术研究中心,内蒙古呼和浩特 010080

遗传算法优化时间卷积网络的手机来源识别

武钦芳;吴张倩;苏兆品;张国富-合肥工业大学计算机与信息学院,合肥 230601;智能互联系统安徽省实验室(合肥工业大学),合肥 230009;工业安全与应急技术安徽省重点实验室(合肥工业大学),合肥 230601;安全关键工业测控技术教育部工程研究中心,合肥 230601

基于残差网络和门控卷积网络的语音识别研究

朱学超;张飞;高鹭;任晓颖;郝斌-内蒙古科技大学信息工程学院,内蒙古包头 014000

空频域图像增强方法研究综述

郭永坤;朱彦陈;刘莉萍;黄强-江西中医药大学计算机学院,南昌 330004;江西中医药大学网络中心,南昌 330004

基于Transformer的单通道语音增强模型综述

范君怡;杨吉斌;张雄伟;郑昌艳-陆军工程大学指挥控制工程学院,南京 210007;火箭军士官学校测试控制系,山东潍坊 262500

改进相位补偿结合谐波重构的语音增强方法

崔磊;马建芬;张朝霞-太原理工大学信息与计算机学院,山西晋中 030600;太原理工大学物理与光电工程学院,山西晋中 030600

基于ARIMA预测MFCC特征的声纹同一性鉴定方法

王学光;诸珺文;张爱新-华东政法大学刑事法学院上海200052;上海交通大学网络空间安全学院上海200240

语义增强的完全不平衡标签网络表示学习算法

富坤;郭云朋;禚佳明;李佳宁;刘琪-河北工业大学人工智能与数据科学学院天津 300401;河北省大数据计算重点实验室天津 300401

一种用于因果式语音增强的门控循环神经网络

李江和;王玫-桂林理工大学信息科学与工程学院,广西桂林 541006

基于非线性堆叠双向网络的端到端声纹识别

王芷悦;崔琳-西安工程大学电子信息学院,陕西西安 710699;西北工业大学航海学院,陕西西安 710072

基于TasNet的单通道语音分离技术的研究综述

陆炜;朱定局-华南师范大学计算机学院,广东广州 510631

基于GAN和U-Net的低光照图像增强算法

李晨曦;李健-中国科学院计算机网络信息中心, 北京 100190;中国科学院大学, 北京 100049

基于CycleGAN的语音可懂度关键技术

肖晶;刘佳奇;李登实;赵兰馨;王前瑞-武汉大学计算机学院国家多媒体软件工程技术研究中心, 武汉 430072;武汉大学多媒体与网络通信工程湖北省重点实验室, 武汉 430072;江汉大学人工智能学院, 武汉 430056

基于融合频域和时域特征的说话人识别

龙翔;夏秀渝-四川大学电子信息学院,成都 610065

利用ERB尺度划分对补偿相位谱语音增强算法的改进

许清臣;韦怡;张再跃-江苏科技大学镇江 212003;中国石油化工股份有限公司金陵分公司南京 210033

基于最短欧氏距离替换码元的VoIP隐写算法

孙鑫昊;王开西-青岛大学计算机科学技术学院,山东青岛 266071

基于C语言的语谱图生成

罗海涛-广东外语外贸大学信息学院,广州 510420

基于生成式对抗网络和多级小波包卷积网络的水下图像增强算法

温佩芝;陈君谋;肖雁南;温雅媛;黄文明-桂林电子科技大学计算机与信息安全学院,广西桂林 541004;广西师范大学电子工程学院,广西桂林 541004

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。