首站-论文投稿智能助手
典型文献
基于抛物面焦点麦克风预处理和迁移学习的语音增强方法
文献摘要:
背景噪声会严重影响语音的质量和可懂度,从一段带噪语音中分离出目标语音,尽可能地降低背景噪声对目标语音的影响,是语音增强技术的目标.语音增强技术在自动语音识别、电话通信等领域有着广泛的应用,近年来,该技术也受到了学者的关注.在真实噪声环境中,带噪语音的背景噪声往往十分复杂,传统的语音增强方式无法很好地适应各类噪声场景.针对复杂的非线性问题,基于深度学习的语音增强方法具有很强的适应能力.然而,对于真实噪声环境,模型的增强性能往往因为泛化性不足而下降.为了进一步提升语音增强模型在真实噪声环境下的增强性能,提出了一种基于抛物面焦点麦克风预处理和迁移学习的语音增强方法.该方法利用抛物面焦点麦克风采集带噪语音和噪声,通过物理汇聚增强的方式,对带噪语音进行预处理.再利用迁移学习方法,小样本微调训练LSTM-convolutional-BLSTM编解码(LSTM-convolutional-BLSTM encoder-decoder,LCLED)网络的编码器和输出层,冻结解码器,通过算法模型,适应真实噪声环境特性,进一步增强语音.所提出的方法通过物理途径和算法途径两个方面,构建了一整套端到端的语音增强系统,提升了整个系统的语音增强性能,降低了深度神经网络算法模型的复杂度.实验结果表明,所提出的方法可以有效地增强真实噪声环境下的带噪语音.
文献关键词:
迁移学习;神经网络;语音增强;真实噪声场景;抛物面焦点麦克风
作者姓名:
张涛;王泽宇;胡梦雪;赵鑫;刘赣俊;耿彦章
作者机构:
天津大学电气自动化与信息工程学院,天津 300072;天津大学国际工程师学院,天津 300072
引用格式:
[1]张涛;王泽宇;胡梦雪;赵鑫;刘赣俊;耿彦章-.基于抛物面焦点麦克风预处理和迁移学习的语音增强方法)[J].天津大学学报(自然科学与工程技术版),2022(10):1053-1060
A类:
抛物面焦点麦克风,LCLED,真实噪声场景
B类:
语音增强,增强方法,背景噪声,目标语,增强技术,自动语音识别,噪声环境,十分复杂,非线性问题,增强性能,泛化性,增强模型,法利,风采,迁移学习方法,小样本,微调训练,convolutional,BLSTM,编解码,encoder,decoder,编码器,出层,冻结,解码器,算法模型,环境特性,和算,一整套,端到端,增强系统,深度神经网络,神经网络算法
AB值:
0.213838
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。