典型文献
基于CNN-SVM性别组合分类的单通道语音分离
文献摘要:
实际语音分离时,混合语音的说话人性别组合相关信息往往是未知的.若直接在普适的模型上进行分离,语音分离效果欠佳.为了更好地进行语音分离,本文提出一种基于卷积神经网络-支持向量机(CNN-SVM)的性别组合判别模型,来确定混合语音的两个说话人是男-男、男-女还是女-女组合,以便选用相应性别组合的分离模型进行语音分离.为了弥补传统单一特征表征性别组合信息不足的问题,本文提出一种挖掘深度融合特征的策略,使分类特征包含更多性别组合类别的信息.本文的基于CNN-SVM性别组合分类的单通道语音分离方法,首先使用卷积神经网络挖掘梅尔频率倒谱系数和滤波器组特征的深度特征,融合这两种深度特征作为性别组合的分类特征,然后利用支持向量机对混合语音性别组合进行识别,最后选择对应性别组合的深度神经网络/卷积神经网络(DNN/CNN)模型进行语音分离.实验结果表明,与传统的单一特征相比,本文所提的深度融合特征可以有效提高混合语音性别组合的识别率;本文所提的语音分离方法在主观语音质量评估(PESQ)、短时客观可懂度(STOI)、信号失真比(SDR)指标上均优于普适的语音分离模型.
文献关键词:
性别组合识别;卷积神经网络-支持向量机;单通道语音分离;深度特征
中图分类号:
作者姓名:
孙林慧;张蒙;梁文清
作者机构:
南京邮电大学通信与信息工程学院,江苏南京 210003
文献出处:
引用格式:
[1]孙林慧;张蒙;梁文清-.基于CNN-SVM性别组合分类的单通道语音分离)[J].信号处理,2022(12):2519-2531
A类:
性别组合识别
B类:
单通道语音分离,混合语,说话,接在,分离效果,判别模型,组合信息,融合特征,分类特征,组合类,分离方法,网络挖掘,梅尔频率倒谱系数,滤波器组,深度特征,后选择,对应性,深度神经网络,DNN,识别率,语音质量,质量评估,PESQ,STOI,信号失真,SDR
AB值:
0.202466
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。