典型文献
基于GFCC和能量算子倒谱的语种识别
文献摘要:
为了提高低信噪比下语种识别的准确率,引入一种新的特征提取融合方法.?在前端加入有声段检测,并基于人耳听觉感知模型提取伽玛通频率倒谱系数(Gammatone?Frequency?Cepstrum?Coefficient,GFCC)特征,通过主成分分析对特征进行压缩、降噪,融合每个有声段的Teager能量算子倒谱参数,通过高斯混合通用背景模型进行语种识别验证.?实验结果表明,在信噪比为?5~0?dB时,相对于基于对数梅尔尺度滤波器组能量特征方法,融合特征集方法对5种语言的识别率,分别提升了23.7%~34.0%,其他信噪比等级下识别率也有明显的提升.
文献关键词:
语种识别;伽玛通频率倒谱系数;有声无声段检测;Teager能量算子倒谱参数;主成分分析
中图分类号:
作者姓名:
刘晶;邵玉斌;龙华;李一民
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500
文献出处:
引用格式:
[1]刘晶;邵玉斌;龙华;李一民-.基于GFCC和能量算子倒谱的语种识别)[J].云南大学学报(自然科学版),2022(02):254-261
A类:
伽玛通频率倒谱系数,有声无声段检测
B类:
GFCC,能量算子,语种识别,低信噪比,融合方法,人耳听觉,听觉感知,感知模型,Gammatone,Frequency,Cepstrum,Coefficient,降噪,Teager,谱参数,高斯混合,合通,背景模型,dB,尺度滤波器,滤波器组,能量特征,融合特征,征集,识别率
AB值:
0.373969
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。