首站-论文投稿智能助手
典型文献
基于时域Gammatone滤波特征的广播语种识别
文献摘要:
针对广播语种识别问题,提出一种语音时域滤波方法,用gammatone时域函数与预处理后的语音信号进行卷积滤波,再分帧加窗并求对数化能量得到时域GF(gammatone filterbank)特征.将特征参数图像化表示,然后通过VGG19和Resnet34分类网络进行语种识别实验.同时,也使用自动色阶算法对加噪语音的图像化特征参数进行去噪,并对比不同维数的特征参数以及不同噪声类型和信噪比对语种识别率的影响.结果表明,采用该特征参数的广播语种识别准确率高于使用传统的GFCC特征、GFCC-D-A特征、GFCC-SDC特征及Fbank特征,且在不同噪声类型和不同信噪比的广播语音识别场景下,语种识别准确率均有一定提升.
文献关键词:
广播语种识别;gammatone时域滤波;时域gammatone filterbank;自动色阶算法
作者姓名:
陈亮;邵玉斌;龙华;杜庆治;彭艺;唐维康
作者机构:
昆明理工大学信息工程与 自动化学院,云南昆明650500
文献出处:
引用格式:
[1]陈亮;邵玉斌;龙华;杜庆治;彭艺;唐维康-.基于时域Gammatone滤波特征的广播语种识别)[J].信号处理,2022(03):599-608
A类:
广播语种识别,gammatone,filterbank,自动色阶算法,Fbank
B类:
Gammatone,波特征,时域滤波,滤波方法,语音信号,行卷,卷积滤波,分帧,加窗,图像化,VGG19,Resnet34,分类网络,去噪,识别率,识别准确率,GFCC,SDC,语音识别
AB值:
0.231413
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。