典型文献
基于改进GFCC特征参数的广播音频语种识别
文献摘要:
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法.
文献关键词:
广播音频语种识别;能量谱包络;倒谱提升;改进伽马频率倒谱系数
中图分类号:
作者姓名:
邵玉斌;陈亮;龙华;杜庆治
作者机构:
昆明理工大学 信息工程与自动化学院,昆明 650500
文献出处:
引用格式:
[1]邵玉斌;陈亮;龙华;杜庆治-.基于改进GFCC特征参数的广播音频语种识别)[J].吉林大学学报(理学版),2022(02):417-424
A类:
广播音频语种识别,能量谱包络,倒谱提升,改进伽马频率倒谱系数
B类:
GFCC,改进特征,说话,Gammatone,滤波器组,离散余弦变换,音频信号,信号提取,提取特征,Markov,衍生方
AB值:
0.142477
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。