首站-论文投稿智能助手
典型文献
基于梅尔频率倒谱系数的音频分类研究
文献摘要:
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面.对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确度低、处理速度慢等方面的不足,提出了基于梅尔频率倒谱的音频分类算法,该算法对音频设定采样率,获取音频的时间序列,并根据时间序列提取梅尔频率倒谱系数特征,将获取的二维特征值进行数据拟合、标准化处理.构建多层卷积神经网络模型,将标准化处理后的梅尔频率倒谱系数特征作为网络的输入,通过交叉熵验证的方法,对模型的输出进行分类.通过实验数据可知,梅尔频率倒谱系数特征通过多层卷积网络处理后,分类结果准确率达到92.8%,使用模型进行分类时,速度达到每个样本7 ms的耗时,模型能对音频进行准确快速的分类.
文献关键词:
梅尔频率倒谱系数;音乐特征;音频分类;多层卷积神经网络
作者姓名:
屈晓渊;崔青
作者机构:
榆林学院信息工程学院,陕西榆林719000;榆林学院艺术学院,陕西榆林719000
文献出处:
引用格式:
[1]屈晓渊;崔青-.基于梅尔频率倒谱系数的音频分类研究)[J].电子设计工程,2022(09):82-87,92
A类:
B类:
梅尔频率倒谱系数,音频分类,分类研究,Mel,Frequency,Cepstrum,Coefficient,MFCC,人耳听觉,非线性对,频谱特征,语音识别,音频特征,处理速度,速度慢,分类算法,对音,采样率,维特,数据拟合,标准化处理,多层卷积神经网络,卷积神经网络模型,交叉熵,出进,卷积网络,ms,准确快速,音乐特征
AB值:
0.356652
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。