首站-论文投稿智能助手
典型文献
基于深度神经网络及隐马尔科夫模型的生猪状态音频识别
文献摘要:
针对传统音频识别方法在生猪音频信号识别中识别率较低的问题,将深度神经网络及隐马尔可夫模型理论作为生猪音频信号识别依据,以长白猪的吃饭声、发情声、嚎叫声、哼叫声和生病长白猪的喘气声为识别对象,利用卡尔曼滤波和改进的EMD-TEO倒谱距离端点检测算法对生猪音频信号进行预处理,把提取的39维的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为网络学习和识别的数据集,构建基于深度神经网络及隐马尔科夫模型的生猪状态音频识别模型.试验结果表明:1)隐马尔可夫隐状态数设置为5,深度神经网络隐藏层设置为3层,每层128个节点 的深度神经网 络-隐马尔可夫模型(Deep neural network-hidden Markov model,DNN-HMM),对5种生猪状态音频,即吃饭声、嚎叫声、哼叫声、发情声和病猪喘气声的识别率为70%、95%、75%、80%和95%,总体识别率83%;2)相较于传统的高斯 混合模型-隐马尔可夫模型(Gaussian mixture model-hidden Markov model,GMM-HMM),DNN-HMM对相应音频的识别率分别提高了 5%、5%、15%、30%、30%,总体识别率提高了 17%;3)DNN-HMM 模型对于5种不同类型的生猪音频信号均呈现出较好的识别效果.基于DNN-HMM生猪音频识别模型,对生猪不同状态下音频的识别具有较高正确率,且更为可靠.
文献关键词:
生猪;MFCC;卡尔曼滤波;DNN-HMM;识别;音频信号
作者姓名:
彭硕;刘东阳;时国龙;李广博;慕京生;辜丽川;焦俊
作者机构:
安徽农业大学 信息与计算机学院,合肥230036;蒙城县京徽蒙农业科技发展有限公司,安徽亳州233524
引用格式:
[1]彭硕;刘东阳;时国龙;李广博;慕京生;辜丽川;焦俊-.基于深度神经网络及隐马尔科夫模型的生猪状态音频识别)[J].中国农业大学学报,2022(06):172-181
A类:
嚎叫声,喘气声
B类:
深度神经网络,隐马尔科夫模型,生猪,音频识别,音频信号识别,识别率,隐马尔可夫模型,长白猪,吃饭,生病,识别对象,卡尔曼滤波,EMD,TEO,端点检测,检测算法,梅尔频率倒谱系数,Mel,frequency,cepstral,coefficient,MFCC,网络学习,识别模型,状态数,每层,Deep,neural,network,hidden,Markov,model,DNN,HMM,病猪,混合模型,Gaussian,mixture,GMM,别具
AB值:
0.226202
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。