首站-论文投稿智能助手
典型文献
基于多维神经网络深度特征融合的鸟鸣识别算法
文献摘要:
为了进一步提高夜间迁徙鸟鸣监测的准确率,提出一种基于多维神经网络深度特征融合的鸟鸣识别算法.首先,提取鸟鸣对数尺度的梅尔谱图作为VGG Style模型的训练特征,增强时频谱图的能量分布,通过Mix up数据混合生成虚拟数据以减少模型的过拟合.之后,将预训练的VGG Style作为特征提取器对每一段鸟鸣提取深度特征.鉴于不同维度模型的互补性,该文提出分别使用1维CNN-LSTM、2维VGG Style与3维DenseNet121模型作为特征提取器生成高级特征.对于1维CNN-LSTM,使用小波分解作为池化方法,分别对鸟鸣时、频域进行9层小波分解,生成多层LBP特征以获取更丰富的时频信息.最后,对CNN-LSTM与DenseNet121的全连接层进行优化,减少模型参数,提高实时性.实验结果表明,通过融合多维神经网络的深度特征,使用浅层分类器在含有43种鸟类的CLO-43SD数据集中,获得了 93.89%的平衡准确率,相较于最新的Mel-VGG与Subnet-CNN融合模型,平衡准确率提高了 7.58%.
文献关键词:
鸟鸣识别;1维CNN-LSTM;2维VGG Style;3维DenseNet121;深度特征融合
作者姓名:
吉训生;江昆;谢捷
作者机构:
江南大学物联网工程学院,江苏无锡214122;轻工业先进过程控制重点实验室(教育部),江南大学,江苏无锡214122;江苏省先进食品制造装备与技术重点实验室,江南大学,江苏无锡214122
文献出处:
引用格式:
[1]吉训生;江昆;谢捷-.基于多维神经网络深度特征融合的鸟鸣识别算法)[J].信号处理,2022(04):844-853
A类:
鸟鸣识别,43SD
B类:
深度特征融合,识别算法,迁徙,数尺,VGG,Style,训练特征,时频谱,频谱图,能量分布,Mix,up,虚拟数据,过拟合,预训练,不同维度,互补性,DenseNet121,小波分解,解作,池化,频域,LBP,时频信息,全连接层,层进,高实时性,分类器,种鸟,鸟类,CLO,Mel,Subnet,融合模型
AB值:
0.337051
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。