典型文献
基于频谱位移模块的环境声音识别方法
文献摘要:
针对卷积操作只能提取局部频谱信息,不能有效地挖掘频谱之间相关信息的问题,提出了一种基于频谱位移模块的神经网络.该网络采用密集卷积神经网络的架构,并在支路上使用频谱位移模块实现频谱信息之间的交互.利用这种频谱移位取代了频谱间的下采样操作,实现了频谱的全局化特征提取,同时避免了下采样过程中信息的丢失,进一步地提高了频谱特征图质量.并在公开的数据集ESC10和ESC50上验证频谱位移密集模块,在两种数据集的分类准确度分别达到了 96.00%和88.75%,与原有的网络相比准确度分别提升了 2.1%和2.25%.实验结果表明,和现有的其他卷积神经网络方法相比,所提出的网络能够更好有效地挖掘全局时频信息,具有更高的识别准确率.
文献关键词:
环境声音识别;卷积神经网络;频谱位移;密集神经网络;深度学习
中图分类号:
作者姓名:
李传坤;郭锦铭;李剑;孙袖山
作者机构:
中北大学信息与通信工程学院 太原030051;中北大学无损检测技术中心 太原030051;中北大学省部共建动态测试技术国家重点实验室 太原030051
文献出处:
引用格式:
[1]李传坤;郭锦铭;李剑;孙袖山-.基于频谱位移模块的环境声音识别方法)[J].电子测量技术,2022(05):62-67
A类:
频谱位移,环境声音识别,移位取代,ESC10,ESC50
B类:
卷积操作,频谱信息,密集卷积神经网络,支路,下采样,中信,频谱特征,特征图,神经网络方法,时频信息,识别准确率,密集神经网络
AB值:
0.171341
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。