典型文献
神经网络的声场景自动分类方法
文献摘要:
声场景探察和自动分类能帮助人类制定应对特定环境的正确策略,具有重要的研究价值.随着卷积神经网络的发展,出现了许多基于卷积神经网络的声场景分类方法.其中时频卷积神经网络(TS-CNN)采用了时频注意力模块,是目前声场景分类效果最好的网络之一.为了在保持网络复杂度不变的前提下进一步提高网络的声场景分类性能,该文提出了一种基于协同学习的时频卷积神经网络模型(TSCNN-CL).具体地说,该文首先建立了基于同构结构的辅助分支参与网络的训练.其次,提出了一种基于KL散度的协同损失函数,实现了分支与主干的知识协同,最后,在测试过程中,为了不增加推理计算量,该文提出的模型只使用主干网络预测结果.在ESC-10、ESC-50和UrbanSound8k数据集的综合实验表明,该模型分类效果要优于TS-CNN模型以及当前大部分的主流方法.
文献关键词:
声场景分类;时频卷积神经网络;协同学习;声信号处理
中图分类号:
作者姓名:
梁腾;姜文宗;王立;刘宝弟;王延江
作者机构:
中国石油大学(华东)海洋与空间信息学院 青岛 266580;中国石油大学(华东)控制科学与工程学院 青岛 266580
文献出处:
引用格式:
[1]梁腾;姜文宗;王立;刘宝弟;王延江-.神经网络的声场景自动分类方法)[J].应用声学,2022(03):373-380
A类:
时频卷积神经网络,TSCNN,UrbanSound8k
B类:
自动分类方法,探察,助人,声场景分类,中时,注意力模块,分类效果,分类性能,协同学习,卷积神经网络模型,CL,具体地说,KL,散度,损失函数,知识协同,试过,计算量,主干网络,ESC,综合实验,模型分类,主流方法,声信号处理
AB值:
0.245208
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。