神经网络的声场景自动分类方法|梁腾;姜文宗;王立;刘宝弟;王延江|中国石油大学(华东)控制科学与工程学院青岛 266580 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

神经网络的声场景自动分类方法

文献摘要：

声场景探察和自动分类能帮助人类制定应对特定环境的正确策略,具有重要的研究价值.随着卷积神经网络的发展,出现了许多基于卷积神经网络的声场景分类方法.其中时频卷积神经网络(TS-CNN)采用了时频注意力模块,是目前声场景分类效果最好的网络之一.为了在保持网络复杂度不变的前提下进一步提高网络的声场景分类性能,该文提出了一种基于协同学习的时频卷积神经网络模型(TSCNN-CL).具体地说,该文首先建立了基于同构结构的辅助分支参与网络的训练.其次,提出了一种基于KL散度的协同损失函数,实现了分支与主干的知识协同,最后,在测试过程中,为了不增加推理计算量,该文提出的模型只使用主干网络预测结果.在ESC-10、ESC-50和UrbanSound8k数据集的综合实验表明,该模型分类效果要优于TS-CNN模型以及当前大部分的主流方法.

文献关键词：

声场景分类;时频卷积神经网络;协同学习;声信号处理

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化技术及设备（TP2） / 自动化系统（TP27） / 自动控制、自动控制系统（TP273）

作者姓名：

梁腾;姜文宗;王立;刘宝弟;王延江

作者机构：

中国石油大学(华东)海洋与空间信息学院青岛 266580;中国石油大学(华东)控制科学与工程学院青岛 266580

文献出处：

引用格式：

[1]梁腾;姜文宗;王立;刘宝弟;王延江-.神经网络的声场景自动分类方法)[J].应用声学,2022(03):373-380

A类：

时频卷积神经网络,TSCNN,UrbanSound8k

B类：

自动分类方法,探察,助人,声场景分类,中时,注意力模块,分类效果,分类性能,协同学习,卷积神经网络模型,CL,具体地说,KL,散度,损失函数,知识协同,试过,计算量,主干网络,ESC,综合实验,模型分类,主流方法,声信号处理

AB值：

0.245208

相似文献

P-Net框架下的小样本雷达信号识别算法

徐帅;刘鲁涛-哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001

基于迁移学习的小样本垂直阵目标距离估计方法

姚琦海;汪勇;杨益新-西北工业大学航海学院,陕西西安710072;陕西省水下信息技术重点实验室,陕西西安710072

基于深度学习的双耳声源定位算法研究

宋昊;刘雪洁;俞胜锋;钟小丽-广东工业大学管理学院,广东广州510000;华南师范大学物理与电信工程学院,广东广州510006;华南理工大学物理与光电学院,广东广州510640

嵌入注意力机制的卷积神经网络水声目标识别

张钇;熊水东;马燕新;姚琼;王付印;郭微;朱家华-国防科技大学前沿交叉学科学院,湖南长沙 410073;海洋探测技术湖南省重点实验室,湖南长沙 410073;国防科技大学气象海洋学院,湖南长沙 410073

用于声音分类的Deep LightGBM算法

李行健;汤心溢;张瑞-中国科学院上海技术物理研究所红外探测与成像技术重点实验室,上海 200083;上海科技大学信息科学与技术学院,上海 200120;中国科学院大学,北京 100049

基于一维卷积神经网络的自动扶梯机械故障分类研究

梁敏健;彭晓军;刘德阳-广东省特种设备检测研究院珠海检测院,广东珠海 519002

基于ResNet50和通道注意力机制的行人多属性协同识别方法

卓力;袁帅;李嘉锋-北京工业大学信息学部,北京 100124;北京工业大学计算智能与智能系统北京市重点实验室,北京 100124

针对轻量化网络的安全帽检测方法

刘泽西;张楠;连婷;马骏;赵勇;倪威-国网新疆电力有限公司巴州供电公司,新疆库尔勒 841000;华北电力大学电气与电子工程学院,北京 102206

基于信息融合与CNN的齿轮箱故障诊断方法

赵晓平;魏旭全;孙中波;王荣发-南京信息工程大学计算机与软件学院,江苏南京 210044;南京信息工程大学数字取证教育部工程研究中心,江苏南京 210044

基于经验模态-小波包分解和卷积神经网络的P300脑电信号分类研究

崔丽丽;郑赟;孟小飞;马玉良-杭州电子科技大学采购中心,浙江杭州310018;杭州电子科技大学自动化学院,浙江杭州310018

基于深度学习的眼底视网膜图像疾病分类研究

李果璟;夏秋婷;李宏-杭州电子科技大学自动化(人工智能)学院,浙江杭州310018

融合LSTM和注意力机制的新闻文本分类模型

孙刘成;黄润才-上海工程技术大学电子电气工程学院,上海201620

基于深度学习的烧结断面识别分类研究

阮志国;周敏;文喆皓;高强-武汉科技大学冶金装备及其控制教育部重点实验室,湖北武汉430081;武汉科技大学机械传动与制造工程湖北省重点实验室,湖北武汉430081

基于浅层Inception-MobileNet旋转机械故障诊断

孙国栋;杨雄;黄得龙;高媛-湖北工业大学机械工程学院,武汉 430068;湖北省包装装备工程技术研究中心,武汉 430068

基于全局注意力机制的CNN-LSTM说话人识别研究

楚宪腾;杨海涛;闫道申;许铭洋;王华朋-中国刑事警察学院公安信息与情报学院,辽宁沈阳 110854

基于深度学习的常规调制信号与跳频调制信号识别

刘聪;韩东;李宁;张埂铭-海军大连舰艇学院学员五大队,辽宁大连 116018;海军大连舰艇学院信息系统系,辽宁大连 116018

一种基于MFCC特征的水下目标分类网络

徐晓刚;罗昕炜-东南大学水声信号处理教育部重点实验室,南京,210096

无人机图像风力发电机轮毂中心检测与跟踪

范玉莹;何赟泽;孙高森;王洪金;刘昊;李杰-湖南大学,湖南长沙 410082;中南勘测设计研究院有限公司,湖南长沙 410014

圈养瓶鼻海豚通讯信号分析及融合分类方法

张晓伟;张春华;薛山花;尹力-中国科学院声学研究所先进水下信息技术重点实验室北京 10019;中国科学院大学北京 100049

融合多尺度特征的短时音频场景识别方法

王猛;张鹏远-中国科学院声学研究所语言声学与内容理解重点实验室北京 100190;中国科学院大学北京 100049

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。