静音掩蔽和频域分段的音频指纹检索算法|陈树丽;张学帅;张鹏远;刘建|中国科学院大学北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

静音掩蔽和频域分段的音频指纹检索算法

文献摘要：

为解决背景音及噪音等条件下音频检索识别率低的问题,提出静音掩蔽和频域分段的音频指纹检索算法.首先采用端点检测技术进行语音预处理,将有效语音帧重新组合并利用相邻子带能量差对其提取指纹特征,可有效解决静音帧指纹特征不鲁棒的问题.然后在检索匹配时根据不同音频信号在频域范围内的分布特点,对音频指纹在不同频率区间进行分段和加权,以更精确地计算模板和待检音频之间的相似度.实验表明,与Philips基线算法相比,所提算法在检索速度上提升了一倍,在受背景音等干扰的数据集上,平均准确率与召回率分别绝对提升17.94％和4.66％;与最新Philips算法相比,平均准确率与召回率分别绝对提升13.68％和2.45％.

文献关键词：

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 医药、卫生（R） / 中国医学（R2） / 中药学（R28） / 中药化学（R284） / 化学分析与鉴定（R284.1）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

作者姓名：

陈树丽;张学帅;张鹏远;刘建

作者机构：

中国科学院声学研究所语言声学与内容理解重点实验室北京 100190;中国科学院大学北京 100049

文献出处：

引用格式：

[1]陈树丽;张学帅;张鹏远;刘建-.静音掩蔽和频域分段的音频指纹检索算法)[J].声学学报,2022(04):531-540

A类：

B类：

静音,掩蔽,频域,检索算法,噪音,识别率,端点检测,重新组合,指纹特征,同音,音频信号,对音,不同频率,频率区间,Philips,基线算法,一倍,平均准确率,召回率

AB值：

0.343345

相似文献

时频分析法在锅炉承压管线泄漏检测中的应用研究

艾学忠;袁天奇;闫敏;杨叶礼;陈思宇-吉林化工学院信息与控制工程学院,吉林吉林132000;东北电院开元科技有限公司,吉林吉林132000

基于骨导麦克风数据的咀嚼发音类型自动识别与分类方法

更太加;张新意;魏建国-青海民族大学人工智能应用技术国家民委重点实验室,青海西宁810007;天津大学智能与计算学部,天津300350

一种基于语音图信号处理的端点检测方法

郭振超;杨震;葛子瑞;郭海燕;王婷婷-南京邮电大学通信与信息工程学院,江苏南京210003;南京邮电大学通信与网络技术国家地方联合工程研究中心,江苏南京210003

基于改进YOLOv5的复杂场景下SAR图像船舶检测方法

李男;叶晓东;王昊;黄鑫宇;陶诗飞-南京理工大学电子工程与光电技术学院,江苏南京210094

基于指纹匹配的无蜂窝大规模MIMO三维定位方法

贾若;许魁;夏晓晨;谢威;臧国珍;郭明喜-解放军陆军工程大学,江苏南京210007

机载CNI系统外场原位性能检测技术

童大鹏;周靖宇;黄泽贵-中国西南电子技术研究所,成都 610036;中国人民解放军93147部队,成都 610036

基于卷积神经网络的通信辐射源个体识别

陈旗;郑瑞华-海军工程大学,武汉430033

在变换域中实现的能量自适应音频隐藏算法

杨青林;高勇-四川大学,四川成都 610065

基于短时傅里叶变换的无人机射频指纹分类识别

李超群;王金明-中国人民解放军陆军工程大学,江苏南京 210007

通信辐射源个体识别中的特征提取方法综述

韦建宇;俞璐-中国人民解放军陆军工程大学,江苏南京 210007

基于图注意力和单中心损失的语音鉴伪

沈宜;杨捍;石珺;贾宇-深圳市网联安瑞网络科技有限公司,广东深圳 518042

基于改进胶囊网络的音调篡改检测算法

杜海云;王宏霞-四川大学,四川成都 610207

基于全局注意力机制的CNN-LSTM说话人识别研究

楚宪腾;杨海涛;闫道申;许铭洋;王华朋-中国刑事警察学院公安信息与情报学院,辽宁沈阳 110854

调频广播机房报警系统

王书刚-山东广播电视台,山东济南 250062

奥运手球公共音频信号转播制作探讨

张辛宬-广东广播电视台,广东广州 510066

基于MFCC均值特征的电台语言类节目相似度比对算法研究

聂晨淅-中央广播电视总台,北京 100866

基于CNN+LSTM的藏语语音去噪算法

王君堡;王希;边巴旺堆-西藏大学信息科学技术学院,西藏拉萨 850000;西藏大学信息技术国家级实验教学示范中心,西藏拉萨 850000

相控阵扬声器系统的设计与测试

纪璐;温今凡;温怀疆-浙江传媒学院媒体工程学院,浙江杭州 310018;兰州交通大学机电工程学院 ,甘肃兰州 730070

卷积技术在虚拟乐器中的应用

康健-北京博声音元科技有限公司,北京 100176

南京森林音乐会音频转播设计方案

杨倩-南京广播电视集团,江苏南京 210001

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。