典型文献
静音掩蔽和频域分段的音频指纹检索算法
文献摘要:
为解决背景音及噪音等条件下音频检索识别率低的问题,提出静音掩蔽和频域分段的音频指纹检索算法.首先采用端点检测技术进行语音预处理,将有效语音帧重新组合并利用相邻子带能量差对其提取指纹特征,可有效解决静音帧指纹特征不鲁棒的问题.然后在检索匹配时根据不同音频信号在频域范围内的分布特点,对音频指纹在不同频率区间进行分段和加权,以更精确地计算模板和待检音频之间的相似度.实验表明,与Philips基线算法相比,所提算法在检索速度上提升了一倍,在受背景音等干扰的数据集上,平均准确率与召回率分别绝对提升17.94%和4.66%;与最新Philips算法相比,平均准确率与召回率分别绝对提升13.68%和2.45%.
文献关键词:
中图分类号:
作者姓名:
陈树丽;张学帅;张鹏远;刘建
作者机构:
中国科学院声学研究所语言声学与内容理解重点实验室 北京 100190;中国科学院大学 北京 100049
文献出处:
引用格式:
[1]陈树丽;张学帅;张鹏远;刘建-.静音掩蔽和频域分段的音频指纹检索算法)[J].声学学报,2022(04):531-540
A类:
B类:
静音,掩蔽,频域,检索算法,噪音,识别率,端点检测,重新组合,指纹特征,同音,音频信号,对音,不同频率,频率区间,Philips,基线算法,一倍,平均准确率,召回率
AB值:
0.343345
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。