首站-论文投稿智能助手
典型文献
基于ResNet的音频场景声替换造假的检测算法
文献摘要:
针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法.该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果.在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100%,错误接收率最低仅为1.37%.在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27%.实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的.
文献关键词:
音频造假;音频场景声替换;残差网络;常数Q频谱系数
作者姓名:
董明宇;严迪群
作者机构:
宁波大学信息科学与工程学院,浙江宁波315211;东南数字经济发展研究院,浙江衢州324000
文献出处:
引用格式:
[1]董明宇;严迪群-.基于ResNet的音频场景声替换造假的检测算法)[J].计算机应用,2022(06):1724-1728
A类:
音频场景声替换,CQCC,Voicebank,音频造假
B类:
ResNet,检测算法,察觉,检测问题,残差网络,结构学习,残差块,特征归一化,TIMIT,检测准确率,现实场景,多种不同,录音,录制,本底,下利,测音,痕迹
AB值:
0.281241
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。