基于ResNet的音频场景声替换造假的检测算法|董明宇;严迪群|东南数字经济发展研究院,浙江衢州324000 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于ResNet的音频场景声替换造假的检测算法

文献摘要：

针对造假成本低、不易察觉的音频场景声替换的造假样本检测问题,提出了基于ResNet的造假样本检测算法.该算法首先提取音频的常数Q频谱系数(CQCC)特征,之后由残差网络(ResNet)结构学习输入的特征,结合网络的多层的残差块以及特征归一化,最后输出分类结果.在TIMIT和Voicebank数据库上,所提算法的检测准确率最高可达100％,错误接收率最低仅为1.37％.在现实场景下检测由多种不同录音设备录制的带有设备本底噪声以及原始场景声音频,该算法的检测准确率最高可达99.27％.实验结果表明,在合适的模型下利用音频的CQCC特征来检测音频的场景替换痕迹是有效的.

文献关键词：

音频造假;音频场景声替换;残差网络;常数Q频谱系数

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

董明宇;严迪群

作者机构：

宁波大学信息科学与工程学院,浙江宁波315211;东南数字经济发展研究院,浙江衢州324000

文献出处：

计算机应用

引用格式：

[1]董明宇;严迪群-.基于ResNet的音频场景声替换造假的检测算法)[J].计算机应用,2022(06):1724-1728

A类：

音频场景声替换,CQCC,Voicebank,音频造假

B类：

ResNet,检测算法,察觉,检测问题,残差网络,结构学习,残差块,特征归一化,TIMIT,检测准确率,现实场景,多种不同,录音,录制,本底,下利,测音,痕迹

AB值：

0.281241

相似文献

注意力监督策略下的自然场景文本检测算法

梁浩然;叶凌晨;梁荣华;陈龙;吴昊-浙江工业大学信息工程学院杭州 310023;杭州海康威视数字技术股份有限公司杭州 310051

融合注意力机制的深层次小目标检测算法

赵鹏飞;谢林柏;彭力-物联网技术应用教育部工程研究中心(江南大学物联网工程学院),江苏无锡 214122

基于残差网络和GRU的XSS攻击检测方法

林雍博;凌捷-广东工业大学计算机学院,广州 510006

基于多尺度感受野融合的小目标检测算法

李成豪;张静;胡莉;肖贤鹏;张华-西南科技大学信息工程学院,四川绵阳 621010;中国科学技术大学信息科学技术学院,合肥 230026

基于层级集成的个性化空间音频技术

卢金燕;戚肖克-河南工程学院电气信息工程学院,郑州451191;中国政法大学法治信息管理学院,北京 102249

考虑结构与行为特征的水军群组检测算法

张琪;纪淑娟;张文鹏;曹宁;李宁-山东科技大学山东省智慧矿山信息技术重点实验室,山东青岛266590

一种基于时不变稳定性和夏普比率的模型泛化能力优化方法

邓洪武;邢凯;王志勇;李亚鸣;胡璇-中国科学技术大学计算机科学与技术学院,合肥230027;中国科学技术大学苏州高等研究院,江苏苏州215123

融合随机擦除和通道注意力的行人重识别方法

闫昊雷;李小春;张仁飞;邱浪波-空军工程大学信息与导航学院,西安7100772;武警陕西省总队,西安710054;陕西省信息化工程研究院,西安710061

基于改进YOLOv5的多任务安全人头检测算法

毛雨晴;赵奎-四川大学网络空间安全学院,成都610065

基于改进残差网络的交通标志识别算法

梁正友;耿经邦;孙宇-广西大学计算机与电子信息学院,广西南宁 530004

基于音视一致性的音视人眼关注点检测

袁梦;于小雨-青岛大学计算机科学技术学院,山东青岛 266071

基于轻量级结构重参数化网络的口罩检测算法

李燕;卢峥松;李青云;杨世海;张小龙-南京信息工程大学自动化学院,江苏南京 210044;无锡学院物联网工程学院,江苏无锡 214105;中国科学院天文光学技术重点实验室,江苏南京 210042

基于卷积痕迹挖掘的GAN生成假脸图片检测

罗正军;张丽丽-南京航空航天大学经济与管理学院,江苏南京 211106

基于改进的ResNet网络的人脸表情识别

周婕;马明栋-南京邮电大学通信与信息工程学院,江苏南京 210003;南京邮电大学地理与生物信息学院,江苏南京 210003

结合注意机制和多尺度卷积的YOLO行人检测

孙家慧;葛华勇;张哲浩-东华大学信息科学与技术学院,上海201620

融合阈值分割和注意力网络的建筑阴影检测

孟慧;陶为翔;吕俊杰-淄博市公用事业服务中心,淄博255090;正元地理信息集团股份有限公司,北京101300

一种基于三维残差网络分组膨胀卷积的人体行为识别方法

王志强-上海海事大学信息工程学院,上海 201306

基于最短欧氏距离替换码元的VoIP隐写算法

孙鑫昊;王开西-青岛大学计算机科学技术学院,山东青岛 266071

基于多尺度联合权重分配的目标检测算法

崔静雯;马杰;张宇-河北工业大学电子信息工程学院,天津 300401

改进RetinaNet的轻量化工件检测算法研究

梅菠萍;赵皓;阳珊;李林静;张静;张华-西南科技大学信息工程学院,四川绵阳 621010;中国科学技术大学信息科学技术学院,合肥 230026

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。