典型文献
基于ResNeSt网络的音频欺骗检测
文献摘要:
目前最先进的语音合成和语音转换模型能够生成人耳无法区分的虚假语音,这对自动说话人验证(ASV)系统的安全构成巨大威胁.近年来,越来越多抗欺骗对策用于提高ASV系统的可靠性.然而,在实际使用中,在检测未知攻击时遇到困难,特别是,合成语音欺骗算法的快速发展正在产生越来越强大的未知攻击.在这项工作中,由于ResNeSt网络模型在图像分类和检测任务中取得较好的成绩,因此构建了残差卷积神经网络的变体ResNeSt,使用时域二维特征转换、频域特征等各种特征提取方法(MFCC、LFCC、CQCC)来检测未知的合成语音欺骗攻击.实验结果表明,ResNeSt系统在ASV的逻辑评估集上达到了6.04%的等错误率(EER),相比ASVspoof2019的基线模型提高了25%的性能.
文献关键词:
自动说话人验证;ResNeSt模型;语音合成;语音转换;倒谱系数;EER;神经网络
中图分类号:
作者姓名:
何信;胡金瑶;艾斯卡尔·艾木都拉;米吉提·阿不里米提
作者机构:
新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046
文献出处:
引用格式:
[1]何信;胡金瑶;艾斯卡尔·艾木都拉;米吉提·阿不里米提-.基于ResNeSt网络的音频欺骗检测)[J].现代电子技术,2022(23):88-92
A类:
自动说话人验证,欺骗对策,CQCC
B类:
ResNeSt,音频,欺骗检测,最先,语音合成,语音转换,转换模型,人耳,大威,多抗,抗欺骗,未知攻击,时遇,遇到困难,合成语音,图像分类,残差卷积神经网络,变体,维特,特征转换,频域特征,MFCC,LFCC,欺骗攻击,上达,等错误率,EER,ASVspoof2019,基线模型,倒谱系数
AB值:
0.370092
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。