首站-论文投稿智能助手
典型文献
基于注意力机制的端到端合成语音检测
文献摘要:
近年来深度伪造(Deepfake)技术的迅猛发展使合成语音的自然度和拟人度有了显著提升,对合成语音检测研究提出了更大挑战.本文将五种轻量级注意力模块中的机制改进为适用于语音序列的通道注意力机制和一维空间注意力机制,然后将模块分别嵌入到Inc-TSSDNet网络中,提出基于注意力机制的端到端合成语音检测系统.结果表明,改进系统能够重点关注某些对于检测真伪更关键的通道或区域来提高检测性能,相比于基线模型,引入注意力机制的十种模型在增加的参数量较少的情况下,ASVspoof2019测试集的等错误率(Equal Error Rate,EER)和最小串联检测代价函数(Minimum Tandem Detection Cost Function,min t-DCF)都有所降低,其中在池化层之前嵌入CBAM(Convolutional Block Attention Module)的模型测试集EER最低且具有较强的泛化性,在池化层之前嵌入ECA(Efficient Channel Attention)模块的模型测试集min t-DCF最低且统计性能较基线模型有显著提升.
文献关键词:
合成语音检测;端到端;通道注意力机制;一维空间注意力机制
作者姓名:
王锦阳;华光;黄双
作者机构:
武汉大学电子信息学院,湖北武汉430072;武汉第二船舶设计研究所,湖北武汉430064
文献出处:
引用格式:
[1]王锦阳;华光;黄双-.基于注意力机制的端到端合成语音检测)[J].信号处理,2022(09):1975-1987
A类:
端到端合成,一维空间注意力机制,TSSDNet
B类:
合成语音检测,深度伪造,Deepfake,自然度,拟人,轻量级注意力,注意力模块,机制改进,音序,通道注意力机制,Inc,改进系统,够重,真伪,高检,检测性能,基线模型,十种,参数量,ASVspoof2019,测试集,等错误率,Equal,Error,Rate,EER,小串,联检,代价函数,Minimum,Tandem,Detection,Cost,Function,DCF,池化,CBAM,Convolutional,Block,Attention,Module,模型测试,泛化性,ECA,Efficient,Channel
AB值:
0.38177
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。