典型文献
融合LSTM‑GRU网络的语音逻辑访问攻击检测
文献摘要:
为进一步提高语音欺骗检测的准确率,提出一种融合LSTM?GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法.融合LSTM?GRU网络是由长短期记忆网络(Long short?term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层、丢弃层、批归一化层和全连接层串联结合的一种混合网络,其中LSTM层可以解决语音序列中的长时依赖问题,GRU层则可降低模型参数量.实验在ASVspoof2019 LA数据集上进行,提取20维的梅尔倒谱系数特征用于模型训练,在测试阶段使用训练好的LSTM?GRU模型对测试集中的语音进行欺骗检测.与GRU网络及LSTM网络的比较结果表明:LSTM?GRU网络在3种网络模型中正确识别率最高,等错误率(Equal error rate,EER)比ASVspoof2019挑战赛所提供基线系统低27.07%,对逻辑访问攻击语音检测的平均准确率达到98.04%,并且融合LSTM?GRU网络具备训练时间短、防止过拟合及稳定性高等优点.结果证明本文方法可有效应用于语音逻辑访问攻击检测任务中.
文献关键词:
逻辑访问攻击;梅尔倒谱系数;等错误率;LSTM-GRU网络
中图分类号:
作者姓名:
杨海涛;王华朋;牛瑾琳;楚宪腾;林暖辉
作者机构:
中国刑事警察学院公安信息技术与情报学院,沈阳 110854;广州市刑事科学技术研究所,广州 510030
文献出处:
引用格式:
[1]杨海涛;王华朋;牛瑾琳;楚宪腾;林暖辉-.融合LSTM‑GRU网络的语音逻辑访问攻击检测)[J].数据采集与处理,2022(02):396-404
A类:
逻辑访问攻击
B类:
GRU,攻击检测,欺骗检测,语音转换,语音合成,长短期记忆网络,Long,short,term,memory,门控,Gated,recurrent,unit,丢弃,批归一化层,全连接层,混合网络,音序,模型参数量,ASVspoof2019,LA,梅尔倒谱系数特征,征用,模型训练,测试阶段,练好,测试集,中正,识别率,等错误率,Equal,error,rate,EER,挑战赛,语音检测,平均准确率,训练时间,过拟合,有效应用
AB值:
0.380125
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。