首站-论文投稿智能助手
典型文献
面向复杂声学环境的伪装语音检测
文献摘要:
随着技术更迭,最新语音合成和语音转换模型生成的伪装语音在感知上与真正语音无法区分,这严重威胁着公众的个人信息安全.现有的检测方法虽有可观进展,但仍存在检测声学环境单一、对未知欺骗攻击泛化能力差等问题.针对以上问题,提出了一种基于深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)的多特征联合语音欺骗检测方法,首先DRSN利用基于深度注意力机制的自适应阈值学习模块和软阈值模块提高了在复杂声学环境下的特征学习能力,再选取合适的声学特征构建单类特征-DRSN检测模型,最后执行多模型联合检测以实现互补,进一步提升整体性能.使用ASVspoof2019数据集的实验结果表明,相较于最佳基线系统,本方法在t-DCF和EER性能指标上分别降低47%和53%.
文献关键词:
伪装语音检测;欺骗对策;复杂声学环境;DRSN
作者姓名:
周晔;章坚武;程继承
作者机构:
杭州电子科技大学通信工程学院,浙江 杭州310018;浙江宇视科技有限公司,浙江 杭州310051
文献出处:
引用格式:
[1]周晔;章坚武;程继承-.面向复杂声学环境的伪装语音检测)[J].传感技术学报,2022(10):1355-1362
A类:
伪装语音检测,欺骗对策
B类:
复杂声学环境,更迭,新语,语音合成,语音转换,转换模型,模型生成,个人信息安全,虽有,欺骗攻击,泛化能力,深度残差收缩网络,Deep,Residual,Shrinkage,Networks,DRSN,多特征联合,合语,欺骗检测,注意力机制,自适应阈值,学习模块,软阈值,阈值模块,特征学习能力,再选,声学特征,特征构建,检测模型,多模型,联合检测,整体性能,ASVspoof2019,DCF,EER
AB值:
0.384714
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。