典型文献
基于深度残差网络的变换语音伪装检测
文献摘要:
语音变换(Voice Transformation,VT)是一种隐藏说话人的真实身份的常用操作,它能显著增加自动说话人识别(Automatic Speaker Verification,ASV)系统的错误拒绝率,从而达到防识别的目的.语音变换操作己集成在众多主流的音频/语音处理工具中,并在众多案例中作为犯罪手段,为社会安全带来严重威胁.因此,研究语音变换伪装的检测具有重要意义.但是,目前相关的研究相对不足.为此,本文提出一种基于深度残差网络的变换语音伪装检测方法.所提网络能自动提取语音数据的深层特征,且随着网络层数的增加不会出现梯度退化的现象.另外,本文针对变换操作为语音信号频谱引入的变化特征分布,设计特殊的卷积核和池化,更有利于网络提取特征信息.实验结果表明,本文所提的网络结构可以取得96%以上的精确度,优于目前已报道的研究结果.
文献关键词:
变换语音;防识别伪装;深度残差网络;安全;Deep Residual Net
中图分类号:
作者姓名:
王泳;张峻;陈艺芳;张梦鸽
作者机构:
广东技术师范大学 网络空间安全学院,广东 广州 510665
文献出处:
引用格式:
[1]王泳;张峻;陈艺芳;张梦鸽-.基于深度残差网络的变换语音伪装检测)[J].广东技术师范大学学报,2022(03):1-7
A类:
变换语音,防识别伪装
B类:
深度残差网络,音变,Voice,Transformation,VT,真实身份,说话人识别,Automatic,Speaker,Verification,ASV,拒绝率,音频,语音处理,多案例,社会安全,安全带,自动提取,语音数据,深层特征,网络层,层数,语音信号,信号频谱,特征分布,卷积核,池化,提取特征,特征信息,Deep,Residual,Net
AB值:
0.443797
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。