首站-论文投稿智能助手
典型文献
融合CNN和Transformer编码器的变声语音鉴别与还原
文献摘要:
语音变声伪装会导致人耳感知和声纹识别出现错误,从而达到隐匿说话人真实身份的目的 .为削弱变声语音的影响,提出一种融合卷积神经网络(Convolutional Neural Networks,CNN)和Transformer编码器的模型,提取变声语音的局部特征和全局特征用于判别变声因子,并根据变声因子的数值实施变声语音还原.在中英文真实场景录音数据集上验证了所提方法的有效性,对变声因子判别实现了95%以上的准确率.利用所提出的方法,在黑箱条件下对某型商用硬件变声器输出的语音进行鉴别与还原,取得了较好的效果.
文献关键词:
基频变声;语音鉴伪;变声还原;时频特征
作者姓名:
魏春雨;孙蒙;刘伟;张星昱
作者机构:
陆军工程大学指挥控制工程学院,江苏南京210007
引用格式:
[1]魏春雨;孙蒙;刘伟;张星昱-.融合CNN和Transformer编码器的变声语音鉴别与还原)[J].网络安全与数据治理,2022(01):47-54
A类:
变声语音,人耳感知,基频变声,变声还原
B类:
Transformer,编码器,音变,伪装,和声,声纹识别,隐匿,说话,真实身份,融合卷积神经网络,Convolutional,Neural,Networks,局部特征,全局特征,征用,实施变,中英文,真实场景,录音,黑箱,商用,变声器,语音鉴伪,时频特征
AB值:
0.325558
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。