典型文献
基于图注意力和单中心损失的语音鉴伪
文献摘要:
随着基于深度学习的语音合成技术的不断发展,语音鉴伪面临着巨大的挑战,为了应对多变的新兴合成技术,提高模型鉴别泛化性,设计了基于图注意力网络和单中心损失的语音鉴伪方案.该方案从音频前端处理、音频特征提取、损失函数选择、数据增强等方面进行提升,选用端到端的音频特征提取方式,经过数据增强后,基于图注意力的骨干网络,分别得到音频的频域图和时域图特征,两者融合后得到融合特征,最后结合单中心损失和二分类交叉熵损失,让网络具有更强的鉴别能力.在ASVspoof2019数据集上,对所提方案进行了实验,实验结果表明,所提方案的鉴别效果较好.
文献关键词:
音频鉴伪;单中心损失;图注意力;数据增强
中图分类号:
作者姓名:
沈宜;杨捍;石珺;贾宇
作者机构:
深圳市网联安瑞网络科技有限公司,广东 深圳 518042
文献出处:
引用格式:
[1]沈宜;杨捍;石珺;贾宇-.基于图注意力和单中心损失的语音鉴伪)[J].通信技术,2022(07):943-949
A类:
单中心损失,音频鉴伪
B类:
语音鉴伪,语音合成技术,泛化性,图注意力网络,前端处理,音频特征,损失函数,数据增强,端到端,提取方式,骨干网络,频域,融合特征,二分类交叉熵,交叉熵损失,鉴别能力,ASVspoof2019
AB值:
0.258838
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。