典型文献
基于角裕度损失的说话人识别研究
文献摘要:
针对传统身份认证矢量与概率线性判别分析结合的声纹识别模型步骤烦琐、泛化能力较弱等问题,基于自建的普通话唱红歌语音库,设计三个针对文本无关的闭集声纹识别模型,分别为Res-SD、Res-SA和Rep-SA模型.Res-SD模型采用传统的交叉熵损失函数完成训练,Rs-SA和Rep-SA模型采用可以在特征表达的角度空间中最大化分类界限的附加角裕度损失函数完成训练.实验结果验证了所提出的三个模型针对文本无关的闭集识别任务是有效的.在参数量和准确性方面,Rep-SA模型更适合在红歌数据库上学习到具有类别区分性的唱歌者特征.
文献关键词:
声纹识别;闭集;Res-SD;Res-SA;Rep-SA
中图分类号:
作者姓名:
孟飞宇
作者机构:
中国刑事警察学院,辽宁 沈阳 110854
文献出处:
引用格式:
[1]孟飞宇-.基于角裕度损失的说话人识别研究)[J].电声技术,2022(10):17-19
A类:
B类:
裕度,说话人识别,身份认证,线性判别分析,声纹识别,识别模型,烦琐,泛化能力,普通话,唱红,红歌,本无,Res,SA,Rep,交叉熵损失函数,数完,Rs,特征表达,度空间,闭集识别,参数量,别区,区分性,唱歌,歌者
AB值:
0.359396
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。