典型文献
基于对比预测编码模型的多任务学习语种识别方法
文献摘要:
语种识别的关键是从语音片段中提取有用的特征.通过延时神经网络(Time?delayed neural network,TDNN)可以提取包含丰富上下文信息的特征向量,有效提高系统性能.本文提出一种ECAPA(Emphasized channel attention)?TDNN+对比预测编码(Contrastive predictive coding,CPC)模型的多任务学习语种识别网络.ECAPA?TDNN为主干网络,提取语音全局特征,改进的CPC模型为辅助网络,对ECAPA?TDNN提取的帧级特征进行对比预测学习,通过联合损失函数进行优化训练.在东方语种竞赛数据集AP17?OLR的10类语种上进行了实验.实验结果表明,本文提出的网络在1 s,3 s和全长(All)测试集测得的识别准确率相比于基础网络都有明显的提高.
文献关键词:
语种识别;对比预测编码;多任务学习;ECAPA-TDNN;联合损失
中图分类号:
作者姓名:
赵建川;杨浩铨;徐勇;吴恋;崔忠伟
作者机构:
贵州师范学院数学与大数据学院,贵阳 550018;贵州师范学院大数据科学与智能工程研究院,贵阳 550018;哈尔滨工业大学(深圳)计算机科学与技术学院,深圳 518000
文献出处:
引用格式:
[1]赵建川;杨浩铨;徐勇;吴恋;崔忠伟-.基于对比预测编码模型的多任务学习语种识别方法)[J].数据采集与处理,2022(02):288-297
A类:
TDNN,ECAPA,Emphasized,TDNN+,AP17
B类:
对比预测编码,多任务学习,习语,语种识别,延时,Time,delayed,neural,network,上下文信息,特征向量,系统性能,channel,attention,Contrastive,predictive,coding,CPC,识别网络,主干网络,全局特征,预测学,联合损失函数,OLR,全长,All,测试集,识别准确率
AB值:
0.28323
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。