首站-论文投稿智能助手
典型文献
自监督聚类重训练的语音表示学习
文献摘要:
现有的基于重建的自监督预训练方法往往通过对语音帧的还原重建进行训练,未充分利用语音帧包含的音素信息.因此,文中结合自监督学习方法与噪声学生训练,提出基于自监督聚类重训练的语音表示学习方法.基于一个初始的语音表示模型(教师模型),利用无监督聚类得到音素类别伪标签.结合伪标签预测任务与重构任务,重新训练表示模型(学生模型).将学生模型作为新的教师模型,借助聚类与重训练,不断优化伪标签与语音表示模型.对比实验表明,经过聚类重训练后,语音表示模型在音素识别和说话人识别两项下游任务上均优于聚类重训练前的模型,性能较优.
文献关键词:
无监督学习;自监督学习;语音表示;预训练模型;掩蔽重建;噪声学生训练
作者姓名:
张文林;刘雪鹏;牛铜;杨绪魁;屈丹
作者机构:
中国人民解放军战略支援部队信息工程大学 信息系统工程学院 郑州450001
引用格式:
[1]张文林;刘雪鹏;牛铜;杨绪魁;屈丹-.自监督聚类重训练的语音表示学习)[J].模式识别与人工智能,2022(05):461-471
A类:
噪声学生训练,音素识别,掩蔽重建
B类:
语音表示,训练方法,自监督学习,表示学习方法,表示模型,无监督聚类,伪标签,新训,学生模型,说话人识别,项下,无监督学习,预训练模型
AB值:
0.181527
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。