基于正样本对比与掩蔽重建的自监督语音表示学习|张文林;刘雪鹏;牛铜;陈琦;屈丹 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于正样本对比与掩蔽重建的自监督语音表示学习

文献摘要：

针对现有基于对比预测的自监督语音表示学习方法在训练时需要构建大量负样本,其学习效果依赖于大批次训练,需要耗费大量计算资源的问题,提出了一种仅使用正样本进行语音对比学习的方法,并将其与掩蔽重建任务相结合得到一种多任务自监督语音表示学习方法,在降低训练复杂度的同时提高语音表示学习的性能.其中,正样本对比学习任务,借鉴图像自监督表示学习中SimSiam方法的思想,采用孪生网络架构对原始语音信号进行两次数据增强,并使用相同的编码器进行处理,将一个分支经过一个前向网络,另一个分支使用梯度停止策略,调整模型参数以最大化2个分支输出的相似度.整个训练过程中不需要构造负样本,可采用小批次进行训练,大幅提高了学习效率.使用LibriSpeech语料库进行自监督表示学习,并在多种下游任务中进行微调测试,对比实验表明,所提方法得到的模型在多个任务中均达到或者超过了现有主流语音表示学习模型的性能.

文献关键词：

语音表示;自监督学习;无监督学习;孪生网络

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

作者姓名：

张文林;刘雪鹏;牛铜;陈琦;屈丹

作者机构：

信息工程大学信息系统工程学院,河南郑州 450001

文献出处：

引用格式：

[1]张文林;刘雪鹏;牛铜;陈琦;屈丹-.基于正样本对比与掩蔽重建的自监督语音表示学习)[J].通信学报,2022(07):163-171

A类：

掩蔽重建,SimSiam

B类：

语音表示,表示学习方法,耗费,计算资源,语音对比,对比学习,多任务,学习任务,孪生网络架构,语音信号,数据增强,编码器,支使,训练过程,学习效率,LibriSpeech,语料库,微调,调测,自监督学习,无监督学习

AB值：

0.239212

相似文献

基于无标签视频数据的深度预测学习方法综述

潘敏婷;王韫博;朱祥明;高思宇;龙明盛;杨小康-上海交通大学人工智能研究院、人工智能教育部重点实验室,上海201109;清华大学软件学院,北京100084

基于元路径的动态异质网络表示学习

刘群;谭洪胜;张优敏;王国胤-重庆邮电大学计算机科学与技术学院,重庆400065

基于双向准循环神经网络和注意力机制的业务流程剩余时间预测方法

徐兴荣;刘聪;李婷;郭娜;任崇广;曾庆田-山东理工大学计算机科学与技术学院,山东淄博255000;山东科技大学计算机科学与工程学院,山东青岛266590

基于自监督学习的去流行度偏差推荐方法

张帅;高旻;文俊浩;熊庆宇;唐旭-信息物理社会可信服务计算教育部重点实验室(重庆大学),重庆400044;重庆大学大数据与软件学院,重庆400044

一种面向动态科研网络的社区检测算法

蒲实;赵卫东-复旦大学软件学院上海200433;上海市数据科学重点实验室上海200433

基于自注意力的自监督深度聚类算法

韩洁;陈俊芬;李艳;湛泽聪-河北大学数学与信息科学学院河北省机器学习与计算智能重点实验室河北保定071002;北京师范大学珠海分校应用数学学院广东珠海 519087

基于无监督集群级的科技论文异质图节点表示学习方法

宋杰;梁美玉;薛哲;杜军平;寇菲菲-北京邮电大学计算机学院(国家示范性软件学院)智能通信软件与多媒体北京市重点实验室北京100876

基于异构网络表征学习的作者学术行为预测

黄丽;朱焱;李春平-西南交通大学计算机与人工智能学院成都611756;清华大学软件学院北京100091

时序知识图谱表示学习

徐涌鑫;赵俊峰;王亚沙;谢冰;杨恺-北京大学计算机学院北京100871;高可信软件技术教育部重点实验室北京100871;北京大学(天津滨海)新一代信息技术研究院天津300450

一种鲁棒的双教师自监督蒸馏哈希学习方法

苗壮;王亚鹏;李阳;王家宝;张睿;赵昕昕-陆军工程大学指挥控制工程学院南京210007

语义增强的完全不平衡标签网络表示学习算法

富坤;郭云朋;禚佳明;李佳宁;刘琪-河北工业大学人工智能与数据科学学院天津 300401;河北省大数据计算重点实验室天津 300401

基于时序信息对齐的连续手语跨模态知识蒸馏

肖正业;林世铨;万修安;方昱春;倪兰-上海大学计算机工程与科学学院上海 200444;上海大学文学院上海 200444

面向拓扑感知的层次结构信息可视探索方法

谭博友;韩永国;王桂娟;赵韦鑫;周锐;蔡梦杰;吴亚东-西南科技大学计算机科学与技术学院,四川绵阳 621000;四川轻化工大学计算科学与工程学院,四川自贡 643000

基于T2VNN模型的阀冷系统进阀温度预测

陈霖;周宇-南京航空航天大学计算机科学与技术学院, 南京 210016

基于深度哈希的文本表示学习

邹傲;郝文宁;田媛-陆军工程大学指挥控制工程学院, 南京 210007

结合向前状态预测和隐空间约束的强化学习表示算法

项宇;秦进;袁琳琳-贵州大学计算机科学与技术学院,贵阳550025;贵州开放大学信息工程学院,贵阳550023

少样本条件下基于自监督改进SimDet模型的消毒场景目标检测

蔡汝佳;江文萱;齐立哲;孙云权-复旦大学工程与应用技术研究院,上海200082

深度学习的10年回顾与展望

韩炳涛;刘涛;唐波-中兴通讯股份有限公司,中国深圳 518057;移动网络和移动多媒体技术国家重点实验室,中国深圳 518055

基于网络表示学习的机会网络链路预测

刘琳岚;宋修洋;陈宇斌-南昌航空大学信息工程学院, 南昌330063;南昌航空大学软件学院,南昌330063

基于非对称特征差异网络的图像超分辨率重建

王彩玲;沈齐-南京邮电大学自动化学院、人工智能学院,江苏南京 210023

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。