基于wav2vec预训练的样例关键词识别|李昭奇;黎塔|中国科学院大学北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于wav2vec预训练的样例关键词识别

文献摘要：

样例关键词识别是将语音关键词片段与语音流中的片段匹配的任务.在低资源或零资源的情况下,样例关键词识别通常采用基于动态时间规正的方法.近年来,神经网络声学词嵌入已成为一种常用的样例关键词识别方法,但神经网络的方法受限于标注数据数量.使用wav2 vec预训练可以减少神经网络对数据量的依赖,提升系统的性能.使用wav2 vec模型提取的预训练特征直接替换梅尔频率倒谱系数特征后,在SwitchBoard语料库中提取的数据集上使双向长短时记忆网络的神经网络声学词嵌入系统的平均准确率提高了11.1％,等精度召回值提高了10.0％.将wav2 vec特征与梅尔频率倒谱系数特征相融合以提取嵌入向量的方法进一步提高了系统的性能,与仅使用wav2 vec的方法相比,融合方法的平均准确率提高了5.3％,等精度召回值提高了2.5％.

文献关键词：

声学词嵌入;孤立词识别;wav2 vec预训练;样例查询;语音片段查询

中图分类号：

[1] 医药、卫生（R） / 临床医学（R4） / 康复医学（R49） / 医学康复（康复疗法）（R493）

[2] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

作者姓名：

李昭奇;黎塔

作者机构：

中国科学院声学研究所语言声学与内容理解重点实验室北京 100190;中国科学院大学北京 100049

文献出处：

计算机科学

引用格式：

[1]李昭奇;黎塔-.基于wav2vec预训练的样例关键词识别)[J].计算机科学,2022(01):59-64

A类：

wav2vec,声学词嵌入,wav2,SwitchBoard,样例查询,语音片段查询

B类：

预训练,关键词识别,语音关键词,低资源,规正,受限于,数据量,提升系统,训练特征,接替,梅尔频率倒谱系数,语料库,双向长短时记忆网络,嵌入系统,平均准确率,等精度,召回,嵌入向量,融合方法,孤立词识别

AB值：

0.209536

相似文献

噪音过滤和深度学习相结合的安全缺陷报告识别

蒋远;牟辰光;苏小红;王甜甜-哈尔滨工业大学计算学部哈尔滨 150001

OMRDetector:一种基于深度学习的混淆恶意请求检测方法

杨秀璋;彭国军;罗元;宋文纳;张杰;操方涛-武汉大学空天信息安全与可信计算教育部重点实验室武汉 430072;武汉大学国家网络安全学院武汉 430072

基于时间卷积注意力神经网络的序列推荐模型

杜永萍;牛晋宇;王陆霖;闫瑞-北京工业大学信息学部北京100124;中国科学院计算技术研究所计算机体系结构国家重点实验室北京100086

结合注意力与循环神经网络的专家推荐算法

吕晓琦;纪科;陈贞翔;孙润元;马坤;邬俊;李浥东-济南大学信息科学与工程学院,济南 250022;济南大学山东省网络环境智能计算技术重点实验室,济南 250022;北京交通大学计算机与信息技术学院,北京 100044

基于BERT的初等数学文本命名实体识别方法

张毅;王爽胜;何彬;叶培明;李克强-重庆邮电大学通信与信息工程学院,重庆400065

基于神经网络的复杂垃圾信息过滤算法分析

张建;严珂;马祥-中国计量大学信息工程学院,杭州310018

融合多语义特征的命名实体识别方法

左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤-广东工业大学计算机学院,广州510006

基于注意力机制的双BERT有向情感文本分类研究

张铭泉;周辉;曹锦纲-华北电力大学控制与计算机工程学院,河北保定071003;华北电力大学复杂能源系统智能计算教育部工程研究中心,河北保定071003

融合高低层语义信息的自然语言句子匹配方法

姜克鑫;赵亚慧;崔荣一-延边大学智能信息处理研究室,吉林延吉 133002

基于迁移学习的小样本恶意域名检测

赵凡;赵宏;常兆斌-甘肃省科学技术情报研究所创新平台中心,甘肃兰州 730000;兰州理工大学计算机与通信学院,甘肃兰州 730050

融合文本特征的老挝语文字识别方法研究

杨志婥琪;周兰江;周蕾越-昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学津桥学院电子与信息工程学院,昆明650106

一种服饰风格特征指导下的服装搭配学习模型

刘锐;彭敦陆-上海理工大学光电信息与计算机工程学院,上海200093

基于图注意力网络的方面级别文本情感分析

施荣华;金鑫;胡超-中南大学计算机学院,长沙 410083;中南大学大数据研究院,长沙 410083

基于异构并行神经网络的语音情感识别

张会云;黄鹤鸣-青海师范大学计算机学院,西宁 810008;藏语智能信息处理及应用国家重点实验室,西宁 810008

基于ALBERT-BGRU-CRF的中文命名实体识别方法

李军怀;陈苗苗;王怀军;崔颖安;张爱华-西安理工大学计算机科学与工程学院,西安 710048;中铝萨帕特种铝材(重庆)有限公司,重庆 401326

基于CNN-BiLSTM模型的日志异常检测方法

孙嘉;张建辉;卜佑军;陈博;胡楠;王方玉-郑州大学中原网络安全研究院,郑州450001;中国人民解放军战略支援部队信息工程大学,郑州450001

结合残差BiLSTM与句袋注意力的远程监督关系抽取

江旭;钱雪忠;宋威-江南大学人工智能与计算机学院,江苏无锡 214112

基于非线性堆叠双向网络的端到端声纹识别

王芷悦;崔琳-西安工程大学电子信息学院,陕西西安 710699;西北工业大学航海学院,陕西西安 710072

基于层次化表示的电力文本命名实体识别和匹配算法

杨政;蔡迪;李慧斌-云南电网有限责任公司电力科学研究院,云南昆明 650217;西安交通大学数学与统计学院,陕西西安 710049

基于BERT和混合神经网络的诈骗电话文本识别

许鸿奎;周俊杰;姜彤彤;卢江坤;张子枫;胡文烨-山东建筑大学信息与电气工程学院,山东济南 250101;山东省智能建筑技术重点实验室,山东济南 250101

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。