多语言语音识别声学模型建模方法最新进展|程高峰;颜永红|中国科学院大学电子电气与通信工程学院北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

多语言语音识别声学模型建模方法最新进展

文献摘要：

随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多.语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈.文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难.并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果.最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术.

文献关键词：

多语言;语音识别;声学模型

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 语言、文字（H） / 语言学（H0） / 语言规划（H002）

[3] 无线电电子学、电信技术（TN） / 通信（TN91） / 电声技术和语音信号处理（TN912） / 语音信号处理（TN912.3）

作者姓名：

程高峰;颜永红

作者机构：

中国科学院声学研究所北京 100190;中国科学院大学电子电气与通信工程学院北京 100049

文献出处：

计算机科学

引用格式：

[1]程高峰;颜永红-.多语言语音识别声学模型建模方法最新进展)[J].计算机科学,2022(01):47-52

A类：

多语言跨越,帧级别对齐

B类：

声学模型,最新进展,多媒体信息,信息和通信技术,语音数据,语音分析,分析与处理,文和,多资源,语言处理,处理能力,低资源语言,前识,中试,语音识别技术,单语,越过,能面,端到端语音识别,关键词检索,检索系统,系统构建,整体效果,最新研究进展,基于模型,参数共享,言声,声学建模,语种,分类信息,检索技术

AB值：

0.344345

相似文献

基于残差的门控循环单元

张忠豪;董方敏;胡枫;吴义熔;孙水发-三峡大学计算机与信息学院宜昌443002;智慧医疗宜昌市重点实验室宜昌443002

深度神经网络FPGA设计进展、实现与展望

焦李成;孙其功;杨育婷;冯雨歆;李秀芳-西安电子科技大学智能感知与图像理解教育部重点实验室西安 710071

深度生成模型综述

胡铭菲;左信;刘建伟-中国石油大学(北京)自动化系北京102249

基于多语BERT的无监督攻击性言论检测

师夏阳;张风远;袁嘉琪;黄敏-郑州轻工业大学软件学院,郑州 450001;郑州轻工业大学数学与信息科学学院,郑州 450001

自然语言语法纠错的最新进展和挑战