首站-论文投稿智能助手
典型文献
多语言语音识别声学模型建模方法最新进展
文献摘要:
随着多媒体信息和通信技术的快速发展,网络上的多语言语音数据日益增多.语音识别作为语音分析与处理的核心技术,如何快速地把中文和英文等少数多资源主要语言处理能力推广到更多的低资源语言,是当前识别技术迫切需要突破的瓶颈.文中试图总结声学模型建模领域的最新进展,探讨传统语音识别技术从单语言向多语言跨越过程中可能面临的困难.并在此基础之上,探索了最新的端到端语音识别技术在关键词检索系统构建上的作用,以进一步改善系统的整体效果.最后总结了如下最新研究进展:1)基于模型参数共享的多语言声学建模;2)基于语种分类信息的多语言声学建模;3)基于帧级别对齐的端到端关键词检索技术.
文献关键词:
多语言;语音识别;声学模型
作者姓名:
程高峰;颜永红
作者机构:
中国科学院声学研究所 北京 100190;中国科学院大学电子电气与通信工程学院 北京 100049
文献出处:
引用格式:
[1]程高峰;颜永红-.多语言语音识别声学模型建模方法最新进展)[J].计算机科学,2022(01):47-52
A类:
多语言跨越,帧级别对齐
B类:
声学模型,最新进展,多媒体信息,信息和通信技术,语音数据,语音分析,分析与处理,文和,多资源,语言处理,处理能力,低资源语言,前识,中试,语音识别技术,单语,越过,能面,端到端语音识别,关键词检索,检索系统,系统构建,整体效果,最新研究进展,基于模型,参数共享,言声,声学建模,语种,分类信息,检索技术
AB值:
0.344345
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。