典型文献
基于CRNN混合神经网络的多语种识别
文献摘要:
在语种识别过程中,为提取语音信号中的空间特征以及时序特征,从而达到提高多语种识别准确率的目的,提出了一种利用卷积循环神经网络(convolutional recurrent neural network,CRNN)混合神经网络的多语种识别模型.该模型首先提取语音信号的声学特征;然后将特征输入到卷积神经网络(convolutional neural network,CNN)提取低维度的空间特征;再通过空间金字塔池化层(spatial pyramid pooling layer,SPP layer)对空间特征进行规整,得到固定长度的一维特征;最后将其输入到循环神经网络(recurrenrt neural network,CNN)来判别语种信息.为验证模型的鲁棒性,实验分别在3个数据集上进行,结果表明:相比于传统的CNN和RNN,CRNN混合神经网络对不同数据集的语种识别准确率均有提高,其中在8语种数据集中时长为5 s的语音上最为明显,分别提高了 5.3%和6.1%.
文献关键词:
语种识别;卷积循环神经网络混合神经网络;卷积神经网络;循环神经网络
中图分类号:
作者姓名:
王瑶;龙华;邵玉斌;杜庆治;王延凯
作者机构:
昆明理工大学信息工程与自动化学院,云南昆明650500
文献出处:
引用格式:
[1]王瑶;龙华;邵玉斌;杜庆治;王延凯-.基于CRNN混合神经网络的多语种识别)[J].光电子·激光,2022(06):620-628
A类:
recurrenrt,卷积循环神经网络混合神经网络
B类:
CRNN,多语种,语种识别,识别过程,语音信号,空间特征,时序特征,识别准确率,convolutional,recurrent,neural,network,识别模型,声学特征,低维,空间金字塔池化,spatial,pyramid,pooling,layer,SPP,规整,定长,维特,验证模型,中时
AB值:
0.229237
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。