首站-论文投稿智能助手
典型文献
基于神经网络的英语口音识别
文献摘要:
针对英语口音识别问题,首先基于梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以卷积神经网络(convolutional neural network,CNN)-长短时记忆(long short-term memory,LSTM)网络为骨干网络,建立英语口音识别模型;然后对比研究了卷积神经网络-双向门限循环单元(CNN-bidirectional gated recurrent unit,CNN-BiGRU)模型和卷积神经网络-双向长短时记忆(CNN-bidirectional LSTM,CNN-BiLSTM)模型,并引入注意力机制,探索不同衍生模型在英语口音识别中的效果.实验结果表明,在小规模样本情况下,整体而言,CNN-BiLSTM模型对英语地域口音识别取得了较好效果,获得了 74.0%的准确率.
文献关键词:
英语口音识别;注意力机制;卷积神经网络;双向长短时记忆;梅尔频率倒谱系数
作者姓名:
刘辉翔;赵云梦;陈雯柏;董立成
作者机构:
北京信息科技大学自动化学院,北京100192;博鼎实华(北京)技术有限公司,北京100096
引用格式:
[1]刘辉翔;赵云梦;陈雯柏;董立成-.基于神经网络的英语口音识别)[J].北京信息科技大学学报(自然科学版),2022(05):46-52
A类:
英语口音识别,口音识别
B类:
梅尔频率倒谱系数,Mel,frequency,cepstral,coefficients,MFCCs,convolutional,neural,network,long,short,term,memory,骨干网络,识别模型,双向门限循环单元,bidirectional,gated,recurrent,unit,BiGRU,双向长短时记忆,BiLSTM,注意力机制,衍生模型,小规模,模样,整体而言
AB值:
0.272695
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。