典型文献
基于BLSTM-CTC的语音特征的音素识别研究
文献摘要:
音音素是自然语言中的最小建模单元,音素识别模型的优劣直接影响关键词检索、连续语音识别的性能.本文首先针对幅度特征MSRCC和相位特征PSRCC进行了一系列对比实验研究,发现融合幅度特征和相位特征可以取得更好的识别效果;接着比较分析了几种深度神经网络的优缺点,并将它们用于音素识别,仿真实验表明基于BLSTM-CTC的声学模型相比于其他模型具有更好的识别性能.
文献关键词:
音素识别;深度神经网络;语音特征
中图分类号:
作者姓名:
吴丹丹;夏秀渝
作者机构:
四川大学电子信息学院,成都 610065
文献出处:
引用格式:
[1]吴丹丹;夏秀渝-.基于BLSTM-CTC的语音特征的音素识别研究)[J].现代计算机,2022(10):32-38
A类:
音素识别,MSRCC,PSRCC
B类:
BLSTM,CTC,语音特征,自然语言,言中,小建,识别模型,关键词检索,连续语音,语音识别,相位特征,深度神经网络,声学模型,识别性
AB值:
0.281446
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。