典型文献
基于注意力机制的多任务3D CNN-BLSTM情感语音识别
文献摘要:
语音情感识别广泛应用于车载驾驶系统、服务行业、教育以及医疗等各个领域.为了使计算机能更准确地识别出说话人的情感,提出了一种基于注意力机制的多任务三维卷积神经网络(Convolution Neural Network,CNN)和双向长短期记忆网络(Bidirectional Long-Short Term Memory,BLSTM)相结合的情感语音识别方法(3D CNN-BLSTM).基于多谱特征融合组图,利用三维卷积神经网络提取深层语音情感特征,结合性别分类的多任务学习机制提升语音情感识别准确率.在CASIA汉语情感语料库上的实验结果表明,该方法获得了较高的准确率.
文献关键词:
语音情感识别;注意力机制;多谱特征融合组图;卷积神经网络;多任务学习
中图分类号:
作者姓名:
姜特;陈志刚;万永菁
作者机构:
华东理工大学信息科学与工程学院,上海 200237
文献出处:
引用格式:
[1]姜特;陈志刚;万永菁-.基于注意力机制的多任务3D CNN-BLSTM情感语音识别)[J].华东理工大学学报(自然科学版),2022(04):534-542
A类:
多谱特征融合组图
B类:
注意力机制,BLSTM,情感语音,语音识别,语音情感识别,车载,服务行业,说话,三维卷积神经网络,Convolution,Neural,Network,双向长短期记忆网络,Bidirectional,Long,Short,Term,Memory,语音情感特征,结合性,多任务学习,学习机制,识别准确率,CASIA,语料库
AB值:
0.268287
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。