首站-论文投稿智能助手
典型文献
面向语音情感识别的SCBAMM网络
文献摘要:
语音情感识别是自动语音识别的重要研究方向,提取最能表征语音情感的特征并构建具有较强鲁棒性和泛化性的声学模型是语音情感识别的重要研究内容.基于此,构建了基于注意机制、跳跃连接、掩蔽操作等关键技术的语音情感识别声学模型,称为具有掩蔽操作的基于注意机制的跳跃卷积双向循环神经网络.该模型有8个隐层,依次是2个全连接层、卷积层、跳跃层、掩蔽层、Bi-LSTM层、注意层和池化层.其中,卷积层提取语音情感空间特征;Bi-LSTM层提取语音情感时间序列特征;跳跃层主要解决梯度问题;掩蔽层使数据中为0的值不参与计算,降低了计算量;注意层根据不同时间序列特征对情感的贡献程度分配权重;池化层计算语音情感序列权重.实验结果表明,所提出的模型在EMO-DB库上取得了92.34%的识别性能.
文献关键词:
语音情感识别;特征提取;声学建模;注意机制;跳跃连接;掩蔽操作
作者姓名:
张会云;黄鹤鸣
作者机构:
青海师范大学 计算机学院,青海 西宁 810008;藏语智能信息处理及应用国家重点实验室,青海 西宁 810008;藏文信息处理教育部重点实验室,青海 西宁 810008;青海省藏文信息处理与机器翻译重点实验室,青海 西宁 810008
文献出处:
引用格式:
[1]张会云;黄鹤鸣-.面向语音情感识别的SCBAMM网络)[J].现代电子技术,2022(05):79-83
A类:
SCBAMM,掩蔽操作
B类:
语音情感识别,自动语音识别,泛化性,声学模型,注意机制,跳跃连接,双向循环神经网络,全连接层,卷积层,跃层,Bi,池化,情感空间,空间特征,时间序列特征,计算量,贡献程度,分配权重,EMO,DB,识别性,声学建模
AB值:
0.228355
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。