典型文献
基于混合分布注意力机制与混合神经网络的语音情绪识别方法
文献摘要:
针对现有语音情绪识别中存在无关特征多和准确率较差的问题,提出一种基于混合分布注意力机制与混合神经网络的语音情绪识别方法.该方法在2个通道内,分别使用卷积神经网络和双向长短时记忆网络进行语音的空间特征和时序特征提取,然后将2个网络的输出同时作为多头注意力机制的输入矩阵.同时,考虑到现有多头注意力机制存在的低秩分布问题,在注意力机制计算方式上进行改进,将低秩分布与2个神经网络的输出特征的相似性做混合分布叠加,再经过归一化操作后将所有子空间结果进行拼接,最后经过全连接层进行分类输出.实验结果表明,基于混合分布注意力机制与混合神经网络的语音情绪识别方法比现有其他方法的准确率更高,验证了所提方法的有效性.
文献关键词:
语音情绪识别;梅尔频率倒谱系数;双向长短时记忆网络;卷积神经网络;多头注意力机制
中图分类号:
作者姓名:
陈巧红;于泽源;贾宇波
作者机构:
浙江理工大学信息学院,浙江杭州 310018
文献出处:
引用格式:
[1]陈巧红;于泽源;贾宇波-.基于混合分布注意力机制与混合神经网络的语音情绪识别方法)[J].计算机工程与科学,2022(12):2246-2254
A类:
B类:
混合分布,混合神经网络,语音情绪识别,双向长短时记忆网络,空间特征,时序特征提取,多头注意力机制,低秩,计算方式,再经,子空间,拼接,全连接层,层进,其他方法,梅尔频率倒谱系数
AB值:
0.179768
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。