首站-论文投稿智能助手
典型文献
融合多头注意力的VGGNet语音情感识别研究
文献摘要:
针对语音情感识别存在数据样本不足、识别准确率不高以及算法模型参数量大等问题,提出一种融合多头注意力的VGGNet语音情感识别方法.首先,通过在原语音中添加高斯白噪声以及对对数梅尔频谱图进行色彩饱和度处理的方法实现数据增强;然后,搭建一种轻量级VGGNet,将扩充后的频谱图输入到网络模型中;最后,将多头注意力机制与VGGNet相结合,有效提高语音情感识别算法的准确率.通过在RAVDESS和IEMOCP数据集上与其他主流算法进行跨数据集对比实验,表明该算法的识别准确率均达最高,分别为88.3%和77.11%.
文献关键词:
语音情感识别;数据增强;多头注意力机制
作者姓名:
焦亚萌;周成智;李文萍;崔琳;董免
作者机构:
西安工程大学电子信息学院 西安710048
引用格式:
[1]焦亚萌;周成智;李文萍;崔琳;董免-.融合多头注意力的VGGNet语音情感识别研究)[J].国外电子测量技术,2022(01):63-69
A类:
RAVDESS,IEMOCP
B类:
VGGNet,语音情感识别,别存,识别准确率,算法模型,模型参数量,原语,高斯白噪声,对对,梅尔频谱图,行色,色彩饱和度,数据增强,轻量级,多头注意力机制,识别算法,流算法
AB值:
0.218603
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。