FAILED
首站-论文投稿智能助手
典型文献
融合多特征的语音情感识别方法
文献摘要:
语音情感识别已经成为下一代人机交互技术的重要组成部分,从语音信号中提取与情感相关的特征是语音情感识别的重要挑战.针对单一特征在情感识别中准确度不高的问题,该文提出了特征级-决策级融合的方法融合声学特征和语义特征进行情感识别.首先提取声学特征,包括:1)低层次手工特征集,包括基于谱相关、音质、能量、基频等相关特征,以及基于低层次特征的高级统计特征;2)DNN提取的谱相关特征的深度特征;3)CNN提取的基于Filter_bank特征的深度特征.并且使用基于Listen-Attend-Spell(LAS)模型的语音识别模块提取语义特征.然后将声学特征中的3类特征与语义特征进行特征级融合,在确定融合特征的先后顺序时引入了构造哈夫曼树的方法.最后得到融合后特征和原始4类特征各自的情感识别结果,在结果之上进行决策级融合,使用此方法在IEMOCAP数据集中分类准确度可达76.2%.
文献关键词:
语音情感识别;声学特征;语义特征;特征级-决策级融合
作者姓名:
王怡;王黎明;柴玉梅
作者机构:
郑州大学信息工程学院,郑州450001
引用格式:
[1]王怡;王黎明;柴玉梅-.融合多特征的语音情感识别方法)[J].小型微型计算机系统,2022(06):1232-1239
A类:
Attend,Spell
B类:
多特征,语音情感识别,下一代,一代人,人机交互技术,语音信号,决策级融合,方法融合,合声,声学特征,语义特征,低层次,手工特征,征集,音质,基频,层次特征,统计特征,DNN,深度特征,Filter,bank,Listen,LAS,语音识别模块,特征级融合,融合特征,先后顺序,序时,哈夫曼,IEMOCAP
AB值:
0.357573
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。