首站-论文投稿智能助手
典型文献
基于双模态融合特征的模糊语音识别研究
文献摘要:
针对模糊语音发音机理相近、听觉上容易混淆和容易被智能机器误识的问题,该文设计了一个双模态模糊语音数据库,并提取不同特征用于分类研究.数据库包括语音信号和发音器官运动信号两种模态,共计语音数据6300条,运动信号数据1 268条.提取声学特征与运动学特征,在特征层进行双模态的融合,通过核主成分分析降维来得到双模态融合特征,选择支持向量机分类模型进行分类识别.实验结果表明,单模态声学特征中,对数变化的耳蜗倒谱系数特征具有较高的识别率,最高可达86.95%.双模态融合特征相比于单模态特征识别率有明显的提高,在低信噪比情况下提升效果更加明显,最大可提高6.53%.
文献关键词:
双模态数据库;语音识别;特征提取;特征融合;发音运动特征
作者姓名:
冯晓静;白静;薛珮芸;戎如意
作者机构:
太原理工大学信息与计算机学院,山西晋中030600
文献出处:
引用格式:
[1]冯晓静;白静;薛珮芸;戎如意-.基于双模态融合特征的模糊语音识别研究)[J].电子设计工程,2022(02):43-48,54
A类:
双模态数据库,发音运动特征
B类:
模态融合,融合特征,模糊语,语音识别,听觉,智能机器,误识,一个双,语音数据库,征用,分类研究,语音信号,发音器官,官运,号数,声学特征,运动学特征,层进,核主成分分析,来得,支持向量机分类,分类模型,分类识别,单模,耳蜗,倒谱系数,识别率,模态特征,特征识别,低信噪比,提升效果,特征融合
AB值:
0.343545
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。