首站-论文投稿智能助手
典型文献
基于深度学习的长语音口音识别研究
文献摘要:
普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别的多个短语音,然后使用经过预训练的X-vectors模型提取特征,再基于不同方法对句子特征进行融合,最后采用Amsoftmax最大化口音类别间隔并进行分类.在真实的物证口音识别数据集上的实验结果显示,本文方法的识别精确率为94.1%,比非深度学习的基准方法和基于X-vectors的基准方法分别提升了21.6%和2.1%,验证了本文方法的有效性和针对长语音的口音识别能力.
文献关键词:
深度学习;口音识别;长语音;普通话
作者姓名:
朱丹浩;王震;黄肖宇;马壮;徐杰
作者机构:
江苏警官学院刑事科学技术系,江苏 南京210031;江苏警官学院干训部,江苏 南京210031;江苏警官学院计算机信息与网络安全系,江苏 南京210031;江苏省苏州市张家港市公安局,江苏 苏州215600
引用格式:
[1]朱丹浩;王震;黄肖宇;马壮;徐杰-.基于深度学习的长语音口音识别研究)[J].南京师大学报(自然科学版),2022(04):110-118
A类:
口音识别,Amsoftmax
B类:
长语音,普通话,物证鉴定,机器学习方法,识别精度,切分,句子级,短语,预训练,vectors,提取特征,不同方法,对句,句子特征,音类,别数,精确率,基准方法,识别能力
AB值:
0.245848
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。