典型文献
视频会议发言者语音的偏好转移矩阵识别方法
文献摘要:
为了识别视频会议发言者语音,扩大语音识别精度,研究基于偏好转移矩阵与数据库的视频会议发言者语音识别方法.提取有价值的语音信息,结合矢量量化与规整网络,生成有价值语音的音节状态偏好转移矩阵,将数个训练后的稀疏自编码器叠加,构成自编码神经网络,逐层训练该网络后,输入至Softmax分类器中,完成会议发言者语音识别.实验结果表明,该方法应用后,在2层隐含层、500个神经元的神经网络结构下,识别率最高可达到96.55%,具有最佳的语音识别效果,且所识别语音与初始实验发言者语音几乎吻合,识别精度高,识别效果理想.提高视频会议通信质量,保障用户体验.
文献关键词:
偏好转移矩阵;数据库;视频会议;发言者语音;自编码器;Softmax分类器
中图分类号:
作者姓名:
杨斌;李庭瑞;李俊杰;罗睿;涂珂;胡施琦
作者机构:
北京中电飞华通信有限公司 北京 100071
文献出处:
引用格式:
[1]杨斌;李庭瑞;李俊杰;罗睿;涂珂;胡施琦-.视频会议发言者语音的偏好转移矩阵识别方法)[J].网络新媒体技术,2022(06):35-41
A类:
发言者语音,偏好转移矩阵
B类:
视频会议,语音识别,识别精度,音信,矢量量化,规整,音节,数个,稀疏自编码器,自编码神经网络,逐层,Softmax,分类器,隐含层,神经网络结构,识别率,效果理想,通信质量,用户体验
AB值:
0.163693
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。