首站-论文投稿智能助手
典型文献
改进YOLOv5s的手语识别算法研究
文献摘要:
为解决健全人士与听障人士交互信息困难的问题,提出一种改进YOLOv5s网络模型的手语识别网络.应用K-means++算法提高先验锚框的尺寸匹配度,确定了最优先验锚框尺寸,实现先验锚框与实际物体的精确匹配;改进CBAM(convolution block attention module)注意力机制的通道域,解决其因降维而造成的通道信息缺失问题,并将改进后的CBAM加入到YOLOv5s的骨干网络中,使模型更加精准地定位和识别到关键的目标.将Cross Entropy Loss和Lovasz-Softmax Loss加权结合使用,使得网络在模型训练过程中更加稳定地收敛,在精准率上也得到了一定的提升.实验结果表明,与原本的YOLOv5s模型相比,改进后网络模型的平均精度均值(mean average precision,mAP)、精准率和召回率分别提升了3.44个百分点、3.17个百分点、1.89个百分点,有效地提高了手语识别网络的检测精确度.
文献关键词:
手语识别;YOLOv5;K-means++;注意力机制;损失函数
作者姓名:
邢晋超;潘广贞
作者机构:
中北大学 软件学院,太原 030000
引用格式:
[1]邢晋超;潘广贞-.改进YOLOv5s的手语识别算法研究)[J].计算机工程与应用,2022(16):194-203
A类:
B类:
YOLOv5s,手语识别,识别算法,算法研究,健全人,听障人士,交互信息,识别网络,means++,先验,锚框,尺寸匹配,匹配度,CBAM,convolution,block,attention,module,注意力机制,通道域,信息缺失,骨干网络,Cross,Entropy,Loss,Lovasz,Softmax,结合使用,模型训练,训练过程,平均精度均值,average,precision,mAP,召回率,百分点,检测精确度,损失函数
AB值:
0.456892
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。