首站-论文投稿智能助手
典型文献
基于Vision Transformer模型的牛脸识别算法
文献摘要:
使用卷积神经网络(Convolutional Neural Networks,CNN)提取牛脸特征时,往往忽略全局上下文信息,只能提取到牛脸图像的局部特征信息.视觉转换器(Vision Transformer,ViT)模型的全局感受野能有效改善CNN局部感受野问题.提出一种基于ViT模型的牛脸识别算法.首先,在ViT模型中加入patch-shift网络层,通过获取牛脸图像的全局特征和局部特征,以及局部特征之间的相关性,有效缓解了牛脸图像脏污的影响;然后,在patch-shif t网络层之后加入可学习的掩码矩阵,运用掩码矩阵学习图像块的重要性,使模型更加关注牛脸图像块,抑制了背景噪声的干扰.在包含正脸、左侧脸和右侧脸3种正常图像库和特殊图像库中进行仿真实验,和基于CNN的牛脸识别算法相比,提出的算法有效降低了零误识下的拒识率,提高了T o p1排序性能.
文献关键词:
Vision Transformer;牛脸识别;个体识别;深度学习
作者姓名:
郑鹏;沈雷;刘浩;牟家乐
作者机构:
杭州电子科技大学通信工程学院,浙江杭州310018
引用格式:
[1]郑鹏;沈雷;刘浩;牟家乐-.基于Vision Transformer模型的牛脸识别算法)[J].杭州电子科技大学学报,2022(06):40-46
A类:
shif
B类:
Vision,Transformer,牛脸识别,识别算法,Convolutional,Neural,Networks,全局上下文信息,取到,局部特征,特征信息,视觉转换器,ViT,感受野,patch,shift,网络层,全局特征,脏污,可学,掩码,背景噪声,特殊图,误识,p1,个体识别
AB值:
0.384174
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。